




已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)挖掘關(guān)聯(lián)分析,概念,數(shù)據(jù)挖掘(Data Mining) 是通過分析每個(gè)數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù),主要有數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示3個(gè)步驟。 數(shù)據(jù)挖掘的任務(wù)有關(guān)聯(lián)分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等。 關(guān)聯(lián)分析是指如果兩個(gè)或多個(gè)事物之間存在一定的關(guān)聯(lián),那么其中一個(gè)事物就能通過其他事物進(jìn)行預(yù)測(cè).它的目的是為了挖掘隱藏在數(shù)據(jù)間的相互關(guān)系 。,數(shù)據(jù)挖掘能做什么,分類 (Classification) 首先從數(shù)據(jù)中選出已經(jīng)分好類的訓(xùn)練集,在該訓(xùn)練集上運(yùn)用數(shù)據(jù)挖掘分類的技術(shù),建立分類模型,對(duì)于沒有分類的數(shù)據(jù)進(jìn)行分類。 例子: a. 信用卡申請(qǐng)者,分類為低、中、高風(fēng)險(xiǎn) b. 故障診斷:中國(guó)寶鋼集團(tuán)與上海天律信息技術(shù)有限公司合作,采用數(shù)據(jù)挖掘技術(shù)對(duì)鋼材生產(chǎn)的全流程進(jìn)行質(zhì)量監(jiān)控和分析,構(gòu)建故障地圖,實(shí)時(shí)分析產(chǎn)品出現(xiàn)瑕疵的原因,有效提高了產(chǎn)品的優(yōu)良率。,數(shù)據(jù)挖掘能做什么,估計(jì)(Estimation) 估計(jì)與分類類似,不同之處在于,分類描述的是離散型變量的輸出,而估值處理連續(xù)值的輸出;分類 數(shù)據(jù)挖掘 的類別是確定數(shù)目的,估值的量是不確定的。 例子: a. 根據(jù)購(gòu)買模式,估計(jì)一個(gè)家庭的孩子個(gè)數(shù) b. 根據(jù)購(gòu)買模式,估計(jì)一個(gè)家庭的收入 c. 估計(jì)real estate的價(jià)值 一般來(lái)說(shuō),估值可以作為分類的前一步工作。例如:銀行對(duì)家庭貸款業(yè)務(wù),運(yùn)用估值,給各個(gè)客戶記分(Score 01)。然后,根據(jù)閾值,將貸款級(jí)別分類。,數(shù)據(jù)挖掘能做什么,預(yù)測(cè)(Prediction) 通常,預(yù)測(cè)是通過分類或估值起作用的,也就是說(shuō),通過分類或估值得出模型,該模型用于對(duì)未知變量的預(yù)言。從這種意義上說(shuō),預(yù)言其實(shí)沒有必要分為一個(gè)單獨(dú)的類。預(yù)言其目的是對(duì)未來(lái)未知變量的預(yù)測(cè),這種預(yù)測(cè)是需要時(shí)間來(lái)驗(yàn)證的,即必須經(jīng)過一定時(shí)間后,才知道預(yù)言準(zhǔn)確性是多少。,數(shù)據(jù)挖掘能做什么,相關(guān)性分組或關(guān)聯(lián)規(guī)則 (Affinity grouping or association rules) 決定哪些事情將一起發(fā)生。 例子: a. 超市中客戶在購(gòu)買A的同時(shí),經(jīng)常會(huì)購(gòu)買B,即A = B(關(guān)聯(lián)規(guī)則) b. 客戶在購(gòu)買A后,隔一段時(shí)間,會(huì)購(gòu)買B (序列分析),數(shù)據(jù)挖掘能做什么,聚類(Clustering) 聚類是對(duì)記錄分組,把相似的記錄在一個(gè)聚集里。聚類和分類的區(qū)別是聚集不依賴于預(yù)先定義好的類,不需要訓(xùn)練集。 例子: a. 一些特定癥狀的聚集可能預(yù)示了一個(gè)特定的疾病 b. 租VCD類型不相似的客戶聚集,可能暗示成員屬于不同的亞文化群,數(shù)據(jù)關(guān)聯(lián),我們會(huì)發(fā)現(xiàn)很多網(wǎng)站都具備了內(nèi)容推薦的功能,這類功能無(wú)疑在幫助用戶發(fā)現(xiàn)需求,促進(jìn)商品購(gòu)買和服務(wù)應(yīng)用方面起到了顯著性的效果。,那么這類的推薦是怎么得到的呢?,數(shù)據(jù)關(guān)聯(lián),關(guān)聯(lián)推薦在營(yíng)銷上被分為兩類: 向上營(yíng)銷(Up Marketing):根據(jù)既有客戶過去的消費(fèi)喜好,提供更高價(jià)值或者其他用以加強(qiáng)其原有功能或者用途的產(chǎn)品或服務(wù)。 交叉營(yíng)銷(Cross Marketing):從客戶的購(gòu)買行為中發(fā)現(xiàn)客戶的多種需求,向其推銷相關(guān)的產(chǎn)品或服務(wù)。,數(shù)據(jù)關(guān)聯(lián),向上營(yíng)銷是基于同類產(chǎn)品線的升級(jí)或優(yōu)化產(chǎn)品的推薦,而交叉營(yíng)銷是基于相似但不同類的產(chǎn)品的推薦。,數(shù)據(jù)關(guān)聯(lián),關(guān)聯(lián)推薦在實(shí)現(xiàn)方式上也可以分為兩種: 以產(chǎn)品分析為基礎(chǔ)的關(guān)聯(lián)推薦 以用戶分析為基礎(chǔ)的關(guān)聯(lián)推薦,比如Web Analytics和Web Analytics 2.0的作者都是Avinash Kaushik,而且書名都包含Web Analytics,都是網(wǎng)站分析類的書籍,同時(shí)也可能是同一個(gè)出版社那么基于產(chǎn)品的關(guān)聯(lián)就可以向購(gòu)買了Web Analytics的用戶推薦Web Analytics 2.0。,數(shù)據(jù)關(guān)聯(lián),關(guān)聯(lián)推薦在實(shí)現(xiàn)方式上也可以分為兩種: 以產(chǎn)品分析為基礎(chǔ)的關(guān)聯(lián)推薦 以用戶分析為基礎(chǔ)的關(guān)聯(lián)推薦,基于用戶分析的推薦是通過分析用戶的歷史行為數(shù)據(jù),可能會(huì)發(fā)現(xiàn)購(gòu)買了Web Analytics的很多用戶也買了The Elements of User Experience這本書,那么就可以基于這個(gè)發(fā)現(xiàn)進(jìn)行推薦。,關(guān)聯(lián)規(guī)則,數(shù)據(jù)關(guān)聯(lián),經(jīng)典案例:沃爾瑪?shù)钠【坪湍虿嫉墓适?關(guān)聯(lián)規(guī)則,基于用戶行為分析的關(guān)聯(lián)推薦,更有利于發(fā)現(xiàn)用戶的潛在需求,幫助用戶更好的選擇它們需要的產(chǎn)品,并由用戶決定是否購(gòu)買,也就是所謂的“拉式”營(yíng)銷。通過向用戶推薦產(chǎn)品或服務(wù),激發(fā)用戶的潛在需求,促使用戶消費(fèi),更加符合“以用戶為中心”的理念。 以電子商務(wù)網(wǎng)站為例來(lái)說(shuō)明一下關(guān)聯(lián)規(guī)則的具體實(shí)現(xiàn): 目前大部分電子商務(wù)網(wǎng)站都提供用戶注冊(cè)的功能,而購(gòu)物的用戶一般都是基于登錄的條件下完成的,所以這里為用戶識(shí)別提供了最為有效的標(biāo)示符用戶ID;同時(shí)網(wǎng)站會(huì)把所有用戶的購(gòu)物數(shù)據(jù)儲(chǔ)存在自己的運(yùn)營(yíng)數(shù)據(jù)庫(kù)里面,這個(gè)為用戶行為分析提供了數(shù)據(jù)基礎(chǔ)用戶歷史購(gòu)物數(shù)據(jù)。,基于用戶行為分析的關(guān)聯(lián)推薦,關(guān)聯(lián)規(guī)則的實(shí)現(xiàn)原理: 從所有的用戶購(gòu)物數(shù)據(jù)中(如果數(shù)據(jù)量過大,可以選取一定的時(shí)間區(qū)間,如一年、一個(gè)季度等),尋找當(dāng)用戶購(gòu)買了A商品的基礎(chǔ)上,又購(gòu)買了B商品的人數(shù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 茶葉品牌授權(quán)許可合同
- 高速公路沿線廠區(qū)租賃及廣告使用權(quán)合同
- 互聯(lián)網(wǎng)場(chǎng)門面裝修設(shè)計(jì)與電商運(yùn)營(yíng)合同
- 注冊(cè)工程師企業(yè)內(nèi)部培訓(xùn)講師聘用合同
- 企業(yè)員工福利采購(gòu)合同范本
- 高端商務(wù)接送服務(wù)司機(jī)雇傭合同范本
- 大腦銀行活動(dòng)方案
- 太二公司周年慶活動(dòng)方案
- 太行山研學(xué)活動(dòng)方案
- 大班挑戰(zhàn)活動(dòng)方案
- 高考英語(yǔ)讀后續(xù)寫:三大主題語(yǔ)境結(jié)尾金句
- 直飲水施工合同協(xié)議
- 老年護(hù)理技能和知識(shí)培訓(xùn)
- 供應(yīng)商現(xiàn)場(chǎng)審核計(jì)劃管理制度
- 售電業(yè)務(wù)知識(shí)培訓(xùn)課件
- 預(yù)防病人走失
- 2025-2030中國(guó)抗體藥物結(jié)合物(ADC)行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025-2030中國(guó)安全儀表系統(tǒng)行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025年非高危行業(yè)生產(chǎn)經(jīng)營(yíng)單位主要負(fù)責(zé)人安全培訓(xùn)(復(fù)訓(xùn))考試題庫(kù)-下(判斷題)
- 2025年江蘇防雷考試試題及答案
- T-SBIAORG 001-2023 間充質(zhì)干細(xì)胞外泌體質(zhì)量控制標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論