




下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)挖掘在電子商務(wù)中的體現(xiàn)內(nèi)容摘要:隨著電子商務(wù)的競(jìng)爭(zhēng)日趨激烈,如何在海量的信息中獲取有價(jià)值的信 息就成了企業(yè)的核心工作,這就促進(jìn)了數(shù)據(jù)挖掘和電子商務(wù)的結(jié)合。本文從獲取 數(shù)據(jù)來(lái)源、分析訪問(wèn)路徑、構(gòu)建數(shù)據(jù)挖掘體系等三個(gè)方面淺談了數(shù)據(jù)挖掘在電子 商務(wù)中的表現(xiàn)及特點(diǎn)。關(guān)鍵詞:電子商務(wù)數(shù)據(jù)挖掘路徑分析挖掘體系前g我們都應(yīng)該有過(guò)這樣的瀏覽網(wǎng)頁(yè)經(jīng)歷,就是當(dāng)我們?cè)跒g覽一些購(gòu)物網(wǎng)站準(zhǔn)備 離開(kāi)時(shí)會(huì)彈出一個(gè)頁(yè)而顯示以下一些內(nèi)容“瀏覽該商品的朋友還會(huì)對(duì)下而一些商 品感興趣”;有時(shí)我們?cè)诰€聽(tīng)一些歌曲時(shí)也會(huì)有類(lèi)似的推薦信息“猜你還段歡 下面這首歌”如果我們按照這些推薦去看看這些網(wǎng)頁(yè)發(fā)現(xiàn)里面還真有自己喜歡 的東西或喜歡的
2、歌曲。大家可能很好奇,它怎么就知道我喜歡這些東西的,其實(shí) 這其中就是通過(guò)數(shù)據(jù)挖掘技術(shù)分析了我們消費(fèi)者的行為和喜好。數(shù)據(jù)挖掘定義:數(shù)據(jù)挖掘就是從大量的、不完整的、有噪聲的、模糊的隨機(jī)的實(shí)際應(yīng)用過(guò)程 中產(chǎn)生的數(shù)據(jù)中提取出隱含的有價(jià)值的信息的過(guò)程。電子商務(wù)就是以信息資源為核心而展開(kāi)的商務(wù)活動(dòng)或商務(wù)模式。電子商務(wù)數(shù) 據(jù)挖掘就是采集網(wǎng)絡(luò)上主要是電子商務(wù)網(wǎng)站存在的與電子商務(wù)有關(guān)信息,通過(guò)對(duì) 這些數(shù)據(jù)信息的分析從而了解市場(chǎng)供求信息、顧客偏好、購(gòu)買(mǎi)模式等,進(jìn)而隨時(shí) 調(diào)整經(jīng)營(yíng)策略。例如,在電子商務(wù)環(huán)境下,搜集到的有關(guān)客戶的數(shù)據(jù),經(jīng)過(guò)抽取、 變換和裝入,建立企業(yè)的數(shù)據(jù)倉(cāng)庫(kù),利用數(shù)據(jù)挖掘能發(fā)現(xiàn)客戶的共性和特殊性的
3、信息、必然和偶然的信息、獨(dú)立和關(guān)聯(lián)的信息等。所有這些挖掘發(fā)現(xiàn)的信息都將 為電子商務(wù)管理者提供決策依據(jù),以更好的滿足客戶需要。數(shù)據(jù)挖掘在電子商務(wù)中的體現(xiàn)從數(shù)據(jù)挖掘的定義可以看出數(shù)據(jù)挖掘z于電子商務(wù)的作用。那么數(shù)據(jù)挖掘在 電子商務(wù)中是如何體現(xiàn)出來(lái)的呢?從電子商務(wù)以及數(shù)據(jù)挖掘的關(guān)系來(lái)看主要體 現(xiàn)在以下一些方面;1. 獲取廣泛的數(shù)據(jù)來(lái)源2. 進(jìn)行路徑分析3建立數(shù)據(jù)挖掘體系結(jié)構(gòu)獲取廣泛的數(shù)據(jù)來(lái)源在電子商務(wù)中可以用作數(shù)據(jù)挖掘的數(shù)據(jù)來(lái)源很多,而且數(shù)據(jù)的類(lèi)型種類(lèi)也很 多。通常有以下一些方面的數(shù)據(jù)類(lèi)型:1、服務(wù)器h志數(shù)據(jù)??蛻粼L問(wèn)服務(wù)器時(shí)就會(huì)自動(dòng)在服務(wù)器上產(chǎn)生相應(yīng)的服務(wù)器 日志數(shù)據(jù)文件,日志文件分為server
4、 logs> error logs> cookie logs等幾種類(lèi)型。 server logs有兩種存儲(chǔ)格式;一種是公用el志文件格式,另一種是組合el志文 件格式。前者提供了有關(guān)訪問(wèn)者物理訪問(wèn)站點(diǎn)的信息。如果能夠?qū)@些信息 中的一些項(xiàng)進(jìn)行語(yǔ)法上的分析,就可以知道客戶主要來(lái)源的區(qū)域是哪里了。后者主要是支持關(guān)于h志文件元信息的指令,如版本號(hào),會(huì)話監(jiān)控開(kāi)始和結(jié) 束的日期、被記錄的域名等。error logs存儲(chǔ)了請(qǐng)求失敗的數(shù)據(jù),如丟失連接、授權(quán)失敗,超時(shí)等信息。cookie logs cookie是一種軟件結(jié)構(gòu),它能夠在客戶端存儲(chǔ)客戶訪問(wèn)服務(wù)器的 信息。服務(wù)器上存儲(chǔ)關(guān)于cookie的
5、信息就叫做cookie logso在電子商務(wù)網(wǎng)站 中,存儲(chǔ)在cookie r志中的主要是交易信息。2、查詢(xún)數(shù)據(jù)。查詢(xún)數(shù)據(jù)是電子商務(wù)站點(diǎn)在服務(wù)器上產(chǎn)生的一種典型數(shù)據(jù),如對(duì) 聯(lián)機(jī)存儲(chǔ)的客戶也許會(huì)搜索一些產(chǎn)品或某些廣告信息,這些查詢(xún)數(shù)據(jù)信息就 通過(guò)cookie或登記信息鏈接到服務(wù)器的訪問(wèn)日志上。但到0前為止還沒(méi)有一 個(gè)標(biāo)準(zhǔn)的查詢(xún)數(shù)據(jù)格式。3、代理服務(wù)器端數(shù)據(jù)。代理服務(wù)器fi志記錄了用戶對(duì)所有網(wǎng)站的訪問(wèn),它相當(dāng) 于客戶瀏覽器和web服務(wù)器之間的中介服務(wù)器。它可以將大量的用戶訪問(wèn)信 息通過(guò)代理口志的形式保存起來(lái)。通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行挖掘,能夠自動(dòng)發(fā)現(xiàn) 隱藏在數(shù)據(jù)中的模式信息,了解客戶的訪問(wèn)模式,從而做出一
6、些預(yù)測(cè)分析。4、客戶登記信息。這類(lèi)信息主要是用戶的注冊(cè)信息。比如用戶的個(gè)人資料、用 戶要訂購(gòu)的商品資料、用戶提交的一些意見(jiàn)反饋等。但問(wèn)題是很多用戶并不 愿意透露自己的個(gè)人信息,往往在填寫(xiě)注冊(cè)表時(shí)亂填一氣,這就會(huì)造成原始 數(shù)據(jù)質(zhì)量下降。這時(shí)就需要對(duì)這些數(shù)據(jù)加以甄別后才可以進(jìn)行使用。進(jìn)行路徑分析路徑分析時(shí)數(shù)據(jù)挖掘在電子商務(wù)中的常用方法。它通過(guò)對(duì)網(wǎng)站服務(wù)器日志文 件中客戶訪問(wèn)站點(diǎn)、訪問(wèn)次數(shù)的分析,挖掘出頻繁訪問(wèn)的路徑。路徑分析的意義 就在于建立更加完善的用戶行為模型,以幫助企業(yè)了解客戶的需求從而向客戶進(jìn) 行有目標(biāo)的推銷(xiāo)。當(dāng)前電子商務(wù)網(wǎng)站的頁(yè)面大多由以下內(nèi)容組成。 站點(diǎn)首頁(yè) 商家信譽(yù)與說(shuō)服性質(zhì)的頁(yè)而
7、產(chǎn)品詳細(xì)信息和常見(jiàn)問(wèn)題以及售后、配送信息頁(yè)面 購(gòu)物車(chē)頁(yè)面 支付結(jié)賬頁(yè)面通過(guò)這些頁(yè)面的引導(dǎo)就可以模擬出客戶訪問(wèn)的路徑了。經(jīng)過(guò)客戶上一步、下 一步或者其他的點(diǎn)擊,直到最后離開(kāi)頁(yè)而這些操作,這樣就需要根據(jù)自己的產(chǎn)品、 購(gòu)物、付款等頁(yè)面建立自己站點(diǎn)的路徑篩選機(jī)制,以便于在最后每周、每月或者 更長(zhǎng)時(shí)間的篩選報(bào)告中清起顧客的訪問(wèn)路徑,根據(jù)訪問(wèn)頁(yè)面的比率來(lái)挖掘用戶喜 歡的內(nèi)容頁(yè)面,消費(fèi)需求,進(jìn)而設(shè)計(jì)合理的點(diǎn)擊路徑和用戶選擇信息流程,方便 用戶點(diǎn)擊。建立數(shù)據(jù)挖掘體系雖然電子商務(wù)屮有許多數(shù)據(jù)來(lái)源,并且電子商務(wù)的服務(wù)器也可以自動(dòng)的進(jìn)行 收集這些數(shù)據(jù)。但如果建立相應(yīng)的數(shù)據(jù)挖掘體系的話,不從中挖掘出隱含的規(guī)律, 擁有
8、再多的數(shù)據(jù)也不會(huì)產(chǎn)牛多少商業(yè)價(jià)值。下圖即表示了當(dāng)前常用的數(shù)據(jù)挖掘體 系結(jié)構(gòu)。該結(jié)構(gòu)圖總體上分為三個(gè)部分即電子商務(wù)部分、用戶以及數(shù)據(jù)挖掘部分。雖 然分成三各部分但這三個(gè)部分不是各自獨(dú)立了,而是相互聯(lián)系的,通過(guò)數(shù)據(jù)的傳 遞有機(jī)的的融合到了一起。從結(jié)構(gòu)圖中可看出整個(gè)數(shù)據(jù)在結(jié)構(gòu)體系中的運(yùn)行流程。首先就是通過(guò)電子商 務(wù)網(wǎng)站去采集這些有關(guān)用戶的數(shù)據(jù)信息,通常這些信息都是不完整、有噪音的, 需要將這些數(shù)據(jù)在存入多維數(shù)據(jù)庫(kù)之前對(duì)它們進(jìn)行過(guò)濾和集成等操作。接著從數(shù) 據(jù)庫(kù)屮提取出數(shù)據(jù)再對(duì)它們進(jìn)行數(shù)據(jù)處理這主要包括數(shù)據(jù)清洗、數(shù)據(jù)合成、生成 新的數(shù)據(jù)。下一步就可以在人機(jī)交互圖形化界面上進(jìn)行數(shù)據(jù)挖掘了,比如進(jìn)行類(lèi) 聚分
9、析、關(guān)聯(lián)探測(cè)、統(tǒng)計(jì)分析等。而數(shù)據(jù)挖掘的結(jié)果還要應(yīng)用于系統(tǒng)用戶檢測(cè)才能知道效果。通過(guò)用戶的反饋就可以提出一些有預(yù)見(jiàn)性的商務(wù)策略,或者對(duì)網(wǎng)站結(jié)束語(yǔ):當(dāng)前很多企業(yè)都開(kāi)始在企業(yè)中推廣信息化,大多都建立起了自己的門(mén)戶網(wǎng) 站。門(mén)戶網(wǎng)站是企業(yè)面向客戶的一個(gè)窗口,客戶可以通過(guò)門(mén)戶網(wǎng)站足不出戶的就 可以了解企業(yè),而企業(yè)也需要通過(guò)門(mén)戶網(wǎng)站進(jìn)行數(shù)據(jù)挖掘分析了解客戶都有什么 樣的需求,對(duì)哪些產(chǎn)品需求量都是多大,進(jìn)而企業(yè)可以了解市場(chǎng)行情、向用戶提 供及時(shí)的服務(wù)。但是實(shí)際上一些企業(yè)都只是將網(wǎng)站建好了以后就不再過(guò)問(wèn)了,有 些信息都已經(jīng)很過(guò)時(shí)了,顯然是不能吸引顧客的。個(gè)人認(rèn)為之所以會(huì)出現(xiàn)這樣的現(xiàn)象,主要是因?yàn)閿?shù)據(jù)挖掘這項(xiàng)技術(shù)所需要的 投入較大,包括設(shè)備和人力的投入,國(guó)內(nèi)一些中小型企業(yè)不愿意投入。此外數(shù)據(jù) 挖掘在現(xiàn)階段的發(fā)展還不太成熟,所取得的商業(yè)價(jià)值表現(xiàn)不太明顯。隨著信息化的深化以及數(shù)據(jù)挖掘技術(shù)的不斷成熟,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 娛樂(lè)活動(dòng)策劃執(zhí)行規(guī)范
- 皺紋的形成和護(hù)理
- 腦梗死肢體活動(dòng)障礙的個(gè)案護(hù)理
- DB43-T 2878-2023 捕食性食蚜蠅繁育技術(shù)規(guī)程
- 名片制作流程
- 財(cái)務(wù)科入職培訓(xùn)
- 麻醉進(jìn)修試題及答案
- 幼兒園小班美術(shù)《一串紅》教案
- 生活技能試題及答案
- 福建高考試題及答案
- 2025年國(guó)學(xué)知識(shí)競(jìng)賽中國(guó)古代文學(xué)知識(shí)競(jìng)賽題庫(kù)及答案(共101題)
- 《中國(guó)聯(lián)通IPv6培訓(xùn)》課件
- 部編版2025春六年級(jí)下冊(cè)語(yǔ)文15《真理誕生于一百個(gè)問(wèn)號(hào)之后》 課件
- 小班安全課件幼兒園
- 《口腔固定修復(fù)工藝技術(shù)》期末考試復(fù)習(xí)題庫(kù)(含答案)
- 高等數(shù)學(xué)基礎(chǔ)-006-國(guó)開(kāi)機(jī)考復(fù)習(xí)資料
- 《常用法蘭墊片特性》課件
- 印刷企業(yè)安全培訓(xùn)
- 機(jī)械制圖-形成性任務(wù)2-國(guó)開(kāi)(ZJ)-參考資料
- 糖葫蘆課件教學(xué)課件
- GNSS定位測(cè)量學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
評(píng)論
0/150
提交評(píng)論