數(shù)據(jù)挖掘管理學(xué)論文范文-對(duì)于數(shù)據(jù)挖掘在高校圖書(shū)館的應(yīng)用論文_第1頁(yè)
數(shù)據(jù)挖掘管理學(xué)論文范文-對(duì)于數(shù)據(jù)挖掘在高校圖書(shū)館的應(yīng)用論文_第2頁(yè)
數(shù)據(jù)挖掘管理學(xué)論文范文-對(duì)于數(shù)據(jù)挖掘在高校圖書(shū)館的應(yīng)用論文_第3頁(yè)
數(shù)據(jù)挖掘管理學(xué)論文范文-對(duì)于數(shù)據(jù)挖掘在高校圖書(shū)館的應(yīng)用論文_第4頁(yè)
數(shù)據(jù)挖掘管理學(xué)論文范文-對(duì)于數(shù)據(jù)挖掘在高校圖書(shū)館的應(yīng)用論文_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)挖掘管理學(xué)論文范文:對(duì)于數(shù)據(jù)挖掘在高校圖書(shū)館的應(yīng)用論文數(shù)據(jù)挖掘在高校圖書(shū)館的應(yīng)用論文導(dǎo)讀:本論文是一篇關(guān)于數(shù)據(jù)挖掘 在高校圖書(shū)館的應(yīng)用的優(yōu)秀論文范文,對(duì)正在寫(xiě)有關(guān)于數(shù)據(jù)挖掘論文 的寫(xiě)作者有一定的參考和指導(dǎo)作用,論文片段:目錄:1、正文2、相關(guān)論文3、相關(guān)欄目4、本文下載摘 要:概述了數(shù)據(jù)挖掘的一般知識(shí),探討了數(shù)據(jù)挖掘在高校圖書(shū)館 信息管理與服務(wù)方面的應(yīng)用,分析了數(shù)據(jù)挖掘在應(yīng)用中存在的理由。 關(guān)鍵詞:數(shù)據(jù)挖掘;知識(shí)發(fā)現(xiàn);高校圖書(shū)館數(shù)據(jù)挖掘是當(dāng)前數(shù)據(jù)庫(kù)研究、開(kāi)發(fā)和應(yīng)用最活躍的分支之一, 它在科學(xué)發(fā)現(xiàn)、商業(yè)零售以及信用管理、醫(yī)學(xué)等領(lǐng)域已得到廣泛應(yīng)用。 隨著高校圖書(shū)館自動(dòng)化程度與數(shù)字圖書(shū)館建設(shè)的不

2、斷發(fā)展,圖書(shū)館 要處理和提供的信息越來(lái)越多,越來(lái)越復(fù)雜。圖書(shū)館如何運(yùn)用這一 新技術(shù)挖掘豐富的信息資源,為服務(wù)讀者和科學(xué)管理提供可靠的依 據(jù),值得圖書(shū)館界深入研究。本文試圖重點(diǎn)探討數(shù)據(jù)挖掘在高校圖 書(shū)館信息管理與服務(wù)方面的應(yīng)用。1數(shù)據(jù)挖掘的定義與策略數(shù)據(jù)挖掘(data mining , dm ) 也稱知識(shí)發(fā)現(xiàn) (knowledgediscovery from database, kdd), 是從大量的、不 完全的、先前不知道的、模糊的、可能有污染的隨機(jī)詳細(xì)數(shù)據(jù)中提取 隱含的、潛在有用的信息和知識(shí)的過(guò)程。挖掘的對(duì)象是數(shù)據(jù)庫(kù)和數(shù)據(jù) 倉(cāng)庫(kù),旨在通過(guò)對(duì)數(shù)據(jù)的統(tǒng)計(jì)、分析、綜合、歸納和推理,揭示事 件間的相

3、互關(guān)系,預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì),起到輔助實(shí)際工作理由求 解的作用。整個(gè)知識(shí)發(fā)現(xiàn)過(guò)程由若干挖掘步驟組成:(1) 數(shù)據(jù)選擇。根據(jù)挖掘要求,將多個(gè)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行 合并處理,提取與kdd相關(guān)的數(shù)據(jù),kdd將主要從這些數(shù)據(jù)中進(jìn) 行數(shù)據(jù)提取。(2) 數(shù)據(jù)預(yù)處理與轉(zhuǎn)換。從與ki)【)相關(guān)的數(shù)據(jù)集合中除去明 顯錯(cuò)誤的數(shù)據(jù)和冗余的數(shù)據(jù),進(jìn)步精減所選數(shù)據(jù)中的有用部分, 縮小處理范圍,提高數(shù)據(jù)分析質(zhì)量。并將數(shù)據(jù)轉(zhuǎn)換成為規(guī)范形式,以 使數(shù)據(jù)挖掘更有效。(3)數(shù)據(jù)挖掘。就是選擇合適的挖掘算法,對(duì)數(shù)據(jù)進(jìn)行分析, 以得出真止合理有用的知識(shí)。(4)知識(shí)描述。根據(jù)數(shù)據(jù)挖掘的目的對(duì)提取的信息進(jìn)行分析, 把有價(jià)值的信息挑選出來(lái),將

4、發(fā)現(xiàn)的知識(shí)以用戶能理解的方式捉供 給用戶。(5)知識(shí)評(píng)價(jià)。用戶根據(jù)已有的知識(shí)對(duì)挖掘的結(jié)果進(jìn)行合理 性分析,若有不合理的方面,再重復(fù)上述步驟,以保證挖掘結(jié)果 的合理性。2數(shù)據(jù)挖掘在圖書(shū)館的應(yīng)用2. 1分析讀者需求,優(yōu)化信息資源建設(shè)高校圖書(shū)館的文獻(xiàn)采購(gòu)常常面對(duì)兩個(gè)理rtn每年的文獻(xiàn)購(gòu)置 費(fèi)是有限的,書(shū)庫(kù)、閱覽室等各種可使用的空間也是有限的,如何 有效地使用有限的經(jīng)費(fèi),充分利用寶貴的空間,添置讀者真正需要 的文獻(xiàn),提高文獻(xiàn)資源的利用效率;根據(jù)學(xué)校的專(zhuān)業(yè)設(shè)置及教學(xué) 科研情況,文獻(xiàn)購(gòu)置費(fèi)在各門(mén)學(xué)科之間如何分配,各種文獻(xiàn)載體形 式之間如何平衡,才能使文獻(xiàn)購(gòu)置費(fèi)發(fā)揮最大效益。傳統(tǒng)圖書(shū)館大 多由專(zhuān)門(mén)采訪人員獨(dú)

5、口確定或與少數(shù)專(zhuān)家商計(jì)決定,不可避開(kāi)地帶有 一定的主觀性以及個(gè)人喜好,難免造成經(jīng)費(fèi)浪費(fèi)及館藏信息資源的 缺漏。利用數(shù)據(jù)挖掘技術(shù)可以解決以上理由。圖書(shū)館每天產(chǎn)生大量可 以對(duì)采訪工作產(chǎn)生指導(dǎo)作用的數(shù)據(jù),利用模糊聚類(lèi)分析技術(shù),通過(guò)對(duì) 圖書(shū)館業(yè)務(wù)系統(tǒng)的借閱、流通狀況、檢索請(qǐng)求及館藏書(shū)目庫(kù)進(jìn)行分析 挖掘,按類(lèi)統(tǒng)計(jì)文獻(xiàn)拒借集和頻繁借閱集,并以此分析出文獻(xiàn)的利用 率,及時(shí)補(bǔ)充短缺的文獻(xiàn),剔除過(guò)時(shí)的文獻(xiàn)或減少部分文獻(xiàn)的采購(gòu)復(fù) 本量。22加強(qiáng)書(shū)庫(kù)科學(xué)管理,提高服務(wù)質(zhì)量書(shū)庫(kù)的頻繁倒架以及圖書(shū)的殘破率、丟失率是經(jīng)常遇到的理由, 如何防微杜漸也是值得挖掘的個(gè)方面。通過(guò)對(duì)歷年借閱數(shù)據(jù)的相關(guān) 分析,增長(zhǎng)幅度相應(yīng)較大的圖書(shū)

6、種類(lèi)在上架的時(shí)候應(yīng)根據(jù)預(yù)測(cè)的趨 勢(shì)預(yù)留架位;通過(guò)對(duì)注銷(xiāo)數(shù)據(jù)的分類(lèi)分析統(tǒng)計(jì)及與樣本庫(kù)比較以確 認(rèn)若丟失率超過(guò)一定比例的理由出在哪些方面,給出在制度上或人 員上加強(qiáng)管理的倡議。對(duì)于那些借閱頻率較大且連續(xù)續(xù)借的123下 一頁(yè)數(shù)據(jù)挖掘在高校圖書(shū)館的應(yīng)用論文導(dǎo)讀:本論文是一篇關(guān)于數(shù)據(jù)挖 掘在高校圖書(shū)館的應(yīng)用的優(yōu)秀論文范文,對(duì)正在寫(xiě)有關(guān)于數(shù)據(jù)挖掘論 文的寫(xiě)作者有一定的參考和指導(dǎo)作用,論文片段:目錄:1、正文2、相關(guān)論文3、相關(guān)欄目4、木文下載文獻(xiàn),應(yīng)以量化的方式反饋給采訪部門(mén)以加重采購(gòu)的力度;對(duì)罰 賠款數(shù)據(jù)的挖掘則可提供對(duì)諸如特定書(shū)刊的借閱期限和人員限制等 的建設(shè)性倡議,以提高服務(wù)質(zhì)量。2.3優(yōu)化數(shù)字圖書(shū)

7、館的信息內(nèi)容數(shù)字圖書(shū)館是一種數(shù)據(jù)信息系統(tǒng),這一系統(tǒng)不但擁有內(nèi)容豐 富、形式多樣的數(shù)字化信息資源,而且依賴于現(xiàn)代高新技術(shù)的支持, 高效地滿足用戶的需求。目前,數(shù)字圖書(shū)館的信息內(nèi)容包括大量的 數(shù)字化館藏、種類(lèi)繁多的數(shù)據(jù)庫(kù)、全文web資源鏈接以及互聯(lián)網(wǎng)上 的大量信息。這大量的數(shù)據(jù),只有通過(guò)組織、分析和挖掘,找出數(shù) 據(jù)背后真正有價(jià)值的知識(shí)信息,才是用戶實(shí)際需要的。采用數(shù)據(jù)挖 掘技術(shù),將其用于數(shù)字圖書(shū)館的信息發(fā)現(xiàn)和信息提供的全過(guò)程,可 向用戶提供更優(yōu)化的信息服務(wù),滿足用戶的個(gè)性化需求。2. 4針對(duì)用戶特點(diǎn)提供個(gè)性化服務(wù)有了數(shù)據(jù)挖掘技術(shù),圖書(shū)館完全可以根據(jù)用戶以前借閱的文獻(xiàn) 資料,甚至經(jīng)常訪問(wèn)的網(wǎng)頁(yè)(we

8、b服務(wù)器訪問(wèn)日志)進(jìn)行分析、挖 掘,進(jìn)行用戶的背景分析、用戶群體的分類(lèi)分析、用戶偏好分析、 用戶檢索滿意度分析等,了解他們的興趣愛(ài)好、研究方向,得出特 定用戶的特定檢索規(guī)律和知識(shí)模型,無(wú)需用戶先提岀信息請(qǐng)求,便 可確定個(gè)性化服務(wù)內(nèi)容,主動(dòng)將相關(guān)文獻(xiàn)送到他們手中。個(gè)性化服 務(wù)的內(nèi)容包括:(1)當(dāng)發(fā)現(xiàn)新的相關(guān)信息或書(shū)目數(shù)據(jù)時(shí),及時(shí) 推送給用戶;(2)當(dāng)用戶訪問(wèn)圖書(shū)館網(wǎng)站時(shí),根據(jù)用戶的興趣 度,為用戶提供定制的web頁(yè)面;(3)跟蹤用戶的興趣變化模 式,發(fā)現(xiàn)用戶的最新需要;(4)根據(jù)用戶的興趣,提供相應(yīng)的 預(yù)測(cè)報(bào)告、動(dòng)態(tài)分析等,提供個(gè)性化決策支持服務(wù)。個(gè)性化服務(wù)的 過(guò)程包括:構(gòu)建個(gè)性化用戶動(dòng)態(tài)需求模

9、型;搜索、挖掘針對(duì)特定需 求的相關(guān)信息;按照特定主題,將搜索、挖掘到的信息進(jìn)行過(guò)濾、 加工和組合,整合成相對(duì)完整的信息集合;以在線或離線形式,主 動(dòng)發(fā)送給用戶;按照特定主題,對(duì)信息集合進(jìn)行分析開(kāi)發(fā),產(chǎn)生 新的知識(shí);以在線或離線形式,主動(dòng)發(fā)送到用戶。3在應(yīng)用中存在的理由當(dāng)前在圖書(shū)館應(yīng)用中,數(shù)據(jù)挖掘技術(shù)還存在一些理由。(1)缺少數(shù)據(jù)挖掘人才。數(shù)據(jù)挖掘技術(shù)是新興的數(shù)據(jù)分析技 術(shù),是多學(xué)科知識(shí)的綜合,涵蓋了數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)學(xué)、可視化技 術(shù)、信息科學(xué)、機(jī)器學(xué)習(xí)等多方面知識(shí)。冃前圖書(shū)館缺少精通數(shù)據(jù)挖 掘技術(shù)的綜合性人才,而對(duì)大型數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)有感性認(rèn)識(shí)的就 更少了。(2)缺少國(guó)產(chǎn)數(shù)據(jù)挖掘軟件。國(guó)外關(guān)于數(shù)

10、據(jù)挖掘軟件相關(guān)技 術(shù)的研究和開(kāi)發(fā)已經(jīng)很先進(jìn)。國(guó)內(nèi)由于數(shù)據(jù)積累不夠充分、全面,業(yè) 務(wù)模型構(gòu)建困難及缺少有經(jīng)驗(yàn)的實(shí)施者等諸多理由,數(shù)據(jù)挖掘未能 得到很好的應(yīng)用,而軟件的發(fā)展也受到限制。國(guó)內(nèi)對(duì)于數(shù)據(jù)挖掘軟 件的研究大部分還處于科研階段。國(guó)外數(shù)據(jù)挖掘軟件在國(guó)內(nèi)使用面對(duì) 漢化、漢字庫(kù)支持、用戶習(xí)慣、適應(yīng)國(guó)情等理由。而且?guī)缀鯖](méi)有面向 圖書(shū)館應(yīng)用的專(zhuān)業(yè)數(shù)據(jù)挖掘軟件,只有一些網(wǎng)絡(luò)專(zhuān)業(yè)信息挖掘工具。(3) 已有數(shù)據(jù)挖掘軟件有待改善。目前主流的數(shù)據(jù)挖掘軟件 專(zhuān)業(yè)化水平太高,易用性與通用性不夠,培訓(xùn)時(shí)間較長(zhǎng),上手慢。 同時(shí)需提高挖掘結(jié)果的可理解性,即數(shù)據(jù)挖掘技術(shù)應(yīng)進(jìn)一步為用戶 理解和接受,也可理解為如何用用戶的語(yǔ)言來(lái)表達(dá)知識(shí)。(4) 數(shù)據(jù)挖掘軟件處理數(shù)據(jù)的能力需進(jìn)一步提高。處理數(shù)據(jù) 的能力不僅指能處理海量的數(shù)據(jù),還包括能處理各種類(lèi)型數(shù)據(jù)和數(shù) 據(jù)源。現(xiàn)在的原始數(shù)據(jù)的格式越來(lái)越多樣化,盡管在數(shù)據(jù)挖掘進(jìn)行 之前要通過(guò)數(shù)據(jù)倉(cāng)庫(kù)對(duì)最初的數(shù)據(jù)進(jìn)行初步篩選,但基本上不會(huì)影 響其數(shù)據(jù)形式。所以,數(shù)據(jù)挖掘軟件必須提高對(duì)于各種類(lèi)型數(shù)據(jù),包 括半結(jié)構(gòu)3下一頁(yè)數(shù)據(jù)挖掘在高校圖書(shū)館的應(yīng)用論文導(dǎo)讀:本論文是一篇關(guān)于數(shù)據(jù)挖 掘在高校圖書(shū)館的應(yīng)用的優(yōu)秀論文范文,對(duì)止在寫(xiě)有關(guān)于數(shù)據(jù)挖掘論 文的寫(xiě)作者有一定的參考和指導(dǎo)作用,論文片段:論壇,2004 (1) ± 一頁(yè) 123目錄:1、止文2、相關(guān)論文3、相關(guān)欄口4、木文下

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論