數(shù)據(jù)挖掘在教育信息化中的應(yīng)用空間分析_第1頁(yè)
數(shù)據(jù)挖掘在教育信息化中的應(yīng)用空間分析_第2頁(yè)
數(shù)據(jù)挖掘在教育信息化中的應(yīng)用空間分析_第3頁(yè)
數(shù)據(jù)挖掘在教育信息化中的應(yīng)用空間分析_第4頁(yè)
數(shù)據(jù)挖掘在教育信息化中的應(yīng)用空間分析_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)挖掘在教育信息化中的應(yīng)用空間分析隨著信息社會(huì)的來(lái)臨,大量信息在給人們帶來(lái)方便的同時(shí)也帶來(lái)了信息的消化、信息的辨識(shí)、信息的安全、信息形式的一致性等問(wèn)題。人們開(kāi)始考慮:如何才能不被信息淹沒(méi),而且從中及時(shí)發(fā)現(xiàn)有用的知識(shí),提高信息利用率,最終避免“數(shù)據(jù)爆炸但知識(shí)貧乏”的現(xiàn)象。1這個(gè)任務(wù)就落在數(shù)據(jù)挖掘的身上。本文對(duì)教育信息化條件下,數(shù)據(jù)挖掘的應(yīng)用空間進(jìn)行分析,希望能為教育信息化建設(shè)提供有價(jià)值的參考。一、數(shù)據(jù)挖掘及其技術(shù)1.數(shù)據(jù)挖掘數(shù)據(jù)挖掘(Data Mining就是從大量的數(shù)據(jù)中,抽取出潛在的、有價(jià)值的知識(shí)(模型或規(guī)則的過(guò)程,是一類深層次的數(shù)據(jù)分析方法。它是一門交叉學(xué)科,包括機(jī)器學(xué)習(xí)、數(shù)理統(tǒng)計(jì)、神經(jīng)

2、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)、模式識(shí)別、粗糙集、模糊數(shù)學(xué)等相關(guān)技術(shù)。數(shù)據(jù)挖掘技術(shù)包括三個(gè)主要部分:算法和技術(shù);數(shù)據(jù);建模能力。22.數(shù)據(jù)挖掘系統(tǒng)一個(gè)完整的數(shù)據(jù)挖掘系統(tǒng)包括規(guī)則生成子系統(tǒng)和應(yīng)用評(píng)估子系統(tǒng)兩個(gè)部分。規(guī)則生成子系統(tǒng)主要完成根據(jù)數(shù)據(jù)倉(cāng)庫(kù)提供的歷史數(shù)據(jù),統(tǒng)計(jì)并產(chǎn)生相關(guān)規(guī)律,并輸出相關(guān)結(jié)果;應(yīng)用評(píng)估子系統(tǒng)可以理解為系統(tǒng)中的挖掘代理程序,根據(jù)生成子系統(tǒng)產(chǎn)生的規(guī)則按照一定的策略對(duì)數(shù)據(jù)進(jìn)行分類預(yù)測(cè),通過(guò)系統(tǒng)的任務(wù)計(jì)劃對(duì)數(shù)據(jù)產(chǎn)生評(píng)估指標(biāo)。3.數(shù)據(jù)挖掘的分類數(shù)據(jù)挖掘的分類方法很多。根據(jù)不同挖掘任務(wù),數(shù)據(jù)挖掘可分為分類或預(yù)測(cè)模型發(fā)現(xiàn),數(shù)據(jù)歸納、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn),序列模式發(fā)現(xiàn),依賴關(guān)系或依賴模型發(fā)現(xiàn),異常和趨勢(shì)發(fā)現(xiàn)等

3、等;根據(jù)挖掘方法,可分為機(jī)器學(xué)習(xí)法、統(tǒng)計(jì)方法、神經(jīng)網(wǎng)絡(luò)方法和數(shù)據(jù)庫(kù)方法。其中機(jī)器學(xué)習(xí)法包括:歸納學(xué)習(xí)方法(決策樹(shù)、規(guī)則歸納等、基于范例學(xué)習(xí)、遺傳算法等;統(tǒng)計(jì)方法包括:回歸分析(多元回歸、自回歸等、判別分析(貝葉斯判別、費(fèi)歇爾判別、非參數(shù)判別等、聚類分析(系統(tǒng)聚類、動(dòng)態(tài)聚類等、探索性分析(主元分析法、相關(guān)分析法等等;神經(jīng)網(wǎng)絡(luò)分析法包括:前向神經(jīng)網(wǎng)絡(luò)(BP算法等、自組織神經(jīng)網(wǎng)絡(luò)(自組織特征映射、競(jìng)爭(zhēng)學(xué)習(xí)等等;數(shù)據(jù)庫(kù)方法主要包括多維數(shù)據(jù)分析(OLAP方法。4.數(shù)據(jù)挖掘過(guò)程數(shù)據(jù)挖掘過(guò)程包括對(duì)問(wèn)題的理解和提出、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評(píng)估、知識(shí)表示等過(guò)程,以上的過(guò)程不是一次完成的,其

4、中某些步驟或者全過(guò)程可能要反復(fù)進(jìn)行。對(duì)問(wèn)題的理解和提出:在開(kāi)始數(shù)據(jù)挖掘之前,最基礎(chǔ)的工作就是理解數(shù)據(jù)和實(shí)際的業(yè)務(wù)問(wèn)題,在這個(gè)基礎(chǔ)之上提出問(wèn)題,對(duì)目標(biāo)作出明確的定義。數(shù)據(jù)收集:廣泛收集用戶的各種信息,建立數(shù)據(jù)庫(kù)與數(shù)據(jù)表,為數(shù)據(jù)挖掘做準(zhǔn)備。數(shù)據(jù)處理:對(duì)收集的信息進(jìn)行如“去噪”等處理,確保數(shù)據(jù)能夠真實(shí)反映待要挖掘的對(duì)象。數(shù)據(jù)變換:將經(jīng)過(guò)“去噪”的數(shù)據(jù)進(jìn)行一定的格式轉(zhuǎn)換,使其適應(yīng)數(shù)據(jù)挖掘系統(tǒng)或挖掘軟件的處理要求。數(shù)據(jù)挖掘:可以單獨(dú)利用也可以綜合利用各種數(shù)據(jù)挖掘方法對(duì)數(shù)據(jù)進(jìn)行分析,挖掘用戶所需要的各種規(guī)則、趨勢(shì)、類別、模型等。模式評(píng)估:對(duì)發(fā)現(xiàn)的規(guī)則、趨勢(shì)、類別、模型進(jìn)行評(píng)估,從而保證發(fā)現(xiàn)的模式的正確性。

5、知識(shí)表示:將挖掘結(jié)果以可視化的形式展現(xiàn)在用戶面前。5.數(shù)據(jù)挖掘的主要功能概念/類描述、特征化和區(qū)分:對(duì)每個(gè)類的匯總、簡(jiǎn)潔、精確的描述可以通過(guò)數(shù)據(jù)特征化、數(shù)據(jù)區(qū)分和數(shù)據(jù)比較來(lái)實(shí)現(xiàn)。數(shù)據(jù)特征化是指目標(biāo)類數(shù)據(jù)的一般特征或特征的匯總,如一年的成績(jī)匯總;數(shù)據(jù)區(qū)分是將目標(biāo)類對(duì)象的一般特征與一個(gè)或多個(gè)對(duì)比類對(duì)象的一般性比較,如A學(xué)校和B學(xué)校的比較。關(guān)聯(lián)分析:目的在于發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,這些規(guī)則揭示屬性與屬性值在數(shù)據(jù)集中一起出現(xiàn)的條件。這種關(guān)聯(lián)規(guī)則可以是單維關(guān)聯(lián)規(guī)則或多維關(guān)聯(lián)規(guī)則。分類與預(yù)測(cè):利用某種數(shù)據(jù)挖掘算法的某種規(guī)則自動(dòng)對(duì)海量數(shù)據(jù)進(jìn)行分類,其間較少有人工干預(yù),目的是為數(shù)據(jù)挖掘基礎(chǔ)上的預(yù)測(cè)服務(wù)。聚類分析:聚類是

6、根據(jù)最大化類內(nèi)的相似性、最小化類間的相似性原則對(duì)海量數(shù)據(jù)進(jìn)行聚類或分組,從而產(chǎn)生屬性相近的各個(gè)類。孤立點(diǎn)分析:所謂孤立點(diǎn),是指數(shù)據(jù)集合中與多數(shù)數(shù)據(jù)的特征或行為完全不一致的數(shù)據(jù)。在最初的挖掘算法中,人們總是將孤立點(diǎn)從數(shù)據(jù)集合中刪除,以保證數(shù)據(jù)的純潔性。然而,刪除孤立點(diǎn)可能會(huì)導(dǎo)致忽略某些非常有用的特殊規(guī)則,因而對(duì)孤立點(diǎn)需作特殊處理。演變分析:可以根據(jù)數(shù)據(jù)的特征對(duì)數(shù)據(jù)的發(fā)展變化作出相應(yīng)的預(yù)測(cè)與分析。主要應(yīng)用于對(duì)時(shí)間序列數(shù)據(jù)的分析、序列或周期模式匹配和基于類似性的數(shù)據(jù)分析。3二、數(shù)據(jù)挖掘在教育信息化中的具體應(yīng)用空間1.學(xué)習(xí)者特征分析學(xué)習(xí)者特征由學(xué)習(xí)者的知識(shí)結(jié)構(gòu)和學(xué)習(xí)風(fēng)格組成。知識(shí)結(jié)構(gòu)說(shuō)明了學(xué)習(xí)者對(duì)正在

7、或?qū)⒁獙W(xué)習(xí)知識(shí)的掌握情況,主要包括學(xué)習(xí)者初始技能、當(dāng)前技能和目標(biāo)技能。學(xué)習(xí)風(fēng)格包括學(xué)習(xí)者的生理特征、心理特征和社會(huì)特征三個(gè)方面。4利用數(shù)據(jù)挖掘功能分析學(xué)習(xí)者特征,目的在于幫助學(xué)習(xí)者修正自己的學(xué)習(xí)行為。這里有一理論假設(shè):通過(guò)對(duì)學(xué)習(xí)者特征分析結(jié)果和事先制定的行為目標(biāo)標(biāo)準(zhǔn)進(jìn)行比較,教師能夠幫助學(xué)習(xí)者修正學(xué)習(xí)行為、提高學(xué)習(xí)能力、完善人格,有利于學(xué)生各方面素質(zhì)的和諧發(fā)展。學(xué)習(xí)者特征分析系統(tǒng)由如下四個(gè)模塊組成,基本框架如圖1所示。人機(jī)互動(dòng)界面:學(xué)習(xí)者可以向系統(tǒng)手工添加學(xué)習(xí)者信息、提出分析要求,同時(shí)查看分析結(jié)果。數(shù)據(jù)收集模塊:收集的信息包括學(xué)習(xí)者的基本信息、績(jī)效信息、學(xué)習(xí)歷史、學(xué)習(xí)偏好、知識(shí)結(jié)構(gòu)等。數(shù)據(jù)處理

8、模塊:數(shù)據(jù)庫(kù)按照元數(shù)據(jù)標(biāo)準(zhǔn)對(duì)數(shù)據(jù)進(jìn)行清理、集成和變換。數(shù)據(jù)分析模塊:利用經(jīng)過(guò)轉(zhuǎn)化的數(shù)據(jù),按照數(shù)據(jù)挖掘規(guī)則,對(duì)數(shù)據(jù)進(jìn)行分析處理,得出結(jié)果并輸出。2.干預(yù)師生行為學(xué)校教學(xué)管理數(shù)據(jù)庫(kù)中記錄著各屆學(xué)生與教師的學(xué)習(xí)、工作、社會(huì)活動(dòng)、獎(jiǎng)勵(lì)、處罰等情況,利用數(shù)據(jù)挖掘的關(guān)聯(lián)分析與演變分析等功能,尋找?guī)熒鞣N行為活動(dòng)之間的內(nèi)在聯(lián)系。如“當(dāng)存在A,B時(shí)可以推出C”這樣的規(guī)則,即當(dāng)有A行為和B行為發(fā)生時(shí),還會(huì)有C行為。在實(shí)際情境中,如果發(fā)現(xiàn)學(xué)生或教師已有A,B行為時(shí),馬上可以分析其產(chǎn)生C行為的可能性,及時(shí)制定策略促進(jìn)或制止C行為的發(fā)生。3.合理設(shè)置課程在學(xué)校,學(xué)生的課程學(xué)習(xí)是循序漸進(jìn)的,而且課程之間有一定的關(guān)聯(lián)與前

9、后順序關(guān)系。在學(xué)一門較高級(jí)課程之前必須先修一些先行課程,如果先行課程沒(méi)有學(xué)好,勢(shì)必會(huì)影響后續(xù)課程的學(xué)習(xí)。另外,同一年級(jí)學(xué)習(xí)同一課程的不同班級(jí),由于授課教師、班級(jí)文化的不同,班內(nèi)學(xué)生的總體成績(jī)相差有時(shí)會(huì)很大。利用學(xué)校教學(xué)數(shù)據(jù)庫(kù)中存放的歷屆學(xué)生各門學(xué)科的考試成績(jī),結(jié)合數(shù)據(jù)挖掘的關(guān)聯(lián)分析與時(shí)間序列分析等相關(guān)功能,就能從這些海量數(shù)據(jù)中挖掘出有用的信息,幫助分析這些數(shù)據(jù)之間的相關(guān)性、回歸性等性質(zhì),得出一些具有價(jià)值的規(guī)則和信息,最終找到影響學(xué)生成績(jī)的原因。在此基礎(chǔ)上,對(duì)課程設(shè)置作出合理安排。4.學(xué)習(xí)評(píng)價(jià)學(xué)習(xí)評(píng)價(jià)是教育工作者的重要職責(zé)之一。評(píng)定學(xué)生的學(xué)習(xí)行為,既對(duì)學(xué)生起到信息反饋和激發(fā)學(xué)習(xí)動(dòng)機(jī)的作用,又是檢

10、查課程計(jì)劃、教學(xué)程序以至教學(xué)目的的手段,也是考查學(xué)生個(gè)別差異,便于因材施教的途徑。5評(píng)價(jià)要遵循“評(píng)價(jià)內(nèi)容要全面、評(píng)價(jià)方式要多元化、評(píng)價(jià)次數(shù)要多次化、注重自評(píng)與互評(píng)的有機(jī)結(jié)合”的原則。在教學(xué)科研網(wǎng)絡(luò)普遍建立的今天,利用數(shù)據(jù)挖掘工具,對(duì)學(xué)生的學(xué)習(xí)成績(jī)數(shù)據(jù)庫(kù)、行為記錄數(shù)據(jù)庫(kù)、獎(jiǎng)勵(lì)處罰數(shù)據(jù)庫(kù)等進(jìn)行分析處理,可以即時(shí)得到學(xué)生的評(píng)價(jià)結(jié)果,對(duì)學(xué)生出現(xiàn)的不良學(xué)習(xí)行為進(jìn)行及時(shí)指正。另外,這種系統(tǒng)還能夠克服教師主觀評(píng)價(jià)的不公正、不客觀的弱點(diǎn),減輕教師的工作量。5.個(gè)性化、智能化網(wǎng)絡(luò)服務(wù)數(shù)據(jù)挖掘基于網(wǎng)絡(luò)的應(yīng)用包括WEB挖掘和個(gè)性化、智能化網(wǎng)上遠(yuǎn)程教育兩個(gè)方面。WEB挖掘是數(shù)據(jù)挖掘的一項(xiàng)重要應(yīng)用。WEB挖掘是從與WW

11、W相關(guān)的資源和行為中抽取感興趣的、有用的模式和隱含信息的過(guò)程。WWW分析就是為網(wǎng)站運(yùn)行提供深入、準(zhǔn)確、詳細(xì)的分析數(shù)據(jù)和有價(jià)值的以及易理解的分析知識(shí)。通過(guò)提供這些數(shù)據(jù)和信息,可以解決以下問(wèn)題:(1對(duì)網(wǎng)站的修改更加有目的、有依據(jù),穩(wěn)步地提高用戶滿意度。根據(jù)用戶訪問(wèn)模式修改網(wǎng)頁(yè)之間的鏈接,把用戶想要的信息以更快、更有效的方式展現(xiàn)給用戶。(2查看網(wǎng)站流量模式。發(fā)現(xiàn)用戶的需要和興趣,對(duì)需求強(qiáng)烈的網(wǎng)頁(yè)提供優(yōu)化,用服務(wù)器預(yù)先存儲(chǔ)的方法來(lái)解決下載緩慢的問(wèn)題。(3提供個(gè)性化網(wǎng)站。針對(duì)不同的用戶,按照其個(gè)人的興趣和愛(ài)好(數(shù)據(jù)挖掘算法得到的用戶訪問(wèn)模式,向用戶動(dòng)態(tài)提供瀏覽的建議,自動(dòng)提供個(gè)性化的網(wǎng)站。(4發(fā)現(xiàn)系統(tǒng)性

12、能瓶頸,找到安全漏洞。(5為教師、教育管理者等提供重要的、有價(jià)值的信息。如通過(guò)對(duì)每個(gè)學(xué)生所做的試題進(jìn)行分析,得出題目之間的關(guān)聯(lián)性及其他一些有用的信息,用來(lái)指導(dǎo)教學(xué)、修正試題難度系數(shù)等。個(gè)性化、智能化網(wǎng)上遠(yuǎn)程教育是充分利用數(shù)據(jù)挖掘技術(shù)的功能,為遠(yuǎn)程教育提供服務(wù)。其表現(xiàn)在:(1利用學(xué)生登記信息,針對(duì)不同的學(xué)生,提供不同的學(xué)習(xí)內(nèi)容和學(xué)習(xí)模式,真正做到因材施教,并對(duì)學(xué)生的學(xué)習(xí)記錄進(jìn)行保存。(2對(duì)站點(diǎn)上保存的學(xué)習(xí)行為和學(xué)習(xí)記錄信息進(jìn)行挖掘,并結(jié)合課件知識(shí)庫(kù)的信息,自動(dòng)重組課程的內(nèi)容,使之更符合教學(xué)規(guī)律,并結(jié)合內(nèi)容,提供其他相關(guān)學(xué)習(xí)資源。(3通過(guò)對(duì)學(xué)習(xí)者學(xué)習(xí)行為的挖掘,發(fā)現(xiàn)用戶的瀏覽模式,自動(dòng)重構(gòu)頁(yè)面之間的鏈接,以符合用戶的訪問(wèn)習(xí)慣。個(gè)性化、智能化遠(yuǎn)程教育系統(tǒng)模型將涉及到課件知識(shí)庫(kù)、學(xué)習(xí)行為數(shù)據(jù)庫(kù)、個(gè)人學(xué)習(xí)記錄數(shù)據(jù)庫(kù)這三個(gè)大型數(shù)據(jù)庫(kù),還需要構(gòu)建智能學(xué)習(xí)系統(tǒng)、個(gè)性界面生成系統(tǒng)、智能

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論