基于數(shù)據(jù)挖掘技術(shù)優(yōu)化高校貧困生認定體系獲獎科研報告_第1頁
基于數(shù)據(jù)挖掘技術(shù)優(yōu)化高校貧困生認定體系獲獎科研報告_第2頁
基于數(shù)據(jù)挖掘技術(shù)優(yōu)化高校貧困生認定體系獲獎科研報告_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

基于數(shù)據(jù)挖掘技術(shù)優(yōu)化高校貧困生認定體系獲獎科研報告摘

要:近些年高職院校招生政策的逐漸放寬,來自貧困地區(qū)的高職院校大學(xué)生越來越多,增加了高校貧困生資助部門的難度和工作量。傳統(tǒng)的貧困生認定方式需要學(xué)生出具家庭貧困證明,然后在學(xué)校填寫貧困生申請表,再由學(xué)校組織評議小組對申請人進行評議,然而學(xué)生填寫的家庭貧困證明經(jīng)常出現(xiàn)虛假申報的情況,資助管理部門并不能真實掌握學(xué)生家庭情況。因此,如何在缺乏真實家庭情況,以及助學(xué)金金額有限的背景下,將貧困助學(xué)金發(fā)放到最需要幫助的學(xué)生手上成為亟待解決的問題。

關(guān)鍵詞:數(shù)據(jù)挖掘;貧困生測評;校園一卡通

1.引言

高職貧困學(xué)生主要是指高等職業(yè)院校家庭經(jīng)濟較為困難,難以支付起學(xué)費、生活費及學(xué)雜費,且不能保障正常生活的學(xué)生,根據(jù)其情況可以分為特別貧困學(xué)生和普通貧困學(xué)生。高職貧困生資助評定成為高學(xué)生管理工作中的熱點問題。由于貧困助學(xué)金的發(fā)放關(guān)系到貧困學(xué)生的切身利益,因此有著重要的實際意義。

目前從總體情況來看,在實際的貧困學(xué)生認定過程中,輔導(dǎo)員和學(xué)生都過度依賴事情的表面現(xiàn)象,存在相當(dāng)大的盲目性,此外,也存在相當(dāng)大的主觀意識判斷,導(dǎo)致錯判與誤判等情況發(fā)生。因此,在進行貧困學(xué)生認定過程中,我們需要采取多種方式來進行判定,盡量減少在評定過程中出現(xiàn)的人為因素。

2.一卡通消費數(shù)據(jù)的研究價值

通過對一卡通中的學(xué)生消費數(shù)據(jù)分析,輔助貧困生的辨認,找出數(shù)據(jù)之間存在的聯(lián)系,是本文研究的目的。目前在大部分高職中,食堂就餐、校園超市、水費、電費、圖書館等只支持刷卡方式,不支持現(xiàn)金支付,因此,一卡通的消費數(shù)據(jù)具有很強的代表性,這些數(shù)據(jù)具有很好的研究價值,通過分析數(shù)據(jù)可以了解大學(xué)生的消費習(xí)慣和消費行為。

以瀘州職業(yè)技術(shù)學(xué)院為例,我校大學(xué)生作為一類消費群體,有很大的消費數(shù)據(jù),通過對其消費數(shù)據(jù)進行挖掘和分析,就會發(fā)現(xiàn)其中的一些規(guī)律和問題,了解學(xué)生的貧困情況,對貧困生的評定、獎學(xué)金的設(shè)定、助學(xué)金的設(shè)定提供很好的依據(jù),對判別學(xué)生是否為貧困生具有非常重大的意義。

3.數(shù)據(jù)挖掘過程及算法應(yīng)用

數(shù)據(jù)挖掘一般由數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)準備、數(shù)據(jù)分析、結(jié)果分析、知識同化五個部分組成。數(shù)據(jù)挖掘通過對導(dǎo)入到數(shù)據(jù)倉庫中的數(shù)據(jù)進行挖掘,找出數(shù)據(jù)之間的關(guān)系,根據(jù)其存在的某種關(guān)系,對未來的數(shù)據(jù)進行預(yù)測。

截至2020年,瀘州職業(yè)技術(shù)學(xué)院全日制在校生約為14000人左右,在學(xué)校的一卡通系統(tǒng)產(chǎn)生的數(shù)據(jù)中,數(shù)據(jù)信息都是由很多選項組成,如學(xué)生學(xué)號、姓名、消費數(shù)據(jù)等,在對數(shù)據(jù)進行挖掘時,需要對相關(guān)的數(shù)據(jù)進行相應(yīng)的處理,去除一些不必要的信息。本文主要是進行對學(xué)校貧困學(xué)生進行評定,因此選用的是與學(xué)生的消費相關(guān)的數(shù)據(jù)項,對于學(xué)生性別、年齡等與貧困相關(guān)不大的數(shù)據(jù)項消除掉。

在一卡通系統(tǒng)中,各個子系統(tǒng)分別產(chǎn)生相關(guān)的數(shù)據(jù),如果對其中的數(shù)據(jù)進行挖掘,需要通過一定的處理,首先將一卡通的數(shù)據(jù)進行分析提取,可以分為幾張表:學(xué)生信息表、學(xué)生就餐消費表、學(xué)生閱讀情況表、學(xué)生成績表等數(shù)據(jù)表作為源數(shù)據(jù),從中提取出用來與貧困認定有關(guān)的數(shù)據(jù)項,對這些數(shù)據(jù)進行相應(yīng)的格式轉(zhuǎn)換,為下一步的挖掘工作打下基礎(chǔ)。

在數(shù)據(jù)表中,消費金額是一個數(shù)值數(shù)據(jù),而關(guān)聯(lián)規(guī)則不能夠處理相關(guān)的數(shù)值數(shù)據(jù),在對它進行關(guān)聯(lián)之前,需要對這個項進行離散型轉(zhuǎn)換,使之能被操作,再對轉(zhuǎn)換后的數(shù)據(jù)進行排序,使關(guān)系數(shù)據(jù)變換成相關(guān)的事務(wù)數(shù)據(jù)。

在對數(shù)據(jù)進行相應(yīng)的轉(zhuǎn)換后,就可以應(yīng)用相應(yīng)的挖掘關(guān)聯(lián)規(guī)則進行操作了,在操作的過程中,還需要對其進行最小可信度和支持度進行設(shè)置,如若支持度設(shè)置過高,則在挖掘過程中使用的挖掘規(guī)則較少,則挖掘出結(jié)果越快。本文對數(shù)據(jù)進行挖掘采用的是FP-Growth算法和INFP-Growth算法,通過使用這兩種算法對待挖掘的數(shù)據(jù)進行關(guān)聯(lián)規(guī)則挖掘,在這里,我們設(shè)置最小支持度的值為2,可信度為0.5,生成的規(guī)則如下:

(1)對于學(xué)生成績較好的同學(xué),如班級排名前十,則可以申請助學(xué)貸款,如若家庭情況困難,則可申請三年的助學(xué)貸款(支持度為2,可信度為1)。

(2)對于戶籍為農(nóng)村的學(xué)生,且家庭情況為特困戶,則可申請年限兩年的助學(xué)貸款(支持度為2,可信度為0.95)。

(3)需要申請助學(xué)貸款與申請勤工助學(xué)的學(xué)生(支持度為2,可信度為0.35)。

(4)申請?zhí)乩Ъ吧暾埱诠ぶ鷮W(xué)(支持度為0.6,可信度為0.23)。

通過使用關(guān)聯(lián)規(guī)則的方法對數(shù)據(jù)進行分析,可以得出貧困學(xué)生的消費情況、參與勤工助學(xué)活動、學(xué)習(xí)成績之間的關(guān)系,這些關(guān)系可以為學(xué)校對學(xué)生的貧困工作認定提供一些幫助。

在對可信度和支持度進行選取的過程中,一定要根據(jù)實際的情況來選取,這樣才會得到所需的結(jié)果,如果選取的值過于小,在執(zhí)行的過程中會產(chǎn)生很多多余的規(guī)則,不僅會影響執(zhí)行的效率,得到的結(jié)果也可能是不準確的,但如果選用的值過大,則會產(chǎn)生生成的規(guī)則較少的情況,會造成規(guī)則設(shè)置不準確,導(dǎo)致相關(guān)數(shù)據(jù)漏網(wǎng)情況。

4.結(jié)束語

本文主要針對高職貧困生評價問題,結(jié)合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論