前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘的貧困助學(xué)金評定方法分析范文,希望能給你帶來靈感和參考,敬請閱讀。
【摘要】貧困學(xué)生的教育資助受到了國家、社會、學(xué)校的高度重視,為促進(jìn)享受教育資源的公平性,需要建立更加完善的貧困生助學(xué)金發(fā)放制度,避免出現(xiàn)需要資助的學(xué)生未得到資助,而不需要資助的學(xué)生得到資助。通過大數(shù)據(jù)挖掘,結(jié)合某高校一卡通及貧困助學(xué)金發(fā)放數(shù)據(jù),利用K-means聚類分析模型,對學(xué)校的消費方式進(jìn)行分析,得到最低消費人群占比25.5%,符合貧困生資助比例,但該校的資助比例為21%,未達(dá)到資助覆蓋面。由此方法構(gòu)建的預(yù)測模型,可以為學(xué)校貧困生精準(zhǔn)資助提供幫助。
【關(guān)鍵詞】數(shù)據(jù)挖掘;貧困生;分類預(yù)測;貧困資助
由于社會區(qū)域經(jīng)濟(jì)發(fā)展差異及地理環(huán)境等歷史原因,部分地區(qū)經(jīng)濟(jì)仍然不發(fā)達(dá),貧困人口較多,特別是中國西部地區(qū)。這些貧困家庭中,又不少勤奮好學(xué)的學(xué)子,考上了大學(xué),而其本人和家庭難以支付學(xué)生在校期間學(xué)費、生活費等,為不讓每一個學(xué)子因貧困失學(xué),國家相關(guān)政府部門高度重視,近年來投入了大量的資金用于資助貧困學(xué)生,使得莘莘學(xué)子能圓滿完成學(xué)業(yè)[1]。而在對貧困生的認(rèn)定在,也需要一系列相關(guān)的政策好和措施,從而才能起到真正幫助貧困學(xué)生的目的。建立一個完善的貧困學(xué)生資助體系,有效的降低因家庭貧困而造成學(xué)生失學(xué)的情況發(fā)生。目前諸多學(xué)校不僅僅依靠貧困補助,同時也已經(jīng)制定了許多辦法和措施來積極解決貧困學(xué)生的經(jīng)濟(jì)來源問題,比方各類的獎學(xué)金、助學(xué)金、勤工儉學(xué)崗位等,進(jìn)一步擴(kuò)大對貧困學(xué)生的資助額[2]。為保障貧困學(xué)生認(rèn)定的公平、公正和公開,提高貧困學(xué)生資助工作的精準(zhǔn)度,一方面需要學(xué)校在資助預(yù)算上分配準(zhǔn)確,另一方面也需要對貧困學(xué)生的認(rèn)定更加精確,就調(diào)研情況來看,現(xiàn)階段許多學(xué)校對助學(xué)金的評定分兩種情況,一種是在新生入學(xué)前通過學(xué)生家庭情況的調(diào)研,綜合考慮來評定助學(xué)金等級,另一種是根據(jù)在校學(xué)生的申請和各學(xué)院的評定來確定助學(xué)金的等級。雖然助學(xué)金的評價體系日趨完善,但仍然有一些不盡人意的地方,例如有些需要受到資助的學(xué)生并未獲得資助,少數(shù)并不需要自身的學(xué)生卻得到了補助等。因此,精準(zhǔn)的資助同樣成為了現(xiàn)階段需要解決的問題。
一、學(xué)生行為數(shù)據(jù)分析
(一)數(shù)據(jù)來源學(xué)生一卡通數(shù)據(jù)及全校助學(xué)金發(fā)放情況,一般由于隱私保護(hù)這類數(shù)據(jù)較難查詢和獲得,因此,通過某官網(wǎng),獲取了某高校2016~2017年助學(xué)金發(fā)放情況,以及學(xué)生一卡通行為數(shù)據(jù)及學(xué)生的學(xué)習(xí)成績及排名情況。數(shù)據(jù)類型包括:圖書館借閱收集數(shù)據(jù)、圖書館門禁數(shù)據(jù)、一卡通數(shù)據(jù)、成績數(shù)據(jù)和助學(xué)金數(shù)據(jù)。(二)數(shù)據(jù)初探對選取的5個數(shù)據(jù)進(jìn)行說明如下:1.圖書館借閱數(shù)據(jù)和門禁數(shù)據(jù)可以反映學(xué)生在校學(xué)習(xí)情況,分析學(xué)生在課后的學(xué)習(xí)興趣和學(xué)習(xí)態(tài)度,數(shù)據(jù)日期和時間非常準(zhǔn)確,圖書編號缺失率僅1%,圖書名完整,不影響數(shù)據(jù)分析。2.學(xué)生的成績數(shù)據(jù)排名為學(xué)生所有數(shù)據(jù)的成績加權(quán)求和,然后除于總學(xué)分,并按照學(xué)生所在學(xué)院進(jìn)行排名。3.助學(xué)金補償人數(shù)為學(xué)生總?cè)藬?shù)的21%,基本達(dá)到了助學(xué)金覆蓋學(xué)生20%~30%的要求,分為三檔:4000元、3000元、2000元,比例分別4%、7%、10%。4.學(xué)生一卡通數(shù)據(jù)量較大,且包含面較廣,基本包括:POS機刷卡消費、卡充值、存轉(zhuǎn)賬、換卡補卡等,其中POS機刷卡消費為頻率最高的部分,包括:超市購物、食堂、淋雨、洗衣房、校車、圖書館、校醫(yī)院等。
二、分類預(yù)測
(一)基于K-means的聚類分析該分析方法是將數(shù)據(jù)分成有意義或者不同特征的組,K-means是其中一種動態(tài)聚類分析方法,將多個樣本點依據(jù)某個特征來進(jìn)行分離,使每一類樣本都是聚合的,并且每一類之間都有很好的差異性[3-4]。具體步驟如下:1.按照某種規(guī)則將樣本分為K類,計算該類重心,并作為初始凝聚點。2.計算出每個樣本點與各初始凝聚點的相似性,并將相似度進(jìn)行歸類。3.重復(fù)步驟二,將所有樣本進(jìn)行處理,使得所有樣本不再分配。相似度計算公式見式1。(式1)該方法的優(yōu)勢是能夠良好的將高消費人群和低消費人群區(qū)分開,使得能夠更好的分析助學(xué)金發(fā)放的準(zhǔn)確性。(二)分析成果根據(jù)消費方式將學(xué)生分為4類,最低消費群體(A類)、較低消費群體(B類)、較高消費群體(C類)和高消費群體(D類),由此來拉開兩個極端群體的差異.利用K-means聚類得到消費最低的A類人群比例為25.5%,因此,學(xué)校應(yīng)該擴(kuò)大貧困資助比例。聚類分析成果見表2。其中消費水平最低的909人應(yīng)當(dāng)被認(rèn)為貧困生,其中721位沒有受到資助。消費水平較高的238人,其中有43人受到資助。消費水平較高的D類中,僅校園卡平均消費已經(jīng)較高,不應(yīng)再認(rèn)定為需要資助的學(xué)生[6]。
三、結(jié)語
應(yīng)用K-means聚類分析方法判定助學(xué)是否存在誤判的情況,能夠較為全面的反應(yīng)學(xué)生在學(xué)校的消費水平和經(jīng)濟(jì)能力。
參考文獻(xiàn)
[1]郭兆云,黃文婷.影響高校貧困生認(rèn)定公平性的因素及對策[J].學(xué)校黨建與思想教育,2016,(18):71-72.
[2]宋美喆.基于模糊綜合評價方法的高校貧困生認(rèn)定研究[J].黑龍江高教研究,2016,(07):16-20.
[3]鄧巍偉.基于貧困生認(rèn)定的高校資助精準(zhǔn)化研究[J].長沙民政職業(yè)技術(shù)學(xué)院學(xué)報,2016,(01):110-112.
[4]楊良斌.數(shù)據(jù)挖掘領(lǐng)域研究現(xiàn)狀與趨勢的可視化分析[J].圖書情報工作,2015,(S2):142-147.
[5]賀瑤,王文慶,薛飛.基于云計算的海量數(shù)據(jù)挖掘研究[J].計算機技術(shù)與發(fā)展,2013,(02):69-72.
[6]雷燕,隗送爽.試析高校貧困生認(rèn)定中存在的問題和對策[J].成都紡織高等專科學(xué)校學(xué)報,2010,(04):25-27+50.
作者:李瑾 單位:西安石油大學(xué) 陜西財經(jīng)職業(yè)技術(shù)學(xué)院