学生学习成效决策树分析_第1页
学生学习成效决策树分析_第2页
学生学习成效决策树分析_第3页
学生学习成效决策树分析_第4页
学生学习成效决策树分析_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

學生學習成效決策樹分析以台中市文山國小學童為例

報告:賴慶霖報告架構基礎概念簡介資料探勘技術決策樹演算法操作實例介紹資料來源屬性資料分組與切割結果分析關聯法則推估資料探勘技術資料探勘監督式學習模型非監督式學習模型屬性選擇與資料轉化分群樹型結構關聯模式規則誘發決策樹(類別型屬性)迴歸樹(連續型屬性)C4.5/C5ID3CARTCARTM5CN2ITRULECubist決策樹決策樹:決策樹是一種簡單監督式學習程式,可以將輸入範例資料經學習建立成決策樹。是將一個新的範例,歸類至一個明確的類別。將目前的行為分類,而非預測未來的類型。獨立變數相依變數演算法常用的決策樹演算法:

ID3,C4,C4.5,C5,CART(二分),CHAID(只有類別),QUEST決策樹訓練用以建立決策樹模型(例子)的樣本稱為訓練資料(Trainingdata);為了測試模型正確分類的資料稱為測試集(Testset)–都已分類過了。訓練資料(Trainingdata)中,再劃分出1/3作為inside-testing用。最主要的用意是為了避免Overftinig的狀況發生。資料來源說明動機:希望對校園學童學習成就,做進一步資料的探勘與分析,透過若干屬性的比重權宜記分,企圖建立一個模型,以作為決策參考之用。資料取得:就過去所學以及目前職場的背景。在資料取得的便利考量。以台中市文山國民小學五年級的學習成就為分類資料。分類屬性總表分類屬性,歸納如下表:

表1-台中市文山國小五年級學習成就屬性分類家庭環境financialcondition管教方式disciplineway學習態度learningattitude智商高低IQ課後補習coach學習成就achievementType:類別Type:類別Type:類別Type:類別Type:類別Type:類別Distinct:3Distinct:3Distinct:2Distinct:3Distinct:2Distinct:2goodstrictpositivesuperioryesgoodgeneraldemoracynegativecommonnobadbadlooseinferior資料說明

文山國小五年級樣本數為312人,運用問卷方式取的學生的背景屬性,有項回收問卷數目120份,根據學生實際的學習成效製表,資料建置使用MicrosoftExcel,並將結果轉存為CSV檔(附表一)。資料說明原計畫資料切割如下:1/3為TestSet2/3*2/3

為TrainingSet2/3*1/3為ValidationSetWEKA內部並無以上機制,因此修正如下2/3為TrainingSet預計有80筆資料

(檔案training.csv)1/3為TestSet預計有40筆資料

(檔案testing.csv)訓練資料DATAFinancialconditionDisciplinewayLearningattitudeIQcoachachievementgoodstrictpositivesuperioryesgoodgooddemocracypositivesuperioryesgoodgoodloosepositivesuperioryesgoodgoodstrictnegativesuperioryesgoodgooddemocracynegativesuperioryesgoodgoodloosenegativesuperioryesbadgoodstrictpositivecommonyesgoodgooddemocracypositivecommonyesgoodgoodloosepositivecommonyesgoodgoodstrictnegativecommonyesgood共有120筆,不一一列出開啟Weka選擇Explorer選擇Openfile相關屬性Visualsize選擇Classifier並點選Trees資料夾選用J48的演算模式經不斷調整測試以便發現出現最大正確率的是當值TrainingTree修剪前TrainingTree經過修剪後Output原始0:J48-C0.25-M2微調1:J48-C0.2-M2微調2:J48-C0.1-M2微調3:J48-C0.52-M5

(*得到最佳模型)自下一頁載入TestingData,進行測試。存成Arff的格式方便日後讀取TestingOutput測試結果:J48-C0.25-M2CorrectlyClassifiedInstances2357.5%IncorrectlyClassifiedInstances1742.5%Kappastatistic

0.1099Meanabsoluteerror

0.431Rootmeansquarederror

0.5589Relativeabsoluteerror

94.1176%Rootrelativesquarederror

104.3913%TotalNumberofInstances

40

另一種測試方法使用CrossValidation或是PercentageSplit的方式進行資料訓練。將訓練模型儲存。開啟外部測試資料,並將原先儲存的模型給load進來。執行出新的結果。(操作如下面解說)Associatormodel方法:Apriori-N10-T0-C0.9-D0.05

-U1.0-M0.1-S-1.0-c-1Minimumsupport:0.1(12instances)

(我把所有資料丟進去做關聯,共120筆)Minimummetric<confidence>:0.9Numberofcyclesperformed:18Generatedsetsoflargeitemsets:SizeofsetoflargeitemsetsL(1):15SizeofsetoflargeitemsetsL(2):88SizeofsetoflargeitemsetsL(3):43Bestrulesfounddisciplineway=looselearningattitude=negative18==>achievement=bad18conf:(1)learningattitude=negativeIQ=inferior18==>achievement=bad18conf:(1)financialcondition=goodIQ=inferior12==>achievement=bad12conf:(1)financialcondition=badIQ=inferior12==>achievement=bad12conf:(1)disciplineway=looseIQ=inferior12==>achievement=bad12

conf:(1)financialcondition=badlearningattitude=negative20==>achievement=bad19conf:(0.95)financialcondition=badcoach=no20==>achievement=bad19conf:(0.95)IQ=inferiorcoach=no20==>achievement=bad19conf:(0.95)IQ=inferior39==>achievement=bad37conf:(0.95)IQ=inferiorcoach=yes19==>achievement=bad18conf:(0.95)結論外部資料測試的結果,準確度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论