版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、诺基亚第三代移动通信系统分類範例一:鳶尾花分類應用分類範例二:客戶信用風險評估分類範例四:乳腺癌醫學診斷應用 4 2 3 12.資料分類和CR&T模型分類範例三:部署客戶信用模型诺基亚第三代移动通信系统資料分類範例 一節點【C5.0】檔案150 records 5 fields诺基亚第三代移动通信系统決策樹基本概念Quinlan在1986年所提出的ID3演算法後,因其無法處理連續屬性的問題且不適用在處理大的資料集,因此1993又發表的前身,直到現在所使用的決策樹演算法演算法的結果可產生決策樹及規則集兩種模型,並且依最大資訊增益的欄位來切割樣本,並重複進行切割直到樣本子集不能再被分割爲止【C5.
2、0】模型節點能處理連續型變數與類別型的變數資料,因此需要至少一個【輸入】的輸入欄位以及一個(或以上)的【目標】欄位,且目標欄位必須是類別型變數诺基亚第三代移动通信系统決策樹圖例诺基亚第三代移动通信系统鳶尾花分類應用這個鳶尾花(Iris)資料集是非常著名的生物資訊資料集之一,取自美國加州大學歐文分校的機械學習資料庫,主要是使用於分類(classification) 演算法的測試,非常符合本章的決策樹演算法來練習。資料的筆數計有150筆,共有五個欄位:1. 花萼長度(Sepal Length):計算單位是公分。2. 花萼寬度(Sepal Width):計算單位是公分。3. 花瓣長度(Petal L
3、ength):計算單位是公分。4. 花瓣寬度(Petal Width):計算單位是公分。5. 類別(Class):可分為Setosa,Versicolour和Virginica三個品種诺基亚第三代移动通信系统【變數檔案】節點诺基亚第三代移动通信系统【類型】節點诺基亚第三代移动通信系统【分割區】節點诺基亚第三代移动通信系统【C5.0】模型輸出決策樹诺基亚第三代移动通信系统執行後產生模型金磚(nugget)诺基亚第三代移动通信系统檢視決策樹及預測變數重要性诺基亚第三代移动通信系统由左至右的決策樹模型诺基亚第三代移动通信系统查看摘要設定值诺基亚第三代移动通信系统計算每一筆資料的預測信賴度诺基亚第三代
4、移动通信系统【C5.0】模型輸出規則組集诺基亚第三代移动通信系统檢視規則組集及預測變數重要性诺基亚第三代移动通信系统輸出測試資料的矩陣和分析诺基亚第三代移动通信系统資料分類範例二節點【C5.0】檔案4117 records 12 fields诺基亚第三代移动通信系统【EXCEL】節點诺基亚第三代移动通信系统【過濾器】節點诺基亚第三代移动通信系统【導出】節點诺基亚第三代移动通信系统【導出】節點诺基亚第三代移动通信系统【分割區】節點诺基亚第三代移动通信系统【C5.0】節點诺基亚第三代移动通信系统【矩陣】節點诺基亚第三代移动通信系统外觀加上百分比诺基亚第三代移动通信系统建模後使用測試資料诺基亚第三代
5、移动通信系统測試資料的矩陣和分析結果诺基亚第三代移动通信系统資料分類範例三節點【C5.0】檔案 12470 records 10 fields诺基亚第三代移动通信系统模型的部署部署(deployment)就是將模型運用在新資料上,亦即先訓練舊資料再以新資料預測舊資料檔Risk有4117 筆資料,已有分類好的RISK欄位,某欄名storecar,loan範圍0-3新資料檔RiskNew有12470筆資料,但沒有RISK欄位,storecards需改名成storecar ,又如果有一筆資料loan=5?因為新資料檔沒有RISK欄位,因此產生的模型就無法產生混淆矩陣和正確率分析的結果诺基亚第三代移动
6、通信系统訓練Risk後再以RiskNew預測模型诺基亚第三代移动通信系统所產生模型的表格诺基亚第三代移动通信系统模型的分配圖诺基亚第三代移动通信系统模型的直方圖诺基亚第三代移动通信系统資料分類範例四節點【CR&T】檔案569 records 32 fields诺基亚第三代移动通信系统分類迴歸樹基本概念分類迴歸樹(C&R Tree, Classification and Regression Tree)由Breiman在1984年提出C&R Tree以反覆運算的方式,由根部開始反覆建立二元分支樹,直到樹節點中的同質性達到某個標準,或觸發反覆運算終止條件為止C&R Tree的輸出欄位既可以是數值型
7、資料,也可以是類別型資料诺基亚第三代移动通信系统乳腺癌醫學診斷應用本範例檔的乳腺癌(Breast Cancer Diagnostic)的診斷資料,取自美國加州大學歐文分校的機械學習資料庫Wisconsin大學臨床研究中心於1995年蒐集569例乳腺癌症的病患實際診斷資料,診斷的方式是對於可疑的乳腺腫塊使用細針穿刺的技術 (Fine Needle Aspirate, FNA)蒐集數位化圖像並加以計算诺基亚第三代移动通信系统乳腺癌醫學診斷欄位說明的欄位計有32項,分別是1. 識別號碼(ID number):識別號碼2. 診斷結果(Diagnosis):惡性(M = malignant)、良性(B = benign)3-32. 這30項資料是計算每一個細胞核的真實資料測量值,包含以下的內容:半徑(radius)、紋理(texture)周長(perimeter)、範圍(area)、平滑度(smoothness)、緊密度(compactness)、凹陷部分的程度(concavity)、凹陷部分的數量(concave points) 、對稱度(symmetry) 、碎型維度(fractal dimension)诺基
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 浙教版2021-2022学年度七年级数学上册模拟测试卷 (742)【含简略答案】
- Matlystatin-A-生命科学试剂-MCE
- 浙教版2021-2022学年度七年级数学上册模拟测试卷 (692)【含简略答案】
- 教师成长课程设计
- 论文的课程设计
- 教工管理系统课程设计
- 教室室分配系统课程设计
- 教学楼照明配电课程设计
- 教培机构 课程设计
- 教务管理系统 课程设计
- 北京盈科律师所管理制度
- 道法友谊的真谛+课件-2024-2025学年统编版道德与法治七年级上册
- 期中 (试题) -2024-2025学年外研版(三起)英语六年级上册
- 电力公司临时用工安全管理办法(标准版)
- 山东省济南市历下区2023-2024学年五年级上学期月考英语试卷(12月份)
- 江苏省高速公路设计优化指导意见
- 金融交易课程设计实训
- 2024人教版道德与法治三年级上册第四单元:家是最温暖的地方大单元整体教学设计
- 房子两年后过户协议书模板
- 毕业研究生登记表(适用于江苏省)
- 会诊制度培训总结
评论
0/150
提交评论