版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学信息学论文spss分类树应用医学信息学论文spss分类树应用第1页内容基础概念快速入门知识拓展医学信息学论文spss分类树应用第2页一、基础概念什么是分类树?对资料要求用途怎样确定变量主要性、相互关系、交互作用分类树优缺点分类树运算法则医学信息学论文spss分类树应用第3页1.什么是分类树?分类树产生一个基于树状分类模型;它将研究对象分组,能够依据自变量预测因变量;是探索性和证实性分类分析有效工具。医学信息学论文spss分类树应用第4页2.对资料要求:任何类型不要求解释变量Xi和结果变量Y含有某种特定分布。允许不一样数据类型解释变量一起进入模型,能够使用不一样数据类型结果变量。传统方法对资料类型和分布有相对严格要求(如多元线性回归);不易处理共线性问题和多水平变量之间复杂交互作用(如logistic回归)。医学信息学论文spss分类树应用第5页
依据解释变量对结果变量进行分类和预测。识别影响原因间交互作用3.用途
医学信息学论文spss分类树应用第6页1352名少年儿童肥胖症危险原因儿童肥胖症
高危人群和低危人群医学信息学论文spss分类树应用第7页4.变量主要性及
变量间相互关系怎样确定?解释变量主要性表现为该解释变量出现在树干起始部位,或离起始部位很靠近;另首先,主要性还表现为同一解释变量屡次在模型中出现。利用解释变量之间上下关系分析解释变量间是否有可能存在交互作用。假如一些解释变量在单原因分析时与结果变量之间无显著关联,而在模型中一些局部有显著效应,提醒这些解释变量之间可能存在交互作用。医学信息学论文spss分类树应用第8页5.分类树优缺点是一个新多原因分析方法,其结果直观、明了、易于解释,能有效处理缺失数据及变量之间共线性,对资料分布无任何要求。只适合大样本资料。假如结果变量是连续性资料,样本含量能够小一些。假如结果变量是分类资料,样本含量要大。医学信息学论文spss分类树应用第9页6.运算法则
CHAID结果变量:分类资料(最常见)、计量或等级资料ExhaustiveCHAID:结果变量:分类资料(最常见)、计量或等级资料CRT结果变量:计量资料(最常见)、分类或等级资料QUEST结果变量:仅用于分类资料医学信息学论文spss分类树应用第10页二、快速入门QuickStart1352名少年儿童肥胖症危险原因银行对客户信贷风险评定学生压力影响原因分析医学信息学论文spss分类树应用第11页(一)结果变量是分类资料
例11352名少年儿童肥胖症危险原因性别:男、女年纪组:7-9岁,10-12岁,13-15岁,≥16岁胆固醇:<5.18(mmol/L),≥5.18(mmol/L)甘油三脂:<0.50(mmol/L),≥0.50(mmol/L)医学信息学论文spss分类树应用第12页1.数据文件医学信息学论文spss分类树应用第13页2.SPSS过程医学信息学论文spss分类树应用第14页单击OK(无须在此定义变量属性)医学信息学论文spss分类树应用第15页右键单击变量,定义变量类型医学信息学论文spss分类树应用第16页定义数据测量类型Measure计数资料:Nominal等级资料:Ordinal计量资料:Scale医学信息学论文spss分类树应用第17页定义变量“性别”Nominal医学信息学论文spss分类树应用第18页定义变量“年纪组”Ordinal医学信息学论文spss分类树应用第19页定义变量“胆固醇”Nominal
定义变量“甘油三脂”Nominal
定义变量“肥胖症”Nominal医学信息学论文spss分类树应用第20页肥胖症DependentVariable
性别、年纪组、胆固醇、甘油三脂IndependentVariable
GrowingMethodExhaustiveCHAID医学信息学论文spss分类树应用第21页单击OK医学信息学论文spss分类树应用第22页3.主要结果医学信息学论文spss分类树应用第23页例2银行对客户信贷风险评定
Abankwantstocategorizecreditapplicantsaccordingtowhetherornottheyrepresentareasonablecreditrisk.Basedonvariousfactors,includingtheknowncreditratingsofpastcustomers,youcanbuildamodeltopredictiffuturecustomersarelikelytodefaultontheirloans.医学信息学论文spss分类树应用第24页数据文件医学信息学论文spss分类树应用第25页2.ToObtainClassificationTrees
AnalyzeClassifyTree...医学信息学论文spss分类树应用第26页3.DefineVariableProperties医学信息学论文spss分类树应用第27页定义数据测量类型Measure计数资料:Nominal等级资料:Ordinal计量资料:Scale医学信息学论文spss分类树应用第28页ClassificationTreedialogbox
DefineVariableProperties医学信息学论文spss分类树应用第29页可对变量设置变量值标签医学信息学论文spss分类树应用第30页可更改变量类型和设置变量值标签医学信息学论文spss分类树应用第31页单击OK医学信息学论文spss分类树应用第32页4.分类树主对话框医学信息学论文spss分类树应用第33页(1)SelectingCategories医学信息学论文spss分类树应用第34页医学信息学论文spss分类树应用第35页GrowingMethod:CHAID医学信息学论文spss分类树应用第36页(2)Forcethefirstvariable
Influencevariable
普通不选择这2项医学信息学论文spss分类树应用第37页(3)Validation是否需要交叉核实和分开2样本核实?默认:不需要医学信息学论文spss分类树应用第38页
(4)Criteria
GrowthLimits、CHAID、Intervals医学信息学论文spss分类树应用第39页TreeDepth:Automatic
ParentNode:400;ChildNode:200医学信息学论文spss分类树应用第40页CriteriaCHAID,默认
拆分及合并检验水准均定位0.05医学信息学论文spss分类树应用第41页CriteriaIntervals,对连续性变量,默认分为10个区间医学信息学论文spss分类树应用第42页(5)
Outputtree
Treeintableformat:非默认,可不选医学信息学论文spss分类树应用第43页OutputStatistics医学信息学论文spss分类树应用第44页OutputPlots医学信息学论文spss分类树应用第45页5.主要结果CHAID,ExhaustiveCHAID医学信息学论文spss分类树应用第46页ModelSummary:统计了主要操作医学信息学论文spss分类树应用第47页医学信息学论文spss分类树应用第48页TreeEditor医学信息学论文spss分类树应用第49页改变图形方向医学信息学论文spss分类树应用第50页增大图形医学信息学论文spss分类树应用第51页单击“-”或右键隐蔽子结
HideChildren医学信息学论文spss分类树应用第52页TreeTable(非默认,可不选)医学信息学论文spss分类树应用第53页TargetCategory:Bad
子结1、8对区分Bad区分作用大
Bad百分比41.4%(1020/2464)
Index=Response/41.4*100%医学信息学论文spss分类树应用第54页246=2464*10%;493=2464*20%;
如累计GainPercent快速靠近100%,
则分类和预测效果好医学信息学论文spss分类树应用第55页横坐标为调查总例数百分比,纵坐标为目标分类如bad百分比。医学信息学论文spss分类树应用第56页Foragoodmodel,theindexvalueshouldstartwellabove100%,remainonahighplateauasyoumovealong(说明区分度高节点多),andthentrailoffsharplytoward100%.Foramodelthatprovidesnoinformation,thelinewillhoveraround100%fortheentirechart.医学信息学论文spss分类树应用第57页从应答率或检出率角度,说明各节点作用。假如多数节点应答率靠近41.4%(1020/2464,没有建立模型情况),则说明模型效果不好。医学信息学论文spss分类树应用第58页模型评价:总正确率是79.5%,Bad正确率是65.2%。医学信息学论文spss分类树应用第59页小结:Dependent为分类变量操作医学信息学论文spss分类树应用第60页单击OK医学信息学论文spss分类树应用第61页选择CHAID;单击Categories医学信息学论文spss分类树应用第62页BadTarget医学信息学论文spss分类树应用第63页OutputTree医学信息学论文spss分类树应用第64页OutputStatistics医学信息学论文spss分类树应用第65页OutputPlots医学信息学论文spss分类树应用第66页是否需要交叉核实和分开2样本核实?
默认:不需要医学信息学论文spss分类树应用第67页CriteriaGrowthLimits
默认类别分3层;母结100,子结50;本例样本大,调整为400,200医学信息学论文spss分类树应用第68页如有过多Missingdata:
用CRTorQUESTmethods取代医学信息学论文spss分类树应用第69页(二)结果变量是连续资料
医学信息学论文spss分类树应用第70页学生压力影响原因分析(61例)性别:男;女专业:会计系;注册会计师系专业满意:很满意;满意;普通;不满意学业成绩:很好;好;普通;较差压力总分:0~18医学信息学论文spss分类树应用第71页1.数据文件医学信息学论文spss分类树应用第72页2.SPSS过程医学信息学论文spss分类树应用第73页单击OK医学信息学论文spss分类树应用第74页定义变量“性别”、“系”Nominal
定义变量“专业满意”、“学业成绩”Ordinal
医学信息学论文spss分类树应用第75页GrowingMethod:CRT;
单击Criteria医学信息学论文spss分类树应用第76页ParentNode:20;ChildNode:10医学信息学论文spss分类树应用第77页单击OK医学信息学论文spss分类树应用第78页3.主要结果ParentNodeChildNode医学信息学论文spss分类树应用第79页模型构建主要参数以下应变量为分类资料,选取ExhaustiveCHAID或CHAID算法。拆分及合并检验水准普通设置为0.05分类树最大生长深度定为几层(默认为3层,可最多设定8层)?设定母结点和子结点中最少例数分别为多少(默认:母结点100;子结点50)?医学信息学论文spss分类树应用第80页知识拓展
对乳腺癌患者死亡相关原因进行分类树分析医学信息学论文spss分类树应用第81页主要操作医学信息学论文spss分类树应用第82页主要结果医学信息学论文spss分类树应用第83页在Word中重新绘制图形≤2病理肿瘤大小(cm)>2Node1死亡率0.9%观察例数326Node4死亡率19.1%观察例数89Node5死亡率7.0%观察例数86Node3死亡率6.0%观察例数439Node0死亡率6.0%观察总例数1207Node2死亡率=4.1%观察例数267≤1.01.1~1.41.5~3.0>3.0未检测Node6死亡率6.5%观察例数370Node7死亡率15.9%观察例数69腋下淋巴结转移个数图1乳腺癌患者死亡相关原因分类树结果医学信息学论文spss分类树应用第84页分类树方法及其结果文字描述方法结果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论