下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Logistic回归主要分为三类,一种是因变量为二分类得logistic 回归,这种回归叫做二项logistic 回归,一种是因变量为无序多分类得logistic 回归, 比方倾向于选择哪种产品,这种回归叫做多项logistic 回归.还有一种是因变量为有序多分类的logistic 回归,比方病重的程度是高,中,低呀等等,这种 回归也叫累积logistic回归,或者序次logistic 回归.二值 logistic 回归:选择分析回归二元logistic ,翻开主面板,因变量勾选你的二分 类变量,这个没有什么疑问,然后看下边写着一个协变量.有没有很奇怪什么 叫做协变量?在二元logistic回
2、归里边可以认为协变量类似于自变量,或者就是自变量.把你的自变量选到协变量的框框里边.细心的朋友会发现,在指向协变量的那个箭头下边,还有一个小小的按 钮,标着a*b,这个按钮的作用是用来选择交互项的.我们知道,有时候两个 变量合在一起会产生新的效应,比方年龄和结婚次数综合在一起,会对健康程 度有一个新的影响,这时候,我们就认为两者有交互效应.那么我们为了模型 的准确,就把这个交互效应也选到模型里去.我们在右边的那个框框里选择变 量a,按住ctrl ,在选择变量b,那么我们就同时选住这两个变量了,然后点 那个a*b的按钮,这样,一个新的名字很长的变量就出现在协变量的框框里 了,就是我们的交互作用的
3、变量.然后在下边有一个方法的下拉菜单.默认的是进入,就是强迫所有选择的 变量都进入到模型里边.除去进入法以外,还有三种向前法,三种向后法.一 般默认进入就可以了,如果做出来的模型有变量的p值不合格,就用其他方法在做.再下边的选择变量那么是用来选择你的个案的.一般也不用管它.选好主面板以后,单击分类右上角,翻开分类对话框.在这个对话框 里边,左边的协变量的框框里边有你选好的自变量,右边写着分类协变量的框 框那么是空白的.你要把协变量里边的字符型变量和分类变量选到分类协变量里 边去系统会自动生成哑变量来方便分析,什么事哑变量具体参照前文.这 里的字符型变量指的是用值标签标注过得变量,不然光文字,系
4、统也没法给你分析啊.选好以后,分类协变量下边还有一个更改比照的框框,我们知道,对 于分类变量,spss需要有一个参照,每个分类都通过和这个参照进行比拟来得 到结果,更改比照这个框框就是用来选择参照的.默认的比照是指示符,也就 是每个分类都和总体进行比拟,除了指示符以外还有简单,差值等.这个框框 不是很重要,默认就可以了.点击继续.然后翻开保存对话框,勾选概率,组成员,包含协方差矩阵.点击继续,翻开选项对话框,勾选分类图,估计值的相关性,迭代历史,exp(B)的CI,在模型中包含常数,输出一一在每个步骤中.如果你的协变量有连续型的,或者小样本,那还要勾选 Hosmer-LemeshoW以合度,这
5、个拟合度表 现的会较好一些.继续,确定.然后,就会输出结果了.主要会输出六个表.第一个表是模型系数综合检验表,要看他模型的 p值是不是小于0.05,判 断我们这个logistic 回归方程有没有意义.第二个表示模型汇总表.这个表里有两个 RA2,叫做广义决定系数,也叫 伪RA2,作用类似于线性回归里的决定系数,也是表示这个方程能够解释模型 的百分之多少.由于计算方法不同,这两个广义决定系数的值往往不一样,但 是出入并不会很大.在下边的分类表那么表述了模型的稳定性.这个表最后一行百分比校正下边 的三个数据列出来在实际值为 0或者1时,模型预测正确的百分比,以及模型 总的预测正确率.一般认为预测正
6、确概率到达百分之五十就是良好(标准真够 低的),当然正确率越高越好.在然后就是最重要的表了,方程中的变量表.第一行那个B下边是每个变量的系数.第五行的p值会告诉你每个变量是否适合留在方程里.如果有某个 变量不适合,那就要从新去掉这个变量做回归.根据这个表就可以写出logistic 方程了: P=Exp常量+a1*变量 1+a2*变量 2. . /1+Exp常量 +a1*变量1+a2*变量2.如果大家学过一点统计,那就应该对这个形 式的方程不陌生.提供变量,它最后算出来会是一个介于0和1的数,也就是你的模型里设定的值比拟大的情况发生的概率,比方你想推算会不会治愈,你 设0治愈,1为没有治愈.那你
7、的模型算出来就是没有治愈的概率.如果你想 直接计算治愈的概率,那就需要更改一下设定,用1去代表治愈.此外倒数后两列有一个EXPB,也就是ORfi,哦,这个可不是或者的 意思,ORfi是优势比.在线性回归里边我们用标准化系数来比照两个自变量对 于因变量的影响力的强弱,在logistic 回归里边我们用优势比来比拟不同的情 况对于因变量的影响.举个例子.比方我想看性别对于某种病是否好转的影响,假设0代表女,1代表男,0代表不好转,1代表好转.发现这个变量的 OR 值为2.9 ,那么也就是说男人的好转的可能是女人好转的2.9倍.注意,这里都是以数值较大的那个情况为基准的.而且 ORfi可以直接给出这
8、个倍数.如果 是0,1,2各代表一类情况的时候,那就是 2是1的2.9倍,1是0的2.9倍, 以此类推.ORfi对于方程没什么奉献,但是有助于直观的理解模型.在使用 OR 值得时候一定要结合它95%勺置信区间来进行判断.此外还有相关矩阵表和概率直方图,就不再介绍了.多项logistic 回归:选择分析回归多项logistic ,翻开主面板,因变量大家都知道选什么,因变量下边有一个参考类别,默认的第一类别就可以.再然后出现了两 个框框,因子和协变量.很明显,这两个框框都是要你选因变量的,那么到底 有什么区别呢?嘿嘿,区别就在于,因子里边放的是无序的分类变量,比方性别,职业什么的,以及连续变量实际
9、上做logistic回归时大局部自变量都是分类变量,连续变量是比拟少的.,而协变量里边放的是等级资料,比方病 情的严重程度啊,年龄啊以十年为一个年龄段撒,一年一个的话就看成连续 变量吧还是之类的.在二项logistic回归里边,系统会自动生成哑变量,可是在多项logistic 回归里边,就要自己手动设置了.参照上边的解释,不难知 道设置好的哑变量要放到因子那个框框里去.然后点开模型那个对话框,哇,好恐怖的一个对话框,都不知道是干嘛的.好,我们一点点来看.上边我们已经说过交互作用是干嘛的了,那么不难 理解,主效应就是变量本身对模型的影响.明确了这一点以后,这个对话框就 没有那么难选了.指定模型那
10、一栏有三个模型,主效应指的是只做自变量和因 变量的方程,就是最普通的那种.全因子指的是包含了所有主效应和所有因子 和因子的交互效应的模型我也不明白为什么只有全因子,没有全协变量.这 个问题真的很难,所以别追问我啦.第三个是设定 /步进式.这个是自己手动 设置交互项和主效应项的,而且还可以设置这个项是强制输入的还是逐步进入的.这个概念就不用再啰嗦了吧啊?点击继续,翻开统计量对话框,勾选个案处理摘要,伪 R方,步骤摘要, 模型拟合度信息,单元格可能性,分类表,拟合度,估计,似然比检验,继 续.翻开条件,全勾,继续,翻开选项,勾选为分级强制条目和移除工程.打 开保存,勾选包含协方差矩阵.确定总算选完
11、了.结果和二项logistic 回归差不多,就是多了一个似然比检验,p值小于0.05认为变量有意义.然后我们直接看参数估计表.假设我们的因变量有 n个 类,那参数估计表会给出n-1组的截距,变量1,变量2.我们我们用Zm代表 Exp 常量m+am1变量1+am2变量2+.,那么就有第 m类情况发生的概 率为Zn/1+Z2+Z3+Zn如果我们以第一类为参考类别的话,我们就不会有 关于第一类的参数,那么第一类就是默认的 1,也就是说Z1为1.有序回归累积logistic 回归:选择菜单分析一一回归一一有序,翻开主面板.因变量,因子,协变量如 何选取就不在重复了.选项对话框默认.翻开输出对话框,勾选拟合度统计, 摘要统计,参数估计,平行线检验,估计响应概率,实际类别概率,确定,位 置对话框和上文的模型对话框类似,也不重复了.确定.结果里边特有的一个表是平行线检验表.这个表的p值小于0.05那么认为斜率系数对于不同的类别是不一样的.此外参数估计表得出的参数也有所不同. 假设我们的因变量有四个水平,自变量有两个,那么参数估计表会给出三个阈 值a1,a2, a3 (也就是截距),两个自变量的参数 3n.计算方程时,首先算 三个 Link 值,Link1=a1+m*x1+n*x2 , Link2=a2+m*x1+n*x2 , Link3=a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 集料视频课件
- 2024版设备采购合同标的为工业自动化设备3篇
- 部编版四年级语文上册第21课《古诗三首》教学设计
- 工业园区绿色低碳发展水平评价规范-地方标准格式审查稿
- 《桩基检测技术上》课件
- 《时间之窗缺口理论》课件
- 教科版小学综合实践6下(教案+课件)6 我为学校出点力 郑湘娥
- 牙龈脓肿病因介绍
- 《债法总论讲义》课件
- 《毒物与化学》课件
- Unit 5 The colourful world Part A(教学设计)-2024-2025学年人教PEP版(2024)英语三年级上册
- 2025届江苏省苏州市新区一中学数学八上期末考试试题含解析
- 2024年统编版道德与法治七年级上册全册课件(新版教材)
- 全国职业院校技能大赛高职组(商务数据分析赛项)备赛试题库(含答案)
- 2025年高考英语总复习专项练习33 阅读理解+读后续写
- 母婴产品安全监管新规解读
- 2024年物理实验操作考试(考生试题)
- 河南省洛阳市2022-2023学年九年级上学期期末数学试题
- 辽宁省大连市2022-2023学年八年级下册期末物理试卷(含答案)
- 2024年高考数学一轮复习练习卷(一)(新高考适用)(含答案)
- 2024年江苏省徐州市中考一模数学试题(含答案)
评论
0/150
提交评论