logistic回归分析影响公共交通工具的因素_第1页
logistic回归分析影响公共交通工具的因素_第2页
logistic回归分析影响公共交通工具的因素_第3页
logistic回归分析影响公共交通工具的因素_第4页
logistic回归分析影响公共交通工具的因素_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 logistic回归分析影响公共交通工具的因素 1 绪论鉴于交通工具是我们出行中必不可少的一部分,而随着科技的发展与进步,交通方式愈加趋向于多元化,人们可以选择的交通工具也多种多样,新的交通工具带来便利的同时,也不可避免的给我们带来了一些问题。不同社会地位的人所选择的交通工具的原因与其本身的在因素以及外部条件相关。不同的年龄,性别,收入都是影响人们交通方式的重要因素。应用Logistic回归的原理和计算方法,并利用在公共交通调查数据在一次关于公共交通的社会调查中,年龄,月收入,性别与是乘公共汽车上下班还是骑自行车上下班的资料,采用Logistic回归方法,进行假设检验,对影响的因素进行分析。

2、建立Logistic回归模型,更加明确因变量与自变量之间的关系。2 Logistic回归理论 logistic回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。所以实际中最为常用的就是二分类的logistic回归。由于Y取值非0即1,如设Y取1的概率为P,则它取0的概率为Q=1-P。第i个观察对象的发生概率比数(odds)为称为发生比,是发生概率与不发生概率的比。发生概率取对数称为LOGIT变换。回归系数的解释,i表示xi改变一个单位时,logitP的平均变化量。 相对危险度:RR=P1/P2 比数 :Odds=P/(1-P) 比数比 :OR= 对比数比取自然

3、对数得到关系式: 的意义是在其他自变量固定不变的情况下,自变量X的水平没改变一个测量单位时所引起的比数比的自然对数改变量。或者说,在其他自变量固定不变的情况下,当自变量X的水平每增加一个测量单位时所引起的比数比为增加前的倍。Logit回归模型实质是求一种概率的估计,将某种概率与一个线性模型联系起来。三实例3.1原始数据 因变量y=1表示乘坐公共汽车,y=0表示骑自行车。自变量x1是年龄,作为连续变量;x2是月收入,x3是性别,x3=1表示男性,x3=0表示女性,调查对象为工薪族群体。表1 公共交通社会调查序号 年龄x1月收入x2性别x3交通y11885000221120000323850014

4、23950015281200016318500073615000184210000194695001104812000011551800011256210001135818000114188501015201000101625120010172713001018281500101930950112032100010213318001022331000102338120010344115001025451800112648100010275215001128561800113.2程序与分析3.2.1程序data sasa;input n x1 x2 x3 y;datalines;1 18 850

5、 0 02 21 1200 0 03 23 850 0 14 23 950 0 15 28 1200 0 16 31 850 0 07 36 1500 0 18 42 1000 0 19 46 950 0 110 48 1200 0 011 55 1800 0 112 56 2100 0 113 58 1800 0 114 18 850 1 015 20 1000 1 016 25 1200 1 017 27 1300 1 018 28 1500 1 019 30 950 1 120 32 1000 1 021 33 1800 1 022 33 1000 1 023 38 1200 1 024

6、 41 1500 1 025 45 1800 1 126 48 1000 1 027 52 1500 1 128 56 1800 1 1;proc logistic data=sasa desending;model y=x1 x2 x3/selection=stepwise;Run;3.2.2 运行结果分析3.2.2.1输入数据信息 Logistic 回归方程log(odds) 默认的形式是处理那个变量值比较小的,由运行结果可以看得出,因变量y取值的排列顺序是从大到小,所以第一个可能概率模型为y=1。3.2.2.2引入变量 给出了自变量进入模型的次序。先是截距项 Step 0 了,step

7、1 x3第一个进入模型,附带了很多评估它对因变量预测能力的指标。-2 Log L 和 Score 用来检测自变量是否显著。-2 Log L 中的L 就是 Likelihood Ratio, 它的 p 值是 0.0108,Score 的p 值是 0.0125,wald的p值为0.0173,都小于0.05,故x3是 一个很显著的解释变量。AIC和SC两个信息量标准用来比较不同的模型,它们数值越小, 模型变现就越好,step2 x1变量进入模型后的情况,模型的情况变化不大,step2 x1变量移除模型后的情况比step2的情况好,AIC 和 SC 的值变小了,-2 Log L 和 Score 对应的 p 值也更小。3.2.2.3模型的总体检验由运行结果可以看出,p<0.05,所以模型有较好的拟合效果。3.2.2.4参数检验以及几个描述性统计量、参数OR值,以及95%置信区间 给出了模型参数的估计,据此可以写出改回归方程的形式是 log(p/(1-p)=0.8109-2.1102*x3。 概率为 X3为性别,结果显示其回归系数b=-2.1102,P值为0.0173,表明在控制其他因素不变的情况下,性别对使用公共交通工具有负面影响。OR(X3)=0.121,表示消除其他影响后,男性乘坐公共汽车是女性的0.121倍,女性乘坐公共汽车的人多95%置信区间为0.021

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论