离散状态变量的回归_第1页
离散状态变量的回归_第2页
离散状态变量的回归_第3页
离散状态变量的回归_第4页
离散状态变量的回归_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

离散状态变量的回归第1页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归1、举例(1)研究“一个人在家是否害怕生人来访”,用Y表示,则:1,害怕

0,不害怕Y=第2页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归1、举例(2)研究“人们对某项政策的态度”,用Y表示,则:1,赞同

2,无所谓

3,反对Y=第3页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归1、举例(3)一只球队的成绩1,胜

2,负

3,平Y=第4页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归2、离散状态因变量回归方程的意义(两状态的情况)能否进行这样的回归呢?第5页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归2、离散状态因变量回归方程的意义(两状态的情况)

Di的期望值:

第6页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归2、离散状态因变量回归方程的意义(只处理两状态)

我们又知道:所以有,即,回归值=“状态1”出现的概率第7页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归3、离散状态因变量回归遇到的障碍可以对下式进行OLS估计吗?第8页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归3、离散状态因变量回归遇到的障碍答案:可以,但有问题!第9页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归3、离散状态因变量回归遇到的障碍(1)误差非正态分布

而X是非随机的,或者虽然是随机的,但不一定是正态的。

即使X是随机的且是正态的,εi也不会是正态的。第10页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归3、离散状态因变量回归遇到的障碍

(2)异方差当X非随机时,有第11页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归3、离散状态因变量回归遇到的障碍(2)异方差显然,方差随X的变化而变化第12页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归3、离散状态因变量回归遇到的障碍(2)异方差

所以,应该采用“可行的广义最小二乘法”,而不是“普通最小二乘法”第13页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归3、离散状态因变量回归遇到的障碍(2)异方差步骤:

A.使用OLS进行估计,并得到拟合值B.在原方程左右同时除以之后,再进行OLS估计;第14页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归3、离散状态因变量回归遇到的障碍(2)异方差

或者:依然用OLS,但使用怀特异方差一致标准误来进行T检验、区间估计;

第15页,共42页,2023年,2月20日,星期一案例:全美橄榄球联盟赛的预测比赛取胜的概率与“让球数”(PointSpreads)之间的关系:第16页,共42页,2023年,2月20日,星期一WhatPointSpreadsSayAbouttheProbabilityofWinningintheNFL:I第17页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归3、离散状态因变量回归遇到的障碍(3)取值的限制

无法保证的值在0到1之间!第18页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归4、解决方法

在线性回归与二值结果之间,引入一个连续取值的潜变量(latentvariable)

例如,在前例中,引入一个“实力”潜变量,Z。第19页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归4、解决方法

“让球数”直接的与“实力”相关联,而“实力”与“结果”相关联。注意:阀值不一定为0!第20页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归4、解决方法

这意味着:

第21页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归4、解决方法

取胜的概率:第22页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归4、解决方法

同理,输的概率:第23页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归4、解决方法

这个F(w)会是什么样呢?必需满足如下特征:第24页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归4、解决方法

这个F(w)会是什么样呢?有两种处理方法:(1)Probit模型(2)Logit模型第25页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归4、解决方法

(1)Probit模型

设服从标准正态分布,从而有表示为:第26页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归4、解决方法

(2)Logit模型表示为:第27页,共42页,2023年,2月20日,星期一Probit&LogisticModel第28页,共42页,2023年,2月20日,星期一LogitModel&LinearProbability第29页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归5、参数估计极大似然估计(MLE:maximumlikelihoodestimate)

第30页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归5、参数估计极大似然估计(MLE:maximumlikelihoodestimate)

第31页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归5、参数估计极大似然估计(MLE:maximumlikelihoodestimate)

通常没有解析解,只有数值解!

第32页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归5、参数估计极大似然估计(MLE:maximumlikelihoodestimate)

参数估计量的标准差的估计(略)

第33页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归6、显著性检验

(1)整体的显著性检验似然比

第34页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归6、显著性检验

(1)整体的显著性检验预测成败分析表:

预测值Y’=0Y’=1total真实值Y=047116487Y=118320203total65436690第35页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归6、显著性检验

(1)整体的显著性检验

预测成功的比率=(471+20)/690但该指标并不能说明太多的问题!

第36页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归6、显著性检验

(1)整体的显著性检验

TPR(TruePositiveRate):正确预测D=1的比率。这里,TPR=20/203;该值表示“取真的概率”,所以该值越高越好

第37页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归6、显著性检验

(1)整体的显著性检验

FPR(FalsePositiveRate):把D=0的个体,错误预测为D=1的比率。这里,FPR=16/487;该值表示“取伪错误”,所以越小越好。

第38页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归6、显著性检验

(1)整体的显著性检验

但上述两个指标之间是“鱼和熊掌”的关系,所以在选择模型时,应该劝和利弊!

第39页,共42页,2023年,2月20日,星期一二、因变量是离散状态的回归6、显著性检验

(2)单个变量的显著性检验

Z统计量(单个变量的检验)LR检验、Ward检验(联合检验)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论