相关和回归非参数统计西南财大_第1页
相关和回归非参数统计西南财大_第2页
相关和回归非参数统计西南财大_第3页
相关和回归非参数统计西南财大_第4页
相关和回归非参数统计西南财大_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章 相关和回归第一节 Spearman相关检验在给定一列数对,¼,之后,要检验他们所代表的二元变量X和Y是否相关。首先将X和Y的观测值分别排序,分别得各自得秩统计量,¼,计算R和S的相关系数,我们知道令Spearman的相关系数为例:下面是10个国家和地区1997年的国际化程度和国际竞争力的资料。国家或地区国际化程度排名国际竞争力排名美国1190新加坡2280香港3370卢森堡4951英国51232荷兰6440爱尔兰71130德国81420比利时92301法国102100Correlations(a) VAR00001VAR00002Spearman's rho

2、VAR00001Correlation Coefficient1.000.927(*)Sig. (2-tailed).000VAR00002Correlation Coefficient.927(*)1.000Sig. (2-tailed).000.第二节 Kendall检验Kendall检验是从另一个角度来看相关,其检验的假设为:定义(Kendall相关系数)令称为Kendall相关系数。 是X与Y协同的对数,或得+1的对数。是X与Y不协同的对数,或得-1的对数。从定义可以看出,当二变量是相关的,则K的绝对值大,反之当K的绝对值接近1,则x与Y是相互无关的。值界于-11之间。当样本容量足够大

3、时,。 VAR00001VAR00002Kendall's tau_bVAR00001Correlation Coefficient1.000.822(*)Sig. (2-tailed).001VAR00002Correlation Coefficient.822(*)1.000Sig. (2-tailed).001.* Correlation is significant at the 0.01 level (2-tailed). 第三节 多元变量协同系数检验在实际生活中,经常需要按照某些特别的性质来多次(m次)对n个个体进行评估或排序,比如m个裁判者对于n种品牌酒类的排队,m个选民

4、对n个候选人的评价,m个咨询机构对一系列(n个)企业的评估以及体操裁判员对运动员的打分等等。人们往往想知道,这m个结果是否多少一致。如果很不一致,则这个评估多少有些随机,没有多大意义。令零假设为从:“这些评估(对于不同个体)是不相关的或者是随机的”而备择假设为H1:“它们(对各个个体虔正相关的或者是多少一致的。”这里完全有理由用前面的Friedman方法来检验。Kendall一开始也是这样做的,后来,Kendall和Slith(1939)提出了协同系数(Coefficient of concordance),协同系数可以看成为二元变量的Kendall 在多元情况的推 广,Kendall协同系数

5、定义为这里S是个体的总秩与平均秩的偏差的平方和,每个评估者(共m个)对于所有参加排序的个体有一个从1到n的排列(秩),而每个个体有m个打分(秩),记Ri为第i个个体的秩的和,(i=l,n),则因为总的秩为m(ln)mn(n1)2,平均秩为m(nl)2, Kendall协同系数W还可以写成下面的形式:上面右边的表达式计算起来较方便,W的取值范围是从0到1,对W和S都有表可查,当n大时,可以利用大样本性质:在零假设下,对固定的m,当n时,W的值大(显著),意味着各个个体在评估中有明显不同,这样所产生的评估结果是有道理的;而如果W不显著,意味着评估者对于诸位个体的意见很不一致,则没有理由认为能够产生

6、一个共同的评估结果。下面以 4个独立的环境研究单位对 10个城市空气等级排序的结果为例。在DPS下编辑定义数据的格式如表:4个研究单位对 10个城市空气等级排序结果评估机构被评估的10个城市(AJ)的排名ABCDEFJHIJA92410768531B10138759642C84210975631D91210674853计算结果为W=0.8530,卡方值等于30.709。在零假设下,利用2近似的p值为0.0003,因此,可以对大于或等于该值的水平拒绝零假设,也就是说,这个评估是有道理的。第四节 Theil回归和最小中位数二乘回归在经济计量学中,最简单的模型是只有一个因变量Y和一个解释变量X的线性

7、回归模型。例如,在一般情况下,消费支出总是随着家庭收入的增加而变动的,如果用为消费支出,为家庭收入,为未列入方程的,对有影响的其它众多因素,即随即扰动项。若用简单线性回归模型表示它们的关系即为 从简单线性回归模型,我们可以看出是的函数。的概率分布决定于干扰项的分布性质。但是无法观察到的随机变量,所以在利用解释变量X和被解释变量Y的实际观测值去估计模型的参数和时,必须对概率分布和经济计量模型作出一些假定。如果没有这些假定,计量经济学理论奠基石经典线性回归模型也就无从谈起,也就无法对总体参数和做出任何统计推断。一、 Theil方法我们知道的斜率是,对直线来说,如果知道了直线上的两个点,则直线的斜率为,设为n个观测点, 则二、 最小中位数二乘回归最小中位数二乘回归 满足的,则是的最小中位数二乘回归的解。例 xyxy.845.464.097.60.465.80.655.601.644.873.462.972.073.66.226.052.274.181.394.69-.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论