第七章相关和回归_第1页
第七章相关和回归_第2页
第七章相关和回归_第3页
第七章相关和回归_第4页
第七章相关和回归_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章相关和回归第1页,课件共23页,创作于2023年2月第七章相关和回归Spearman秩相关检验1235Kendall秩相关系数检验Theil非参数回归和几种稳健回归第2页,课件共23页,创作于2023年2月一、适用范围Spearman秩相关系数是最早、最著名评秩统计量,主要用于研究两变量间的相关程度及其显著性检验,其资料要求两变量都至少是以定序尺度测量的。二、理论依据和方法1.理论依据:Spearman秩相关系数,用rs代表。是对容量为n的xi和yi的秩(i=1,2,…,n)进行相关性测量。如两变量x与y完全正相关,则应有xi=yi;如完全负相关,应有x1=yn,x2=yn-1,…,xn=y1。Spearman秩相关系数通过di=xi—yi研究总的偏离程度。第一节Spearman秩相关第3页,课件共23页,创作于2023年2月在计算相关系数时,直接研究di是不合适的,因为正的di与负的di相互抵消,因此采用∑di2,当di越大时,∑di2也越大。rs的计算公式为:(7.1)当∑di2为0时,rs=1,可认为两个变量完全正相关。rs所量度的是两个等级之间的联系强度,rs处于+1和-1之间。第一节Spearman秩相关第4页,课件共23页,创作于2023年2月2.显著性检验假设组Ho:X和Y相互独立(X和Y正或负相关)H1:X与Y相互不独立(X与Y负或正相关)检验rs的显著性,在小样本情况下,即n从4到30时,可查附表13来检验。该表列出了在H0成立时相伴概率分别为a=0.05和a=0.01的rs值。这是一个单尾表适合用于检验单侧假设。即当rs大于或等于表中临界值时,拒绝Ho。第一节Spearman秩相关第5页,课件共23页,创作于2023年2月在大样本情况下,即n≥10时,在零假设成立时得到的rs的显著性可用统计量t来检验:

t统计量近似服从df=n-2的T分布。如n很大时,即n≥30,还可用统计量Z来检验。近似服从正态分布。(7.2)3.耦合修正。两变量的秩相等即耦合。这时用它们的平均秩作耦合项的秩。第一节Spearman秩相关第6页,课件共23页,创作于2023年2月在耦合现象出现的比例不大时,可以忽略它们对rs的影响;但当其比例较大时,rs用下式来修正:(7.3)

式中,Tx=(t3-t)/12,t等于x变量中同一个秩的耦合数;Ty=(t3-t)/12,t代表y变量中耦合的观察数。第一节Spearman秩相关第7页,课件共23页,创作于2023年2月三、检验步骤1.据题意,作正确假设;2.将变量X和Y的观察值分别从1到n评秩,如观察值相同,用平均秩代替。3.将两样本配对成(xi,yi),xi,yi分别代表两变量的秩。4.定出di=xi-yi;算出∑di2。5.如无耦合现象或比例较小时,用公式(7.1)算出rs,如耦合现象比例较大,则用(7.3)公式计算rs。6.小样本4≤n≤30时,查附表13;大样本时,N≥30用公式(7.2)。第一节Spearman秩相关第8页,课件共23页,创作于2023年2月四、例7.1(小样本举例)学习时间长短与学生考试成绩间是否有关。调查某大学10个学生每周学习的时间与期末平均成绩的资料如表7-1所示.解:假设H0:学习时间X与平均成绩等级Y之间是相互独立的;H1:学习时间X与平均成绩等级Y之间是正相关。根据(9.22)式计算得到:取a=0.05的显著性水平,样本容量n=10,查附表13临界值rs(n,a)=0.5515第一节Spearman秩相关第9页,课件共23页,创作于2023年2月表7-1大学生的学习时间与期末成绩调查表变量秩次di=xi-yidi2周学习时期末平均成绩时间排秩成绩等级(x)(y)(xi)(yi)248467.5-1.52.2517402.511.52.2520584400418487.50.50.25528510911238055004690910-1117552.53-0.50.25154812-1129827611合计9.00第一节Spearman秩相关第10页,课件共23页,创作于2023年2月因为rs=0.946>0.5515(临界值)故拒绝Ho假设,而接受H1假设,即学生的学习时间与学生的平均成绩等级之间存在着正相关关系。这里变量x和y中都分别有一对存在耦合即t=2,所占比例不大,可以不必进行修正。但为说明方法,在此作一修正。用公式(7.3),首先要算出代入公式得:修正后比修正前略有减小。第一节Spearman秩相关第11页,课件共23页,创作于2023年2月例7.2(大样本举例)从一个大企业的生产线上抽出15名雇员组成一个随机样本,然后让这些雇员的同事和管理人员根据他们对工作的兴趣及合作精神分别对他们进行排序,结果列于表7-2,企业当局想知道同事和管理人员的看法是否正相关。解:假设Ho:同伴对雇员的等级评定与管理人员对雇员的等级评定间相互独立;H1:同伴对雇员的等级评定与管理人员对雇员的等级评定正相关由(7.1)式算得rs=1-(6×148)/(15×(152-1))=0.7357查附表13得r15,0.05=0.446<rs。因此我们以0.05的显著性水平否定零假设,作出“两种等级正相关”的结论第一节Spearman秩相关第12页,课件共23页,创作于2023年2月这里n=15>10。我们也可用T统计量来检验。查T分布表当df=13,a=0.05时,临界值ta/2=2.160,因t=3.92>ta/2,所以我们可以在a=0.05的显著性水平上拒绝Ho,从而得出结论:同伴和管理人员对这15个雇员的评价正相关。第一节Spearman秩相关第13页,课件共23页,创作于2023年2月一、适用范围肯德尔(Kendall)秩相关系数τ(读为Tao)是测度两组秩间的相关程度。二、理论依据和方法在容量为n的成对样本(xi,yi)中,如果某对观察值都比另一对观察值大,则称这两对观察值为一致对(协同)。如(1.3,2.2)和(1.6,2.7)就是一致对(用Nc表示在Cn2个可能对中一致对的数目);反之如果某对观察值与另一对观察值以相反的方向变化(即一个减少而另一个增加),我们称之为非一致对,并用Nd表示在Cn2个可能对中非一致对(不协同)的数目。第二节Kendall相关检验第14页,课件共23页,创作于2023年2月如果两对观察值相等,就不能算是一致对,也不能算作非一致对。肯德尔秩相关系数的计算公式为:

(7.4)如所有观察值对都是一致对,则τ=1;如所有观察值对都是非一致对,则τ=-1.在计算τ值时,可以将所有观察对(xi,yi)按变量值xi的递增次序排列,将与其对应的yi与后面的每一个yi比较,有多少对yi是按递增次序排列的,就有多少个一致对;有多少对yi不是递增次序排列,就有多少个非一致对。第二节Kendall相关检验第15页,课件共23页,创作于2023年2月例9.21:双胞胎儿童间的智力相关程度分析。某幼儿园对9对双胞胎的智力进行测验,并按百分制打分。现将资料列示如表7-3:表7-3解:根据τ计算要求,首先将资料(xi,yi)按xi的递增次序排列,并将计算结果列如表7-4所示:双胞胎的对数编号(i)123456789先出生的儿童(xi)867768917071858763后出生的儿童(yi)887664966580817260第二节Kendall相关检验第16页,课件共23页,创作于2023年2月表7-4(xi,yi)(xi,yi)以下的一致对(xi,yi)以下的非一致对63,608068,647070,656071,803277,763185,812186,881187,721091,9600-Nc=31Nd=5第二节Kendall相关检验第17页,课件共23页,创作于2023年2月计算Kendall秩相关系数即双胞胎儿童间的智力相关程度为0.722三、显著性检验求出Nc和Nd后,用统计量T(T=Nc-Nd)检验下面的假设:Ho:X与Y是相互独立的;H1:X与Y不是相互独立的。(正相关或负相关)再根据样本大小n和显著水平a,可查附表14T的临界值.如果T>Wn(1-a)就接受正相关的备择假设;如果T<Wn(a)就接受负相关的备择假设。第二节Kendall相关检验第18页,课件共23页,创作于2023年2月上例中,T=Nc-Nd=31-5=26。又因n=9,a=0.05,查附表14,得出双侧检验的两个临界值为:W0.975=18,W0。025=-18而T=26>W0.975=18,因此以0.05的显著水平拒绝Ho,接受X与Y之间存在正相关的备择假设。四、耦合处理在观察对(Xi,Yi)中有两个或两个以上的数值相等时,用平均秩来代替。这种情况只影响(7.4)式中的分母(7.5)其中Tx=Ty=1/2∑t(t-1),t为观察对中有相同值X(Y)的数目.第二节Kendall相关检验第19页,课件共23页,创作于2023年2月五、大样本检验当N>10时,τ遵从如下的正态分布:均值Uτ=0,标准差:所以正态变量:

上例中N=12于10,可用正态近似法计算.∵τ=0.822∴查正态分布表,当Z=3.72时大于1.96,所以拒绝Ho假设。而接受学生所花的学习时间与取得的学习成绩之间存在相关的结论。第二节Kendall相关检验第20页,课件共23页,创作于2023年2月六、功效讨论斯氏秩相关系数rs与肯氏秩相关系数τ之间对比,两者采用两种不同的方法计算相关系数,所以即使用同样的资料,也会得出不同的数值。在大多数情况下,斯氏的rs的绝对值比肯氏的τ的绝对值为大(不是所有的情况均如此)。但我们绝不能根据它们计算的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论