版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章相关与回归Spearman相关检验注意:通常认为为相关程度较高。6rs的显著性检验前面计算的rs是抽自两个总体的样本数据计算的结果,从这一相关系数的大小,可以猜测总体的秩相关系数是否与零有显著差异,但是否为真,还应进行假设检验。检验可以研究两个总体是否存在相关,也可以分别研究相关的方向,即是正相关,还是负相关。双侧检验:单侧检验:当n≤30时,根据n和rs查找相应的概率P(H0为真时,R为某值可能的概率)。若P值小于显著性水平α,则拒绝H0;若P值大于显著性水平α,则不能拒绝H0
。若n>30,则计算Z统计量,该统计量近似服从正态分布。例题:经济发展水平X和卫生水平Y之间的相关分析显著性检验:因为未指明相关的方向,因此,只需检验是否相关,可以建立双侧检验:R语言中函数cor.test()可完成Speraman秩相关检验,其调用格式为:cor.test(x,y,alternative=c("two.sided","less","greater"),method=c("pearson","kendall","spearman"),exact=NULL,conf.level=0.95,continuity=FALSE,...)
x,ynumericvectorsofdatavalues.xandymusthavethesamelength.Alternativeindicatesthealternativehypothesisandmustbeoneof"two.sided","greater"or"less".Youcanspecifyjusttheinitialletter."greater"correspondstopositiveassociation,"less"tonegativeassociation.Methodacharacterstringindicatingwhichcorrelationcoefficientistobeusedforthetest.Oneof"pearson","kendall",or"spearman",canbeabbreviated.Exactalogicalindicatingwhetheranexactp-valueshouldbecomputed.UsedforKendall'stauandSpearman'srho.See‘Details’forthemeaningofNULL(thedefault).conf.levelconfidencelevelforthereturnedconfidenceinterval.CurrentlyonlyusedforthePearsonproductmomentcorrelationcoefficientifthereareatleast4completepairsofobservations.Continuitylogical:iftrue,acontinuitycorrectionisusedforKendall'stauandSpearman'srhowhennotcomputedexactly.解:书上例6.1的R程序如下:>d=read.table("E:\\Rwork\\DM1.txt")>x=d[,2];y=d[,1]>rx=rank(x);ry=rank(y)>rsd=rbind(rx,ry,(rx-ry)^2)>cor.test(x,y,meth="spearman")输出结果:rsd的输出结果:练习:美国1920到1980年间拥有拖拉机和拥有马匹的农场的百分比为年份1920193019401950196019701980拥有拖拉机9.230.951.872.789.987.790.2拥有马匹91.888.080.643.616.714.410.5是否二者之间有某种相关?何种相关?同分的处理Kendallτ检验Kendallτ检验是从另一个角度来看相关,其检验的假设为:Kendallτ相关系数:
nc是X与Y协同的对数,或得+1的对数。nd是X与Y不协同的对数,或得-1的对数。
从定义可以看出,当二变量是相关的,则K的绝对值大,反之当K的绝对值接近1,则x与Y是相互无关的。值界于-1~1之间。当样本容量足够大时
检验过程:例:下表列出了20个国家和地区的出生率X(%)及人均收入Y(美元),括号中位相应的秩,我们想检验这两者之间是否为负相关。两种方法的比较:Theil回归和最小中位数二乘回归在经济计量学中,最简单的模型是只有一个因变量Y和一个解释变量X的线性回归模型。例如,在一般情况下,消费支出总是随着家庭收入的增加而变动的,如果用Yi为消费支出,Xi为家庭收入,为未列入方程的,对有影响的其它众多因素,即随即扰动项。若用简单线性回归模型表示它们的关系即为Theil方法的思想:从残差出发,寻求斜率β,使得所有观测值对(xi,yi)与(xj,yj)拟合回归直线后的残差之差的正负符号相等。记则第j个与第i个残差之差为Theil回归要求β使得如果x1,x2,…,xn是按升幂排列的,那么为对子(xi,di)中按Kendall定义的协同的数目减去不协同的数目,即x与d之间的Kendall相关系数为记所有两个不同数据点连线的斜率为解:R程序如下:>d=read.table("E:\\Rwork\\CPIGINI.txt",header=T)>x=d[,1];y=d[,2]>n=nrow(d)>s=NULL;>for(iin1:(n-1))for(jin(i+1):n)+s=c(s,(y[j]-y[i])/(x[j]-x[i]))>b=median(s);a=median(y-b*x)>e=y-a-b*x>coef=c(a,b)输出结果:试建立该种鱼年龄与长度的回归方程。Theil回归中对β的检验相比普通最小二乘,Theil回归能接受一定数据污染,为什么最小中位数二乘是最稳健的?Theil回归是计算所有斜率的中位数,首先它不受leverage的影响(leverage就是线性回归中X(X‘X)^{-1}X’这个hat矩阵的对角线元素大小,这个数越大,其对应的点对回归结果的影响也就越大,如果不幸这个leverage很大的点还是个outlier,那结果就非常不可靠了
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 磁粉检测培训课件
- 督灸ppd课件教学课件
- 日语广东湛江市高三年级2026年高考测试(一)(湛江一模)(1.26-1.28)
- 2026年经济师职业培训宏观经济知识基础考试题集
- 2026年食品安全管理标准试题库
- 2026年民航机务维修人员考试题库飞机维护与故障排除
- 2026年食品安全管理员培训题库知识要点与答题指导
- 2026年经济师专业资格测试模拟试题
- 2026年世界地理竞赛专业问题及解答参考
- 2026年建筑设计中绿色建筑原理模拟题
- 2026 昆明市高三市统测 三诊一模 英语试卷
- 市政设施巡查及维护方案
- 大型活动安保工作预案模板
- 2025年文化遗产数字化保护与开发:技术创新与经济效益研究报告
- 1.2 宪法的内容和作用 课件 (共28张) 八年级道法下册
- 山西焦煤考试题目及答案
- 加盟酒店合同范本
- (2025版)成人肺功能检查技术进展及临床应用指南解读课件
- 《春秋》讲解课件
- 铁路信号基础设备维护实训指导课件 5.认识25Hz相敏轨道电路
- T-ZGKSL 022-2025 头皮毛发健康理疗师职业能力评价规范
评论
0/150
提交评论