直线相关教学课件_第1页
直线相关教学课件_第2页
直线相关教学课件_第3页
直线相关教学课件_第4页
直线相关教学课件_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相关与偏相关2021/7/91医学上,许多现象之间也都有相互联系,例如:身高与体重、体温与脉搏、产前检查与婴儿体重、乙肝病毒与乙肝等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。这里,体温和脉搏的关系就比产前检查与婴儿体重之间的关系密切得多,而体重和身高的关系则介与二者之间。另外,可以说乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之间是因果关系;但是,有的现象之间因果不清,只是伴随关系,例如丈夫的身高和妻子的身高之间,就不能说有因果关系。相关就是用于研究和解释两个变量之间相互关系的。

2021/7/92主要内容第一节直线相关第二节偏相关第三节小结2021/7/93第一节直线相关LinearCorrelation2021/7/94为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。

2021/7/95一、相关的类型★正相关★负相关★完全正相关★完全负相关★称零相关

2021/7/96二、相关系数

样本的相关系数用r(correlationcoefficient)相关系数r的值在-1和1之间,但可以是此范围内的任何值。正相关时,r值在0和1之间,散点云图是斜向上的,这时一个变量增加,另一个变量也增加;负相关时,r值在-1和0之间,散点云图是斜向下的,此时一个变量增加,另一个变量将减少。r的绝对值越接近1,两变量的关联程度越强,r的绝对值越接近0,两变量的关联程度越弱。2021/7/97三、相关系数的计算公式r的计算结果说明了两个变量X与Y之间关联的密切程度(绝对值大小)与关联的性质(正负号)。2021/7/98一个产科医师发现孕妇尿中雌三醇含量与产儿的体重有关。于是设想,通过测量待产妇尿中雌三醇含量,可以预测产儿体重,以便对低出生体重进行预防。因此收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。问尿中雌三醇含量与产儿体重之间相关系数是多少?是正相关还是负相关?分析问题:目的、变量、关系

2021/7/99编号

(1)尿雌三醇mg/24h(2产儿体重kg(3)编号

(1)尿雌三醇mg/24h(2)产儿体重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2

待产妇尿雌三醇含量与产儿体重关系

2021/7/9109、人的价值,在招收诱惑的一瞬间被决定。2023/2/32023/2/3Friday,February3,202310、低头要有勇气,抬头要有低气。2023/2/32023/2/32023/2/32/3/20235:02:14PM11、人总是珍惜为得到。2023/2/32023/2/32023/2/3Feb-2303-Feb-2312、人乱于心,不宽余请。2023/2/32023/2/32023/2/3Friday,February3,202313、生气是拿别人做错的事来惩罚自己。2023/2/32023/2/32023/2/32023/2/32/3/202314、抱最大的希望,作最大的努力。03二月20232023/2/32023/2/32023/2/315、一个人炫耀什么,说明他内心缺少什么。。二月232023/2/32023/2/32023/2/32/3/202316、业余生活要有意义,不要越轨。2023/2/32023/2/303February202317、一个人即使已登上顶峰,也仍要自强不息。2023/2/32023/2/32023/2/32023/2/32021/7/911计算结果从计算结果可以知道,31例待产妇尿中雌三醇含量与产儿体重之间程正相关,相关系数是0.61。2021/7/912问题:我们能否得出结论说明待产妇尿中雌三醇含量与产儿体重之间程正相关,相关系数是0.61?为什么?2021/7/913四、相关系数的假设检验

上例中的相关系数r等于0.61,说明了31例样本中雌三醇含量与出生体重之间存在相关关系。但是,这31例只是总体中的一个样本,由此得到的相关系数会存在抽样误差。因为,总体相关系数()为零时,由于抽样误差,从总体抽出的31例,其r可能不等于零。所以,要判断该样本的r是否有意义,需与总体相关系数=0进行比较,看两者的差别有无统计学意义。这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。

2021/7/914对相关系数的假设检验,常用t检验,选用统计量t的计算公式如下:=n-2

2021/7/915H0:

=0

H1:

≠0

=0.05r=0.61,n=31,

代入公式

t==n-2=31-2=29

t=4.14查t值表,=2.756,查t值表,=2.756,上述计算t=4.14>2.756,由t所推断的P值小于0.01,按=0.05水准拒绝,接受,认为临产妇24小时内尿中雌三醇浓度与产儿体重之间有正相关关系。

2021/7/916五、直线相关的应用

前面我们已经讲过,相关是研究两个变量间的相互关系,而且这种相互关系是用相关系数反应的。在确实存在相关关系的前提下,如果r的绝对值越大,说明两个变量之间的关联程度越强,那么,已知一个变量对预测另一个变量越有帮助;如果r绝对值越小,则说明两个变量之间的关系越弱,一个变量的信息对猜测另一个变量的值无多大帮助。一般说来,当样本量较大(n>100),并对r进行假设检验,有统计学意义时,r的绝对值大于0.7,则表示两个变量高度相关;r的绝对值大于0.4,小于等于0.7时,则表示两个变量之间中度相关;r的绝对值大于0.2,小于等于0.4时,则两个变量低度相关。

2021/7/917例题:某地29名13岁男童身高X1(cm)、体重X2(kg)和肺活量Y(ml),请用该资料计算身高与肺活量,体重与肺活量的相关关系。2021/7/918第二节偏相关2021/7/919一、概念当有多个变量存在时,为了研究任何两个变量之间的关系,而使与这两个变量有联系的其它变量都保持不变。即控制了其它一个或多个变量的影响下,计算两个变量的相关性。二、偏相关系数偏相关系数是用来衡量任何两个变量之间的关系的大小。2021/7/920三、选择不同的方法计算相关系数

Pearson:双变量正态分布资料,连续变量

Kendall:资料不服从双变量正态分布或

总体分布未知,等级资料。

Spearman:等级资料。2021/7/921应用相关注意事项

1.实际意义进行相关回归分析要有实际意义,不可把毫无关系的两个事物或现象用来作相关回归分析。例如,有人说,孩子长,公园里的小树也在长。求孩子和小树之间的相关关系就毫无意义,用孩子的身高推测小树的高度则更加慌谬。2.相关关系相关关系不一定是因果关系,也可能是伴随关系,并不能证明事物间有内在联系,例如,有人发现,对于在校儿童,鞋的大小与阅读技能有很强的相关关系。然而,学会新词并不能使脚变大,而是涉及到第三个因素‑‑年龄。当儿童长大一些,他们的阅读能力会提高而且由于长大也穿不下原来的鞋。

2021/7/9223.利用散点图对于性质不明确的两组数据,可先做散点图,在图上看它们有无关系、关系的密切程度、是正相关还是负相关,然后再进行相关分析。4.变量范围相关分析和回归方程仅适用于样本的原始数据范围之内,出了这个范围,我们不能得出两变量的相关关系和原来的回归关系。2021/7/923第三节小结

一、基本概念二、分析计算2021/7/9241.为了了解某地20~29岁健康女性血红蛋白的正常值范围,现随机调查了该地2000名20~29岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是

A.该地所有20~29的健康女性

B.该地所有20~29的健康女性的血红蛋白测量值

C.抽取的这2000名20~29岁女性

D.抽取的这2000名20~29岁女性的血红蛋白测量值选择最佳答案2021/7/9252.各观察值加同一数后:A.均数不变,标准差改变B.均数改变,标准差不变C.二者均不变D.均改变3.用均数和标准差可全面描述:A.正偏态资料B.负偏态资料C.正态分布和近似正态分布D.任何分布4.正态分布曲线下,从均数u到u+1.96的面积为;2021/7/9265.按α=0.10水准做t检验,P>0.10,不能认为两总体均数不相等,此时若推断有错,其错误的概率为()。

A.大于0.10B.β,而β未知

C.小于0.10D.1-β,而β未知6.某地正常成年男子红细胞的普查结果,均数为480万/mm3,标准差为41.0万/mm3,后者反映()

A.个体变异B.抽样误差

C.总体均数不同D.均数间变异2021/7/9277.两个样本均数比较,经t检验,差异有显著性,p越小,说明()A.两样本均数差别越大B.两总体差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同

2021/7/928是非判断:1.标准误是一种特殊的标准差,其表示抽样误差的大小。2.N一定时,测量值的离散程度越小,用样本均数估计总体均数的抽样误差就越小。3.假设检验的目的是要判断两个样本均数的差别有多大。2021/7/929思考:1.标准差和标准误有何区别和联系?2.可信区间和参考值范围有何不同?3.一类错误和二类错误的区别4.方差分析的基本思想是什么?2021/7/930分析计算要求:注意应用条件,选择合适的计算程序在计算机上计算出结果会看结果完整的书写出来2021/7/9311.1976年美国8岁男孩的平均身高为146厘米,标准差为8厘米,估计在该研究中有%多少的男孩平均身高在138与154之间?又有多少在130到162之间?2021/7/9322.随机将20只雌性中年大鼠均分为甲、乙两组,甲组大鼠不接受任何处理(即空白对照),乙组中的每只大鼠接受3mg/kg的内毒素,分别测得两组大鼠的肌酐(μmol/L)数据,请问肌酐水平与内毒素有无关系?甲组:55,33,51,24,34,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论