版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、变量间的关系 人们每时每刻都在关心事物之间的关系。 比如,职业种类和收入之间的关系、政府投入和经济增长之间的关系、广告投入和经济效益之间的关系、治疗手段和治愈率之间的关系等等。 这些都是二元的关系。 还有更复杂的诸多变量之间的相互关系,比如企业的固定资产、流动资产、预算分配、管理模式、生产率、债务和利润等诸因素的关系是不能用简单的一些二元关系所描述的。 广告投入和销售之间的关系:AALE706050403020100 这两个变量是否有关系? 显然,它们有关系;这从散点图就很容易看出。 基本上销售额是随着广告投入的递增而递增。 如果有关系,它们的关系是否显著? 这也可以
2、从散点图得到。当广告投入在6万元以下,销售额 增长很快;但大于这个投入时,销售额增长就不明显了。 因此,这两个变量的关系是由强变弱。 这些关系是什么关系,是否可以用数学模型来描述? 本例看上去是可以拟合一个回归模型,但绝不是线性的 (用一条直线可以描述的)。具体细节需要进一步的分析 这两个变量是否有关系?参数统计的关联性分析 参数统计中衡量两个定量变量之间线性相关程度的常用指标是皮尔逊 (Pearson) 相关系数,也称积距相关系数或动差相关系数 (离差相乘) 。 相关系数的定义公式是:12211()()()()niiinniiiiXXYYrXXYY1122(,),(,),.,(,).nnXY
3、XYXY “相关”一词涉及一组二元观测的相关值这又是什么关系? 这个关系是否带有普遍性? 也就是说,仅仅这一个样本有这样的关系,还是对于其他企业也有类似的规律。这里的数据还不足以回答这个问题。可能需要考虑更多的变量和收集更多的数据。 一般来说,人们希望能够从一些特殊的样本,得到普遍的结论,以利于预测。 这个关系是不是因果关系? 在本问题中,看来似乎有因果关系。这类似于一种试验;而试验时是容易找到因果关系的。但是,一般来说,变量之间有关系但绝不意味着存在因果关系。这里充满了危险和未知!1. 提出假设:H0: ;H1: 02. 计算检验的统计量: 3. 确定显著性水平 ,并作出决策。 相关系数非常
4、高的样本也有可能来自无相关关系的总体。为了排除这种情况,需要对相关系数进行显著性检验。注: 这一检验是在零假设成立且两个变量服从正态分布的情况下得出的。参数统计检验的步骤是:22 (2)1rntt nr皮尔逊相关系数的局限性 Pearson 相关系数及其显著性检验是建立在数据变量为定量且服从正态分布的前提下。若这一前提不成立,则结果不可信或是错误的。此时需要非参数方法。 Pearson 相关系数只能用来度量两个变量的线性相关性,不能用来度量两者的相关性.sPearsonrSpearmanrKendall实践中经常应用的三种相关系数:相关系数秩相关系数相关系数sPearsonrXYSpearma
5、nrKendall传统的相关系数是度量和的线性关系的而后两种非参数的秩相关系数和相关系数则度量更加广义的单调关系(不一定是线性的).这是因为变量的秩不会被变量的任何严格单调递增变换所改变.6.1 Spearman 秩相关检验 SpearmanSpearman秩相关是利用等级相关系数测定变量间等级相关程度的一种非参数统计相关分析方法。.Spearman检验统计量是历史最久(1904 年)的秩统计量.SpearmanSpearman检验统计量也被称为1122(,),(,),.,(,).nnXYXYXYXY之后,要检验它们所代表的二元变量和在给定一列数对是否相关010101:HXYHXYHXYHXY
6、HXYHXY和不相关.和相关.或和不相关.和正相关.或和不相关.和假设检验问题负相关.12121122,.,.,(,),(,),.,(,)nnnnx xxyyyxyXYxyxyxy设 ,是抽自两个不同总体,的样本,其观察值为,将它们配对形成和;基本思路与检验步骤基本思路与检验步骤 1122(,),(,),.,(, ).iiiiiinnxyxyRSR SRSRnS如果将各自排序,分别评出在两个顺序样本中所在位置的名次(即 秩),记作和,得到对秩和和n 对秩可能完全相同,也可能完全相反,或者不完全相同.( )00iiiiiXYxyxyRSddd可见,当与完全相关时,记作.其中可以用来度量和的相关程
7、度:越大, 与之间的相关越不完全.22 iiiiiiiiiiddRSdRSdnRS与与由于可正可负,直接用测度相关会缩小之间的差值,故用来反映的差值大小;但既受不一致程度的影响,也受观察值个数的多与少之影响。22 .iiddxySpearmanR为了准确度量和的相关程度,我们用的最大值去除,则得到了一个相对测量指标,称为等级相关系数,记为22223(1) / 3(1)iiddRn nn n22222222(1)(1)2.2(1)(1)2 (1)(3).(1) . / 3idnnnnnnn n的注:这是因为最大值等于22223.(1) / 3(1)iiddRn nn n故22()iiidRS很大
8、,则说明两个变量可能负相关,而如果它们很小,则如果可能正相关.010101:1:HXYHXYHXYHXYHXYHXY和不相关.和相关.或和不相关.和正相关.或和不相关.检验步骤()建立假和设负相关.11 0011 00.8ssssssssrrrrrrrr 的取值范围在到之间.为正相关,为负相关;为完全正相关,为完全负相关;当越接近 1,表示样本之间的相关程度越高;越接近于,表示样本之间的相关程注度越低。一般认为为相关程:时时度越高.2112221111()()61(1)()()11,.2nniiiiisnniiiinniiiiSpearRRSSdrn nRRSSRRmanSSnn( )计算检验
9、统计量:等级相关系数是测定两个样本相关程度的重要指标:其中003 .)sssssrrHrrHnSpea manrcr( )做出决策:当时,拒绝;当时,不能拒绝是临界值(书中记为,它是根据样本观测之个数 、备择假设(单侧或双侧)以及给定的显著性水平查秩相关系数检验临界值表查得。11/ 520,1()1( )(2 (2)szrnZzzZxyznNPPz 注:.遇到打结的情况时,如果或打结不多,可以用平均秩解决;如果打结过多(超过全部数据的),在计算时需要加上校正因子. 当为大样本时,近似服从正态分布。单侧:双侧: 例题:某班15名学生的数学成绩与统计学成绩如下表所示试分析学生的数学成绩和统计学成绩
10、的相关性( ) 05. 001:(1).HXYHXY解:提出假设和不相关.和正相关2126698110.825(1)15(.1)512niisdrn n:计算检验统计量( )0.050(3)5%82.5%.0.4460.8sssrrHr:作决策所以拒绝,可以在的显著性水平下认为数学成绩与统计学成绩存在正相关关系。又因为,两者呈高度正相关,相关程度达,2125%在一次跳水比赛中,有名裁判员给运动员的评分引起了争议。下表列出了他们给名选手的评分情况。试在的显著性水平下对这两名裁判员在本次比赛中的评分进行相关分析。选手A裁判员评分B裁判员评分选手A裁判员评分B裁判员评分18.09.078.910.0
11、29.08.889.18.337.58.598.89.548.59.8108.28.9510.08.7119.58.667.08.0128.07.5 这两个变量是否有关系? 显然,它们有关系;这从散点图就很容易看出。 基本上销售额是随着广告投入的递增而递增。 如果有关系,它们的关系是否显著? 这也可以从散点图得到。当广告投入在6万元以下,销售额 增长很快;但大于这个投入时,销售额增长就不明显了。 因此,这两个变量的关系是由强变弱。 这些关系是什么关系,是否可以用数学模型来描述? 本例看上去是可以拟合一个回归模型,但绝不是线性的 (用一条直线可以描述的)。具体细节需要进一步的分析 这两个变量是否有关系?这又是什么关系? 这个关系是否带有普遍性? 也就是说,仅仅这一个样本有这样的关系,还是对于其他企业也有类似的规律。这里的数据还不足以回答这个问题。可能需要考虑更多的变量和收集更多的数据。 一般来说,人们希望能够从一些特殊的样本,得到普遍的结论,以利于预测。 这个关系是不是因果关系? 在本问题中,看来似乎有因果关系。这类似于一种试验;而试验时是容易找到因果关系的。但是,一般来说,变量之间有关系但绝不意味着存在因果关系。这里充满了危险和未知!12121122,.,.,(,),(,),.,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 压缩感知在自适应信号处理中的应用-洞察分析
- 《欧美建筑特点》课件
- 写给对象的道歉信(15篇)
- 数字政府法律框架构建-洞察分析
- 外语学校品牌建设策略-洞察分析
- 性别视角下的家庭叙事研究-洞察分析
- 天然气液化技术发展趋势-洞察分析
- 《电源系统培训》课件
- 企业文化在客户服务中的作用
- 办公自动化与小设备的智能设计与实施案例分享
- PS平面设计练习题库(附参考答案)
- 混合云架构整体设计及应用场景介绍
- 六年级上册分数乘除混合运算300题带答案
- 北京市西城区2022-2023学年六年级上学期语文期末试卷(含答案)
- 小王子-英文原版
- 垫付协议合同范例
- 2024年高一语文期末复习训练-非连续性文本阅读
- 统编版2024-2025学年语文五年级上册日积月累专项训练练习题
- 2024年新人教版三年级数学上册《第8单元第8课时 分数的初步认识复习》教学课件
- 2024-2030年中国混凝土管桩行业发展分析及发展前景与趋势预测研究报告
- 全区国有企业资产全面清查工作方案
评论
0/150
提交评论