版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
变量间关系变量间关系1引例引例1:秃头与政治有西方专家研究发现,前苏联最高首脑头发多少居然与他们的政治风格有关,秃头的激进,头发浓密的保守,而且激进和保守交替出现:列宁秃头,激进;斯大林发多,保守;赫鲁晓夫秃头,激进;勃列日涅夫发多,保守;安德罗波夫秃头,激进;契尔年科夫发多,保守;戈尔巴乔夫秃头,激进叶利钦虽然发多,却最激进,但他不属于前苏联引例引例1:秃头与政治2引例2:“裙摆定律”泰勒就提出了着装与经济状况关系的“裙边理论”女士的裙子长短是经济状况的一个指示器在经济繁荣的年代,女士能够穿得起并显露昂贵的丝袜鞋子,裙边自然上移;到了经济萧条的年月,勤俭持家成为一种基本要求,丝袜鞋子自然没有那么漂亮了,于是裙边要往下放一下有人验之以美国20年代经济上升时期及30年代大萧条时期的服装市场,还真证实了裙子长度与经济状况的这种反比关系引例2:“裙摆定律”3引例3:有名字的奶牛产奶量更高英国纽卡斯尔的科学家,凯瑟琳·道格拉斯博士和皮特·罗林森博士表示,给奶牛起名字,并像对待人一样去对待奶牛,这样牛也高兴了,放松了,产奶量也上去了,可以为每个奶牛场提高500品脱的年产量引例3:有名字的奶牛产奶量更高4引例4:鹳鸟送子欧洲,人们把一种鸟称为送子鸟相传,送子鸟落到谁家屋顶造巢,谁家就会喜得贵子,幸福美满。因此,在欧洲乡村,你经常能看到住家的屋顶烟囱上搭着一个平台,那是专为送子鸟准备的,种神奇的送子鸟就是白鹳引例4:鹳鸟送子5函数关系19世纪末,德国数学家康托创立了集合论,人们把函数的定义提升到抽象的层次:设A,B是非空的集合,f是某一法则,若A中每个元素x,经由法则f,总有集合B中确定的元素y与之对应,则称f是定义在集合A上的一个函数圆的面积(S)与半径之间非关系可表示为S=R2;商品的销售额(y)与销售量(x)之间的关系可表示为y=pxp为单价变量间关系函数关系变量间关系6统计(相关)关系变量间确实存在、但数量上不固定的相互依存。这种关系不能用函数关系精确表达FourthLevel商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度之间的关系(x)父亲身高(y)与子女身高(x)之间的关系……变量间关系(续)统计(相关)关系变量间关系(续)7变量间关系(续)因果关系科学研究的目的是探讨因果关系
《周易》有言,积善之家必有余庆,积恶之家必有余殃!包括启蒙书上也有,善恶终有报,不是不报,时辰未到牛顿也说过它可以用他的力学规律描述任何物体的任何运动,都是确定的,所以牛顿理论是确定论,其因果律是确定的因果律,因果一一对应,不可倒置;量子力学中位置和动量不可以同时被确定的,但是其中之一是可以被精确地确定的,对于单个微观粒子无法判断其真实位置,但是服从统计规律,所以量子力学的因果律是统计规律的因果律变量间关系(续)因果关系8变量间关系(续)证明因果关系三要素:存在相关关系两个变量统计相关—A引起了B的变化存在适当的时间顺序自变量在因变量之前发生排除其他可能的原因B不是由A之外的其他原因引起思考:冰淇淋消费量与车祸中儿童受伤数—伪相关变量间关系(续)证明因果关系三要素:9变量间关系(续)关于变量间关系的四个问题从数据来看,变量间有关系吗?如果有关系,关系有多强?是偶然的吗?是因果关系吗?思考:如何看待吸烟与健康的关系?变量间关系(续)关于变量间关系的四个问题10变量间关系(续)
工作偏好合计
工作社会生活性别男235女325合计5510
工作偏好合计
工作社会生活性别男145女415合计5510
工作偏好合计
工作社会生活性别男055女505合计5510例子:性别与工作偏好变量间关系(续)工作偏好合计工作社会生活性别男23511预测自变量与因变量Y与X:两条腿比一条腿有劲闪电和打雷爆米花销售和垃圾袋使用发电量和热天数广告时间和用水量……变量间关系(续)预测变量间关系(续)12不同类型变量的关系思考:引例中分别属于?自变量因变量分类型顺序型数值型分类型数值型顺序型变量间关系(续)不同类型变量的关系自变量分类型顺序型数值型13列联表(contingencytable)由两个以上的变量交叉分类的频数分布表行变量的类别用r表示,ri
表示第i个类别列变量的类别用c表示,cj
表示第j个类别每种组合的观察频数用fij表示表中列出了行变量和列变量的所有可能的组合,所以称为列联表一个r行c列的列联表称为r
c列联表分类变量间的关系列联表(contingencytable)分类变量间的关系14列联表(contingencytable)由两个以上的变量交叉分类的频数分布表行变量的类别用r表示,ri
表示第i个类别列变量的类别用c表示,cj
表示第j个类别每种组合的观察频数用fij表示表中列出了行变量和列变量的所有可能的组合,所以称为列联表一个r行c列的列联表称为r
c列联表分类变量间的关系(续)列联表(contingencytable)分类变量间的关系15二维列联表…:………::::nc2c1合计r2f22f21i=2r1合计f12j=2j=1f11i=1列(cj)列(cj)行(ri)fij表示第i行第j列的观察频数分类变量间的关系(续)二维列联表…:………::::nc2c1合计r2f22f21i16三维列联表
观点:赞成观点:不赞成
低收入中等收入高收入低收入中等收入高收入男201055810女25157279分类变量间的关系(续)三维列联表
观点:赞成观点:不赞成
低收入中等收入高收入低收17分类变量间的关系(续)例析广告公司想要了解观众的所得收入与电视节目收视是否相关,其零假设为:
H0:电视节目的选择与收入无关
H1:收入与选择电视节目有关该公司抽取500户为样本,先用收入将样本区分成高、中、低三类,再以收看电视的种类分成「运动」、「电影」、「新闻」三类分类变量间的关系(续)例析18所得资料列联表分类变量间的关系(续)所得资料列联表分类变量间的关系(续)19分类变量间的关系(续)图示法分类变量间的关系(续)图示法20250*250/500=125150*50/500=15分类变量间的关系(续)250*250/500=125150*50/500=15分类21Criticalvalue=9.49数值法:有没有关系?分类变量间的关系(续)Criticalvalue=9.49数值法:有没有关系22分类变量间的关系(续)相关的强度主要是对分类(也可对顺序数据)之间相关程度的测度列联表相关测量的统计量主要有相关系数列联相关系数V相关系数分类变量间的关系(续)相关的强度23分类变量间的关系(续)
相关系数(correlationcoefficient)测度22列联表中数据相关程度对于22列联表,
系数的值在0~1之间
相关系数计算公式为分类变量间的关系(续)相关系数(correlation24分类变量间的关系(续)思路:简化的22列联表为例因素Y因素X合计x1x2y1aba+by2cdc+d合计a+cb+dn分类变量间的关系(续)思路:简化的22列联表为例因素因25分类变量间的关系(续)列联表中每个单元格的期望频数分别为将各期望频数代入的计算公式得分类变量间的关系(续)列联表中每个单元格的期望频数分别为26分类变量间的关系(续)将入
相关系数的计算公式得若ad等于bc,=0,表明变量X与Y之间独立;若b=0,c=0,或a=0,d=0,意味着各观察频数全部落在对角线上,此时||=1,表明变量X与Y之间完全相关列联表中变量的位置可以互换,的符号没有实际意义,故取绝对值即可分类变量间的关系(续)将入相关系数的计算公式得27分类变量间的关系(续)C相关系数(coefficientofcontingency)用于测度大于22列联表中数据的相关程度计算公式为C的取值范围是0C<1C=0表明列联表中的两个变量独立C的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大根据不同行和列的列联表计算的列联系数不便于比较分类变量间的关系(续)C相关系数(coefficiento28分类变量间的关系(续)V相关系数(Vcorrelationcoefficient)计算公式为V的取值范围是0V1V=0表明列联表中的两个变量独立V=1表明列联表中的两个变量完全相关不同行和列的列联表计算的列联系数不便于比较当列联表中有一维为2,min[(r-1),(c-1)]=1,此时V=分类变量间的关系(续)V相关系数(Vcorrelatio29分类变量间的关系(续)、C、V的比较同一个列联表,、C、V的结果会不同不同的列联表,、C、V的结果也不同在对不同列联表变量之间的相关程度进行比较时,不同列联表中的行与行、列与列的个数要相同,并且采用同一种系数分类变量间的关系(续)、C、V的比较30分类变量间的关系(续)
值近似值Sig.
φ.200.527Cramer的V.200.527相依系数.196.527用软件求解:SPSS需原始数据格式分类变量间的关系(续)值近似值Sig.φ.200.531分类变量间的关系(续)列联分析的一个局限Simpson’sParadoxAssociationoftwovariableswithoutthethirdleadstoaspecificconclusion.Associationoftwovariableswiththethirdvariableleadstotheoppositeconclusions分类变量间的关系(续)列联分析的一个局限32分类变量间的关系(续)分类变量间的关系(续)33缘由顺序变量比分类数据信息含量多父亲的教育程度是否与儿女的教育程度经济地位与能力高低社会阶层与幸福感….顺序变量间的关系缘由顺序变量间的关系34顺序变量间的关系(续)
政党身份合计
强弱中立兴趣不感兴趣20353287非常感兴42232590有点感兴384243123合计100100100300例:1956年调查,政党身份与选举兴趣顺序变量间的关系(续)政党身份合计强弱中立兴趣不感兴35顺序变量间的关系(续)图示法顺序变量间的关系(续)图示法36顺序变量间的关系(续)数值法(Gamma系数)
值渐进标准误近似值
近似值Sig.按标量标定φ.200
.018Cramer的V.141
.018相依系数.196
.018按顺序Kendall'stau-b.137.0512.696.007Kendall'stau-c.136.0502.696.007γ.205.0752.696.007顺序变量间的关系(续)数值法(Gamma系数)值渐进标准37顺序变量间的关系(续)将数字作为排序(秩)HDI与人均GDP顺序变量间的关系(续)将数字作为排序(秩)38顺序变量间的关系(续)顺序变量间的关系(续)39顺序变量间的关系(续)Spearman秩相关系数将两组变量按顺序等级排列,在等级的基础上计算等级相关系数,从而反映两组变量之间联系的密切程度等级相关系数的计算公式其中di为两变量每一对样本的等级之差,n为样本容量等级相关系数与相关系数一样,取值-1到+1之间,区别是它是建立在等级的基础上计算的,较适用于反映序列变量的相关顺序变量间的关系(续)Spearman秩相关系数40顺序变量间的关系(续)
HDI人均GNPSpearman的rhoHDI相关系数1.000.951**Sig.(双侧)..000N182182人均GNP相关系数.951**1.000Sig.(双侧).000.N182182**.在置信度(双测)为0.01时,相关性是显著的。顺序变量间的关系(续)HDI人均GNPSpearman41变量间关系变量间关系42引例引例1:秃头与政治有西方专家研究发现,前苏联最高首脑头发多少居然与他们的政治风格有关,秃头的激进,头发浓密的保守,而且激进和保守交替出现:列宁秃头,激进;斯大林发多,保守;赫鲁晓夫秃头,激进;勃列日涅夫发多,保守;安德罗波夫秃头,激进;契尔年科夫发多,保守;戈尔巴乔夫秃头,激进叶利钦虽然发多,却最激进,但他不属于前苏联引例引例1:秃头与政治43引例2:“裙摆定律”泰勒就提出了着装与经济状况关系的“裙边理论”女士的裙子长短是经济状况的一个指示器在经济繁荣的年代,女士能够穿得起并显露昂贵的丝袜鞋子,裙边自然上移;到了经济萧条的年月,勤俭持家成为一种基本要求,丝袜鞋子自然没有那么漂亮了,于是裙边要往下放一下有人验之以美国20年代经济上升时期及30年代大萧条时期的服装市场,还真证实了裙子长度与经济状况的这种反比关系引例2:“裙摆定律”44引例3:有名字的奶牛产奶量更高英国纽卡斯尔的科学家,凯瑟琳·道格拉斯博士和皮特·罗林森博士表示,给奶牛起名字,并像对待人一样去对待奶牛,这样牛也高兴了,放松了,产奶量也上去了,可以为每个奶牛场提高500品脱的年产量引例3:有名字的奶牛产奶量更高45引例4:鹳鸟送子欧洲,人们把一种鸟称为送子鸟相传,送子鸟落到谁家屋顶造巢,谁家就会喜得贵子,幸福美满。因此,在欧洲乡村,你经常能看到住家的屋顶烟囱上搭着一个平台,那是专为送子鸟准备的,种神奇的送子鸟就是白鹳引例4:鹳鸟送子46函数关系19世纪末,德国数学家康托创立了集合论,人们把函数的定义提升到抽象的层次:设A,B是非空的集合,f是某一法则,若A中每个元素x,经由法则f,总有集合B中确定的元素y与之对应,则称f是定义在集合A上的一个函数圆的面积(S)与半径之间非关系可表示为S=R2;商品的销售额(y)与销售量(x)之间的关系可表示为y=pxp为单价变量间关系函数关系变量间关系47统计(相关)关系变量间确实存在、但数量上不固定的相互依存。这种关系不能用函数关系精确表达FourthLevel商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度之间的关系(x)父亲身高(y)与子女身高(x)之间的关系……变量间关系(续)统计(相关)关系变量间关系(续)48变量间关系(续)因果关系科学研究的目的是探讨因果关系
《周易》有言,积善之家必有余庆,积恶之家必有余殃!包括启蒙书上也有,善恶终有报,不是不报,时辰未到牛顿也说过它可以用他的力学规律描述任何物体的任何运动,都是确定的,所以牛顿理论是确定论,其因果律是确定的因果律,因果一一对应,不可倒置;量子力学中位置和动量不可以同时被确定的,但是其中之一是可以被精确地确定的,对于单个微观粒子无法判断其真实位置,但是服从统计规律,所以量子力学的因果律是统计规律的因果律变量间关系(续)因果关系49变量间关系(续)证明因果关系三要素:存在相关关系两个变量统计相关—A引起了B的变化存在适当的时间顺序自变量在因变量之前发生排除其他可能的原因B不是由A之外的其他原因引起思考:冰淇淋消费量与车祸中儿童受伤数—伪相关变量间关系(续)证明因果关系三要素:50变量间关系(续)关于变量间关系的四个问题从数据来看,变量间有关系吗?如果有关系,关系有多强?是偶然的吗?是因果关系吗?思考:如何看待吸烟与健康的关系?变量间关系(续)关于变量间关系的四个问题51变量间关系(续)
工作偏好合计
工作社会生活性别男235女325合计5510
工作偏好合计
工作社会生活性别男145女415合计5510
工作偏好合计
工作社会生活性别男055女505合计5510例子:性别与工作偏好变量间关系(续)工作偏好合计工作社会生活性别男23552预测自变量与因变量Y与X:两条腿比一条腿有劲闪电和打雷爆米花销售和垃圾袋使用发电量和热天数广告时间和用水量……变量间关系(续)预测变量间关系(续)53不同类型变量的关系思考:引例中分别属于?自变量因变量分类型顺序型数值型分类型数值型顺序型变量间关系(续)不同类型变量的关系自变量分类型顺序型数值型54列联表(contingencytable)由两个以上的变量交叉分类的频数分布表行变量的类别用r表示,ri
表示第i个类别列变量的类别用c表示,cj
表示第j个类别每种组合的观察频数用fij表示表中列出了行变量和列变量的所有可能的组合,所以称为列联表一个r行c列的列联表称为r
c列联表分类变量间的关系列联表(contingencytable)分类变量间的关系55列联表(contingencytable)由两个以上的变量交叉分类的频数分布表行变量的类别用r表示,ri
表示第i个类别列变量的类别用c表示,cj
表示第j个类别每种组合的观察频数用fij表示表中列出了行变量和列变量的所有可能的组合,所以称为列联表一个r行c列的列联表称为r
c列联表分类变量间的关系(续)列联表(contingencytable)分类变量间的关系56二维列联表…:………::::nc2c1合计r2f22f21i=2r1合计f12j=2j=1f11i=1列(cj)列(cj)行(ri)fij表示第i行第j列的观察频数分类变量间的关系(续)二维列联表…:………::::nc2c1合计r2f22f21i57三维列联表
观点:赞成观点:不赞成
低收入中等收入高收入低收入中等收入高收入男201055810女25157279分类变量间的关系(续)三维列联表
观点:赞成观点:不赞成
低收入中等收入高收入低收58分类变量间的关系(续)例析广告公司想要了解观众的所得收入与电视节目收视是否相关,其零假设为:
H0:电视节目的选择与收入无关
H1:收入与选择电视节目有关该公司抽取500户为样本,先用收入将样本区分成高、中、低三类,再以收看电视的种类分成「运动」、「电影」、「新闻」三类分类变量间的关系(续)例析59所得资料列联表分类变量间的关系(续)所得资料列联表分类变量间的关系(续)60分类变量间的关系(续)图示法分类变量间的关系(续)图示法61250*250/500=125150*50/500=15分类变量间的关系(续)250*250/500=125150*50/500=15分类62Criticalvalue=9.49数值法:有没有关系?分类变量间的关系(续)Criticalvalue=9.49数值法:有没有关系63分类变量间的关系(续)相关的强度主要是对分类(也可对顺序数据)之间相关程度的测度列联表相关测量的统计量主要有相关系数列联相关系数V相关系数分类变量间的关系(续)相关的强度64分类变量间的关系(续)
相关系数(correlationcoefficient)测度22列联表中数据相关程度对于22列联表,
系数的值在0~1之间
相关系数计算公式为分类变量间的关系(续)相关系数(correlation65分类变量间的关系(续)思路:简化的22列联表为例因素Y因素X合计x1x2y1aba+by2cdc+d合计a+cb+dn分类变量间的关系(续)思路:简化的22列联表为例因素因66分类变量间的关系(续)列联表中每个单元格的期望频数分别为将各期望频数代入的计算公式得分类变量间的关系(续)列联表中每个单元格的期望频数分别为67分类变量间的关系(续)将入
相关系数的计算公式得若ad等于bc,=0,表明变量X与Y之间独立;若b=0,c=0,或a=0,d=0,意味着各观察频数全部落在对角线上,此时||=1,表明变量X与Y之间完全相关列联表中变量的位置可以互换,的符号没有实际意义,故取绝对值即可分类变量间的关系(续)将入相关系数的计算公式得68分类变量间的关系(续)C相关系数(coefficientofcontingency)用于测度大于22列联表中数据的相关程度计算公式为C的取值范围是0C<1C=0表明列联表中的两个变量独立C的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大根据不同行和列的列联表计算的列联系数不便于比较分类变量间的关系(续)C相关系数(coefficiento69分类变量间的关系(续)V相关系数(Vcorrelationcoefficient)计算公式为V的取值范围是0V1V=0表明列联表中的两个变量独立V=1表明列联表中的两个变量完全相关不同行和列的列联表计算的列联系数不便于比较当列联表中有一维为2,min[(r-1),(c-1)]=1,此时V=分类变量间的关系(续)V相关系数(Vcorrelatio70分类变量间的关系(续)、C、V的比较同一个列联表,、C、V的结果会不同不同的列联表,、C、V的结果也不同在对不同列联表变量之间的相关程度进行比较时,不同列联表中的行与行、列与列的个数要相同,并且采用同一种系数分类变量间的关系(续)、C、V的比较71分类变量间的关系(续)
值近似值Sig.
φ.200.527Cramer的V.200.527相依系数.196.527用软件求解:SPSS需原始数据格式分类变量间的关系(续)值近似值Sig.φ.200.572分类变量间的关系(续)列联分析的一个局限Simpson’sParadoxAssociationoftwovariableswithoutthethirdleadstoaspecificco
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024债务担保服务合同标准文本3篇
- 2024年沪教版四年级语文下册阶段测试试卷
- 2024年鲁人新版七年级数学上册月考试卷
- 创新学生心理健康教育在科技教育中的应用
- 办公环境下的家庭健康菜谱推广策略
- 商务礼仪在家庭与社交中的艺术运用
- 中小学教育中数学与自然科学知识融合教学的案例分析
- 办公心理学与家园共育的融合实践
- 不同年龄段对教育信息接受度差异的深度研究
- 2025中国铁路北京局集团限公司招聘189人(三)高频重点提升(共500题)附带答案详解
- 广东省广州市天河区2022-2023学年七年级上学期期末语文试题(含答案)
- DBJT45T 037-2022 高速公路出行信息服务管理指南
- 期末试卷(试题)-2024-2025学年三年级上册数学苏教版
- 天津市南开区2023-2024学年四年级上学期期末英语试题
- 期末考试-公共财政概论-章节习题
- 反循环钻孔灌注桩施工方案
- 齿轮传动的设计论文
- 国家开放大学《纳税筹划》章节测试参考答案
- 上海市医疗器械经营质量管理规范实施细则
- EVM500在电缆中应用
- 联想集团内训师管理制度
评论
0/150
提交评论