第八章相关性测量_第1页
第八章相关性测量_第2页
第八章相关性测量_第3页
第八章相关性测量_第4页
第八章相关性测量_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一节第一节 统计相关的性质统计相关的性质 第二节第二节 相关测量相关测量 第一节第一节 统计相关的性质统计相关的性质 v相关关系:相关关系: 一个变量值与另一个变量值有连带性;一个变量值与另一个变量值有连带性; 一个变量值发生变化,另一个变量值也发生变化;一个变量值发生变化,另一个变量值也发生变化; 指变量间具有密切关联而又不能用函数关系精确指变量间具有密切关联而又不能用函数关系精确 表示的关系表示的关系。 v正相关与负相关:正相关与负相关: 正相关:一个变量值增加时,另一个变量值正相关:一个变量值增加时,另一个变量值 也增加;也增加; 负相关:一个变量值增加时,另一个变量值负相关:一个变量

2、值增加时,另一个变量值 却减少;却减少; 相关方向的分析只适用于定序或定距变量。相关方向的分析只适用于定序或定距变量。 v对称关系:对称关系: 两变量的关系仅是共变的,不能确定是两变量的关系仅是共变的,不能确定是X X影响影响Y Y, 还是还是Y Y影响影响X X,即,即XYXY; 不能区分自变量与因变量;不能区分自变量与因变量; v不对称关系:不对称关系: 两变量的关系具有因果性,两变量的关系具有因果性,X X影响影响Y Y,而,而Y Y不会影不会影 响响X X,即,即X X是因,是因,Y Y是果,即是果,即 X Y;X Y; 可以区分自变量与因变量可以区分自变量与因变量; v相关关系与函数

3、关系相关关系与函数关系; ; 函数关系是一种确定的一一对应的关系;可以用函数关系是一种确定的一一对应的关系;可以用 精确的函数表达式来描述;有自变量精确的函数表达式来描述;有自变量x x与因变量与因变量y y 之分;之分; 相关关系则不具备上述特征,是一种松散的对应相关关系则不具备上述特征,是一种松散的对应 关系。关系。 v曲线相关。家庭收入与购买汽车的愿望曲线相关。家庭收入与购买汽车的愿望 v线性相关系数:线性相关系数: -1-1-完全负相关完全负相关 -0.6- -0.6-强负相关强负相关 -0.3- -0.3-中度负相关中度负相关 -0.1- -0.1-弱负相关弱负相关 0- 0-不相关

4、不相关 0.1- 0.1-弱正相关弱正相关 0.3- 0.3-中度正相关中度正相关 0.6- 0.6-强正相关强正相关 1- 1-完全正相关完全正相关 交互表与相关分析交互表与相关分析 表表1 1不同年级大学生志愿活动参与情况统计不同年级大学生志愿活动参与情况统计 人人 年级年级 志愿者活动志愿者活动参与情况参与情况 合计合计经常参加经常参加偶尔参加偶尔参加从未参加从未参加 大一大一138637136 大二大二237419116 大三大三147417105 合计合计5023473357 教育水平教育水平 志愿志愿 快乐家庭快乐家庭理想工作理想工作增广见闻增广见闻 高高0 00 05 5 中中0

5、 030300 0 低低5 50 00 0 教育水平教育水平 志愿志愿 快乐家庭快乐家庭理想工作理想工作增广见闻增广见闻 高高5 50 00 0 中中0 030300 0 低低0 00 05 5 v在绝大多数情况下,观测频数是分散在列联在绝大多数情况下,观测频数是分散在列联 表的各个单元格中,此时就不太容易直接发表的各个单元格中,此时就不太容易直接发 现行列变量之间的关系和它们关系的强弱程现行列变量之间的关系和它们关系的强弱程 度。为此,度。为此,需要根据样本数据计算变量间的需要根据样本数据计算变量间的 关系,并通过假设检验检定总体中变量之间关系,并通过假设检验检定总体中变量之间 的关系。的关

6、系。 第二节第二节 相关测量相关测量 一、选择相关测量法的注意事项一、选择相关测量法的注意事项 (一)两个变量的测量层次:(一)两个变量的测量层次: 两个定类变量;两个定类变量; 两个定序变量;两个定序变量; 两个定距变量;两个定距变量; 一个定类变量和一个定距变量;一个定类变量和一个定距变量; 一个定类变量和一个定序变量;一个定类变量和一个定序变量; 一个定序变量和一个定距变量;一个定序变量和一个定距变量; (二)两个变量是否对称(二)两个变量是否对称 (三)该相关系数是否具有更丰富的其他(三)该相关系数是否具有更丰富的其他 数学含义。数学含义。 二、相关测量与相关性的检验 (一)两个定类变

7、量;(一)两个定类变量; (二)两个定序变量;(二)两个定序变量; (三)两个定距变量;(三)两个定距变量; (四)一个定类变量和一个定距变量;(四)一个定类变量和一个定距变量; (五)一个定类变量和一个定序变量;(五)一个定类变量和一个定序变量; (六)一个定序变量和一个定距变量(六)一个定序变量和一个定距变量 LambdaLambda相关测量法(相关测量法(对称与不对称对称与不对称) v基本逻辑:以一个定类变量值来预测另基本逻辑:以一个定类变量值来预测另 一个变量值时,若以众值次数作为预测的一个变量值时,若以众值次数作为预测的 准则,则可减少的误差是多少准则,则可减少的误差是多少。 (一)

8、两个定类变量的相关测量(一)两个定类变量的相关测量 v对称相关测量法对称相关测量法 v不对称相关测量法不对称相关测量法: vMy=Y变量边缘分布的变量边缘分布的 众值次数;众值次数; vMx=X变量边缘分布的变量边缘分布的 众值次数众值次数 vmy=X变量的每个值之变量的每个值之 下的下的Y变量的众值次数变量的众值次数 vmx=Y 变量的每个值之变量的每个值之 下的下的X变量的众值次数变量的众值次数 vn=全部个案数目全部个案数目 )(2 )( yx yxyx MMn MMmm y yy y Mn Mm Lambda相关测量法(对称)相关测量法(对称) v职工的行业与性别(职工的行业与性别(0

9、.32) 性别性别 行业行业 轻工轻工 重工重工合计合计 女女15070220 男男60120180 合计合计210190400 vmx=150+120=270 vmy=150+120=270 v My=210 v Mx=220 vn=400 )(2 )( yx yxyx MMn MMmm (不对称)(不对称) 专业类型专业类型 工作价值工作价值 经济型经济型 成就型成就型 人际关系型人际关系型合计合计 生物生物1802020220 IT4080120 行政管理行政管理204060 合计合计24010060400 y yy y Mn Mm Lambda相关测量法(缺点)相关测量法(缺点) v缺

10、点:比较粗略,不够灵敏。它以众值次数为预测缺点:比较粗略,不够灵敏。它以众值次数为预测 的准则,不理的准则,不理会众值次数会众值次数以外的次数分布。若众值以外的次数分布。若众值 次数集中在条件次数表上的同一行或同一列,则次数集中在条件次数表上的同一行或同一列,则 Lambda相关系数为相关系数为0。 职业与工作价值取向的关系职业与工作价值取向的关系 职业职业 价值取向价值取向 物质报酬物质报酬 人情关系人情关系合计合计 制造业制造业10540145 服务业服务业452570 合计合计15065215 (二)两个定类变量相关性的检验(二)两个定类变量相关性的检验 2 检验检验 vH1:X与与Y相

11、关相关 vH0:X与与Y不相关不相关 vf f是根据所抽取的样是根据所抽取的样 本而计算出来的每本而计算出来的每 个单元格中的观察个单元格中的观察 频次。频次。e e是二者不相是二者不相 关情况下每个单元关情况下每个单元 格内的期望频次。格内的期望频次。n n 是样本大小,是样本大小,r r与与c c 则分别是交互表的则分别是交互表的 行数与列数。行数与列数。 自由度自由度df=(r-1)(c-1)。 v 2越大,就是越大,就是H0的正确性越小。也就是说在的正确性越小。也就是说在 总体中总体中X与与Y越可能是相关的。越可能是相关的。 不同自由度不同自由度 df df 的的2 2 分布曲线图。分

12、布曲线图。 2 df= 3 df= 5 df= 10 df= 30 例题例题 v研究不同性别(研究不同性别(X X)的学生对父母的敬重情况()的学生对父母的敬重情况(Y Y)。)。 从一个随机样本中得到下表的次数分布,可见男学生从一个随机样本中得到下表的次数分布,可见男学生 较多敬佩父亲,而女学生则较多敬佩母亲。问总体中较多敬佩父亲,而女学生则较多敬佩母亲。问总体中 性别与敬佩父母情况是否存在差异?性别与敬佩父母情况是否存在差异? 最敬佩最敬佩 性性 别别 总数总数男男女女 父亲父亲 1261269999225225 母亲母亲 7171162162233233 总数总数 19719726126

13、1458458 计算计算 2值值 在在0.05显著度水平下显著度水平下 ,自由度为,自由度为1的卡方的卡方 临界值为临界值为3.841. 因为因为 2 3.841,所,所 以否定虚无假设,以否定虚无假设, 即即总体中性别与敬总体中性别与敬 佩父母情况存在差佩父母情况存在差 异异。 F11=126; f12=99F11=126; f12=99 F21=71; f22=162F21=71; f22=162 e11=96.8; e12=128.2e11=96.8; e12=128.2 e21=100.2; e22=132.8e21=100.2; e22=132.8 =30.389 =30.389 D

14、f=(2-1)(2-1)=1Df=(2-1)(2-1)=1 v应该注意应该注意:卡方分布是一个连续分布。在列:卡方分布是一个连续分布。在列 联表分析中,由于数据是分类非连续的,因联表分析中,由于数据是分类非连续的,因 此此pearsonpearson卡方统计量只能近似服从卡方分布卡方统计量只能近似服从卡方分布 。在单元格较多、样本量较大时,分类数据。在单元格较多、样本量较大时,分类数据 的不连续分布与卡方分布之间的差异并不显的不连续分布与卡方分布之间的差异并不显 著。反之,这种差异那就不可忽视。著。反之,这种差异那就不可忽视。 StataStata提供的两个定类变量的相关系数是:提供的两个定类

15、变量的相关系数是: GramersGramers V V系数系数 V V系数在计算时既考虑了样本数的影响,还考虑系数在计算时既考虑了样本数的影响,还考虑 了列联表的单元格数,最适用于社会学研究。了列联表的单元格数,最适用于社会学研究。 C Cr ra am m r r s s V V = = 0 0. .1 10 08 84 4 T To ot ta al l 1 16 61 1 1 1, ,4 41 16 6 1 1, ,5 57 77 7 1 1 2 23 3 4 43 32 2 4 45 55 5 0 0 1 13 38 8 9 98 84 4 1 1, ,1 12 22 2 u ur

16、rb ba an n 0 0 1 1 T To ot ta al l e en nr ro ol ll l . . t ta ab b u ur rb ba an n e en nr ro ol ll l, , V V C Cr ra am m r r s s V V = = 0 0. .1 10 08 84 4 P Pe ea ar rs so on n c ch hi i2 2( (1 1) ) = = 1 18 8. .5 53 33 39 9 P Pr r = = 0 0. .0 00 00 0 T To ot ta al l 1 16 61 1 1 1, ,4 41 16 6 1 1

17、, ,5 57 77 7 1 1 2 23 3 4 43 32 2 4 45 55 5 0 0 1 13 38 8 9 98 84 4 1 1, ,1 12 22 2 u ur rb ba an n 0 0 1 1 T To ot ta al l e en nr ro ol ll l . . t ta ab b u ur rb ba an n e en nr ro ol ll l, , V V c ch hi i2 2 似然比卡方值(似然比卡方值(likelihood-ratio chi2)与)与 Fisher 精确检验精确检验 1 1- -s si id de ed d F Fi is sh

18、 he er r s s e ex xa ac ct t = = 0 0. .0 00 00 0 F Fi is sh he er r s s e ex xa ac ct t = = 0 0. .0 00 00 0 l li ik ke el li ih ho oo od d- -r ra at ti io o c ch hi i2 2( (1 1) ) = = 2 20 0. .9 94 44 47 7 P Pr r = = 0 0. .0 00 00 0 T To ot ta al l 1 16 61 1 1 1, ,4 41 16 6 1 1, ,5 57 77 7 1 1 2 23 3

19、 4 43 32 2 4 45 55 5 0 0 1 13 38 8 9 98 84 4 1 1, ,1 12 22 2 u ur rb ba an n 0 0 1 1 T To ot ta al l e en nr ro ol ll l . . t ta ab bu ul la at te e u ur rb ba an n e en nr ro ol ll l, , e ex xa ac ct t l lr rc ch hi i2 2 n no ok ke ey y . . 1 1- -s si id de ed d F Fi is sh he er r s s e ex xa ac ct

20、 t = = 0 0. .0 00 00 0 F Fi is sh he er r s s e ex xa ac ct t = = 0 0. .0 00 00 0 C Cr ra am m r r s s V V = = 0 0. .1 10 08 84 4 l li ik ke el li ih ho oo od d- -r ra at ti io o c ch hi i2 2( (1 1) ) = = 2 20 0. .9 94 44 47 7 P Pr r = = 0 0. .0 00 00 0 P Pe ea ar rs so on n c ch hi i2 2( (1 1) ) =

21、= 1 18 8. .5 53 33 39 9 P Pr r = = 0 0. .0 00 00 0 1 16 61 1. .0 0 1 1, ,4 41 16 6. .0 0 1 1, ,5 57 77 7. .0 0 T To ot ta al l 1 16 61 1 1 1, ,4 41 16 6 1 1, ,5 57 77 7 4 46 6. .5 5 4 40 08 8. .5 5 4 45 55 5. .0 0 1 1 2 23 3 4 43 32 2 4 45 55 5 1 11 14 4. .5 5 1 1, ,0 00 07 7. .5 5 1 1, ,1 12 22 2.

22、.0 0 0 0 1 13 38 8 9 98 84 4 1 1, ,1 12 22 2 u ur rb ba an n 0 0 1 1 T To ot ta al l e en nr ro ol ll l . . t ta ab b u ur rb ba an n e en nr ro ol ll l, , c ch hi i2 2 e ex xa ac ct t e ex xp pe ec ct te ed d l lr rc ch hi i2 2 V V n no ok ke ey y 二、两个定序变量相关关系测量与鉴定二、两个定序变量相关关系测量与鉴定 vGammaGamma系数系数:

23、 :分析对称关系分析对称关系 v系数值在系数值在-1-1至至+1+1之间之间, ,比相关程度比相关程度, ,也表示相也表示相 关方向。关方向。 v相关系数具有消减误差的含义。相关系数具有消减误差的含义。 例:例:A A、B B、C C、D D、E E五位同学学习积极性等级五位同学学习积极性等级 与考试成绩等级情况如下表,求同学学习积极与考试成绩等级情况如下表,求同学学习积极 性等级与考试成绩等级的相关性性等级与考试成绩等级的相关性 同学同学积极性等级(积极性等级(x)成绩等级(成绩等级(y) A B C D E F 5 3 4 1.5 1.5 3 5 3 1 3 3 4 GammaGamma级

24、序相关法(对称关系)级序相关法(对称关系) v基本逻辑:根据任何两个个案在某变量上的等级来基本逻辑:根据任何两个个案在某变量上的等级来 预测他们在另一个变量上的等级时,可以减少的误预测他们在另一个变量上的等级时,可以减少的误 差是多少;差是多少; v公式推导公式推导:G=(Ns-Nd) :G=(Ns-Nd) / / (Ns+Nd).(Ns+Nd). v当不知当不知X X与与Y Y之间的等级关系时,预测之间的等级关系时,预测Y Y的等级是个的等级是个 随机过程,对错各占一半;随机过程,对错各占一半; v当知道当知道X X与与Y Y之间的等级关系后,再知道之间的等级关系后,再知道XaXa大于大于X

25、bXb, 猜猜YaYa与与YbYb的关系;或的关系;或XaXa小于小于XbXb时,猜时,猜YaYa与与YbYb的关系。的关系。 v总对数总对数T=n(n-1)/2, nT=n(n-1)/2, n为个案数目。为个案数目。 v当只有两个定序变量时,可能出现的对的种类有以当只有两个定序变量时,可能出现的对的种类有以 下五种下五种(设:个案设:个案A A在在X X上的等级为上的等级为X Xa a,在,在Y Y上的等级上的等级 为为Y Ya a,个案,个案B B在在X X上的等级为上的等级为X Xb b,在,在Y Y上的等级为上的等级为Y Yb b):): 1.1.同序对同序对N Ns s:X Xa a

26、大于大于X Xb b; ;Y Ya a大于 大于Y Yb b; 2.2.异序对异序对N Nd d: X Xa a大于大于X Xb b; ;Y Ya a小于 小于Y Yb b; 3.3.X X同分对同分对T Tx x: X Xa aX Xb b; ;Y Ya a不等于 不等于Y Yb b ; ; 4.4.Y Y同分对同分对T Ty y: X Xa a不等于不等于X Xb b; ;Y Ya a Y Yb b ; ; 5.5.X X与与Y Y同分对同分对T Txy xy: : X Xa a X Xb b; ;Y Ya a Y Yb b ; vNs= vNd= vTx= vTy= vTxy= 工厂工厂

27、 积极性等级(积极性等级(x)成绩等级(成绩等级(y) A B C D E F 5 3 4 1.5 1.5 3 5 3 1 3 3 4 vN Ns s = 4 ; N = 4 ; Nd d = 3 = 3 vG = ( 4 -3 ) / ( 4 + 3 ) = +0.14G = ( 4 -3 ) / ( 4 + 3 ) = +0.14 v学生积极性与成绩成正比。二者相关程度较学生积极性与成绩成正比。二者相关程度较 弱,用其中一个变量来预测另一个变量,可弱,用其中一个变量来预测另一个变量,可 以消减以消减14%14%的误差。的误差。 练习练习 工作满足感与归属感工作满足感与归属感 被访者被访者工

28、作满足感(工作满足感(X)归属感(归属感(Y) A23 B12 C13 D31 E12 v小样本可以用前面方法求相关系数。小样本可以用前面方法求相关系数。 v社会学研究往往是大样本,要用到交互分类社会学研究往往是大样本,要用到交互分类 表,如何求交互表中两个定序变量的相关系表,如何求交互表中两个定序变量的相关系 数呢?数呢? 在个案数目众多次数表中求在个案数目众多次数表中求Gamma或或dy 系数系数 v2 2 * * 2 2 表表 v2 2 * * 3 3 表表 v3 3 * * 2 2 表表 v3 3 * * 3 3 表表 2 * 2 表 v X v 1 2 v Y 1 f11 f12 v

29、 2 f21 f22 )21(12)22(11 )21(12)22(11 ffff ffff NdNs NdNs G Ns= f11(f22) Nd=f12(f21) Tx=f11(f21)+f12(f22) Ty=f11(f12)+f21(f22) Txy:从略:从略 N Ns s=f=f11 11(f (f22 22+f +f23 23+)+f +)+f12 12(f (f23 23) ) N Nd d=f=f13 13(f (f22 22+f +f21 21)+f )+f12 12(f (f21 21) ) T Ty y=f=f11 11(f (f12 12+f +f13 13)+f )

30、+f12 12(f (f13 13)+f )+f21 21(f (f22 22+f +f23 23)+f )+f22 22(f (f23 23) ) (T Tx x与与T Txy xy略去) 略去) Y Y X X 1 12 23 3 1 1f f11 11 f f12 12 f f13 13 2 2f f21 21 f f22 22 f f23 23 Ns=f11(f22+f23+f32+f33)+f12(f23+f33)+f21(f32+f33)+f22(f33) Nd=f13(f22+f21+f32+f31)+f12(f21+f31)+f23(f32+f31)+f22(f31) Ty=f

31、11(f12+f13)+f12(f13)+f21(f22+f23)+f22(f23)+f31(f32+f33)+ f32(f33) Y Y X X 1 12 23 3 1 1f f11 11 f f12 12 f f13 13 2 2f f21 21 f f22 22 f f23 23 3 3f f31 31 f f32 32 f f33 33 v两个定序变量相关性的计算:两个定序变量相关性的计算: 如果同序对占多数,则认为两个变量为正相如果同序对占多数,则认为两个变量为正相 关;如果异序对较多,则认为两变量为负相关;如果异序对较多,则认为两变量为负相 关;如果同序对和异序对数大致相同,则认关

32、;如果同序对和异序对数大致相同,则认 为两个变量无相关关系。为两个变量无相关关系。 (二)两个定序变量相关的检定(二)两个定序变量相关的检定 v假设总体中的两个变量满足下列条件假设总体中的两个变量满足下列条件: v1 1、两个变量都是定序变量。、两个变量都是定序变量。 v2 2、随机抽样。、随机抽样。 v3 3、样本数量较大(最好、样本数量较大(最好n100n100) v那么,据统计学的推算,依据那么,据统计学的推算,依据H H0 0而成立的而成立的G G值值 的抽样分布就会近似正态分布,所以可以用的抽样分布就会近似正态分布,所以可以用Z Z 检定法来检定检定法来检定H H0 0的正误。的正误

33、。 (二)两个定序变量相关的检定(二)两个定序变量相关的检定 v比较准确的做法,是以比较准确的做法,是以GammaGamma系数求出系数求出 样本中的样本中的X X与与Y Y的相关,然后以的相关,然后以Z Z检定法检定法 或或t t检定法来推论在总体中检定法来推论在总体中GammaGamma是否等是否等 于零。于零。 v即: H1H1 : : 总体中总体中Gamma 或或0 0 v H0 :H0 : 总体中总体中Gamma =0 =0 (二)两个定序变量相关的检定(二)两个定序变量相关的检定 v大样本用大样本用Z Z检定法,小样本或大样本都可用检定法,小样本或大样本都可用t t检定检定 法法

34、v v df = Ns+ Nd 2 vNsNs是同序对数,是同序对数,NdNd是异序对数,是异序对数,n n是样本的大小是样本的大小。 vStata提供两个定序变量的相关系数:提供两个定序变量的相关系数:gamma与与taub 小学或以下小学或以下初中初中高中(含中专)高中(含中专) 大专以上大专以上合计合计 普工普工1111113353351641643535645645 技工技工47472022021271273232408408 班组长、班组长、 领班领班 8 8525249491616125125 主管主管6 61717141429296666 其他其他6 63535383832321

35、11111 合计合计17817864164139239214414413551355 . . t ta ab b t t1 11 1 t t3 31 1, ,g ga am mm ma a t ta au ub b K Ke en nd da al ll l s s t ta au u- -b b = = 0 0. .2 21 18 86 6 A AS SE E = = 0 0. .0 02 23 3 g ga am mm ma a = = 0 0. .3 32 22 23 3 A AS SE E = = 0 0. .0 03 33 3 三、两个定距变量相关测量与检定三、两个定距变量相关测量与

36、检定 v(一)两个定距变量相关性的测量(一)两个定距变量相关性的测量 v皮尔逊(皮尔逊(PearsonPearson)相关系数)相关系数 r r : v(1 1)测量两个定距变量相关程度的最好尺度;)测量两个定距变量相关程度的最好尺度; (2 2)r r 本身不表示消减误差比例,本身不表示消减误差比例,r r2 2具有消减误差比例的具有消减误差比例的 意义,称为意义,称为决定系数决定系数,表示以线性回归方程作为预测工具,表示以线性回归方程作为预测工具 时所能减少的误差比例。时所能减少的误差比例。 例题:检验例题:检验8 8名儿童样本的身高和体重之间的相关程度名儿童样本的身高和体重之间的相关程度

37、 儿童儿童XYABABA2B2 A4981-5-9452581 B5088-4-28164 C5387-1-3319 D5599199181 E6091616361 F55891-1-111 G609565303625 H5090-400160 X= 432 Y= 720 SP=100SSX= 132 SSY= 202 vPearsonPearson(皮尔逊)相关系数:(皮尔逊)相关系数: 61.0 )202)(132( 100 )()( )( 2 2 YX SSSS SP YYXX YYXX r (二)两个定距变量相关的总体检定(二)两个定距变量相关的总体检定 v可以用可以用F F检定检定或

38、者或者t t检定检定 vr r是样本的积距相关系数,是样本的积距相关系数, r2 称为称为决定系数决定系数, 具有消减误差比例的意义。具有消减误差比例的意义。 vH1H1:总体中:总体中 r 0r 0 vH0: H0: 总体中总体中 r = 0r = 0 练习十二练习十二 v9 9名女青年受教育年期名女青年受教育年期 与参加家务劳动时间与参加家务劳动时间 的关系是:的关系是:r = -0.81r = -0.81 v检定总体中女青年受检定总体中女青年受 教育年期与参加家务教育年期与参加家务 劳动时间的关系劳动时间的关系 妇女妇女教育年期教育年期X劳动小时劳动小时Y A25 B24 C34 D33

39、 E41 F41 G40 H60 I80 总数3618 vF=13.36F=13.36 vdfdf1 1=k-1=2-1=1=k-1=2-1=1 vdfdf2 2=n-k=9-2=7=n-k=9-2=7 v在在0.010.01显著度水平上,自由度显著度水平上,自由度dfdf1 1=1=1; dfdf2 2=7=7情况下,情况下,F F的临界值是的临界值是12.2512.25,因为,因为 13.3613.3612.2512.25,在否定域内,故否定虚,在否定域内,故否定虚 无假设,即总体中这两个变量相关。无假设,即总体中这两个变量相关。 使用皮尔逊相关系数的要求使用皮尔逊相关系数的要求 v(1

40、1)线性相关。要求)线性相关。要求X X与与Y Y之间是线性相关关之间是线性相关关 系。系。 v(2 2)定距数据。)定距数据。X X与与Y Y要求是定距变量。要求是定距变量。 v(3 3)随机抽样。)随机抽样。 v(4 4)正态分布。要求)正态分布。要求X X与与Y Y的总体都呈正态分的总体都呈正态分 布。如果是大样本(布。如果是大样本(n n3030),这个要求就不),这个要求就不 严格了。严格了。 Stata命令命令 vcorr a b c 参与计算任何一个变量有缺参与计算任何一个变量有缺 失值,该改革就被排除在计算之外失值,该改革就被排除在计算之外 vpwcorr a b c,sig

41、参与计算的变量有缺失参与计算的变量有缺失 值,则剔除在这两个变量上有缺失值的个案值,则剔除在这两个变量上有缺失值的个案 v偏相关分析偏相关分析:pcorr a b c s si ib bs s - -0 0. .0 08 81 10 0 - -0 0. .0 06 64 41 1 1 1. .0 00 00 00 0 a ag ge e 0 0. .9 92 26 63 3 1 1. .0 00 00 00 0 e ed du u 1 1. .0 00 00 00 0 e ed du u a ag ge e s si ib bs s ( (o ob bs s= =1 15 58 83 3) ) . . c co or rr r e ed du u a ag ge e s si ib bs s 1 15 58 83 3 2 21 10 01 1 2 21 10 01 1 0 0. .0 00 01 13 3 0 0. .3 39 97 72 2 s si ib bs s - -0 0. .0 08 81 10 0 0 0. .0 01 18 85 5 1 1. .0 00 00 00 0 1 15 58 8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论