版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十一讲:多变量的统计分析
-详析分析与统计控制1社会现象的复杂性决定了社会中各事物之间的关系并不是简单的两两相关,两个变量之间的关系也可能受到其他因素(如W、T)的影响。因此,当前社会学的研究中不仅关注两个变量的关系,更关注多个变量关系的分析。
2一、多变量分析的主要类型详析分析多项分析多因分析
多项相关分析多变量的分析根据研究目的的不同,可以分为三类:详析分析、多因分析和多项相关分析。31、详析分析详析分析是通过引进第三个变量(如W、T),通过分析第三个变量与两个变量(X,Y)的关系,进一步加深对两个变量之间关系的了解。4
详析分析研究的是两个变量之间的关系,引进其他变量(W,T,C)的目的是要加深了解这两个变量(X和Y)的相关关系XYW,T,C52、多因分析
X1X2YX3说明的是多个自变量对某个因变量的共同影响和相对效果分析两个或两个以上的自变量对一个因变量的影响63、多项相关—多个变量之间是如何相互影响的X1X2X4X3简化众多变量之间的相关关系—路径分析7二、详析分析详析分析反映的是两个变量之间的关系,根据作用的不同又可以分为三种模式:因果分析:X和Y是否真有因果关系?阐明分析:X为什么会影响Y?条件分析:在不同的情况下X与Y会有不同的关系吗?8(一)因果分析要鉴定X和Y之间是否确实有因果关系1、做法:引进其他变量w(通常称为第三类变项),看看是否由于w既影响了x,又影响了y,而使x和y的关系发生了变化。9如:我们发现结婚年数(X)越多的人,发病率(Y)也越高;这是否表示二者有因果关系呢?显然不一定.结婚年数(x)越多的人,发病率(y)越高年龄(w)两者之间的因果关系不成立10在因果分析中,第三类变项(变量)称为前置变项—因它在因果模型中是先于x和y的引进若干w,辨别x和y的因果关系是不是虚假的:如果我们能控制w,使之不变,而x变化时y也起变化,那么,x和y的关系可能就是真实的。除了W的影响外,还会有其他因素的影响11如果控制W?简单地说就是按W的取值分组,看每一组中x和y的关系.用分表法(p221李沛良).假设W有两个值(1,2),而X与Y也是各二值,则原表与其分表的关系,如下图所示:12
原表XY
W=1w=2xx分表Yy步骤:1.分析X与Y的关系;2.分析W1与X,W1与Y;然后控制W1来辩明X与Y的关系.3.分析W2与X,w2与Y,然后控制W2来辩明X与Y的因果关系13每个分表的作用就是在W不变的情况下分析X与Y的关系,而这就是统计控制的基本原理了.在原表中W是变项,但在分表中却受到控制而变为常数.在控制W后,研究结果原则上有三种可能性:14第一.X与Y的关系消失,即在各分表中X与Y都没有关系.表示原表中X与Y的因果关系是虚假的,它们原来的关系其实是由于W所导致的.如图所示:
WXY15第二.X与Y的关系维持原状,即在各分表中X与Y的相关与原表中的相关是大致上相同的.这种情况,表示X与Y的因果关系可能是真实的,并非由W所导致。如图所示:WXY16第三、X与Y虽然仍有关系,但其相关程度减弱了,即各分表中X与Y的关系不等于0,但相关程度却低于原表中的相关。这种情况,表示所控制的第三类变项产生局部效应,即原表中X与Y的因果关系可能是真实的,但其中某些部分是由W所导致。如图所示:WXY173、统计结果与研究状况如果以R表示X与Y的原相关,以R1和R2分别表示两个分表中的X与Y的相关,则上述的三种研究结果可用下表表示:18例:在某城镇调查1000户人家,目的是要研究住房的拥挤情况是否会引起夫妻之间的冲突是否能证明住户拥挤是导致夫妻冲突的原因?19住户拥挤(x)与夫妻冲突(y),可能与家庭的经济水平有关家庭经济水平住房拥挤夫妻冲突?20因此引进经济水平变量,再进行分析21住户拥挤(x)与夫妻冲突(y),没有显著性关系,家庭经济水平影响了住房情况和夫妻冲突状况家庭经济水平住房拥挤夫妻冲突22详析分析的一般步骤:1、分析XY,2、分析WX与WY,3、控制W,分析XY的变化。23(二)阐明分析分析的问题是:为什么X会影响Y?如:为什么较为贫困的家庭,少年犯罪率较高呢?是否由于较为贫困的家庭中父母的争吵较多,因而使儿女的品性较为恶劣呢?阐明分析的作用,就是要以事实来验证:X是通过哪些因素(如T)来影响Y的?如下图所示:24XYT介入变量25X通过T影响Y意味着:X变动时引起T的变动,而T的变动影响Y的变动。如果控制T使之不变,结果是X变动但Y不变,则说明X是通过T影响Y;如果,在控制T以后X变而Y亦变,则证明T是无关紧要的,即X不是通过T而影响Y的。研究的方法:与因果分析相同,通过分解T比较X与Y的关系。
1、X-T-Y的关系:26例:调查了近300名年纪相近的妇女,发现教育水平(x)越高,子女数目(y)越少(G=-0.70)。为什么?(1)如果以晚婚来解释,教育水平越高的妇女结婚越晚,因而生的孩子就较少。如要证明这种说法,就要引进“结婚年龄”作为介入变项(T),加以控制。27采用分表法的结果,发现在晚婚的妇女教育水平与生孩子数目的关系是G=-0.71,而在早婚的妇女中G=-0.68。分表的相关与原相关非常接近。因此,可以得出结论:晚婚的说法,不能阐明教育水平与子女数目的反比关系。也就是说,教育水平较高的妇女所生的孩子比较少,不是由于她们结婚较晚。28(2)如果以“重男轻女”来解释,认为教育水平越低的妇女,越是重男轻女,结果会生很多孩子。控制“重男轻女”这个介入变量之后,发现重男轻女的女性中教育水平与生育子女数量的G=-0.45,不重男轻女的女性中教育水平与生育子女数量的G=-0.50虽然教育水平与生育子女数目这两个变量仍然维持反比关系,但在程度上弱于原相关(G=-0.70)结论:教育水平较低的妇女所生的子女比较多,部分是由于她们所具有的重男轻女的观念。教育水平生育子女数重男轻女292、结果完全阐明:X完全是通过T影响Y的不能阐明:X完全不是通过T而影响Y部分阐明:X部分是通过T影响Y的30(三)条件分析与互动效果关注的是在不同情况下,X和Y的关系会不同吗?条件分析就是以第三类变项(如C)为基础来了解X与Y在不同情况下的关系。故C也称为条件变项。结果:如果在各组中X与Y的关系大致上相同,则表示X与Y的关系具有普遍性。相反,如果X与Y在不同的C组中有不同的关系,就表示X与Y的关系具有条件性,也称为C变项产生互动效果。31我们的假设是,随着计划生育政策的实施,城市独生子女家庭的比例高于农村,这会对人们的生育意愿产生影响,使得城市中的妇女更倾向于少生孩子,因此我们引进“城乡”作为条件变量,分析城市和农村妇女文化程度与生育意愿的关系。结果发现,城市妇女中文化程度与生育意愿的关系是G=-0.78,农村是G=-0.76,两者相差不大。文化程度与妇女生育意愿的关系是否存在城乡(C)差异?32不同年龄段妇女的文化程度与生育意愿的关系,发现55岁以上妇女中,文化程度与生育意愿的关系是G=-0.18,45-55岁者为G=-0.35,35-45岁者为G=-0.68,35岁以下者为G=-0.89。可见,年龄在妇女文化程度和生育意愿关系中所起的作用远大于城乡的影响,说明文化程度与生育意愿的关系在不同的条件下表现出不同的情况。33这里有几种情况:1、压抑分析:即X与Y本来是没有关系的或关系很弱(如人口密度与精神病率),但在标明了若干条件[就叫压抑变项](如文化异同)以后,X与Y显然是有关系或关系强大起来。2、曲解分析:即把原先的负相关(如教育水平与社区参与成反比,当引入性别变量后发现男、女两组的教育水平与社区参与均成正比)变为正相关,或把原先的正相关变为负相关的分析。而所用的条件(如性别)就叫曲解变项。34二、净相关(偏相关分析)在前面的分析中,要用分表法,然后再与原表相比,特别是当分表很多时就很难作出结论。因此,如果能以一个统计值来综合和简化所有的分表相关,然后将之与原相关比较,问题就清楚多了。净相关分析(偏相关分析,partialanalysis),就是以一个系数值表示控制第三类变项(W、T)后X与Y的相关程度的分析方法,其系数称为净相关系数。(partialcorrelationcoefficient)35因为净相关系数以积矩相关系数(r)为基础,因此属于对称相关测量法的一种,它要求变项间是直线关系,且所有变项都必须是定距变项。净相关系数值是由-1至+1,表示在控制第三类变项以后X与Y这两个变项的相关的程度与方向,而且其平方值具有消减误差比例的意义。36如以R表示原关系的强弱,以Rp表示净相关系数的大小,则在因果分析中,如果:Rp=0时,表示原关系是虚假的;Rp=R时,表示原关系可能真实;Rp≠0且Rp<R时,表示原关系是部分真实的.37同样,在阐明分析中,Rp=0则表示原关系是完全阐明.即X完全是通过T影响Y的;Rp=R时则表示原关系是不能阐明.即X完全不是通过T而影响Y;Rp≠0且Rp<R时则表示原关系是部分阐明.即X部分是通过T影响Y的.38根据变量测量层次的不同,定类\定序和定距变量偏相关系数的计算方法也有所不同.39(一)定类变量:λp、tau-yp如果X和Y两个变量中,至少有一个是定类变量(另一个为定类或定序变量)计算偏相关时,通常采用的是偏Lambda系数(partialLambda,记为λp)和偏tau-y系数(partialtau-y,记为tau-yp)偏Lambda系数的计算方法是通过将样本分组,分别计算各组的λ系数,以各组的样本数与全部样本数的比作为权数计算加权平均,即:40λp表示偏Lambda系数;ni表示每个组的样本数量;λi表示每个组的X与Y的λ值;n表示全部样本数。41同理,tau-y计算偏相关系数的公式为:tau-yp表示偏tau-y系数;ni表示每个组的样本数量;tau-yi表示每个组的X与Y的tau-y值;n表示全部样本数。42性别与工作家庭冲突的相关系数λ=0.22,如果我们认为工作时间可能影响青年的工作家庭冲突,而引进每天工作时间变量,如下表,每天不同工作时间的青年,性别与工作家庭冲突的关系明显减弱。
43控制每天工作时间后,性别与工作家庭冲突的偏相关程度如何?如果已知n1=54,n2=261,n3=38计算可知:性别与工作家庭冲突的原相关系数为0.22,控制每天工作时间后的偏相关系数为0.05,λp<λ,因此可以说性别与工作家庭冲突的关系可能是部分真实关系(或者无相关),工作时间对青年工作家庭冲突产生了影响。
44(二)定序变量:Gp如果X和Y都是定序变量,在计算偏相关时,常用的是偏Gamma系数(partialGamma,简写为Gp)。计算方法是根据控制变量的取值将样本分组,然后分别计算各组的同序对数(Ns)和异序对数(Nd),将各组的同序对与异序对的差(Ns-Nd)除以各组的同序对与异序对之和(Ns+Nd)公式为:45如一次调查中,我们调查了400名青年,发现他们的收入和工作满意度的相关系数G=0.265。假设我们认为收入和工作满意度的关系受文化程度的影响,文化程度高的青年可能收入高,但他们对自己的期望更高,从而对工作的满意度并不高。因此,我们引进文化程度变量,来计算收入和工作满意度之间的偏相关系数。
46通过计算可知:在低教育程度组中,Ns1=5450,Nd1=3262在高教育程度组中,Ns2=5440,Nd2=3154所以偏相关系数与原相关系数0.265十分接近,因此可以说收入和青年工作满意度之间的相关关系可能是真实存在的。
47dy偏相关的原理与偏Gamma系数相同,其公式为:48(三)定距变量:rp=rxy.1如果X和Y都是定距变量,可采用偏相关系数rp(partialcorrelationcoefficient,简写为rxy·1或rp)来计算其偏相关程度。它以积矩相关系数(r)为基础4950rp是控制一个变量以后X与Y的偏相关系数,rxy是没有控制之前X与Y的相关系数,rx1是控制变量与X的相关系数,ry1是控制变量与Y的相关系数。51如调查了300名青年职工,发现其开始就业时的工资与现在工资的关系是r=0.88。进一步分析发现两者的关系可能受中间变量——受教育年数的影响,也就是说受教育年数越多的青年,他们的初始工资和现在工资越高。于是控制受教育年数,发现:rxy=0.88(初始工资与现在工资的相关系数)rx1=0.63(受教育年数与初始工资的相关系数)ry1=0.66(受教育年数与现在工资的相关系数)偏相关系数0.79小于原来的相关系数0.88,可见初始工资和现在工资的关系受教育年数的影响。
52三.偏相关系数的假设检验rp净相关系数,n样本数的大小,K是控制变量的数目.df1=1,df2=n-k-253如前面偏相关分析中的例题,调查300名青年职工的初始工资与现在工资的关系是r=0.88,受教育年数与初始工资的关系rx1=0.63,受教育年数与现在工资的关系ry1=0.66,控制了受教育年数后,初始工资与现在工资的关系r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度桥梁栏杆采购合同模板6篇
- 2025年度口腔诊所投资合作与风险分担合同3篇
- 二零二五版材料采购合同补充协议:技术创新共享2篇
- 二零二五版抵押借款合同与借款合同签订流程与风险防范3篇
- 二零二五版国有房产出售合同(智慧社区共建协议)3篇
- 2025年度餐饮业中央厨房租赁合同3篇
- 二零二五年度35KV变电站电气设备技术改造合同3篇
- 二零二五年房地产项目乡村振兴战略合作开发合同3篇
- 二零二五版班组分包道路养护合同3篇
- 2025版金融产品股权及债权转让与风险管理合同3篇
- 公务员考试工信部面试真题及解析
- GB/T 15593-2020输血(液)器具用聚氯乙烯塑料
- 2023年上海英语高考卷及答案完整版
- 西北农林科技大学高等数学期末考试试卷(含答案)
- 金红叶纸业简介-2 -纸品及产品知识
- 《连锁经营管理》课程教学大纲
- 《毕淑敏文集》电子书
- 颈椎JOA评分 表格
- 员工岗位能力评价标准
- 定量分析方法-课件
- 朱曦编著设计形态知识点
评论
0/150
提交评论