统计学教程(含spss)六_列联分析_第1页
统计学教程(含spss)六_列联分析_第2页
统计学教程(含spss)六_列联分析_第3页
统计学教程(含spss)六_列联分析_第4页
统计学教程(含spss)六_列联分析_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、卡方 分析,用SPSS作卡方分析,列联表中的卡方检验,列联表中的相关性测量,某集团公司打算进行一项改革,但此项改革涉及到各分公司的利益。今采用抽样方法分别从下设的四个分公司中共抽取420名职工了解对此项改革的看法。如果四个分公司对改革的看法一致,则决定实施这项改革。调查结果如下表所示:,关于改革方案调查结果的样本数据,列联表是描述两个分类变量的频数分布表。,列联表中的卡方检验,RC列联表,取值多的变量表示为列变量,取值少的变量表示为行变量,列变量单元频数的合计,行变量单元频数的合计,样本容量,单元观 察频数,列联表的一般结构,列联表中的卡方检验,赞成或反对的比率的样本数据,从样本数据上看,各公

2、司的赞成(反对)比率存在差异。,从样本到总体的外推可通过假设检验完成。,赞成的比率一致。,赞成的比率不一致。,列联表中的卡方检验,如果 为真,则总比率对各公司都适用。于是可根据总比率得出各单元的期望频数。,观察频数(observed frequency 简写f0),期望频数(expected frequency 简写fe ),总赞成比率:,总反对比率:,该单元的期望频数,该单元所在行总频数,该单元所在列总频数,样本容量,列联表中的卡方检验,0,4,2,6,0.00,0.05,0.10,0.15,0.25,0.20,8,10,0.30,观察频数与期望频差异的大小以 统计量衡量。,统计量服从自由度

3、为 的分布。,自由度为3 的分布,自由度为1 的分布,自由度为10 的分布,自由度为20 的分布,列联表中的卡方检验,寻找自由度,自由度是可以自由取值的数据个数。列联表中的行与列的总和是固定的。总有一行和一列的取值不是自由的。自由度=(R-1)(C-1)=(2-1)(2-1)。,列联表中的卡方检验,关于改革方案调查结果样本数据列联表的自由度,自由度=,列联表中的卡方检验,自由度用以衡量列联表的大小。,34列联表,26列联表,列联表中的卡方检验,列联表中的卡方检验,6.251,3.0319,拒绝域,接受域,结论: 接受“赞成的比率一致”的原假设。即集团公司所属四个分公司的全体职工一致赞成此项改革

4、。样本数据中赞成比率的差异由抽样的随机性所造成。,自由度为3的 分布,经计算,查表得临界值,已知,自由度=,0,列联表中的卡方检验,某啤酒厂生产三种类型啤酒:淡啤酒、普通啤酒、黑啤酒。会议上有人提出男性与女性饮酒者啤酒偏好是否相同的问题。若不同,公司将针对不同的目标市场采取不同的推销策略;若相同,公司将发起对所有啤酒的广告运动。,男性与女性饮者啤酒偏好的样本数据,列联表中的卡方检验,从样本数据上看,男性与女性的啤酒偏好比率存在差异。,从样本到总体的外推应通过假设检验完成。,不同性别饮酒偏好比率的样本数据,男性与女性啤酒偏好相同,男性与女性啤酒偏好不同,列联表中的卡方检验,如果H0为真,则代表饮

5、酒偏好的总比率对男性和女性饮酒者都适用,于是可根据总比率得出各单元的期望频数。,观察频数(observed frequency 简写f0),期望频数(expected frequency 简写fe ),总比率:,淡 啤,普 啤,黑 啤,式中:,该单元的期望频数,该单元所在行总频数,该单元所在列总频数,样本容量,期望频数:,列联表中的卡方检验,注意: 用 进行假设检验时,每一单元的期望频数至少为5。当某一单元的期望频数小于时,通常将相年邻的类合并以使每一单元的期望频数大于或等于5。,服从自由度为(R-1)(C-1)的 分布。,列联表中的卡方检验,判定饮酒偏好是否与饮酒者性别有关所需检验统计量的计

6、算,列联表中的卡方检验,结论: 拒绝 “男性与女性啤酒偏好相同”的原假设并接受“男性与女性啤酒偏好不同”的备择假设。即啤酒的偏好与性别是有关联的。,已知:,自由度=,查表得临界值:,经计算:,列联表中的卡方检验,相关系数,C相关系数,V相关系数,列联表中的相关性测量,相关系数计算公式,适用于2 2列联表,22列联表,无相关,完全相关,弱相关,中度相关,高度相关,相关系数,22列联表,化简得:,可充当测量相关性的尺度。,即:,因为,于是得:,变量 与变量 不相关时,有,因此,,相关系数,22列联表,完全相关的两种情况,22列联表,相关系数,相关系数与 统计量的关系,22列联表,或,相关系数,丹麦

7、人与法国人以同样的眼光看待陌生人吗?一次抽样调查中就“你认为大多数人都可信赖呢?还是认为与人相处要处处小心?”这一问题,获得数据如下表。 要求:判定“国籍”与“态度”两变量间的相关性。,22列联表,相关系数比较适用于22列联表。列联表的行数和列数大于2时, 相关系数会出现大于是1情况。,相关系数,适用于大于2 2列联表,的最大值依赖于列联表的行列数,无相关,相关系数(列联系数)计算公式,C相关系数,一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,得样本数据如下表所示:,原料抽样数据,要求:检验地区与原料质量之间有无依赖关系。,C相关系数,为判定地区

8、是否与原料质量相关所需 统计量的计算,C相关系数,适用于大于2 2列联表,计算结果表明:“地区”与“原料质量”之间低度相关。,列联表行数和列数中较小者。,相关系数计算公式,V相关系数解决了相关系数无上界和C相关系数小于1的情况。两个变量无相关时V=0;两个变量完全相关时V=1。,V相关系数,结 束,用SPSS作卡方分析,关于改革方案调查结果的样本数据,数据集9,1、打开数据集; 2、点击data; 2、点击weight cases;弹出weight cases对话框; 3、选择weight cases by; 4、将变量Fo点击进入frequency variable框内,对其进行加权。,1、

9、点击analyze; 2、选择descriptive statistics; 3、在下拉菜单中选择crosstabs,进行列联表分析。,显示交叉频数分布图,指定行变量,指定列变量,卡方检验,定类变量相关指标,相关分析,列联系数,和V系数,值,不确定系数,定序变量的相关指标,本例中选择chi-square,频数,观察频数,期望频数,频率,行频率,列频率,总和频率,残差,未标准化,已标准化,已由标准误标准化,本例中选择频数中的两选项,升序,行顺序,降序,故接受原假设。即四个分公司态度一致。,如果在crosstabs cell display对话中,选择了count中的observed和expect

10、ed 与percentages中的row、column和total,系统将输出如下列联表。,为了解非计算机专业对计算机课程教学的意见,在金融系和统计系本科生中进行了一次抽样调查,得到了390名学生的调查数据。试据此推断两系本科生对计算机课程教学的意见是否一致。,关于计算机课程教学意见的样本数据,数据集10,结 束,列联表(contingency table):在卡方检验中,用于汇总观察频数与期频数的表格。 卡方分布(chi-square distribution):一种概率分布。随着自由度的增大,卡方分布将趋近于正态分布。常用于列联表中变量之间是否相关的检验,尤其适合于两个定类变量之间是否相关的检验。 观察频数(observed frequency ):列联表中的实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论