统计学教程含六 列联分析_第1页
统计学教程含六 列联分析_第2页
统计学教程含六 列联分析_第3页
统计学教程含六 列联分析_第4页
统计学教程含六 列联分析_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学教程含六列联分析第一页,共五十一页,编辑于2023年,星期三列联表中的卡方检验列联表中的相关性测量第二页,共五十一页,编辑于2023年,星期三某集团公司打算进行一项改革,但此项改革涉及到各分公司的利益。今采用抽样方法分别从下设的四个分公司中共抽取420名职工了解对此项改革的看法。如果四个分公司对改革的看法一致,则决定实施这项改革。调查结果如下表所示:公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420关于改革方案调查结果的样本数据列联表是描述两个分类变量的频数分布表。列联表中的卡方检验第三页,共五十一页,编辑于2023年,星期三

C1C2C3C4合计R1f11f12f13f14RT1R2f21f22f23f24RT2R3f31f32f33f34RT3合计CT1CT2CT3CT4nR×C列联表取值多的变量表示为列变量取值少的变量表示为行变量列变量单元频数的合计行变量单元频数的合计样本容量单元观察频数列联表的一般结构列联表中的卡方检验第四页,共五十一页,编辑于2023年,星期三公司1公司2公司3公司4合计赞成频数68755779279比率%68.062.563.371.866.4反对频数32453331141比率%32.037.536.728.233.6合计频数10012090110420比率%100100100100100赞成或反对的比率的样本数据从样本数据上看,各公司的赞成(反对)比率存在差异。从样本到总体的外推可通过假设检验完成。赞成的比率一致。赞成的比率不一致。列联表中的卡方检验第五页,共五十一页,编辑于2023年,星期三如果为真,则总比率对各公司都适用。于是可根据总比率得出各单元的期望频数。公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420公司1公司2公司3公司4合计赞成66806073279反对34403037141合计10012090110420观察频数(observedfrequency简写f0)期望频数(expectedfrequency简写fe)总赞成比率:总反对比率:该单元的期望频数该单元所在行总频数该单元所在列总频数样本容量列联表中的卡方检验第六页,共五十一页,编辑于2023年,星期三04260.000.050.100.150.250.208100.30观察频数与期望频差异的大小以统计量衡量。统计量服从自由度为的分布。自由度为3的分布自由度为1的分布自由度为10的分布自由度为20的分布列联表中的卡方检验第七页,共五十一页,编辑于2023年,星期三寻找自由度自由度是可以自由取值的数据个数。列联表中的行与列的总和是固定的。总有一行和一列的取值不是自由的。自由度=(R-1)(C-1)=(2-1)(2-1)。C1C2合计R1f11f12RT1R2f21f22RT2合计CT1CT2n列联表中的卡方检验第八页,共五十一页,编辑于2023年,星期三公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420关于改革方案调查结果样本数据列联表的自由度自由度=列联表中的卡方检验第九页,共五十一页,编辑于2023年,星期三自由度用以衡量列联表的大小。C1C2C3C4合计R1f11f12f13f14RT1R2f21f22f23f24RT2R3f31f32f33f34RT3合计CT1CT2CT3CT43×4列联表2×6列联表C1C2C3C4合计R1f11f12f13f14RT1R2f21f22f23f24RT2R3f31f32f33f34RT3合计CT1CT2CT3CT4C1C2C3C4C5C6合计R1f11f12f13f14f15f16RT1R2f21f22f23f24f25f26RT2合计CT1CT2CT3CT4CT5CT6列联表中的卡方检验第十页,共五十一页,编辑于2023年,星期三687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.97303.0319列联表中的卡方检验第十一页,共五十一页,编辑于2023年,星期三6.2513.0319拒绝域接受域结论:接受“赞成的比率一致”的原假设。即集团公司所属四个分公司的全体职工一致赞成此项改革。样本数据中赞成比率的差异由抽样的随机性所造成。自由度为3的分布经计算查表得临界值已知自由度=0列联表中的卡方检验第十二页,共五十一页,编辑于2023年,星期三某啤酒厂生产三种类型啤酒:淡啤酒、普通啤酒、黑啤酒。会议上有人提出男性与女性饮酒者啤酒偏好是否相同的问题。若不同,公司将针对不同的目标市场采取不同的推销策略;若相同,公司将发起对所有啤酒的广告运动。淡啤普啤黑啤合计男性20402080女性30301070合计507030150男性与女性饮者啤酒偏好的样本数据列联表中的卡方检验第十三页,共五十一页,编辑于2023年,星期三从样本数据上看,男性与女性的啤酒偏好比率存在差异。淡啤普啤黑啤合计频数比率%频数比率%频数比率%频数比率%男性2025.04050.02025.080100女性3042.93042.91014.270100合计5033.37046.73020.0150100从样本到总体的外推应通过假设检验完成。不同性别饮酒偏好比率的样本数据男性与女性啤酒偏好相同男性与女性啤酒偏好不同列联表中的卡方检验第十四页,共五十一页,编辑于2023年,星期三如果H0为真,则代表饮酒偏好的总比率对男性和女性饮酒者都适用,于是可根据总比率得出各单元的期望频数。淡啤普啤黑啤合计男性26.6737.3316.0080女性23.3332.6714.0070合计507030150观察频数(observedfrequency简写f0)期望频数(expectedfrequency简写fe)总比率:淡啤普啤黑啤淡啤普啤黑啤合计男性20402080女性30301070合计507030150式中:该单元的期望频数该单元所在行总频数该单元所在列总频数样本容量期望频数:列联表中的卡方检验第十五页,共五十一页,编辑于2023年,星期三注意:用进行假设检验时,每一单元的期望频数至少为5。当某一单元的期望频数小于时,通常将相年邻的类合并以使每一单元的期望频数大于或等于5。服从自由度为(R-1)(C-1)的分布。列联表中的卡方检验第十六页,共五十一页,编辑于2023年,星期三性别偏好男男男女女女淡啤普啤黑啤淡啤普啤黑啤20402030301026.6737.3316.0023.3332.6714.00-6.672.674.006.67-2.67-4.0044.497.1316.0044.497.1316.001.670.191.001.910.221.146.13判定饮酒偏好是否与饮酒者性别有关所需检验统计量的计算列联表中的卡方检验第十七页,共五十一页,编辑于2023年,星期三结论:拒绝“男性与女性啤酒偏好相同”的原假设并接受“男性与女性啤酒偏好不同”的备择假设。即啤酒的偏好与性别是有关联的。已知:自由度=查表得临界值:经计算:列联表中的卡方检验第十八页,共五十一页,编辑于2023年,星期三Φ相关系数C相关系数V相关系数列联表中的相关性测量第十九页,共五十一页,编辑于2023年,星期三相关系数计算公式适用于2×2列联表C1C2合计R1aba+bR2cdc+d合计a+cb+dn2×2列联表无相关完全相关弱相关中度相关高度相关Φ相关系数第二十页,共五十一页,编辑于2023年,星期三C1C2合计R1aba+bR2cdc+d合计a+cb+dn2×2列联表化简得:可充当测量相关性的尺度。即:因为于是得:变量与变量不相关时,有因此,Φ相关系数第二十一页,共五十一页,编辑于2023年,星期三2×2列联表完全相关的两种情况C1C2合计R1a0a+bR20dc+d合计a+cb+dn2×2列联表C1C2合计R10ba+bR2c0c+d合计a+cb+dnΦ相关系数第二十二页,共五十一页,编辑于2023年,星期三相关系数与统计量的关系C1C2合计R1aba+bR2cdc+d合计a+cb+dn2×2列联表或Φ相关系数第二十三页,共五十一页,编辑于2023年,星期三丹麦人与法国人以同样的眼光看待陌生人吗?一次抽样调查中就“你认为大多数人都可信赖呢?还是认为与人相处要处处小心?”这一问题,获得数据如下表。

要求:判定“国籍”与“态度”两变量间的相关性。丹麦法国合计信任625206831怀疑3607631123合计98596919542×2列联表Φ相关系数比较适用于2×2列联表。列联表的行数和列数大于2时,Φ相关系数会出现大于是1情况。Φ相关系数第二十四页,共五十一页,编辑于2023年,星期三适用于大于2×2列联表列联表2×23×34×4C的最大值0.70710.81650.87的最大值依赖于列联表的行列数无相关相关系数(列联系数)计算公式C相关系数第二十五页,共五十一页,编辑于2023年,星期三一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,得样本数据如下表所示:一级二级三级合计地区1526424140地区2605952171地区3506574189合计162188150500原料抽样数据要求:检验地区与原料质量之间有无依赖关系。C相关系数第二十六页,共五十一页,编辑于2023年,星期三性别偏差11122233312312312352642460595250657445.3652.6442.0055.4064.3051.3061.2471.0656.706.6411.36-18.004.605.300.70-11.24-6.0617.3044.09129.05324.0021.1628.090.49126.3436.72299.290.972.457.710.380.440.012.060.525.28合计—————19.82为判定地区是否与原料质量相关所需统计量的计算C相关系数第二十七页,共五十一页,编辑于2023年,星期三适用于大于2×2列联表计算结果表明:“地区”与“原料质量”之间低度相关。列联表行数和列数中较小者。相关系数计算公式V相关系数解决了Φ相关系数无上界和C相关系数小于1的情况。两个变量无相关时V=0;两个变量完全相关时V=1。V相关系数第二十八页,共五十一页,编辑于2023年,星期三结束第二十九页,共五十一页,编辑于2023年,星期三用SPSS作卡方分析第三十页,共五十一页,编辑于2023年,星期三公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420关于改革方案调查结果的样本数据态度赞成反对r12公司公司1公司2公司3公司4c1234观察频数fo定义变量68755779324533313142833327452263212579414573137521268111focr序号列联表在spss数据集中的排列[数据集9]第三十一页,共五十一页,编辑于2023年,星期三1、打开数据集;2、点击data;2、点击weightcases;弹出weightcases对话框;3、选择weightcasesby;4、将变量Fo点击进入frequencyvariable框内,对其进行加权。第三十二页,共五十一页,编辑于2023年,星期三1、点击analyze;2、选择descriptivestatistics;3、在下拉菜单中选择crosstabs,进行列联表分析。第三十三页,共五十一页,编辑于2023年,星期三显示交叉频数分布图指定行变量指定列变量第三十四页,共五十一页,编辑于2023年,星期三卡方检验定类变量相关指标相关分析列联系数Φ和V系数λ值不确定系数定序变量的相关指标本例中选择

chi-square第三十五页,共五十一页,编辑于2023年,星期三频数观察频数期望频数频率行频率列频率总和频率残差未标准化已标准化已由标准误标准化本例中选择频数中的两选项第三十六页,共五十一页,编辑于2023年,星期三升序行顺序降序第三十七页,共五十一页,编辑于2023年,星期三第三十八页,共五十一页,编辑于2023年,星期三第三十九页,共五十一页,编辑于2023年,星期三故接受原假设。即四个分公司态度一致。第四十页,共五十一页,编辑于2023年,星期三如果在crosstabscelldisplay对话中,选择了count中的observed和expected与percentages中的row、column和total,系统将输出如下列联表。第四十一页,共五十一页,编辑于2023年,星期三C

fo

r意见合计不能满足基本满足能够满足系别金融系统计系7070160602010250140合了解非计算机专业对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论