




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第9章列联分析PowerPoint统计学第9章列联分析§9.1分类数据与列联表§9.2拟合优度检验§9.3独立性检验§9.4列联表中的相关测量§9.5列联分析中应注意的问题§9.1分类数据与列联表9.1.1分类数据9.1.2列联表的构造9.1.3列联表的分布9.1.1分类数据1.分类变量的结果表现为类别例如:性别(男,女)2.各类别用符号或数字代码来测度3.使用分类或顺序尺度你吸烟吗?(1).是;(2).否你赞成还是反对这一改革方案?(1).赞成;(2).反对4.对分类数据的描述和分析通常使用列联表5.可使用
检验9.1.1数据的类型与列联分析数据定量数据(数值型数据)定性数据(品质数据)离散数据连续数据列联分析9.1.2列联表的构造1.列联表(contigencytable)是由两个以上的变量交叉分类的频数分布表。2.行(row)变量的类别用r表示,ri表示第i个类别3.列(column)变量的类别用c表示,cj表示第j个类别4.每种组合的观察频数用fij表示5.表中列出了行变量和列变量的所有可能的组合,所以称为列联表6.一个r行c列的列联表称为r
c列联表9.1.2列联表的结构(22列联表)列(cj)合计j=1j=2i=1f11f12f11+f12i=2f21f22f21+f22合计f11+f21f12+f22n列(cj)行(ri)9.1.2列联表的结构(r
c列联表)列(cj)合计j=1j=2…i=1f11f12…r1i=2f21f22…r2:::::合计c1c2…n列(cj)行(ri)fij表示第i行第j列的观察频数9.1.2列联表的结构(例题分析)一分公司二分公司三分公司四分公司合计赞成该方案68755779279反对该方案32453331141合计10012090110420【例9.1】一个集团公司在四个不同的地区设有分公司,现该集团公司欲进行一项改革,此项改革可能涉及到各分公司的利益,故采用抽样调查方式,从四个分公司共抽取420个样本单位(人),了解职工对此项改革的看法,调查结果如下表9.1.3列联表的分布(观察值的分布)1.边缘分布(1).行边缘分布:行观察值的合计数的分布例如,赞成改革方案的共有279人,反对改革方案的141人(2).列边缘分布:列观察值的合计数的分布例如,四个分公司接受调查的人数分别为100人,120人,90人,110人2.条件分布与条件频数变量X条件下变量Y的分布,或在变量Y条件下变量X的分布每个具体的观察值称为条件频数观察值的分布一分公司二分公司三分公司四分公司合计赞成该方案68755779279反对该方案32753331141合计10012090110420行边缘频数列边缘频数条件频数百分比分布1.条件频数反映了数据的分布,但不适合比照2.为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布行百分比:行的每一个观察频数除以相应的行合计数(fij/ri)列百分比:列的每一个观察频数除以相应的列合计数(fij/cj)总百分比:每一个观察值除以观察值的总个数(fij/n)百分比分布一分公司二分公司三分公司四分公司合计赞成该方案68755779279%24.426.920.428.3—%68.062.563.3571.8—%16.217.813.618.866.4反对该方案32453331141%22.731.923.422.0—%32.037.536.728.2—%7.610.77.97.433.6合计10012090110420%23.828.621.426.2100总百分比列百分比行百分比期望频数的分布
(例题分析)一分公司二分公司三分公司四分公司合计赞成该方案实际频数68755779279期望频数66806073反对该方案实际频数32453331141期望频数34403037合计10012090110§9.2
拟合优度检验9.2.1
统计量9.2.2拟合优度检验9.2.1
统计量1.c2统计量在列联表中的应用:(1).用于检验列联表中变量间拟合优度和独立性(2).用于测定两个分类变量之间的相关程度2.c2统计量的构造
统计量(例题分析)实际频数f0期望频数fef0
-fe(f0
-fe)2(f0-fe)2fe687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.9730合计:3.03199.2.1
统计量4.列联表中c2自由度确实定:C1C2C3C4合计R1√√√*RT1R2√√√*RT2R3***ORT3合计CT1CT2CT3CT49.2.2拟合优度检验1.如果样本是从总体的不同类别中分别抽取,研究目的是对不同类别的目标量之间是否存在显著性差异进行检验,我们把它称为拟合优度检验(goodnessoffittest)或一致性检验(testofhomogeneity)。2.拟合优度检验可用于检验多个比例是否相等。【例9.1】某集团公司欲进行一项改革,从所属的四个分公司中共随机抽取了420名职工,了解他们对改革方案的态度,以a=0.1的显著性水平检验四个分公司对改革方案的看法是否存在差异。9.2.2拟合优度检验拒绝H006.2519.2.2拟合优度检验(例题分析)拟合优度检验的另一种情况是利用样本数据检验总体比例是否等于某个数值。【例9.2】为了提高市场占有率,某行业两个最主要的竞争对手A公司和B公司同时开展了广告宣传。在广告宣传战之前,A公司的市场占有率为45%,B公司的市场占有率为40%,其他公司的市场占有率为15%。为了了解广告战之后A、B和其他公司的市场占有率是否发生变化,随机抽取了200名消费者,其中102人表示准备购置A公司产品,82人表示准备购置B公司产品,另外16人表示准备购置其他公司产品。以0.05的显著性水平检验广告战前后各公司的市场占有率是否发生了变化。9.2.2拟合优度检验拒绝H005.999.2.2拟合优度检验
(例题分析—用P值检验)第1步:将观察值输入一列,将期望值输入一列第2步:选择“函数〞选项第3步:在函数分类中选“统计〞,在函数名中选“CHITEST〞,点击“确定〞第4步:在对话框“Actual_range〞输入观察数据区域在对话框“Expected_range〞输入期望数据区域得到P值为0.016711,所以拒绝原假设用Excel计算P值9.3独立性检验在研究问题时要求判断两个分类变量之间是否存在联系的问题,可以使用检验,判断两组或多组的资料是否关联,如果不相关联,就称为独立,把这类问题的处理称为独立性检验(testofindependence)。即检验列联表中的行变量与列变量之间是否独立。检验的步骤为提出假设H0:行变量与列变量独立H1:行变量与列变量不独立计算检验的统计量9.3独立性检验(例题分析)【例9.3】一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如下表。要求检验各地区与原料质量之间是否存在依赖关系(0.05)地区一级二级三级合计甲地区526424140乙地区605952171丙地区506574189合计1621881505009.3独立性检验(例题分析)9.3独立性检验(例题分析)地区一级二级三级合计甲地区526424140乙地区605952171丙地区506574189合计1621881505009.3独立性检验(例题分析)拒绝H009.488独立性检验与拟合优度检验关系1.联系:两种检验在列联表的形式上和计算公式上都相同。2.区别:(1).抽取样本或对观测值进行测定的方法不同。一致性检验抽自不同的类别;独立性检验抽取后进行分类。(2).检验的内容不同。一致性检验是各类别总体比例是否等于某个期望概率;独立性检验是变量之间是否独立。(3).频数期望的计算方法不同。一致性检验是利用假设得到期望频数;独立性检验是利用假设的独立性计算得到。§9.4列联表中的相关测量9.4.1
相关系数9.4.2列联相关系数9.4.3
V
相关系数9.4.4数值分析9.4列联表中的相关测量1.主要研究变量之间存在联系时的相关程度的大小。2.品质相关是指对品质数据(分类和顺序数据)之间相关程度的测度3.列联表中变量的相关性属于品质相关4.列联表相关测量的统计量主要有
相关系数列联相关系数V相关系数9.4.1
相关系数1.
相关系数(
correlationcoefficient)是描述22列联表数据相关程度的一种相关系数。2.
相关系数计算公式为3.
系数适合22列联表,因为计算出的
系数的值在0~1之间。9.4.1
相关系数一个简化的22列联表因素Y因素X合计x1x2y1aba+by2cdc+d合计a+cb+dn1.列联表中每个单元格的期望频数分别为2.将各期望频数代入
的计算公式得9.4.1
相关系数3.将
代入
相关系数的计算公式得(1).当ad=bc时,有=0,说明变量X与Y之间相互独立(2).假设b=0,c=0,或a=0,d=0,意味着各观察频数全部落在对角线上,此时||=1,说明变量X与Y之间完全相关(3).列联表中变量的位置可以互换,的符号没有实际意义,故取绝对值即可。9.4.1
相关系数9.4.1
相关系数完全相关时的22列联表因素Y因素Xx1x2y1a0y20d完全相关时的另一种22列联表因素Y因素Xx1x2y10by2c0表中含义:如用X表示性别(男,女),Y表示态度(赞成,反对)。|j|=1表示,男性全部赞同,女性全部反对;或者女性全部赞同,男性全部反对。注:行数或列数增大时,j相关系数也增大且无上限。9.4.2列联相关系数1.列联相关系数又称列联系数(coefficientofcontingency),简称c系数,主要用于测度大于22列联表中数据的相关程度。2.计算公式为(1).c的取值范围是0c<1(2).c=0说明列联表中的两个变量相互独立(3).c的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大(4).根据不同行和列的列联表计算的列联系数不便于比较9.4.3V相关系数1.计算公式为2.V的取值范围是0V13.V=0说明列联表中的两个变量独立4.V=1说明列联表中的两个变量完全相关5.不同行和列的列联表计算的列联系数不便于比较6.当列联表中有一变量维数为2,min[(R-1),(C-1)]=1,此时V=9.4.4数值分析1.同一个列联表,、C、V的结果会不同2.不同的列联表,、C、V的结果也不同3.在对不同列联表变量之间的相关程度进行比较时,不同列联表中的行与行、列与列的个数要相同,并且采用同一种系数9.4.4数值分析(例题分析)【例9.3】一种原料来自三个不同地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如下表。分别计算系数、C系数和V系数,并分析相关程度地区一级二级三级合计甲地区526424140乙地区605952171丙地区506574189合计1621881505009.4.4数值分析(例题分析)结论:三个系数均不高,说明产地和原料等级之间的相关程度不高上节内容列(cj)合计j=1j=2…i=1f11f12…r1i=2f21f22…r2:::::合计c1c2…n列(cj)行(ri)fij表示第i行第j列的观察频数上节内容1.c2统计量在列联表中的应用:(1).用于检验列联表中变量间拟合优度和独立性(2).用于测定两个分类变量之间的相关程度2.c2统计量的构造3.拟合优度检验的步骤4.独立性检验的步骤上节内容5.拟合优度检验和独立性检验的联系和区别1).联系:两种检验在列联表的形式上和计算公式上都相同。2).区别:(1).抽取样本或对观测值进行测定的方法不同。一致性检验抽自不同的类别;独立性检验抽取后进行分类。(2).检验的内容不同。一致性检验是各类别总体比例是否等于某个期望概率;独立性检验是变量之间是否独立。(3).频数期望的计算方法不同。一致性检验是利用假设得到期望频数;独立性检验是利用假设的独立性计算得到。上节内容6.品质相关系数9.5列联分析中应注意的问题9.5.1条件百分表的方向9.5.2c2分布的期望值准那么9.5.1条件百分表的方向1.一般来讲,列联表中变量的位置是任意的。2.如果变量X(自变量、原因)与Y(因变量、结果)存在因果关系时,一般是把自变量X放在列的位置,条件百分数也按自变量的方向计算,因为这样便于更好地表现原因对结果的影响。价值取向Y职业X制造业服务业物质报酬%105724556人情关系%40283544合计145100801009.5.1条件百分表的方向但是,也有例外情况,如果因变量在样本内的分布不能代表其在总体内的分布,例如,为了满足分析的需要,抽样时扩大了因变量某项内容的样本量,这时仍以自变量的方向计算百分表就会歪曲实际情况。青少年行为家庭状况合计完整家庭离异家庭犯罪%3829378275-未犯罪%9271818100-合计13010045100175-9.5.1条件百分表的方向
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 乡村合作社与农户联合开发农业技术项目协议
- 通信技术与信号处理练习题
- 技术标准制定合作协议
- 数学课本九章算术教案
- 教育资源分布报告表
- 西厢记的爱情悲剧征文
- 中学生国学经典故事解读
- 农业旅游开发实施方案
- 数据安全与隐私保护服务协议约定事项
- 业务往来预付款协议书
- 体育测量与评价-第二章-体育测量与评价的基础理论课件
- 法律服务方案(投标)
- 转移的危险废物性状清单
- 高中英语-新外研版必修一unit5-The-Monarchs-Journey-公开课reading课件
- 建设项目用地预审与选址意见课件讲解
- 四年级公共安全教育全册教案(海峡教育出版社)
- 工程结构通用规范
- 《构成基础》PPT课件(190页PPT)
- 四年级道德与法治从中国制造到中国创造
- 2021-2022新教科版四年级科学下册全一册全部课件(共24课)
- 3 弃渣场施工方案
评论
0/150
提交评论