版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第9章 对应分析v对应分析(correspondence analysis)是用于寻求列联表的行和列之间联系的一种低维图形表示法,它可以从直觉上揭示出同一分类变量的各个类别之间的差异,以及不同分类变量各个类别之间的对应关系。v对应分析是由法国人Benzecri于1970年提出的,起初在法国和日本最为流行,然后引入美国。v在对应分析中,列联表的每一行对应(通常是二维)图中的一点,每一列也对应同一图中的一点。本质上,这些点都是列联表的各行各列向一个二维欧式空间的投影,这种投影最大限度地保持了各行(或各列)之间的关系。第九章 对应分析v9.1 行轮廓和列轮廓v9.2 独立性的检验和总惯性v9.3 行
2、、列轮廓的坐标v9.4 对应分析图9.1 行轮廓和列轮廓v一、列联表v二、对应矩阵v三、行、列轮廓一、列联表v其中, 是第 行、第 列类别组合的频数, ; 为第 行的频数之 和, ; 为第 列的频数之和, ; 为所有类别组 合的频数总和。 ijnij1,2, ,1,2,ip jq1qiijjnni1,2,ip1pjijinn1,2,jqj1111pqpqijijijijnnnn二、对应矩阵v这里, 。v显然有 。 1111,qqppijijijijiijjijjjiinnnpppppnnn111pqijijppv称 为对应矩阵。将对应矩阵表中的最后一列用 表示,即 其中 是元素均为1的 维向量
3、,最后一行用 表示,即 v其中 是元素均为1的 维向量,向量 和 的元素有时称为行和列密度(masses)。 ijijpnnPr12,pppprP11,1,11q c12,qpppc1 P1,1,11prc三、行、列轮廓v第 行轮廓: 其各元素之和等于1 ,即 。v第 列轮廓: 其各元素之和等于1 ,即 。i1212,iqiqiiiiiiiiiiipnppnnpppnnnr1,1,2,iip r1j1212,jjpjjjpjjjjjjjjpppnnnpppnnnc1,1,2,jjq1 c行轮廓矩阵 v其中 。111121111221222122212qqrppppqpppppppppppppp
4、ppppppprrRD Pr12diag,rppppD列轮廓矩阵 v其中 。111121222122112121212,qqqqcqpppqqppppppppppppppppppCPDc cc12diag,cqpppD 可见, 可以表示成各列轮廓的加权平均。类似地, 即 可以表示成各行轮廓的加权平均。 121121,qccqjjjqpppprP1PDD 1c cccr11prriiipc1 P1 DD Pr c例9.1.1v将由个人组成的样本按心理健康状况与社会经济状况进行交叉分类,分类结果见表9.1.3。 v 将表9.1.3中的数据除以,得到对应矩阵,列于表9.1.4中。表9.1.4给出的行
5、密度和列密度向量为0.1850.363,0.305,0.173,0.231,0.160,0.1310.2180.234rc 行轮廓矩阵为 列轮廓矩阵为10.3940.1860.2350.1170.0680.3120.1740.2340.1610.1180.3090.1800.2130.1490.1490.2210.1540.2420.2010.183rRD P10.2390.1990.1880.1360.0970.3710.3660.3670.3660.3270.2210.2260.2010.2040.2490.1700.2090.2450.2940.327cCPD两个马赛克图 对心理健康的每
6、一种状况,A、B、C、D、E五个小方块的宽度显示了行轮廓,0、1、2、3四种心理健康状况的小方块高度显示了行密度。 对社会经济的每一种状况,0、1、2、3四个小方块的高度显示了列轮廓,A、B、C、D、E五种社会经济状况的小方块宽度显示了列密度。9.2 独立性的检验和总惯量v一、行、列独立的检验 v二、总惯量一、行、列独立的检验v在列联表中,检验行变量和列变量相互独立假设的统计量为 当独立性的原假设为真,且样本容量 充分大,期望频数 时, 近似服从自由度为 的卡方分布。拒绝规则为 若 ,则拒绝独立性的原假设 其中 是 的上分位点。2211pqijijijijpp pnp pn5,1,2, ,1,
7、2,ijnp pipjq211pq221,1pq221,1pq21,1pq21,1pq二、总惯量 总惯量还可以行轮廓和列轮廓的形式表达如下:2211pqijijijijpp pnp p总惯量21111pqpijijiiiciijijpppppp rc Drc总惯量21111qpqijjijjjrjjijippppppcrDcr总惯量 其中 称为第 行轮廓 到行轮廓中心 的卡方( )距离,它可看作是一个加权的平方欧氏距离。同样, 是第 列轮廓 到列轮廓中心 的卡方距离。故总惯量可看成是行轮廓到其中心的卡方距离的加权平均,也可看成是列轮廓到其中心的卡方距离的加权平均。它既度量了行轮廓之间的总变差,
8、也度量了列轮廓之间的总变差。211qijijicijjpppprc Drcic2211pijjijrjiippppcrDcrjjcrir总惯量为零的等价情形 v总惯量为零与以下三种情形的任一种等价: (1) ,或表示为 ; (2)所有的行轮廓相等,即 ; (3)所有的列轮廓相等,即 。v所以,如果行变量与列变量相互独立,则我们可以期望(由样本数据构成的)列联表中所有的行有相近的轮廓,所有的列亦有相近的轮廓。,1,2, ,1,2,ijijpp pip jqPrc12prrrc12qcccr9.3 行、列轮廓的坐标9.4 对应分析图v一、行、列轮廓的逼近 v二、行(列)点之间的距离 v三、行点和列
9、点相近的意涵一、行、列轮廓的逼近二、行(列)点之间的距离v如果两个行(列)点接近,则表明相应的两个行(列)轮廓是类似的;反之,如果两个行(列)点远离,则表明相应的两个行(列)轮廓是非常不同的。需要指出的是,行点与列点之间并没有直接的距离关系。三、行点和列点相近的意涵v如果一个行点和一个列点相近,则表明行、列两个变量的相应类别组合发生的频数会高于这两个变量相互独立情形下的期望值。例9.4.1v 在例9.1.1中,经计算,奇异值、主惯性以及贡献率等的计算结果列于表9.4.1中。总惯量的94.75%可由第一维来解释,前二维解释了高达99.76%的总惯量,几乎解释了列联表数据的所有变差。例9.4.1 行点和列
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《防火墙技术》课件
- 《中西建筑艺术差异》课件
- 中班文明小观众课件
- 采购部门报告范文模板
- 墙砖地砖施工合同范本
- 财务管理调查报告范文
- 不同企业总结报告范文
- 毕野设计开题报告范文
- 2023年高考真题-语文(天津卷) 含答案
- 《建设之路的探索》课件
- 第五、六、七单元试卷-2024-2025学年统编版九年级历史上册
- 婴幼儿托育服务与管理的职业规划
- 2024年国家电投招聘笔试参考题库含答案解析
- DL-T 2594-2023 电力企业标准化工作 评价与改进
- 中考专题-瓜豆原理课件
- (完整版)临近营业线施工方案
- 蝶之毒华之锁 中文文字攻略(整理版)
- 心理健康C证面试题
- 中小寿险公司机构分类管理暂行办法2017
- 荷叶圆圆教学心得体会(共6篇)
- 母猪发情机理与促情要点PPT课件
评论
0/150
提交评论