版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、二名词解释1 1、 多元统计分析:多元统计分析是运用数理统计的方法来研究多变量(多指标)问题的理论和方法,是一元统计学的推广2 2、 聚类分析:是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。使类内对象的同质性最大化和类间对象的异质性最大化3 3、 随机变量:是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。它是由于随机而获得的非确定值,是概率中的一个基本概念。即每个分量都是随机变量的向量为随机向量。类似地,所有元素都是随机变量的矩阵称为随机矩阵。4 4、统计量:多元统计研究的是多指标问
2、题 ,为了了解总体的特征,通过对总体抽样得到代表 总体 的样本,但因为信息是分散在每个样本上的 ,就需要对样本进行加工,把样本的信息浓缩 到不包 含未知量的样本函数中,这个函数称为统计量、计算题A16-42其中启=(1Q纣眉=-4 4-1一试判断叼+2吟与-r-ro o2 2 J J10-6-15-61 1 a a 2U2U-162040k设H =花一?是否独立?按用片的联合分帚再Ii i -6-61-6 lti-1G-1G2020 ) )2.对某地区农村的白名2周宙另翌的身高、胸圉、上半骨 圉进行测虽,得相关数据 如下根据汶往资料,该地区城市2周岁男婴的递三个指标的 均值血二(90Q乩16庆
3、现欲在多元正态性的假定下检验该地区农 村另娶是 否与城市男婴有相同 的均值?井中乂 =60.2 xA)-1=(115.6924)-1-14.62103.172-37 37602、假设检验I可题:比、# =险用/H地r-8.o经计算可得:X-AA22=6x70.0741=420.445由题目已知热“(3,) = 295由是AI=AW3,3) A147.5所以在显著性水平ff=0.01下,拒绝原设尽 即认为农村和城市的2周岁男婴上述三个 指标的均 值有显著性差异OPP P4、设盂=(耳兀.昂工/M ( (XE),协方差阵龙=P1 P PI 0 pP P 1P P厂43107-14.62108.94
4、6A1 、8.9464-37 376035.S936=0.01,(3,2) = 99.2,03) =293隔工4) =16.7)3107-14.6210E9464ST1=(23J3848)-1-14.62103.172-37.37608 9464-37 376035.5936构造检验统计量:尸却勺(丢-冏)(巫-角)(1)(1) 试从匚出发求X的第一总体主成分;(2)(2) 试|可当取多大时才链 更髡 主成分册贡蕾率达阳滋以上.对二舄=人=1p得人所对应的单位特征向量为匚1* 2 2故得第-主成分一舒+有寸冷禺+*血(2)第一个主成分的责献率为- - =1八95%雄+2入+川4题型二解答题1、
5、简述多元统计分析中协差阵检验的步骤答:第一,提出待检验的假设和 H1;H1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判彳段设做出决策(拒绝或接受)。2 2、 简述一下聚类分析的思想答:聚类分析的基本思想,是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。把相似的样品或指标归为一类,把不相似的归为其他类。直到把所有的样品(或指标)聚合完毕3 3、 多元统计分析的内容和方法答:1 1、简化数据结
6、构,将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量,使研究问题得到简化但损失的信息又不太多。(1 1)主成分分析(2 2)因子分析(3 3)对应分析A 1-P-PA 1-P-P-P-P-PP=0得特征根*A=l + 3p,-PZ-l0.95x4-1 -3-禹0 933等2 2、分类与判别,对所考察的变量按相似程度进行分类。(1 1)聚类分析:根据分析样本的各研 究变量,将性质相似的样本归为一类的方法。(2 2)判别分析:判别样本应属何种类型的统计方法。4 4、系统聚类法基本原理和步骤 答:1 1)先计算 n n 个样本两两间的距离2 2)构造 n n 个类,每个类只包含一个样本3
7、3)合并距离最近的两类为一新类4 4)计算新类与当前各类的距离5 5) 类的个数是否等于 1,1,如果不等于回到 3 3 在做6 6)画出聚类图7 7)决定分类个数和类5 5、聚类分析的类型有:答:(1 1)对样本分类,称为 Q Q 型聚类分析(2 2) 对变量分类,称为 R R 型聚类分析# # Q Q 型聚类是对样本进行聚类,它使具有相似性特征的样本聚集在一起,使差异性大的样本分离开来。#R#R 型聚类是对变量进行聚类,它使具有相似性的变量聚集在一起,差异性大的变量分离开来,可在相似变量中选择少数具有代表性的变量参与其他分析,实现减少变量个数,达到变量降维的目的。6 6、简述欧氏距离与马氏
8、距离的区别和联系。4a简述欧氏距 离与马氏距离的区别和联系.答I设P空闾RP中的两点X= (XpX 2 Xp ) ;和Y= YpYr- Yp;D则欧氏距藕次 欧氏距离的局限肓在多元数据分忻中,其度重不合理-会受到粥间题 中it冈的毙响设是来自均值向II为(J,协方差为别勺总体G中的p维样本.则马氏K巨离为 1B1DaT) = X-YLX-Y n当迟=【即单位阵时小辙Y) =x Y X一 丫 =二(& 丫 =Yj ) W欧氏距 离.因此,在一定程 度上,欧氏E巨离是马氏距离的特殊情况.马氏距离是欧氏距离的推广.7 7、试述系统聚类的基本思想。答:系统聚类的基本思想是:距离相近的样品(或变
9、量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。8 8 对样品和变量进行聚类分析时所构造的统计量分别是什么?简要说明为什么这样构造?答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。因为我们把 n n 个样本看作p p 维空间的 n n 个点。点之间的距离即可代表样品间的相似度。常用的距离为(-)明氏距离;=d血一心严1q取不同值,分次护(1)绝对距离(七巧工)=X口迄-座/Jt-1 4(2)欧氏距离一% )=(祇一兀严(3)切比雪夫距禽新g ) % (Q =出警- X金1 ? 一才j r工、 、/*-(-)马氏距禽 八p r X*+JA “*
10、K * JfrfK(二)兰氏距离壳=(卷-XJ)心(X1-xp对变的拒似性,我们更多地要了解变堡的变化趋势 或变化方向,因此用相关性 进行W0舟变量看作P维空间的向量,一般用PVGOM比一 I矿)(工:) 、厂 jM八必/V * *iI(-)相关系数9 9、在进行系统聚类时,选择距离公式应遵循哪些原则答:(1)(1)要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有非常明确的空间距离概念。马氏距离有消除量纲影响的作用。(2(2 ) )要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。如在进行聚类分析之前已经对变量作了标准化处理,则通常就可采用欧氏距离。(3)(3) 要考虑研
11、究对象的特点和计算量的大小。样品间距离公式的选择是一个比较复杂且带有一定主观性的问题, 我们应根据研究对象的特点不同做出具体分折。实际中,聚类分析前不妨试探性地多选择几个距离公式分别进行聚类,然后对聚类分析的结果进行对比分析, 以确定最合适的距离测度方法。1010、欧式距离的优点缺点欧式距离(Euclid距离)m m优点:几何意义明确,简单,容易掌握,由于中学数学就已初步接触,数学知识不多的人也可以把握它的基本含义。缺点:从统计学的角度看,使用欧式距离要求一个向量的 说各个坐标对欧式距离的贡献同等且变差大小相同, 效果良好,否n n 个分量不相关,且具有相当的方 差,或者此时使用欧式距离才合适,且因此需要对坐标加权,化为统(JL4X)1X . X)则就不能如实反映情况且容易导致错误的结论。计距离1111、 模糊聚类分析的实质和基本原理答:模糊聚类分析的实质就是根据研究对象本身的属性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 总经理助理转正工作总结8篇
- 数学教学工作总结(汇编15篇)
- 小学生读书演讲稿4篇
- 2017年寒假综合实践作业总结
- 将精神抚慰金列入刑事附带民事诉讼
- 做幸福教师演讲稿(4篇)
- 2025年文旅小镇合作协议书
- 停车场地出租合同(2篇)
- 2025年CBZ-5-苯基-L-半胱氨酸项目发展计划
- 个人车辆出租合同
- GB/T 397-2009炼焦用煤技术条件
- GB/T 13384-2008机电产品包装通用技术条件
- 《中考体育项目跳绳》教案
- 增服叶酸预防神经管缺陷理论知识考核试题及答案
- 新业娱乐安全评价报告
- 医保工作自查表
- 小学-英语-湘少版-01-Unit1-What-does-she-look-like课件
- 单证管理岗工作总结与计划
- 安全安全隐患整改通知单及回复
- 国有检验检测机构员工激励模式探索
- 采购部年终总结计划PPT模板
评论
0/150
提交评论