下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
千里之行,始于足下让知识带有温度。第第2页/共2页精品文档推荐多元统计分析期末考试考点整理二名词解释
1、多元统计分析:多元统计分析是运用数理统计的办法来讨论多变量(多指标)问题的理论和办法,是一元统计学的推广
2、聚类分析:是按照“物以类聚”的道理,对样品或指标举行分类的一种多元统计分析办法。将个体或对象分类,使得同一类中的对象之间的相像性比与其他类的对象的相像性更强。使类内对象的同质性最大化和类间对象的异质性最大化
3、随机变量:是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。它是因为随机而获得的非确定值,是概率中的一个基本概念。即每个重量都是随机变量的向量为随机向量。类似地,全部元素都是随机变量的矩阵称为随机矩阵。
4、统计量:多元统计讨论的是多指标问题,为了了解总体的特征,通过对总体抽样得到代表总体的样本,但由于信息是簇拥在每个样本上的,就需要对样本举行加工,把样本的信息浓缩到不包含未知量的样本函数中,这个函数称为统计量
三、计算题
解:
答:
答:
题型三解答题
1、简述多元统计分析中协差阵检验的步骤
答:
第一,提出待检验的假设和H1;
其次,给出检验的统计量及其听从的分布;
第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;
第四,按照样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(否决或接受)。
2、简述一下聚类分析的思想
答:聚类分析的基本思想,是按照一批样品的多个观测指标,详细地找出一些能够度量样品或指标之间相像程度的统计量,然后利用统计量将样品或指标举行归类。把相像的样品或指标归为一类,把不相像的归为其他类。直到把全部的样品(或指标)聚合完毕.
3、多元统计分析的内容和办法
答:1、简化数据结构,将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量,使讨论问题得到简化但损失的信息又不太多。(1)主成分分析(2)因子分析(3)对应分析等
2、分类与判别,对所考察的变量按相像程度举行分类。(1)聚类分析:按照分析样本的各讨论变量,将性质相像的样本归为一类的办法。(2)判别分析:判别样本应属何种类型的统计办法。
4、系统聚类法基本原理和步骤
答:
1)先计算n个样本两两间的距离
2)构造n个类,每个类只包含一个样本
3)合并距离最近的两类为一新类
4)计算新类与当前各类的距离
5)类的个数是否等于1,假如不等于回到3在做
6)画出聚类图
7)打算分类个数和类
5、聚类分析的类型有:
答:
(1)对样本分类,称为Q型聚类分析
(2)对变量分类,称为R型聚类分析#Q型聚类是对样本举行聚类,它使具有相像性特征的样本聚拢在一起,使差异性大的样本分别开来。#R型聚类是对变量举行聚类,它使具有相像性的变量聚拢在一起,差异性大的变量分别开来,可在相像变量中挑选少数具有代表性的变量参加其他分析,实现削减变量个数,达到变量降维的目的。
6、简述欧氏距离与马氏距离的区分和联系。
7、试述系统聚类的基本思想。
答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程向来举行下去,每个样品(或变量)总能聚到合适的类中。
8对样品和变量举行聚类分析时所构造的统计量分离是什么?简要说明为什么这样构造?
答:对样品举行聚类分析时,用距离来测定样品之间的相像程度。由于我们把n个样本看作p维空间的n个点。点之间的距离即可代表样品间的相像度。常用的距离为
9、在举行系统聚类时,挑选距离公式应遵循哪些原则?
答:(1)要考虑所挑选的距离公式在实际应用中有明确的意义。如欧氏距离就有十分明确的空间距离概念。马氏距离有消退量纲影响的作用。
(2)要综合考虑对样本观测数据的预处理和将要采纳的聚类分析办法。如在举行聚类分析之前已经对变量作了标准化处理,则通常就可采纳欧氏距离。
(3)要考虑讨论对象的特点和计算量的大小。样品间距离公式的挑选是一个比较复杂且带有一定主观性的问题,我们应按照讨论对象的特点不同做出详细分折。实际中,聚类分析前不妨摸索性地多挑选几个距离公式分离举行聚类,然后对聚类分析的结果举行对照分析,以确定最合适的距离测度办法。
10、欧式距离的优点缺点
优点:几何意义明确,容易,简单把握,因为中学数学就已初步接触,数学学问不多的人也可以掌握它的基本含义。
缺点:从统计学的角度看,使用欧式距离要求一个向量的n个重量不相关,且具有相当的方差,或者说各个坐标对欧式距离的贡献同等且变差大小相同,此时使用欧式距离才合适,且效果良好,否则就不能照实反映状况且简单导致错误的结论。因此需要对坐标加权,化为统计距离
11、含糊聚类分析的实质和基本原理
答:含糊聚类分析的实质就是按照讨论对象本身的属性而构造含糊矩阵,在此基础上按照一定的隶属度来确定其分类关系
基本原理:假如水平满足,则按水平分出的每一类必是按水平分出的每一类的子类。(p62页)
12、含糊聚类分析计算步骤:
答:
(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全国防灾减灾日主题活动总结6篇
- 学生环保的演讲稿
- 全国劳模表彰大会观后感
- 土力学复习测试题
- 河南省部分重点高中2025届高考适应性考试考前模拟卷(二)物理试题含答案
- 研学基地课程设计流程表
- xx市产业园基础设施项目可行性研究报告
- 校园农耕课程设计理念
- 2024年度企业内部审计保密及合作协议3篇
- 招商创业课程设计与实施
- 医疗质量管理工具课件
- 2023年上海市闵行区中心医院住院医师规范化培训招生(口腔科)考试参考题库+答案
- 单肺通气中的麻醉管理
- 建筑施工安全检查标准jgj59-2023
- 2023-2024学年江苏省高邮市小学数学六年级上册期末通关考试题
- GB/T 7631.5-1989润滑剂和有关产品(L类)的分类第5部分:M组(金属加工)
- GB/T 40428-2021电动汽车传导充电电磁兼容性要求和试验方法
- 中国人民大学组织行为管理学
- 七年级下册道德与法治复习资料
- 奥齿泰-工具盒使用精讲讲解学习课件
- DB32T 4353-2022 房屋建筑和市政基础设施工程档案资料管理规程
评论
0/150
提交评论