多元统计分析选择题_第1页
多元统计分析选择题_第2页
多元统计分析选择题_第3页
多元统计分析选择题_第4页
多元统计分析选择题_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元统计分析选择题第一篇:多元统计分析选择题选择题下面哪一项不是判别分析的方法(C)A.距离判别B.贝叶斯判别C.协方差阵判别D.费歇判别2式子cov(AX,BY)=(C)A.cov(X,Y)BB.cov(X,Y)C.Acov(X,Y)D.Acov(X,Y)B3如果正态随机向量X=(1,2,……)的各分量是相互独立的随机变量,那么随机变量X的协方差阵是(B)。A.零矩阵B.对角阵C.对称阵D.单位阵4利用主成分分析得到的各个主成分之间(D)A.相互独立B.线性相关C.不完全相关D.互不相关5典型相关分析是研究(B)变量之间相关关系的多元统计方法。A.一组B.两组C.大于两组D.大于一组6典型相关分析的步骤不包括(C)A.设计典型相关分析B.确定典型相关分析的目标C.给出典型相关分析方案D.验证模型7对数线性模型中表示两个因素的交互效应,此模型为非饱和模型的条件是(C)A.>0B.<0C.=0D.=18贝叶斯判别法中的判别规则所带来的平均损失ECM达到(D)A.0B.1C.一定数值D.最小9一个p维变量的函数f(∙)能作为中某个随机向量的分布函数,当且仅当(B)A.fx<0B.fx>0C.>0D.<010马氏距离不需要符合下面哪一条基本公理(A)A.dx,y≤0B.dx,y=d(y,x)C.dx,y≤dx,z+d(z,y)D.dx,y=0,当且仅当x=y。第二篇:多元统计分析思考题《多元统计分析思考题》第一章回归分析1、回归分析是怎样的一种统计方法,用来解决什么问题?2、线性回归模型中线性关系指的是什么变量之间的关系?自变量与因变量之间一定是线性关系形式才能做线性回归吗?为什么?3、实际应用中,如何设定回归方程的形式?4、多元线性回归理论模型中,每个系数(偏回归系数)的含义是什么?5、经验回归模型中,参数是如何确定的?有哪些评判参数估计的统计标准?最小二乘估计两有哪些统计性质?要想获得理想的参数估计值,需要注意一些什么问题?6、理论回归模型中的随机误差项的实际意义是什么?为什么要在回归模型中加入随机误差项?建立回归模型时,对随机误差项作了哪些假定?这些假定的实际意义是什么?7、建立自变量与因变量的回归模型,是否意味着他们之间存在因果关系?为什么?8、回归分析中,为什么要作假设检验?检验依据的统计原理是什么?检验的过程是怎样的?9、回归诊断可以大致确定哪些问题?回归分析有哪些基本假定?如果实际应用中不满足这些假定,将可能引起怎样的后果?如何检验实际应用问题是否满足这些假定?对于各种不满足假定的情形,分别采用哪些改进方法?10、回归分析中的R2有何意义?它能用来衡量模型优劣吗?11、如何确定回归分析中变量之间的交互作用?存在交互作用时,偏回归系数的意义与不存在交互作用的情形下是否相同?为什么?12、有哪些确定最优回归模型的准则?如何选择回归变量?13、在怎样的情况下需要建立标准化的回归模型?标准化回归模型与非标准化模型有何关系?形式有否不同?14、利用回归方法解决实际问题的大致步骤是怎样的?15、你能够利用哪些软件实现进行回归分析?能否解释全部的软件输出结果?第二章判别分析1、判别分析的目的是什么?2、有哪些常用的判别分析方法?这些方法的基本原理或步骤是怎样的?它们各有什么特点或优劣之处?3、判别分析与回归分析有何异同之处?4、判别分析对变量与样本规模有何要求?5、如何度量判别效果?有哪些影响判别效果的因素?6、逐步判别是如何选择判别变量的?基本思想或步骤是什么?7、判别分析有哪些现实应用?举例说明。第三章聚类分析1、聚类分析的目的是什么?与判别分析有何异同?这种方法有哪些局限或欠缺?2、有哪些常用的聚类统计量?3、系统(谱系)聚类法的基本思想是怎样的?它包含哪些具体方法?4、聚类分析对变量与样本规模有何要求?有哪些因素影响分类效果?要想减少不利因素的影响,可以采取哪些改进方法?5、实际应用问题,如何确定分类数目?6、快速聚类法(K—均值法)的基本思想或步骤是怎样的?7、有序样品的最优分别法的基本思想或步骤是怎样的?8、应用聚类分析解决实际问题的基本步骤是怎样的?应该注意哪些方面的问题?第四章主成分分析与典型相关分析1、主成分分析的基本思想是什么?在低维情况下,如何利用几何图形解释主成分的意义?2、什么是主成分的贡献率与累计贡献率?实际应用时,如何确定主成分的个数?3、主成分有哪些基本性质?4、对于任何情形的多个变量,都可以采取主成分方法降维吗?为什么?5、怎样的情况下需要计算标准化的主成分?6、主成分有哪些应用?7、如何解释主成分的实际含义?8、典型相关分析的基本思想是什么?有何实际用途?9、典型相关分析与回归分析、判别分析、主成分分析、因子分析有何关联?试比较这些方法的异同之处。10、典型相关分析有哪些基本假定?11、如何解释典型相关函数的实际意义?12、典型相关方法中冗余度分析的意义是什么?第五章因子分析与对应分析1、因子分析是怎样的一种统计方法?它的基本目的和用途是什么?2、因子分子中的KMO统计量与巴特莱特球形性检验的目的是什么?3、因子分析有哪些类型?它们有何区别?Q型因子分析与聚类分析有何异同?4、因子分析中的变量类型是怎样的?因子分析对变量数目有没有要求?对样本规模有没有要求?5、因子分析有怎样的基本假定?对样本特点(或性质)有何要求?6、因子分析模型中,因子载荷、变量共同度、方差贡献等统计量的统计意义是什么?7、因子分析与主成分分析有何区别与联系?它们分别适用于怎样的情况?8、如何确定公共因子数目?如何解释公共因子的实际意义?9、怎样的情况下,需要作因子旋转?10、有哪些估计因子得分的方法?因子得分的估计是普通意义下的参数估计吗?为什么?11、对应分析的基本思想或原理是什么?试举例说明它的应用。12、对应分析中总惯量的意义是什么?第三篇:《多元统计分析》习题《多元统计分析》习题分为三部分:思考题、验证题和论文题思考题绪论1﹑什么是多元统计分析?2﹑多元统计分析能解决哪些类型的实际问题?聚类分析1﹑简述系统聚类法的基本思路。2﹑写出样品间相关系数公式。3﹑常用的距离及相似系数有哪些?它们各有什么特点?4﹑利用谱系图分类应注意哪些问题?5﹑在SAS和SPSS中如何实现系统聚类分析?判别分析1﹑简述距离判别法的基本思路,图示其几何意义。2﹑判别分析与聚类分析有何异同?3﹑简述贝叶斯判别的基本思路。4﹑简述费歇判别的基本思路。5﹑简述逐步判别法的基本思想。6﹑在SAS和SPSS软件中如何实现判别分析?主成分分析1﹑主成分分析的几何意义是什么?2﹑主成分分析的主要作用有那些?3﹑什么是贡献率和累计贡献率,其意义何在?4﹑为什么说贡献率和累计贡献率能反映主成分中所包含的原始变量的信息?5﹑为什么要用标准化数据去估计V的特征向量与特征值?6﹑证明:对于标准化数据有S=R。7﹑主成分分析在SAS和SPSS中如何实现?因子分析1﹑因子得分模型与主成分分析模型有何不同?2﹑因子载荷阵的统计意义是什么?3﹑方差旋转的目的是什么?4﹑因子分析有何作用?5﹑因子模型与回归模型有何不同?6﹑在SAS和SPSS中如何实现因子分析?对应分析1﹑简述对应分析的基本思想。2﹑简述对应分析的基本原理。3﹑简述因子分析中Q型与R型的对应关系。4﹑对应分析如何在SAS和SPSS中实现?典型相关分析1﹑典型相关分析适合分析何种类型的数据?2﹑简述典型相关分析的基本思想。3﹑典型变量有哪些性质?4﹑典型相关系数和典型变量有何意义?5﹑典型相关分析有何作用?﹑在SAS和SPSS中如何实现典型相关分析?验证题聚类分析1、为了更深入了解我国人口的文化程度,现利用1990年全国人口普查数据对全国30个省、直辖市、自治区进行聚类分析。分析选用了三个指标:(1)大学以上文化程度的人口占全部人口的比例(DXBZ);(2)初中文化程度的人都占全部人口的比例(CZBZ);(3)文盲半文盲人口占全部人口的比例(WMBZ),分别用来反映较高、中等、较低文化程度人口的状况。计算样品之间的相似系数,使用最长距离法、重心法和Ward法,将上机结果按样品号画出聚类图,并根据聚类图将30个样品分为四类。2、根据信息基础设施的发展状况,对世界20个国家和地区进行分类。只要采用6个指标:(1)Call—每千人拥有电话线数,(2)movecall—每千户居民蜂窝移动电话数,(3)fee—高峰时期每三分钟国际电话的成本,(4)Computer—每千人拥有的计算机数,(5)mips—每千人中计算机功率(每秒百万指令),(6)net—每千人互联网络户主数。计算样本之间的距离采用欧式距离,用最长距离法、重心法、离差平方和法进行计算。3、按照城乡居民消费水平,对我国30个省市自治区分类。判别分析1、从1995年世界各国人文发展指数的排序中,选取高发展水平、中等发展水平的国家各五个作为两组样本,另选四个国家作为待判样品做距离判别分析。2、对全国30个省市自治区1994年影响各地区经济增长差异的制度变量:—经济增长率(%)、—非国有化水平(%)、—开放度(%)、—市场化程度(%)作判别分析。3、为了解全国各地职工生活费用上涨水平,对29个省市自治区九项指标作判别分析。主成分分析1、对全国30个省市自治区经济发展基本情况的八项指标作主成分分析。2、对30个省市自治区工业企业经济效益作综合评价。3、对我国城市居民生活费支出作主成分分析。因子分析1、利用1995年的数据对我国社会发展状况进行综合考察。2、对我国30个省市自治区的农业生产情况作因子分析。从农业生产条件和生产结果济效益出发,选取六项指标分别为:—乡村劳动力人口(万人),—人均经营耕地面积(亩),—户均生产性固定资产原值(元),—家庭基本纯收入(元),—人均农业总产值(千元/人),—增加值占总产值比重(%)。3、对1979-1988年中国人民银行资金来源的10项指标作因子分析。对应分析1、用对应分析研究我国部分省份的农村居民家庭人均消费支出结构。选取7个变量:—食品支出比重,—衣着支出比重,—居住支出比重,—家庭设备及服务支出比重,—医疗保健支出比重,—交通和通讯支出比重,—文教娱乐、用品及服务支出比重。样品为10个:山西、内蒙古、辽宁、吉林、黑龙江、海南、四川、贵州、甘肃、青海。2、对全国31个省市自治区按各种经济类型资产占总资产比重(%),利用1997年数据作对应分析。选取6个变量:—国有经济/总资产,—集体经济/总资产,—联营经济/总资产,—股份制经济/总资产,—外商投资经济/总资产,—港澳台经济/总资产3、用对应分析研究1991年全国各地区独立核算工业企业的经济效益情况。典型相关分析1、对某高中一年级男生38人进行体力测试(共有七项指标)及运动能力测试(共有五项指标),试对两组指标作典型相关分析。体力测试指标:—反复横向跳(次),—纵跳(cm),—背力(kg),—握力(kg),—台阶试验(指数),—立定体前屈(cm),—俯卧上体后仰(cm)。运动能力测试的指标为:—50米跑(秒),—跳远(cm),—投球(m),—引体向上(次),—耐力跑(秒)。2、全国30个省市自治区农村居民收入和支出的典型相关分析。反映农村居民收入的变量取4个:—劳动者报酬(元),—家庭经营收入(元),—转移性收入(元),—财产性收入(元)。反映农村居民生活费支出的变量取8个:—食品支出(元),—衣着支出(元),—居住支出(元),—家庭设备及服务支出(元),—医疗保健支出(元),—交通和通讯支出(元),—文教、娱乐用品及服务支出(元),—其它商品及服务支出(元)。3、社会经济综合发展水平与邮电发展状况的典型相关分析。论文题通过论文题,可以让学生掌握如何在图书馆查阅数据,录入数据,并根据论文要求对数据进行预处理,使学生了解各分析方法适合解决的问题类型,能够运用所学的多元统计分析方法解决实际数据分析问题。1、自拟题目,论文中的数据处理方法至少选用对应分析、典型相关分析中的一种。2、自拟题目,论文中的数据处理方法至少选用主成分分析、因子分析中的一种。3、自拟题目,论文中的数据处理方法至少选用聚类分析、判别分析中的一种。第四篇:多元统计分析实验报告格式多元统计分析实验报告姓名及学号:(例:张三20110000000)日期:1、实验内容2、实验目的(。。指出通过本实验要了解或掌握什么)3、实验方案分析(。。指出实验内容属于什么问题,说明用什么方法来实验,如果是检验问题,那么原假设是什么)4、操作过程(。。给出有关操作过程)5、实验结果(。。给出实验得到的重要结果)6、讨论(。。对上述得到的结果做出说明与讨论)7、结论(。。根据以上的讨论给出恰当的结论)第五篇:多元统计分析实验报告多元统计分析得实验报告院系:数学系班级:13级B班姓名:陈翔学号:20131611233实验目得:比较三大行业得优劣性实验过程有如下得内容:(1)正态性检验;(2)主体间因子,多变量检验a;(3)主体间效应得检验;(4)对比结果(K矩阵);(5)多变量检验结果;(6)单变量检验结果;(7)协方差矩阵等同性得Box检验a,误差方差等同性得Levene检验a;(8)估计;(9)成对比较,多变量检验;(10)单变量检验。实验结果:综上所述,我们对三个行业得运营能力进行了具体得比较分析,所得数据表明,从总体来瞧,信息技术业要稍好于电力、煤气及水得生产与供应业以及房地产业。1。正态性检验Kolmogorov-SmirnovaShapiro—Wilk统计量dfSig.统计量dfSig、净资产收益率。11335、200*。97835。677总资产报酬率。12135、200*。96435、298资产负债率。08635。200*.96235、265总资产周转率.18035、006。86435。000流动资产周转率、16435、018.88535、002已获利息倍数、28135.000。55135、000销售增长率.10335、200*。94935、104资本积累率。25135。000、65535。000*。这就是真实显著水平得下限。a。Lilliefors显著水平修正此表给出了对每一个变量进行正态性检验得结果,因为该例中样本中n=35<2000,所以此处选用Shapiro—Wilk统计量。由Sig。值可以瞧到,总资产周转率、流动资产周转率、已获利息倍数及资本积累率均明显不遵从正态分布,因此,在下面得分析中,我们只对净资产收益率、总资产报酬率、资产负债率及销售增长率这四个指标进行比较,并认为这四个变量组成得向量遵从正态分布(尽管事实上并非如此)。这四个指标涉及公司得获利能力、资本结构及成长能力,我们认为这四个指标可以对公司运营能力做出近似得度量。2.主体间因子N行业电力、煤气及水得生产与供应业11房地行业15信息技术业9多变量检验aa效应值F假设df误差dfSig。截距Pillai得跟踪.967209。405b4。00029。000。000Wilks得Lambda、033209。405b4.00029、000、000Hotelling得跟踪28.883209、405b4.00029。000.000Roy得最大根28。883209。405b4.00029.000、000行业Pillai得跟踪、4812、3738、00060、000、027Wilks得Lambda、5632.411b8、00058。000.025Hotelling得跟踪.6982。4438.00056、000.024Roy得最大根、5594、193c4、00030、000。008a、设计:截距+行业b、精确统计量c、该统计量就是F得上限,它产生了一个关于显著性级别得下限。上面第一张表就是样本数据分别来自三个行业得个数。第二张表就是多变量检验表,该表给出了几个统计量,由Sig。值可以瞧到,无论从哪个统计量来瞧,三个行业得运营能力(从净资产收益率、总资产报酬率、资产负债率及销售增长率这四个指标得整体来瞧)都就是有显著差别得。3.主体间效应得检验源因变量III型平方与df均方FSig。校正模型净资产收益率306、300a153。1504。000、028总资产报酬率69.464b34、7323、320.049资产负债率302。366c151。183、680。514销售增长率2904.588d1452。2942、154.133截距净资产收益率615.3381615.33816。073.000总资产报酬率218、0161218。01620。841。000资产负债率105315。4591105315。459473、833、000销售增长率1.49711。497.002。963行业净资产收益率306、3002153.1504.000。028总资产报酬率69、464234.7323、320、049资产负债率302。3662151。183。680.514销售增长率2904.58821452、2942.154、133误差净资产收益率1225、0543238、283总资产报酬率334。7533210、461资产负债率7112、40632222.263销售增长率21579、51132674、360总计净资产收益率2238、21635总资产报酬率641.59835资产负债率117585、07535销售增长率24585、04535校正得总计净资产收益率1531。35434总资产报酬率404.21734资产负债率7414。77234销售增长率24484。09934a、R方=。200(调整R方=、150)b.R方=.172(调整R方=、120)c.R方=、041(调整R方=-.019)d。R方=。119(调整R方=、064)此表给出了每个财务指标得分析结果,同时给出了每个财务指标得方差来源,包括校正模型、截距、主效应(行业)、误差及总得方差来源,还给出了自由度、均方、F统计量及Sig。值4、对比结果((K矩阵))行业简单对比a因变量净资产收益率总资产报酬率资产负债率销售增长率级别1与级别3对比估算值-5、649—3、0707。259-13、223假设值0000差分(估计-假设)—5。649-3.0707.259-13。223标准误差2、7811.4546、70111、672Sig、。051.043、287。266差分得95%置信区间下限-11。313-6。031-6、390-36、998上限。016-、10920。90810、552级别2与级别3对比估算值1、054—、0571。791-22。696假设值0000差分(估计-假设)1、054—。0571、791-22。696标准误差2、6091、3646.28610。949Sig、、689。967.778.046差分得95%置信区间下限-4.260-2.834-11.013-44。999上限6。3682、72114、595-.394a、参考类别=3此表表示,在0.05得显著水平下,第一行业(电力、煤气及水得生产与供应业)与第三行业(信息技术业)得总资产报酬率指标存在显著差别,净资产收益率、资产负债率与销售增长率等财务指标无明显差别,但由第一栏可以瞧到,电力、煤气及水得生产与供应业得净资产收益率、总资产报酬率与销售增长率均低于信息技术业,资产负债率高于信息技术业,似乎说明信息技术业作为新兴行业,其成长能力要更高一些。第二行业(房地产业)与第三行业得销售增长率指标有明显得差别,第三行业大于第二行业,说明信息技术业得获利能力高于房地产业。净资产收益率、总资产报酬率与资产负债率等财务指标没有显著差别。5、多变量检验结果值F假设df误差dfSig、Pillai得跟踪、4812。3738。00060。000、027Wilks得lambda、5632、411a8.00058。000.025Hotelling得跟踪.6982、4438。00056.000。024Roy得最大根。5594。193b4。00030.000.008a。精确统计量b、该统计量就是F得上限,它产生了一个关于显著性级别得下限。此表就是上面多重比较可信性得度量,由Sig、值可以瞧到,比较检验就是可信得。6。单变量检验结果源因变量平方与df均方FSig.对比净资产收益率306.3002153。1504。000、028总资产报酬率69、464234、7323。320.049资产负债率302。3662151.183。680、514销售增长率2904。58821452。2942、154.133误差净资产收益率1225。0543238.283总资产报酬率334。7533210、461资产负债率7112.40632222、263销售增长率21579。51132674、360此表就是对每一个指标在三个行业比较得结果、7。协方差矩阵等同性得BBox检验aaBox得M29.207F1。172df120df22585。573Sig、、269检验零假设,即观测到得因变量得协方差矩阵在所有组中均相等、a.设计:截距+行业误差方差等同性得Levene检验aaFdf1df2Sig。净资产收益率、500232、611总资产报酬率1.759232。188资产负债率4。537232、018销售增长率1、739232、192检验零假设,即在所有组中因变量得误差方差均相等。a。设计:截距+行业上面第一张表就是协方差阵相等得检验,检验统计量就是Box“sM,由Sig.值可以认为三个行业(总体)得协方差阵就是相等得、第二张表给出了各行业误差平方相等得检验,在0、05得显著性水平下,净资产收益率、总资产报酬率以及销售增长率得误差平方在三个行业间没有显著差别。这似乎说明,除了行业因素,对资产负债率有显著影响得还有其她因素。这与此处均值比较没有太大得关系。8。估计因变量行业均值标准误差95%置信区间下限上限净资产收益率电力、煤气及水得生产与供应业、1691、866—3、6313、969房地行业6、8711.5983。61710、125信息技术业5。8182、0621、61710.019总资产报酬率电力、煤气及水得生产与供应业、524.975—1、4632、510房地行业3。537。8351.8365.238信息技术业3。5931.0781.3975、789资产负债率电力、煤气及水得生产与供应业60、3154、49551、15869.471房地行业54.8473.84947、00662.688信息技术业53。0564.96942。93363.178销售增长率电力、煤气及水得生产与供应业-1.0387.830-16.98714.911房地行业-10.5126。705-24。1703、146信息技术业12、1848.656—5.44829.816此表给出了每一行业各财务指标描述统计量得估计、9、成对比较因变量(I)行业(J)行业均值差值(I-J)标准误差Sig.b差分得95%置信区间b下限上限净资产收益率电力、煤气及水得生产与供应业房地行业—6.702*2。456。010—11、705-1、699信息技术业—5.6492。781。051—11、313。016房地行业电力、煤气及水得生产与供应业6、702*2。456。0101.69911.705信息技术业1、0542。609。689—4.2606。368信息技术业电力、煤气及水得生产与供应业5.6492、781。051—.01611。313房地行业-1.0542。609、689—6。3684。260总资产报酬率电力、煤气及水得生产与供应业房地行业-3、013*1、284。025—5.628-.398信息技术业-3.070*1、454。043—6、031-、109房地行业电力、煤气及水得生产与供应业3。013*1、284。025.3985、628信息技术业—。0571、364。967—2、8342.721信息技术业电力、煤气及水得生产与供应业3、070*1。454.043.1096。031房地行业。0571.364、967—2、7212。834资产负债率电力、煤气及水得生产与供应业房地行业5.4685。918、362-6、58717。523信息技术业7、2596、701.287-6、39020.908房地行业电力、煤气及水得生产与供应业-5。4685、918。362-17。5236。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论