应用统计真题_第1页
应用统计真题_第2页
应用统计真题_第3页
应用统计真题_第4页
应用统计真题_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

论述题:1.解释假设检验的根本思想方法及可能会犯的两类错误及在实际应用中如何控制可能犯两类错误的概率。2.试述均匀试验设计的特点,对均匀试验设计和正交试验设计两种方法进行比拟,指出各自的优缺点。3.试述费歇判别的根本思想方法及主要步骤。4.试述多元线性回归解决实际问题的根本思想方法及主要步骤。6.解释正交试验设计的特点及理论依据。7.试论述一元线性回归的根本思想及主要方法步骤。一、〔任选两题,每题10分,共20分〕1.解释假设检验的根本思想方法及可能会犯的两类错误及在实际应用中如何控制可能犯两类错误的概率。2.解释正交试验设计的特点及理论依据。3.试述一元线性回归的根本思想及主要方法步骤。答案:1.假设原理运用了小概率原理,在原假设正确的前提下,根据样本观察值和运用统计方法检验由此将导致什么结果,如果导致小概率事件在依次试验中发生了,那么认为原假设可能不正确,从而拒绝原假设;反之,如果未导致小概率事件发生,那么没有理由拒绝原假设。第一类错误:弃真错误即为真时,作出拒绝的判断;第二类错误:纳伪错误即不真时,作出接受的判断。通常限制犯第一类错误的概率,增大样本容量使犯第二类错误的概率尽可能地小。为了简化检验过程,更多的应用是只控制犯第一类错误的概率,而不考虑犯第二类错误的概率。2.正交试验设计是研究多因素多水平的又一种设计方法,它有多、快、好、省的特点。“多〞是指可以考虑多因素、多指标;“快〞是指试验次数少、周期短、见效快;“好〞是指可以很快找到优秀方案和可能最优方案;“省〞是指省时间、省消耗、省资金、省劳力等。正交性原理是正交实验设计的理论依据,它主要表现在均衡分散性和整齐可比性两个方面。均衡分散性是指正交表安排的实验方案均衡地分散在配合完全的水平组合的方案之中。整齐可比性是指对于每列因素,在各个水平导致的结果之和中,其它因素的各个水平出现的次数是相同的。3.一元线性回归是研究两个变量之间的相关关系,且两个变量有着密切的关系,它们的这种相关关系不能用完全确切的函数形式表示,但在平均意义下有一定的定量关系表达式。1)先进行相关性分析,看两个变量间是否有线性关系,确定回归方程中的因变量与自变量,对线性模型进行假设;2)从样本数据出发对线性回归方程进行参数估计,确定回归方程;3)对回归方程进行各种统计检验:回归方程的拟合优度检验、回归方程的显著性检验、回归系数的显著性检验、残差正态检验。4)利用回归方程进行解释或预测现象。1.在某新产品开发试验中需要考虑四个因素A、B、C、D对产品质量的影响。根据专业知识和实践经验知道,A与C之间存在着交互作用,D与A、B及C之间的交互作用可以忽略不计。 〔1〕假设每个因子只取两个水平,试选择适当的正交表安排该实验;〔2〕指出第2号及第5号试验的实验条件。解:〔1〕根据题意,A与B、B与C之间的交互作用还不能肯定,需要通过试验考察。这样,需要考察的因子及交互作用为A,B,C,D,A×B,A×C,B×C。因此可以选用正交表。 表头设计列入表1-1。表1-1表头设计列号1234567因子 试验方案列入表1-2。表1-2实验方案表因因子水平试验号12345671111111121112222312211224122221152121212621221217221122182212112〔2〕第2号试验的试验条件为,第5号试验的试验条件为。2.设,,,为来自总体X的一个样本,求X的协方差矩阵、相关矩阵R的矩估计。解:3.下面记录了三位操作工分别在四台不同机器上操作二天的日产量:机器操作工甲乙丙A151716161821B161715152219C151618171818D182015171717试用方差分析法检验:〔1〕操作工之间的差异是否显著;〔2〕机器之间的差异是否显著;〔3〕交互影响是否显著〔〕。解:由题意知,又由题目给出数据可得:,,,见上表中两数之和。 将计算的有关结果列入方差分析表〔表3-1〕中。表3-1方差分析表方差来源平方和自由度平均平方和F值操作工30.0833215.041710.9394机器0.458330.15280.1111交互作用34.916765.81954.2323误差16.5121.375—总和81.958323——对于给定水平,由分别查〔附表5〕得,,由表3-1可知:〔1〕操作工之间的差异显著。〔2〕机器之间的差异不显著。〔3〕操作工与机器交互影响显著。4.下面是来自两个正态总体、的样本值试分别用贝叶斯判别法〔取〕和距离〔采用马氏距离〕判别法判别样品及所属的类。假设出现不一致结果,请提出你的判别建议。解: 依题意,对于,,对于,。〔1〕贝叶斯判别法:0.2420.2180.066所以,属于,属于。〔2〕距离判别法: 显然,故属于。显然,故属于。 〔3〕结果不一致分析。5.四个样品分别为,试用重心法和离差平方和法进行聚类分析。假设分成两类,请您提出您的分类建议。解:〔1〕重心法: 首先将四个样品分别看做一类,计算距离矩阵。040840251750由可以看出,和之间距离最短,因此可以合并为一个新类,然后计算、、之间的距离,得相应的如下02505250由可以看出,和之间距离最短,因此可以合并为一个新类,然后计算、之间的距离,得相应的如下016.250 最后将与合为一类。上述聚类过程用聚类图表示为图5-1。 〔2〕离差平方和法:由〔1〕中已计算的重心法的距离平方及计算距离矩阵。02042012.58.52.50由可以看出,和之间距离最短,因此可以合并为一个新类,然后计算、、之间的距离,得相应的如下012.2503.333316.66670由可以看出,和之间距离最短,因此可以合并为一个新类,然后计算、之间的距离,得相应的如下012.18750最后将与合为一类。上述聚类过程用聚类图表示为图5-2。6.在有关合成纤维的强度y与其拉伸倍数x的试验中得试验数据如下:变变量序号121.341.692.622.52.56.256.256.2532.72.57.296.256.7543.52.712.257.299.45543.51612.251464.54.220.2517.6418.975.2527.04252686.36.439.6940.9640.3297.16.350.4139.6944.731087644956119881647212108.110065.6181∑64.857.5428.18335.63378〔1〕试利用上述数据表建立合成纤维的强度y与其拉伸倍数x的回归方程;〔2〕检验所见方程是否有意义〔〕;〔3〕预测当拉伸倍数x=6时,强度y的置信度为95%的置信区间。解:〔1〕由于=12,,于是得故所求回归方程为〔2〕由,查分布表〔附表5〕得,而所以回归方程有意义。〔3〕时,y的估计值为又,由,查分布表〔附表3〕得,故得y的置信度为95%的预测区间为从而得时,y的置信度为95%的预测区间为〔4.2992,6.3192〕1.某厂有三条生产线,从三条生产线生产的纤维中分别抽取了一些样品,纤维强度数据见下表,试考察它们生产的纤维在强度上是否有显著差异?自动生产线纤维强度甲7.07.46.16.57.5乙5.56.77.25.8丙6.77.28.27.37.56.9解: 三条生产线可以看做三个水平,即,以表分别示各水平所做的重复试验次数,即,由上表计算得 将有关结果列入方差分析表〔表1-1〕。方差来源平方和自由度平均平方和F值因素A〔组间〕2.421.23.0901误差〔组内〕4.66120.3883总和7.0614—- 对于给定,由查表可得,那么,所以三条生产线上的纤维强度差异。2.设有来自不同总体的四个样本分别为〔2,5〕,〔2,3〕,〔5,1〕,〔6,2〕,试用重心法和离差平方和法进行聚类,并提出您的分类建议。解: 〔1〕重心法: 首先将四个样品分别看做一类,计算距离矩阵。04025130251720由可以看出,和之间距离最短,因此可以合并为一个新类,然后计算、、之间的距离,得相应的如下04024.514.50由可以看出,和之间距离最短,因此可以合并为一个新类,然后计算、之间的距离,得相应的如下018.50最后将与合为一类。上述聚类过程用聚类图表示为图2-1。 〔2〕离差平方和法: 由〔1〕中已计算的重心法的距离平方及计算距离矩阵。02012.56.5012.58.510由可以看出,和之间距离最短,因此可以合并为一个新类,然后计算、、之间的距离,得相应的如下02016.33339.66670由可以看出,和之间距离最短,因此可以合并为一个新类,然后计算、之间的距离,得相应的如下018.50最后将与合为一类。上述聚类过程用聚类图表示为图2-2。3.设有总体,,且分别服从均匀分布U〔-1,1〕,U〔0,3〕,试:分别用贝叶斯判别法〔取〕和距离〔采用马氏距离〕判别法判别样品及所属的类。解: 〔1〕贝叶斯判别法: 由题意得,,故所属的类为。,故所属的类为。 〔2〕距离判别法: 对于总体:,; 对于总体:, 显然,故属于。显然,故属于。4.在异乡试验中测得关于的局部数据如下:-4-3-3-1201465-7-7-3-1-137653-10-8-4-124891011〔1〕试建立y与的回归方程。并就检验所的回归方程是否有意义;〔2〕检验对y的影响是否显著〔〕;解: 〔1〕建立数据预处理表表4-1数据预处理计算变变量序号1-4-7-1016492840701002-3-7-8949212456643-3-3-49991212164-1-1-111111152-1241-24-2460340900121671781497856648469163624365481965103625306050100105311259155533121∑7521117237133240342567由表4-1得解正规方程得,,从而得回归方程〔2〕对于给定的,查表〔附表5〕得临界值,由于,所以检验效果显著,即回归方程有意义。〔3〕检验对y的影响的显著性。那么取统计量计算得,。对给定的,查表〔附表5〕得临界值。由于故在检验水平下对y影响不显著,而对y影响显著。二、〔每题10分,共20分〕1.设,,,为来自总体的一个样本,求的协方差矩阵、相关矩阵的矩估计。解:,其中=所以2.设有总体,,且分别服从均匀分布,,试判别样品及所属的类。解:〔1〕贝叶斯判别法: 由题意得,,故所属的类为。,故所属的类为。 〔2〕距离判别法: 对于总体:,; 对于总体:, 显然,故属于。显然,故属于。三、〔20分〕下面记录了三位操作工分别在四台不同机器上操作二天的日产量:机器操作工甲乙丙ABCD171716182016161515181715171821221918181717试用方差分析法检验:〔1〕操作工之间的差异是否显著;〔2〕机器之间的差异是否显著;〔3〕交互影响是否显著。〔=0.05〕解:由题意知,又由题目给出数据可得:,,,为表中每个操作工在每个机器上操作二天的日产量之和。 将计算的有关结果列入方差分析表中。方差分析表方差来源平方和自由度平均平方和F值操作工30.0833215.041710.9394机器0.458330.15280.1111交互作用34.916765.81954.2323误差16.5121.375—总和81.958323——对于给定水平,由分别查表得,,由方差分析表可知:〔1〕操作工之间的差异显著。〔2〕机器之间的差异不显著。〔3〕操作工与机器交互影响显著。四、〔20分〕4个样品分别为A〔-2,0〕,B〔0,0〕,C〔2,0〕,D〔1,3〕,试用重心法和离差平方和法进行聚类。假设分成两类,请提出你的分类建议。解:〔1〕重心法:〔将两类间的距离定义为两类重心间的距离,每一类的重心是属于该类样品的均值〕 首先将四个样品分别看做一类,计算距离矩阵。04016401810100由可以看出,和之间距离最短,因此可以合并为一个新类,然后计算、、之间的距离,得相应的如下0180990由可以看出,和之间距离最短,因此可以合并为一个新类,然后计算、之间的距离,得相应的如下0100 最后将与合为一类。假设分为两类,那么或 〔2〕离差平方和法:〔先将个样品各自成一类,此时=0;然后每次将其中某两类合并为一类,因每缩小一类离差平方和就要增加,每次选择使增加最小的两类进行合并,直至所有样品合并为一类为止。把两类合并后增加的离差平方和看成为类间的平方距离。〕0208204.5550由可以看出,和之间距离最短,因此可以合并为一个新类,然后计算、、之间的距离,得相应的如下04.50660由可以看出,和之间距离最短,因此可以合并为一个新类,然后计算、之间的距离,得相应的如下090最后将与合为一类。假设分为两类,那么五、〔20分〕在一项某种农作物产量的研究中,从10个农场得到的数据列表如下:变量序号13850501444250019001900250025002395252152127042080202827042704339545615212916210621843024313644156571681313622962337319232495455663202531362520283535283969644626419363844272828163968409674364681849409627522924435246248466369211639692898317443474761948627023043844297633604340490010476171220937212867333743315041430580620186063386625071268953628638980〔1〕试建立与、之间的回归方程。并检验所得回归方程是否有意义;〔2〕假设所得回归方程有意义,试求,时的预测值。〔3〕检验和对的单独影响是否显著;〔,计算过程数据保存4位小数。〕解:(1)由=10,=43,=58,=62,=18606-1043=11625071-104358=13133866-1058=22626895-104362=23536286-105862=32638980-1062=540解正规方程:得:=1.1490;=0.7765从而=62-1.149043-0.776558=-32.4440得到回归方程2351.1490+3260.7765=523.1540540-523.1540=16.8460=108.6928对于给定的,查表,得临界值,由于,所以检验效果显著,即回归方程有意义。(2)当,时,=56.2235(3)由,那么取统计量计算得21.9433,19.5738。对于给定的,查表得临界值=5.59。由于21.9433>5.5919.5738>5.59故在检验水平=0.05下对的影响都显著。A卷2023年至2023年第二学期考试《应用统计方法》试题专业------------------------------------------姓名------------------------------------------学号-----------

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论