数理统计典型例题分析_第1页
数理统计典型例题分析_第2页
数理统计典型例题分析_第3页
数理统计典型例题分析_第4页
数理统计典型例题分析_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

典型例题分析第1页共23页典型例题分析例1.分别从方差为20和35的正态总抽取容量为8和10的两个样本,求第一个样本方差是第二个样本方差两倍的概率的范围。解以和分别表示两个(修正)样本方差。由知统计量服从分布,自由度为(7,9)。事件的概率因为是连续型随机变量,而任何连续型随机变量取任一给定值的概率都等于0。现在我们求事件的概率:。由附表可见,自由度的分布水平α上侧分位数有如下数值:。由此可见,事件的概率介于0.025与0.05之间;。例2.设是取自正态总体的一个样本,为样本方差,求满足不等式的最小值。解由随机变量分布知,随机变量服从分布,自由度,于是,有其中表示自由度的分布随机变量,是自由度为的水平的分布上侧分位数(见附表)。我们欲求满足的最小值,由附表可见,。于是,所求。例3.假设随机变量在区间上有均匀分布,其中未知:是来自的简单随机样本,是样本的均值,是最小观察值。证明和都是的无偏估计量。解由在上均匀分布,知。由,可见是的无偏估计量。为证明是的无偏估计。我们先求统计量的概率分布。其密度为由于独立且与同分布,知的分布函数为;于是,有。,从而是的无偏估计。在证的无偏估计时,先求估计量分布再求其数学期望。此外,下面将看到,是矩估计量,是最大似然估计量。有效性的验证,即验证两个无偏估计量哪一个更有效(方差较小),只需计算它们的方差并加以比较,验证估计量的最小方差超出了本课程的要求。读者只需了解一些常用的最小方差估计量。例如,对于正态分布总体,样本均值和修正样本方差相应为和的最小方差无偏估计量;事件频率是它的概率的最小方差无偏估计量。如果要求有效率,则用公式计算,其中——称为罗.克拉美不等式。例4.设总服从正态分布,其中方差为已知常数;关于未知数学期望有两个二者必居其一的假设:,其中和都有已知常数,并且。根据来自总体的简单随机样本,确定假设的水平否定域(即拒绝域),并计算第二类错误概率。解取统计量做检验的统计量。在假设成立的条件下,。由于。所以以下四种都是假设的水平的否定域:;,其中是标准正态分布水平双侧分位数(见附表)。在假设成立的条件下,统计量,其中。因此,以为假设否定域的检验的第二类错误概率为:。特别(设是标准正态分布函数);;;。为了便于比较,设,则。查附表并经计算,容易得到。计算结果表明,尽管四个检验的一类错误的概率都等于,但它们的第二类错误的概率却不相同。以为否定域的检验的第二类错误的概率最小,为我们所选用。例5.对二项分布作统计假设。假设的否定域取为,其中表示次试验中成功的次数。对(1)(2),求显著性水平和第二类错误的概率。解(1)显著性水平是第一类错误的概率,于是。。(2)。。例6.谋装置的平均工作温度据制造厂家称不高于190℃。今从一个由16台装置构成的随机样本册的工作温度的平均值和标准差分别为195℃和8℃。根据这些数据能否说明平均工作温度比制造厂所说的要高?设,并假定工作温度服从正态分布。解设工作温度为,根据题设。考虑假设由于总体方差未知,故用检验。这里对给定的,查表得。于是由表情形知假设的否定域为。由条件和知,因此。由于,所以否定域假设,说明平均工作温度比制造厂说的要高。某电话交换台在一小时(60分钟)内每分钟接到电话用户的呼唤次数有如下纪录:呼唤次数0123456实际频数81617106210问统计资料是否可以说明,每分钟电话呼唤次数服从泊松分布?(解设表示每分钟电话呼唤次数,需要检验的假设服从泊松分布。泊松分布中未知参数的最大似然估计为。我们用估计概率;用估计的期望频数。为避免期望频数太小,将呼唤次数为5和6的情况,合并为的情况,为第6组:其实际频数为2+1=3,期望频数为。计算结果列入下表:分组012345实际频数816171063期望频数8.1216.2416.2410.835.413.160.01440.05770.57760.68890.34410.02560.00180.00360.03560.06310.06400.0081所以统计量。统计量的自由度,其中是用到参数估计值的个数,故。对于,,查表得;假设的否定域为。由于=0.1762<9.488,所以不否定假设,即可以认为电话呼唤次数服从泊松分布。对200个电池左寿命试验,得如下统计分布:使用寿命小时0-55-1010-1515-2020-2525-30电池个数1334515421试求所得统计分布与指数分布的拟合优度。解设表示电池的寿命,需要检验假设服从指数分布。指数分布中未知参数需要用其最大似然估计来估计。在这里。所以。在”成立前提下,观察值落入各组的概率。计算结果列入下表:分组0-55-1010-1515-2020-2525-实际频率1334515421概率0.63210.23250.08550.03150.01160.0068期望概率126.4246.5017.106.302.321.360.34250.04840.25790.83970.04410.0953所以统计量。统计量的自由度,查表得=1.064,。由于1.064<1.6297<2.195,的可得统计分布与指数分布的拟合优度不小于0.70。例9设随机变量X和Y相互独立,。是X的一个样本,是的一个样本,测得数据(1)分别求的矩估计量;(2)分别求的极大似然估计值;(3)在显著水平下检验假设,。解(1)用样本一阶原点矩估计总体一阶矩,即得和的矩估计值:。(2)正态总体的参数的极大似然估计量为。因此的极大似然估计值为(3)是未知,双总体方差的假设检验。待检假设;,是在下的单侧检验。因为。所以F同机量得值查F分布表,得.经比较知,,故接受,认为大。例10有三台机器,生产同一种规格的铝合金薄板,测量三台机器所生产的薄板厚度(单位:厘米),得结果如表所示。 机器1机器2机器30.2360.2570.2580.2380.2530.2640.2480.2550.2590.2450.2540.2670.2430.2610.262试考察机器对薄板厚度有无显著的影响。解检验假设。是各台机器生产的薄板总体的均值。经计算,。,,.列出方差分析表如下方差来源平均和自由度均方F比结论因素20.005266132.92显著误差0.000192120.000016总14因为,故拒绝,认为各台机器生产的薄板厚度有显著差异。在进行方差分析时,还常要对未知参数进行估计。下面写出常用的几个估计:①是的无偏估计。②分别是的无偏估计。③是的无偏估计,且。④两总体与的均差值的置信度为的置信区间为 。例11求上例中未知参数的点估计及均值差的置信度为0.95的置信区间。解,,,又由,,知,故的置信度为0.95的置信区间分别为(0.242-0.2560.0055)=(-0.0195,-0.0085),(0.242-0.2620.0055)=(-0.0255,-0.0145),(0.256-0.2620.0055)=(-0.0115,-0.0005)。例12某工厂在生产一种产品时使用了三种不同的催化剂和四种不同的原料,每种搭配都做一种试验,测的产品成品的压强(单位:兆帕)数据如下表:催化剂原料313335343637353739393842试在下检验不同催化剂和原料对压强有无显著影响。解设为因素A在水平的效应,为因素B在水平的效应。待检验假设,。因为,所以,,,。列出方差分析表如下方差来源平方和自由度均方结论因素因素误差总和25.1769.344.1698.673361112.58523.1130.69318.12633.35显著显著因为,所以拒绝和,认为催化剂和原料的影响都是显著的。例13设关于某设备的使用年限和支出的维修费用(单位:千元)如下所示:234562.23.85.56.57.0求(1)关于的回归方程,的无偏估计;(2)检验回归是否显著,并求时,维修费用的0.95预测区间。解(1)左散点图(略),数据分布呈直线趋势。列计算表:22.244.44.8433.8911.414.4445.51622.030.2556.52532.542.2567.03642.049.00202590112.3140.78并计算下列数据:,解得,。所以,线性回归方程为。的无偏估计为。(2)将代入回归方程得。因为,所以的置信度为0.95的置信区间为。计算统计量。因为,故知回归效果是显著的。例14(单因素方差分析)下表给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活天数,问三种菌型的平均存活天数有无显著差异?表4-3菌型接种后存活天数Ⅰ型()24324772536Ⅱ型()5685107126665Ⅲ型()7116679510667计算:列成表格如下,其中,方差来源平方和自由度均方值因素误差总和,查表对给定的显著水平,查表因,故拒绝,即认为这三种不同菌型的伤寒杆菌的平均存活天数有显著差异。例15.(正交试验)为了制造轴承,寻求新钢种最佳等温淬火工艺。考察试验指标是径向抗压负荷与硬度,对试验指标有影响的主要因素:加热温度(单位:),等温温度(单位:),淬火返修次数(单位:次),将因素列如下表。水平列号A加热温度B等温温度C淬火返修次数123900880860250260270012因为是3元素3水平,选择正交表合适。制定试验方案表表头设计ABC列号试验号12341234567891(900)2(880)3(860)1231231(250)112(260)223(270)333(2)1(0)2(1)231123231312123确定试验方案在上表中,每一个横行就代表了一个试验条件,共有9个试验条件。等1号试验条件是:加热温度是900(),等温温度是250(,返修次数是2次(),记作为,类似地第2号试验条件是,第9号试验条件是。试验方案的实施按正交表中的试验条件严格操作。将各次的试验结果记录下并列如下表中。其中——第列因素水平,——第列因素水平的3次试验指标的平均例对因素,有硬度。——各因素的3个水平的负荷之和——各元素的3个水平平均硬度。=(硬度)=列号试验号1(A)2(B)3(C)试验指标负荷硬度1234567891(900)2(880)3(860)1231231(250)112(260)223(270)333(2)1(0)2(1)2311235.57.45.95.76.17.88.49.56.959.559.059.058.058.058.057.0~57.557.0~57.557.0~57.5负荷19.6018.8023.60负荷单位:硬度单位:硬度174.75177.50174.25负荷23.0019.6021.10硬度174.25174.00174.25负荷20.6024.8018.50硬度174.25171.75174.75负荷6.536.277.87硬度58.2559.2058.10负荷7.676.537.03硬度58.1058.0058.10负荷6.878.276.17硬度58.1057.2585.25负荷3.406.005.10硬度0.151.950.15正交试验结果的分析直接看:(1)比较9次试验的负荷:抗压负荷最高的试验条件是,即第8号试验,其次是(第7号试验),(第6号试验),(第2号试验)。(2)再比较9次试验的硬度是:硬度的高低主要取决于等温温度,加热温度和返修次数对硬度无明显影响。综合考虑,等2号试验的条件较好。计算分析;(1)负荷因素平均负荷是因素平均负荷是因素平均负荷是由此分析出是最好的试验条件。但这个条件在表中没有出现。类似(1)硬度——根据每个因素对试验指标的影响不同,区分出主次。由上表可见主———————次负荷硬度用极差大小来区分主次:若某因素的极差越大,则该因素对指标的影响就越大。结果可以看出是因素。综合平衡考虑:硬度不能低于。在这一条件下高负荷的好水平组合为。试验结果的分析分别在正交表中进行。方差分析这是3元素3水平的无重复试验设计问题。其效应模型为设表示从第1号试验到第9号试验的试验指标。具体效应模型表示如下检验假设总离差平方其中——第列的离差平方和,由于正交表具有均衡分散性和综合可比性的特点,所以=同理记——为因素的平方和——为因素的平方和——为因素的平方和。——则,当为真时,检验统计量分布;当为真时,检验统计量分布;当为真时,检验统计量分布。若给定显著系性水平,拒绝域,当拒绝,则认为因素对试验指标有显著影响;当拒绝,则认为因素对试验指标有显著影响;当拒绝,则认为因素对试验指标有显著影响;利用正交表进行方差分析时,要确定自由度可以用如下方法。;正交表每列的自由度正交表总的自由度即每个因素平方和的自由度正交表总的自由度=各自由度之和,即;正交表空白列的自由度=误差平方和的自由度。若无空白列,则将最小的离差平方和作为误差平方和,即。将例7的关于抗压负荷的方差列如下表方差分析表方差来源平方和自由度均方因素因素因素误差总和效应是未知参数,应先求效应估计值,效应估计值大的所对应的水平是好水平。前面已经分析过因素对试验指标的影响不显著,可以认为,所以由于所以,比较的大小,只需比较的大小,得出最大,故因素的3水平是好水平。结合直接看和计算分析,确定好的工艺条件为例16设关于某设备的使用年限和所支出的维修费用,有如下统计资料:使用年限23456维修费用2.23.85.56.57.0建立关于的统计数据的散点图,并确定对的统计相依关系的特点;假设对有一元线性回归的统计相依关系,求回归系数和得无偏估计;假设对有一元正态线性回归的统计相依关系,试检验回归效果的显著性;对于,求维修费用的0.95预测区间。将点(2,2.2),(3,3.8),(4,5.5),(5,6.5),(6,7.0)标在坐标系中,得散点图由散点图可见,所给数据具有模型的特点。由散点图可见,可以用模型描述维修费用与使用年限的统计相依关系,为估计和,首先作如下计算:22.244.42.546.05160.115633.8911.43.771.51290.000945.51622.0500.250056.52532.56.231.51290.2700673642.07.466.05160.2116202590112.315.12900.8481将结果代入,得和得无偏估计。;。的无偏估计为,其中。3)为检验回归效果,计算统计量。。查表,得。由于,可见回归效果显著。于是,可以利用回归防城建立使用年限为,应支付维修费用的预测区间:,则,其中,。将相应数据代入上式,得,。于是,使7年应支付费用的0.95预测区间为。例17假设是一个普通变量,是一个随机变量,且与有形如一元线性回归的统计相依关系。在=0.25,0.37,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论