数理统计大作业_第1页
数理统计大作业_第2页
数理统计大作业_第3页
数理统计大作业_第4页
数理统计大作业_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数理统计学大作业学 院航空航天工程学部专 业飞行器设计班 级航宇二班学 号8姓 名张立指导教师姜永负责教师沈阳航空航天大学2021年12月目录目录2前言2一、采集样本数据整理及SPSS统计软件的实现31.1、数据的收集方法及说明31.2、数据整理:给出频数、频率分布表及偏度和峰度41.3、画出直方图和折线图51.4、经验分布函数和图形61.5、各种概率分布7二、给出总体分布的参数估计122.1、矩估计法122.2、最大似然估计122.3、参数区间估计13三、 参数的假设检验163.1.样本统计数据的t检验16检验17四、非参数假设检验拟合优度检验184.1、拟合优度检验18五、结论20参考文献

2、21前言 数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的根底性学科。随着科学技术的开展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。了解数理统计能解

3、决那些实际问题。对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。例如估计未知分布的数学期望,就要考虑到:1.如何寻求适宜的估计量的途径,2.如何比拟多个估计量的优劣。这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。掌握了寻求估计的统计思想,具体寻求估计的步骤往往是“套路子的,并不困难,然而如果没有从根本上理解,仅死背套路子往往会出现各种错误.一、采集样本数据整理及SPSS

4、统计软件的实现1.1、数据的收集方法及说明 我的这次作业采取的数据是机械加工零件中,车床C6140其中一个传动轴的长度,由于这零件是大批量生产,数据很多,我选取了其中的100个数据进行计算,数据具体如下:84 69 73 77 88 83 65 74 79 6767 89 74 85 92 80 87 71 80 6777 76 77 73 53 68 79 81 67 7659 88 70 80 92 79 75 88 48 7274 73 83 68 65 78 88 84 58 7470 78 70 69 80 79 76 75 73 7065 81 81 80 76 52 66 69

5、77 7673 65 75 75 79 89 74 88 81 7377 82 74 88 84 82 81 88 90 6584 90 78 89 93 81 85 83 61 701.2、数据整理:给出频数、频率分布表及偏度和峰度 其中,样本传动轴长度数据最小值为48,最大值为93,取a=40,b=100,全距L=10040=60,把数据分布的区间(40,100等分为6个子区间,等组距为ti=100-40/6=10,i=1,2,3,4,5,6。 通过计数要求落在子区间的个数,那么得样本传动轴长度的频数和频率分布, 序号 区间 频数ni 频率fi1 (40,50 1 12 (50,60 3

6、0.033 (60,70 24 0.244 (70,80 43 0.435 (80,90 23 0.236 (90,100 6 偏度是对样本观察值分布的偏斜方向和程度的度量,通过样本数据计算的偏度为: V1 > 0,分布呈右偏态。 峰度是描述样本观察值分布集中趋势顶峰的程度,通过样本数据计算的峰度为:V2 > 3,分布为尖峰分布。1.3、画出直方图和折线图图一、数据段的直方图图二、数据分段的折线图1.4、经验分布函数和图形 设X1,X2,.,Xn 是来自总体X 的样本,样本的顺序统计量为X(1)X(2).X(n),当固定的一组顺序统计量的观察值x(1)x(2).x(n)时,对于任何

7、实数x 称下式: 为总体X 的经验分布函数。图3经验分布函数图像1.5、各种概率分布 概率分布类型主要分为离散型概率分布和连续型概率分布,我查阅了图书馆还有专业参考资料搜集到以下的概率分布,个别分布还画出了密度函数图像,还对各种概率密度的背景做了简单的介绍。1. 指数分布: 指数函数的一个重要特征是无记忆性又称遗失记忆性。这表示如果一个随机变量呈指数分布,当s,t0时有P(T>s+t|T>t)=P(T>s)。即,如果T是某一元件的寿命,元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。2.威布尔分布: 威布尔分布又称韦伯,是可

8、靠性分析和寿命检验的理论根底。在可靠性工程中被广泛应用,尤其适用于机电类产品的磨损累计失效的分布形式。由于它可以利用概率值很容易地推断出它的分布参数,被广泛应用与各种寿命试验的数据处理。3.正态分布 正态分布是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。假设随机变量X服从一个数学期望为、方差为的正态分布,记为N(,)。正态分布的期望值决定了其位置,其标准差决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是 = 0, = 1的正态分布。 t分布曲线形态与n确切地说与自由度v大小有关。与标准正态分布曲线相比,自由度

9、v越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度v愈大,t分布曲线愈接近正态分布曲线,当自由度v=时,t分布曲线为标准正态分布曲线。柯西分布是一个数学期望不存在的连续型分布函数,它同样具有自己的分布密度 这说明X落在a,b的子区间内的概率只与子区间长度有关,而与子区间位置无关,因此X落在a,b的长度相等的子区间内的可能性是相等的,所谓的均匀指的就是这种等可能性。 伽玛分布是统计学的一种连续概率函数。伽玛分布中的参数,称为形状参数,称为尺度参数。二、给出总体分布的参数估计2.1、矩估计法矩估计法是一种相对简单的估计方法,其理论依据是辛钦大数定律:设随机变量序列X1,X2,独立

10、同分布,且数学期望E(Xi)=µ>0,有即当n时,依概率收敛到。因此当样本很大时因为采集的样本大于等于100,因此可以看作是大样本又因为从数据分布图可以看出样本服从正态分布,X的概率密度函数为:,所以令经过计算可得到,样本均值。所以 a 与 b 的矩估计量分别为。2.2、最大似然估计 因为最大似然估计法有较强的直观性,又能获得参数的合理的估计量,特别是在大样本时,最大似然估计有极好的性质。所以他广泛应用于估计理论中。最大似然估计的解题原理如下: X的概率密度函数为:所以,的似然函数为:取对数得:令 解得:所以,的极大似然估计量为:2.3、参数区间估计假设样本总体服从正态分布进行

11、计算。1方差未知,求数学期望的置信区间: 1由于未知,用样本的标准差代替此时不再服从标准正态分布。而是服从自由度为n-1的t函数,其分布记为:2) 查分位数给定置信水平1-,使:根据自由度n-1和1-,从t-分布表查出分位数为式等价于3的随机置信区间 的置信水平为0.90 的置信区间为:4确实定置信区间 由=74.4,方差S=9.49,那么带入值可得:置信水平为0.9的区间为71.6,77.2。2数学期望,均未知,求方差的置信区间 1选取的样本函数服从分布,记为: 2给定置信水平1-=0.9,使 从分布表查出分位数为于是: 由样本观察值计算样本方差为,那么的置信水平为0.90 确实定置信区间为

12、:。三、 参数的假设检验3.1.样本统计数据的t检验1假设样本总体服从分布N61.5,样本的均值=74.7,样本的标准差为s=9.49,当在显著性水平为0.05下,是否可以认为每个人的成绩都在70分以上?1原假设和备择假设单边检验:2) 选取检验统计量: 当原假设为真时,检验统计量为:3确定拒绝域: 给定显著水平,使得: 查分布表得临界值为: 而,那么其拒绝域为。4) 计算检验统计量的观测值为: 故带入后得到t=0.2334; 因此作出判断不能认为每个人的成绩都在70分以上。3.2样本统计数据的检验1假设总体服从总体分布 1原假设和备择检验: 2选取检验统计量: 当原假设为真时,检验统计量为:

13、 3确定拒绝域: 给定显著性水平=0.05 使:, 故而求的其拒绝域为30.144,+0,10.177 4计算检验统计量的观测值: 而因而可以认为新抽取的样本的标准差比原来的标准差没有区别。四、非参数假设检验拟合优度检验4.1、拟合优度检验序号 区间 频数ni 频率fi1 (40,50 1 12 (50,60 3 0.033 (60,70 24 0.244 (70,80 43 0.435 (80,90 23 0.236 (90,100 6 原假设和备择假设为:其中均为未知参数,的最大似然估计为: 以表中数据为根底,原假设为真时,计算随机变量X落在个区间的概率等价检验假设:计算结果如下:序号 区

14、间 频数 频率 1 (40,50 1 1 55.24 2 (50,60 3 0.03 25.52 3 (60,70 24 0.24 20.178 4 (70,80 43 0.43 10.595 5 (80,90 23 0.23 4.649 6 (90,100 6 6.348 13401 给定显著性水平,使的: 那么拒绝域为而观察值为125.1,因而没落在拒绝域内,原假设正确,样本服从正态分布N(61.5,318.5)。五、结论1.由于数理统计是一门实用性极强的学科,在我们以后的科研生活中不可缺少的。我们在学习的工程中要了解数学的实际背景,知道分布背后的数学知识,理解统计方法的直观含义。了解数理统计能解决那些实际问题。通过这次的数理统计大作业的学习,我学会了如何处理抽样数据,并根据处理的结果能初步的作出合理的统计推断。 2.数理统计从数学的角度去研究统计学,为各种应用统计学提供理论支持。比方以后我们要设计新型的飞机机翼,可以从根本的数据开始试验,把这些数据整理规划,用数理统计的知识来分析这些数据,对我们的设计可以起到指导的作用。因此数理统计受到了非常大的关注,特别是在最近几十年中,数理统计在社会科学、工农业生产、自然科学以及医疗卫生等诸多客观现实中有着广泛应用。3.通过对数理统计学的学习及完本钱次课程作业,初步学会了怎样有效地收集、整理和分析带有随机性的数据,但研究没有深入,无

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论