第五章数理统计的基本知识_第1页
第五章数理统计的基本知识_第2页
第五章数理统计的基本知识_第3页
第五章数理统计的基本知识_第4页
第五章数理统计的基本知识_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章数理统计的基本知识第一节数理统计的基本概念一、总体与总体分布总体是具有一定共性的研究对象的全体,其大小与范围随具体研究与考察的目的而确定.总体确定后,我们称总体的每一个成员为个体.定义1:统计学中称随机变量(或向量)为总体,并把随机变量(或向量)的分布称为总体分布.注:(1)有时个体的特性的直接描述并非是数量指标,但总可将其数量化,如检验某学校全体学生的血型,试验的结果有型、型、型、型4种,若分别以1,2,3,4依次记这4种血型,则试验的结果就可以用数量表示了;(2)总体的分布一般来说是未知的,有时即使知道其分布的类型(如正态分布、二项分布等),但不知这些分不中所含的参数等(如等),数理统计的任务就是根据总体中部分个体的数据资料对总体的未知分布进行统计推断.按一定规则从总体中抽取若干个体进行观察,通过观察可得到关于总体的一组数值其中每一是从总体中抽取的某一个体的数量指标的观察值,上述抽取过程称为抽样,所抽取的部分个体称为样本,样本中所含个体数目称为样本的容量.样本是一个随机变量(或向量).容量为的样本可视为维随机向量一旦具体取定一组样本,便得到样本的一次具体的观察值称其为样本值.二、样本与样本分布例1样本及观察值的表示方法:(1)某食品厂用自动装罐机生产净重为345克的午餐`肉罐头,由于随机性,每个罐头的净重都有差别,现在从生产线上随机抽取10个罐头,秤其净重,得如下结果:344336345342340338344343344343这是一个容量为10的样本的观察值,它是来自该生产线罐头净重这一总体的一个样本的观察值.最常用的一种抽样方法称为简单随机抽样,它要求抽取的样本满足下面两个条件:注:今后假定所考虑的样本均为简单随机样本,简称为样本.1.代表性:与所考察的总体具有相同的分布;2.独立性:是相互独立的随机变量.由简单随机抽样得到的样本称为简单随机样本,它可用与总体独立同分布的个相表示.互独立的随机变量设总体的分布函数为则简单随机样本的联合分布函数为并称其为样本分布.特别地,若总体为连续型随机变量,其概率密度为则样本的概率密度为分别称与为连续总体密度若总体为离散型随机变量,其概率分布为取遍所有可能取值,则样本的概率分布为分别称与为离散总体密度与离散样本密度.例2如果总体服从正态分布,则称总体为正态总体.正态总体是统计应用中最常见的总体,现设总体服从正态分布则其样本密度由下式给出:例3设总体服从参数为的泊松分布,为其样本,则样本的概率分布为其中取非负整数,而三、统计推断问题简述通过总体的一个样本分布进行推断,此即为统计推断问题.样本值的关系:总体推断(个体)样本样本值样抽对总体的总体、样本、在实际应用中,总体的分布一般是未知的,或虽然知道总体分布所属的类型,但其中包含有未知参数.为对总体分布进行推断,可对总体进行抽样研究,对总体的每次抽样,均得到样本的一组确定的值——样本值,统计推断就是利用通过大量抽样得到的样本值,反过来对总体分布的属的类型,分布中所含的未知参数进行推断.或总体四、分组数据统计表和频率直方图1.分组数据表:若样本值较多时,组,分组的组数应与样本容量相适应.可将其分成若干区间所含的样本值个数称为该区间的组频数.组频数与总的样本容量之比称为组2.频率直方图:频率直方图能直观地表示出组频率数的分布.其步骤如下:(1)设是样本个观察值.的中求出和最的最小者大者将区间等分成个小区间使(一般取(2)(略小于)和(略大于),选取常数并在左右,且小区间不包含右端点):(3)组频率及求组频数(4)在上以为高,为宽作小矩形,其面积恰为所有小矩形合在一起就构成了频率直方图.典型的频率直方图如下图所示.参考教材P129,例4五、经验分布函数定义2设总体的一个容量为的样本的样本值可按大小次序排列成若则不大于的样本值的频率为因而函数与事件在独立重复试验中的频率相同的,称为经验分布函数.例5随机观察总体得到一个容量为10的样本值:求经验分布函数.解把样本值按从小到大的顺序排列为于是得经验分布函数为其中如时,因事件包含样本值个数故事件发生的频率为从而六、统计量与常用的统计量定义3:设为总体的一个样本,样本的任一不含总体分布未知参数的函数为该样本的统计量.例如,设总体服从正态分布,未知.为总体的一个样令称此本,则与均为该样本的统计量,但不是统计量.常用统计量以下设为总体的一个样本.1.样本均值2.样本方差3.样本标准差4.样本(k阶)原点矩5.样本(k阶)中心矩6.顺序统计量将样本中的各分量按由小到大的次序排列成则称为样本的一组顺序统计量,称为样本的第个顺序统计量.特别地,与分别为样本极小值与样本极大值,并称为样本的极差.称例6某厂实行计件工资制,为及时了解情况,随机抽取30名工人,调查各自在一周内加工的零件数,然后按规定算出每名工人的周工资如下:(单位:元)其样本均值它反映了该厂工人周工资的一般水平.为:这便是一个容量为30的样本观察值,所以样本方差为进一步我们计算样本方差及样本标准差由于样本标准差为例7(分组样本均值与方差的近似计算)如果在例中收集得到的样本观察值用分组样本形式给出6(见表A),此时样本均值可用下面方法近似计算:以表示第个组的组中值(即区间的中点),为第组的组频数,则这与例7的结果差不多.再求样本方差的近似值,时有而样本标准差为例7的结果相差也不大.其结果与此例8设我们获得了如下三个样本:样本样本样本如果将它们画在数轴上(如图),明显可见它们的“分散”程度是不同的:样本在这三个样本中比较密集,而样本比较分散.这一直觉可以用样本方差来表示.这三个样本的均值都是5,即而样本容量易得同理易得由此可见这与直觉是一致的.由于样本方差的量纲与样品的量纲不一致,故常用样本标准差表示分散程度,易求出同样有第二节常用的统计分布一、分位数设随机变量的分布函数为对给定的实数若实数满足不等式(1)则称为随机变量的分布的水平为的上侧分位数.若实数满足不等式(2)分位数.则称为随机变量的分布的水平为的双侧例如,标准正态分布的上侧分位数和双侧分位数分别如下图:分位数的性质:通常,直接求解分位数是很困难的,对常用的统计分布,可利用附录中给出的分布函数值表来得到分位数的值.例1设求标准正态分布的水平0.05的上侧分位数和双侧分位数.解由于查标准正态分布函数值表可得而水平0.05的双侧分位数为它满足:查标准正态分布函数值表可得今后,分别记与为标准正态分布的上侧注:分位数与双侧分位数.分布定义1:设是取自总体的样本,则称统计量(1)服从自由度为的分布,记为这里,自由度是指(1)式右端所包含的独立变量的个分布的概率密度:数.二、其中G(.)为Gamma函数,G()(1)分布的数学期望与方差:若则分布的性质:分布的可加性:若且与相互独立,则(2)分布的分位数:(3)设对给定的实数足条件的数为分布的水平的上侧分位数.称满对不同的与分位数的值已经编制成表供查用(参见附表5).例如,查表得:例2设是来自总体的样本,又设试求常数使服从分布.解因为所以且相互独立,于是故应取则有定义2:设且与相互独立,则称服从自由度为的分布,记为分布三、分布的概率密度:(1)的图形关于轴对称,且即有但较小时,两者相差较大;(2)当充分大时,分布近似于标准正态分布,(3)分布的分位数对给定的实数称满足条件的点为分布的水平的上侧分位数.似地,可给出分布的双由的对称性及定义有类侧分位数对不同的与分布的上侧分位数可自附表4查得.例3设随机变量随机变量均服从且都相互独立,令试求的分布,并确定的值,使解由于定义3:设立,则称

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论