第5章-样本及其分布(数应)_第1页
第5章-样本及其分布(数应)_第2页
第5章-样本及其分布(数应)_第3页
第5章-样本及其分布(数应)_第4页
第5章-样本及其分布(数应)_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章样本及其分布机动目录上页下页返回结束第五章样本及其分布简单随机样本抽样分布

5.1简单随机样本研究某批灯泡的质量一个统计问题总有它明确的研究对象.研究对象的全体称为总体(母体),总体中每个成员称为个体.总体与个体机动目录上页下页返回结束…总体然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.某批灯泡的寿命该批灯泡寿命的全体就是总体国产轿车每公里的耗油量国产轿车每公里耗油量的全体就是总体机动目录上页下页返回结束由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性.从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布.这样,总体就可以用一个随机变量及其分布来描述.

若用表示总体的个指标,它是一个维随机变量,其分布函数是,则称该总体为具有分布函数的总体.机动目录上页下页返回结束

而概率分布正是刻划这种集体性质的适当工具.因此在理论上可以把总体与概率分布等同起来.

从另一方面看,统计的任务,

是根据从总体中抽取的样本,去推断总体的性质.

由于我们关心的是总体中的个体的某项指标(如人的身高、体重,灯泡的寿命,汽车的耗油量…),所谓总体的性质,无非就是这些指标值的集体的性质.机动目录上页下页返回结束

例如:

研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.某批灯泡的寿命总体寿命X可用一概率分布来刻划

鉴于此,常用随机变量的记号或用其分布函数表示总体.如说总体X或总体F(x).F(x)机动目录上页下页返回结束

类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,

Y)或其联合分布函数F(x,

y)来表示.

统计中,总体这个概念的要旨是:

总体就是一个概率分布.机动目录上页下页返回结束为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.

样本中所包含的个体数目称为样本容量.样本从国产轿车中抽5辆进行耗油量试验样本容量为5机动目录上页下页返回结束

但是,一旦取定一组样本,得到的是n个具体的数(X1,

X2,…,

Xn),称为样本的一次观察值,简称样本值.样本是随机变量.抽到哪5辆是随机的容量为n的样本可以看作n维随机变量.机动目录上页下页返回结束2.独立性:X1,

X2,

…,

Xn是相互独立的随机变量.由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:1.代表性:X1,

X2,

…,

Xn中每一个与所考察的总体有相同的分布.机动目录上页下页返回结束由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独立的随机变量X1,

X2,

…,

Xn表示.简单随机样本是应用中最常见的情形,今后,当说到“X1,

X2,

…,

Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.机动目录上页下页返回结束设总体X的分布为F(x),则其简单随机样本(X1,

X2,

…,

Xn)的联合分布函数为机动目录上页下页返回结束机动目录上页下页返回结束当总体X是离散型时,其分布律为样本的联合分布律为当总体X是连续型时,X~f(x),则样本的联合密度为事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.总体、样本、样本值的关系机动目录上页下页返回结束总体(理论分布)?样本样本值统计是从手中已有的资料--样本值,去推断总体的情况---总体分布F(x)的性质.总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁机动目录上页下页返回结束机动目录上页下页返回结束例设(X1,

X2,

…,

Xn)为X的一个样本,求(X1,

X2,

…,

Xn)的密度函数.解(X1,

X2,

…,

Xn)为X的一个样本,故机动目录上页下页返回结束例设某电子产品的寿命X服从指数分布,密度函数(X1,

X2,

…,

Xn)为X的一个样本,求其密度函数.解因为(X1,

X2,

…,

Xn)为X的一个样本,机动目录上页下页返回结束解例某商场每天客流量X服从参数为

的泊松分布,求其样本(X1,

X2,

…,

Xn)的联合分布律.

由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.

统计量机动目录上页下页返回结束(X1,

X2,

…,

Xn)g(X1,

X2,

…,

Xn)其中g(x1,

x2,

…,

xn)是(x1,

x2,

…,

xn)的连续函数.如果g(X1,

X2,

…,

Xn)中不含有未知参数,称g(X1,

X2,

…,

Xn)为统计量.(不含未知参数的样本的函数)如未知,(X1,

X2,

…,

Xn)为X的一个样本均为统计量不是统计量均为统计量机动目录上页下页返回结束若

已知,

未知,(X1,

X2,

…,

X5)为X的一个样本几个常见统计量样本均值样本方差它反映了总体均值的信息它反映了总体方差的信息机动目录上页下页返回结束样本k阶原点矩样本k阶中心矩

k=1,

2,

…它反映了总体k阶矩的信息它反映了总体k阶中心矩的信息机动目录上页下页返回结束5.2抽样分布

统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的“抽样分布”.

机动目录上页下页返回结束

抽样分布就是通常的随机变量函数的分布.

只是强调这一分布是由一个统计量所产生的.

研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质.抽样分布精确抽样分布渐近分布(小样本问题中使用)(大样本问题中使用)机动目录上页下页返回结束

—分布构造

统计量的分布称为抽样分布.数理统计中常用到如下三个分布:

—分布、—分布和—分布.

设,则称为自由度为的—分布.机动目录上页下页返回结束

统计三大分布-分布的密度函数曲线机动目录上页下页返回结束

卡方分位点设,若对于存在,满足则称为分布的上分位点.机动目录上页下页返回结束卡方分布性质机动目录上页下页返回结束若a.分布可加性独立,则b.期望与方差若,则例,(X1,

X2,

X3)为X的一个样本求的分布.解因为(X1,

X2,

X3)为X的一个样本Xi~N(0,1),i=1,

2,

3则i=1,

2,

3机动目录上页下页返回结束t

分布构造若,与独立,则称为自由度为的分布.机动目录上页下页返回结束的概率密度为机动目录上页下页返回结束(2)的极限为的密度函数,即机动目录上页下页返回结束t分布性质(1)关于(纵轴)对称.

t分布分位点,则称为的

分位点.设,若对存在,满足注:机动目录上页下页返回结束例(X1,

X2,

X3)为X的一个样本,求的分布.i=1,

2,

3解机动目录上页下页返回结束机动目录上页下页返回结束称为第一自由度为

,

第二自由度为

的分布,其概率密度为若独立,则机动目录上页下页返回结束F分布构造对于,若存在,满足,则称为

分位点.机动目录上页下页返回结束F分布的分位点注:得证!证明:设,则机动目录上页下页返回结束定理1(样本均值的分布)设X1,

X2,…,

Xn是取自正态总体的样本,则有机动目录上页下页返回结束

抽样分布定理

n取不同值时样本均值的分布机动目录上页下页返回结束

定理2(样本方差的分布)设X1,

X2,

…,

Xn是取自正态总体的样本,分别为样本均值和样本方差,则有机动目录上页下页返回结束n取不同值时的分布机动目录上页下页返回结束

定理3设X1,

X2,

…,

Xn是取自正态总体的样本,分别为样本均值和样本方差,则有机动目录上页下页返回结束定理4(两总体样本均值差的分布)

分别是这两个样本的且X与Y独立,X1,

X2,

…,是取自X的样本,取自Y的样本,分别是这两个样本的样本方差,均值,则有Y1,

Y2,

…,是样本机动目录上页下页返回结束机动目录上页下页返回结束若假设,则其中称为混合样本方差.定理5(两总体样本方差比的分布)

分别是这两个样本的且X与Y独立,X1,X2,

…,是取自X的样本,取自Y的样本,分别是这两个样本的样本方差,均值,则有Y1,

Y2,

…,是样本机动目录上页下页返回结束机动目录上页下页返回结束例设总体X~N(10,

32),(X1,

X2,

…,

X6)是它的一个样本,设 ,(1)写出Z所服从的分布;(2)求P(Z>11).解(X1,

X2,

…,

X6)是X~N(10,

32)的样本,因此Xi~N(10,

32),且Xi相互独立,i=1,

2,

…,

6,所以机动目录上页下页返回结束直方图基本步骤:

样本分组、确定组距、确定组限、统计频率、画直方图机动目录上页下页返回结束为研究某厂工人生产某种产品的能力,随机调查了20位工人某天生产的该产品的数量,数据如下:160,196,164,148,170,175,178,166,181,162,161,168,166,162,172,156,170,157,162,154.建立该批数量的频数频率分布表.过程:(1)确定样本分组数k,通常组数5-10组,组数主要取决于样本容量.样本容量n<=50,组数5.n>50,组数增加.本例k=5(2)确定各组组距d各组区间长度:组距.一般各组组距相同(也可不同)机动目录上页下页返回结束方便起见,取d=10(3)确定每组组限分组区间:(147,157],(157,167],(16

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论