概率论 样本和抽样分布_第1页
概率论 样本和抽样分布_第2页
概率论 样本和抽样分布_第3页
概率论 样本和抽样分布_第4页
概率论 样本和抽样分布_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Chapter6

样本和抽样分布

(SampleandStatisticDistribution

)引例一公司欲采购某类产品,假设该类产品不合格率为P。P的大小决定产品的质量,影响公司的经济效益。P的大小如何P大致落在哪个范围

P是否满足要求数理统计的方法

概率论

特点:应用面广,分支较多.著名统计软件:SAS,SPSS,STAT,S-plus等

数理统计

理论基础实际应用

数理统计的任务就是研究有效地收集、整理、分析所获得的有限的资料,对所研究的问题,尽可能地作出精确而可靠的结论.

在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.数理统计方法具有“部分推断整体”的特征.

——

对随机现象进行观测、试验,以取得有代表性的观测值

——

对已取得的观测值进行整理、分析,作出推断、决策,从而找出所研究的对象的规律性数理统计的分类描述统计学推断统计学参数估计(第七章)假设检验(第八章)回归分析(第九章)方差分析(第九章)

推断统计学

§6.1随机样本

一个统计问题总有它明确的研究对象.1.总体…研究某批灯泡的质量研究对象的全体称为总体(母体),2.个体总体中每个成员称为个体.总体一、总体和样本

然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标.这时,每个个体具有的数量指标的全体就是总体.某批灯泡的寿命该批灯泡寿命的全体就是总体国产轿车每公里的耗油量国产轿车每公里耗油量的全体就是总体

例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.某批灯泡的寿命总体寿命X可用一概率分布来刻划鉴于此,常用随机变量的记号或用其分布函数表示总体.如说总体X或总体F(x).F(x)

类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)来表示.

统计中,总体这个概念的要旨是:总体就是一个概率分布.例2:用一把尺子测量一件物体的长度。假定

n

次测量值分别为X1,X2,…,Xn。显然,在该问题中,我们把测量值X1,X2,…,Xn看成样本。但总体是什么呢?

事实上,这里没有一个现实存在的个体的集合可以作为上述问题的总体。可是,我们可以这样考虑,既然

n

个测量值X1,X2,…,Xn是样本,那么,总体就应该理解为一切所有可能的测量值的全体。又如:为研究某种安眠药的药效,让

n

个病人同时服用这种药,记录服药者各自服药后的睡眠时间比未服药时增加睡眠的小时数

X1,X2,…,Xn,则这些数字就是样本。

那么,什么是总体呢?

设想让某个地区(或某国家,甚至全世界)所有患失眠症的病人都服用此药,则他们所增加睡眠的小时数之全体就是研究问题的总体。

对一个总体,如果用X表示其数量指标,那么,X的值对不同的个体就取不同的值。因此,如果我们随机地抽取个体,则X的值也就随着抽取个体的不同而不同。所以,X是一个随机变量!

既然总体是随机变量X,自然就有其概率分布。我们把X的分布称为总体分布。

总体的特性是由总体分布来刻画的。因此,常把总体和总体分布视为同义语。.总体分布

为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.3.样本从国产轿车中抽5辆进行耗油量试验样本容量为54.样本容量

样本中所包含的个体数目称为样本容量.

但是,一旦取定一组样本,得到的是n个具体的数(X1,X2,…,Xn),称为样本的一次观察值,简称样本值

.

样本是随机变量.抽到哪5辆是随机的容量为n的样本可以看作n维随机变量.2.独立性:

最常用的一种抽样方法叫作“简单随机抽样”:1.随机性:二、简单随机样本

由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独立的随机变量X1,X2,…,Xn表示.

由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独立的随机变量X1,X2,…,Xn表示.

简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,…,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.若总体的分布函数为F(x),则其简单随机样本的联合分布函数为F(x1)F(x2)…F(xn)设总体X

的分布函数为F(x),则样本若总体X

的概率密度为

f(

x),则样本的联合d.f.为的联合分布函数为三.总体、样本、样本值的关系总体(理论分布)?样本

样本值

统计是从手中已有的资料--样本值,去推断总体的情况---总体分布F(x)的性质.如我们从某班大学生中抽取10人测量身高,得到样本值.小结研究对象的全体称为总体总体中每个成员称为个体抽样分布

§6.2

由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.1.统计量

这种不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量.一、统计量定义请注意:例

是未知参数,若

,

已知,则为统计量是一样本,是统计量,其中则但不是统计量.2.常用的统计量为样本均值为样本方差为样本标准差设是来自总体

X

的容量为

n

的样本,称统计量它反映了总体均值的信息它反映了总体方差的信息为样本的k阶原点矩为样本的k

阶中心矩例如统计量的观察值(样本值)注样本方差与样本二阶中心矩的不同故推导关系式1)推导

设则2)例1

从一批机器零件毛坯中随机地抽取10件,测得其重量为(单位:公斤):

210,243,185,240,215,228,196,235,200,199求这组样本值的均值、方差、二阶原点矩与二阶中心矩.解令例1则例2

在总体中,随机抽取一个容量为36的样本,求样本均值落在50.8到53.8之间的概率.解故例2二、抽样分布

统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的“抽样分布”.

确定统计量的分布是数理统计的基本问题之一

正态总体是最常见的总体,本节介绍的几个抽样分布均对正态总体而言.复习:

正态分布则特别地,则若i.i.d.~若~标准正态分布的

分位数分布的上

分位数.若,则称z

为标准正态定义正态分布的双侧

分位数.若,则称为标准统计三大分布记为分布1、定义:设相互独立,都服从正态分布N(0,1),则称随机变量:

所服从的分布为自由度为

n

的分布.分布是由正态分布派生出来的一种分布.分布的密度函数为来定义.其中伽玛函数通过积分n=2n=3n=5n=10n=15

例如

分布的性质

20.05(10)•n=10性质讲解:

进一步,由中心极限定理可以推出,n充分大时,近似于标准正态分布N(0,1)。E(X)=n,D(X)=2n.t

分布

(Student分布)定义则称T服从自由度为n

的T分布.其密度函数为X,Y相互独立,设t

分布t分布的图形(红色的是标准正态分布)n=1n=20t分布的性质1°fn(t)是偶函数,2°T分布的上

分位数t

与双侧

分位数t/2

有表可查.性质n=10t

-t

••

t

/2-t

/2••

/2

/2由定义可见,3、F分布~F(n2,n1)定义:

设U与V相互独立,则称随机变量服从自由度为n1及n2的F分布,n1称为第一自由度,n2称为第二自由度,记作F~F(n1,n2).m=10,n=4m=10,n=10m=10,n=15m=4,n=10m=10,n=10m=15,n=10F分布的性质例如事实上,故求F

(n,m)•

性质例1

证明证例1四、几个重要的抽样分布定理

当总体为正态分布时,教材上给出了几个重要的抽样分布定理.

定理1(样本均值的分布)设X1,X2,…,Xn是取自正态总体的样本,则有n取不同值时样本均值的分布

定理2(样本方差的分布)设X1,X2,…,Xn是取自正态总体的样本,分别为样本均值和样本方差,则有n取不同值时的分布

定理3

设X1,X2,…,Xn是取自正态总体的样本,分别为样本均值和样本方差,则有

定理4(两总体样本均值差的分布)

分别是这两个样本的且X与Y独立,X1,X2,…,是取自X的样本,取自Y的样本,分别是这两个样本的样本方差,均值,则有Y1,Y2,…,是样本

定理5(两总体样本方差比的分布)

分别是这两个样本的且X与Y独立,X1,X2,…,是取自X的样本,取自Y的样本,分别是这两个样本的样本方差,均值,则有Y1,Y2,…,是样本●样本均值分布函数的近似计算定理1的应用总有●样本均值与

的偏差在一定范围内的概率的近似计算从上式可以看出:对给定的

2和给定的c>0,当样本大小n

增大时,上面的概率也随之增大;n趋于无穷时,上式趋近于1。任给c>0,总有的概率不小于90%,则样本容量至少取多少?例3设,为使样本均值大于70解设样本容量为

n

,则故令得即所以取例3例4

从正态总体中,抽取了

n=20的样本(1)求(2)求解

(1)即例4故(P.386)(2)故例5

设r.v.X与Y相互独立,X~N(0,16),

Y~N(0,9),X1,X2,…,X9

与Y1,Y2,…,Y16

分别是取自X与Y的简单随机样本,求统计量所服从的分布.解例5从而例7

是来自N(,2)的简单随机样本,

是样本均值,则服从自由度为n-1的t分布的随机变量为例7故应选(B)解第二节样本及抽样分布统计三大抽样分布几个重要的抽样分布定理课堂练习

几个常见统计量样本平均值它反映了总体均值的信息样本方差它反映了总体方差的信息样本标准差它反映了总体k阶矩的信息样本k阶原点矩样本k阶中心矩

k=1,2,…它反映了总体k阶中心矩的信息请注意:

二、统计三大抽样分布记为分布1、定义:

设相互独立,都服从正态分布N(0,1),则称随机变量:

所服从的分布为自由度为

n

的分布.分布是由正态分布派生出来的一种分布.

c2

分布请看演示1.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论