概率论样本及其分布_第1页
概率论样本及其分布_第2页
概率论样本及其分布_第3页
概率论样本及其分布_第4页
概率论样本及其分布_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四 章 样本及抽样分布引言随机样本抽样分布4.1 随机样本一、总体与样本 1. 总体:我们把研究对象的全体称为总体(母体)。总体通常指研究对象的某项数量指标,如:产品的使用寿命,学生的身高等等。2.个体:组成总体的每个单元(或元素)称为个体。从本质上讲,总体就是所研究的随机变量或随机变量的分布。 为推断总体分布及各种特征,按一定规则从总体中抽取若干个体X1,X2,Xn进行观察试验,以获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样本中所包含的个体数目n称为样本容量.2. 样本 当抽样还未进行时,样本是随机变量,容量为n的样本可以看作n维随机变量(X1,X2,Xn

2、).但是,一旦取定一组样本,得到的是n个具体的数 (x1,x2,xn),称为样本的一次观察值,简称样本值 .2. 独立性: X1,X2,Xn是相互独立的随机变量. 由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法. 最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:1. 代表性: X1,X2,Xn中每一个与所考察的总体有相同的分布. 由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独立的随机变量X1,X2,Xn表示.常见的简单随机抽样是随机放回抽样,在实际问题中,当总体很大,而样本容量很小时,随机

3、不放回抽样也可看成是简单随机抽样。今后,如未加说明。凡是提到样本都是指简单随机样本。 若总体的分布函数为F(x),则其简单随机样本(X1,X2,Xn)的联合分布函数为F(x1,x2 xn)=PX1 x1,X2 x2,Xn xn = PX1 x1 PX2 x2 PXn xn =F(x1) F(x2) F(xn)总体(理论分布) ? 样本 样本值 统计是从手中已有的资料-样本值,去推断总体的情况-总体分布F(x)的性质. 总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体. 样本是联系二者的桥梁二、统计量定义4.1:设(X1,X2,Xn)是来自总体X的一个样本

4、, g(X1, ,Xn )是样本X1, ,Xn 的函数,若g是连续函数,且g中不含任何未知参数,则称g(X1, ,Xn )为一个统计量。 若(x1,x2,xn)是样本(X1,X2,Xn)的一个观察值,则g(x1,x2,xn)是统计量g(X1, ,Xn )的一个观察值. 2.几个常见统计量样本均值样本方差-它反映了总体均值的信息-它反映了总体方差的信息样本k阶原点矩样本k阶中心矩 k=1,2,样本标准差 三. 统计量的三大分布分布1、分布是由正态分布派生出来的一种分布.记为定义: 设 相互独立, 都服从正态分布N(0,1), 则称随机变量: 所服从的分布为自由度为 n 的 分布.2.2分布的密度

5、函数f(y)曲线由 分布的定义,不难得到以下性质:2. 设 且X1,X2相互独立,则这个性质叫 分布的可加性.1. 设 ,则3. 设 ,则当n充分大时的分布近似正态分布N(0,1).记为Tt(n). 定义: 设XN(0,1) , Y , 且X与Y相互独立,则称变量所服从的分布为自由度为 n的 t 分布.2、t 分布t(n)的概率密度为当n充分大时,其图形类似于标准正态分布密度函数的图形.由定义可见,3、F分布F(n2,n1)定义: 设 X与Y相互独立,则称统计量服从自由度为n1及 n2 的F分布,n1称为第一自由度,n2称为第二自由度,记作 FF(n1,n2) .若XF(n1,n2), X的概

6、率密度为3. 分位点 设X为连续型随即变量,其概率密度为f(x),对于给定的:011).解 因为XN(10,32), 设 又从而所以例2:设X1, ,X10是取自N(0,0.32)的样本,求解 因为所以则从而查表得所以例3:设X1, ,Xn是取自N(,2)的样本,求样本方差S2的期望。解4.2.3 直方图 设X是一个随机变量,如何根据样本值x1,x2,xn近似求出它的概率密度(或分布函数)呢?现在介绍一种近似求概率密度的图解法直方图(1)先把样本值x1,x2,xn进行分组:(i)找出样本值x1,x2,xn的最小值与最大值,分别记为a=t0t1t2tmtm+1=b其中(iii) 数出样本值落在区

7、间(ti,ti+1中的个数,记为ni(i=0,1,2,m)为了掌握分组的三个步骤(i),(ii),(iii),看104页例4.4下面根据分组情况来做直方图。(2) 记则fi是样本值落入区间(ti,ti+1的频数。 由于n个样本的抽取是独立的,有概率的统计定义可知, fi近似等于随机变量X落入区间(ti,ti+1的概率,即现假设X的概率密度为f(t),则有在上式中, fi(i=0,1,m)是已知的,而 f(x)是未知,但它们之间有近似关系。怎样由fi去近似得出f(x)呢?为直观起见,我们借助于图形。 (3) 在平面上,画一排竖着的长方形:对每个i(0i m) ,以ti,ti+1为底,以oxyt1titi+1直方图这个图的好处就在于,它大致地描述了X的概率分布情况,因为每个长方形的面积,刚好近似地代表了X取值落入“底边”的概率。只要有了直方图,就可大致画出概率密度曲线:让曲线大致经过每个竖着的长方形的“上边”。 上面介绍的直方图法对于连续型的随机变量才用得上,现在介绍一种方法,无论对连续型的或离散性的随机变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论