统计量和抽样分布课件_第1页
统计量和抽样分布课件_第2页
统计量和抽样分布课件_第3页
统计量和抽样分布课件_第4页
统计量和抽样分布课件_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章统计量和抽样分布第一节统计量第二节常用统计量第三节抽样分布第九章统计量和抽样分布第一节统计量第二节常用1§9.1统计量完全由样本确定的量(可能是向量)称为统计量

数学观点:统计量是样本的函数(可能是向量值函数)定义:设(X1,…,Xn)为总体X的一个样本,f(X1,…,Xn)为不含任何未知参数的连续函数,则称f(X1,…,Xn)为样本(X1,…,Xn)的一个统计量.统计量是随机变量(或随机向量),统计量是确定的数或向量,其数值称为统计量观察值.例:设(X1,X2,X3)是从正态总体中抽取的样本,其中已知,未知.§9.1统计量完全由样本确定的量(可能是向量)称为统计量2前提:1.样本均值SampleMean一组数据X1,X2,…,Xn是总体X的一个样本§9.2常用统计量2.样本标准差或均方差注意:它们的观测值用相应的小写字母表示反映总体X取值的平均反映总体X取值的离散程度前提:1.样本均值Sample32.样本方差SampleVariance

3.样本的K阶原点矩4.样本的K阶中心矩2.样本方差SampleVariance4它包括两个方面:数据的简单处理研究随机现象,首要的工作是收集原始数据.一般通过抽样调查或试验得到的数据往往是杂乱无章的,需要通过整理后才能显示出它们的分布状况。数据的简单处理:以一种直观明了方式加工数据(1)数据整理(2)计算样本特征数它包括两个方面:数据的简单处理研究随机现象5计算样本特征数:数据简单处理的具体操作步骤数据整理:(1)反映趋势的特征数(a)样本均值(b)中位数:数据按大小顺序排列后,位置居中的那个数或居中的两个数的平均数.(c)众数:样本中出现最多的那个数。(1)将数据分组(2)计算各组频数作频率分布表作频率直方图计算样本特征数:数据简单处理的具体操作步骤6(2)反映分散程度的特征数:极差、四分位差(a)极差:样本数据中最大值与最小值之差记为(b)四分位数:将样本数据依概率分为四等份的3个数椐,依次称为第一、第二、第三四分位数。第一四分位数Q1:第二四分位数Q2:第三四分位数Q3:即(2)反映分散程度的特征数:极差、四分位差(a)7例:为对某小麦杂交组合F2代的株高X进行研究,抽取容量为100的样本,测试的原始数据记录如下(单位:厘米),试根据以上数据,画出它的频率直方图,求随机变量X的分布状况。

87 88 111 91 73 70 92 98 105 9499 91 98 110 98 97 90 83 92 8886 94 102 99 89 104 94 94 92 9687 94 92 86 102 88 75 90 90 8084 91 82 94 99 102 91 96 94 9485 88 80 83 81 69 95 80 97 9296 109 91 80 80 94 102 80 86 9190 83 84 91 87 95 76 90 91 77103 89 88 85 95 92 104 92 95 8386 81 86 91 89 83 96 86 75 92例:为对某小麦杂交组合F2代的株高X进行研究,抽取8第一.整理原始数据,加工为分组资料,作频率分表,画直方图,提取样本分布特征的信息.1.找出数据中最小值m=69,最大值M=111,极差为:

M-m=42,即R=42.2.数据分组,根据样本容量n的大小,决定分组数k。一般规律:30≤n≤405≤k≤640≤n≤606≤k≤860≤n≤1008≤k≤10100≤n≤50010≤k≤20具体步骤如下:数据分组数参考表数据数40~60100150200400600分组数6~87~910~15162024数据数800100015002000500010000分组数273035395674第一.整理原始数据,加工为分组资料,作频率分表,1.找出数9(2)一般采取等距分组(也可以不等距分组),组距等于极差除以组数略大的测量单位的整数倍。(1)本例取k=9(3)本例测量单位为1厘米,组距为(2)一般采取等距分组(也可以不等距分组),(1)本例取103.确定组限和组中点值注意:组的上限与下限应比数据多一位小数。当取a=67.5,b=112.49(a略小于m,b略大于M,且a和b都比数据多一位小数),分组如下:一般根据算式:各组中点值组距=组的上限或下限[67.5,72.5)[72.5,77.5)[77.5,82.5)[82.5,87.5)[87.5,92.5)[92.5,97.5)[97.5,102.5)[102.5,107.5)[107.5,112.5)组中点值分别为:7075808590951001051103.确定组限和组中点值注意:组的上限与下限应比数据多一位小114.将数据分组,计算出各组频数,作频数、频率分布表组序区间范围频数fj频率Wj=fj/n累计频率Fj1[67.5,72.5)20.020.022[72.5,77.5)50.050.073[77.5,82.5)100.100.174[82.5,87.5)180.180.355[87.5,92.5)300.30.656[92.5,97.5)180.180.837[97.5,102.5)100.10.938[102.5,107.5)40.040.979[107.5,112.5)30.031.004.将数据分组,计算出各组频数,作频数、频率分布表组序区间12作频率直方图5.作出频率直方图以样本值为横坐标,频率/组距为纵坐标;以分组区间为底,以为高作频率直方图5.作出频率直方图以样本值为横坐标,13从频率直方图可看到:靠近两个极端的数据出现比较少,而中间附近的数据比较多,即中间大两头小的分布趋势.——随机变量分布状况的最粗略的信息在频率直方图中,每个矩形面积恰好等于样本值落在该矩形对应的分组区间内的频率,即频率直方图中的小矩形的面积近似地反映了样本数据落在某个区间内的可能性大小,故它可近似描述X的分布状况。从频率直方图可看到:在频率直方图中,每个矩形面积恰好等于样本14样本方差样本标准差Q1

Q3极差四分位差68.69098.28885.2595424.875第二.计算样本特征数1.反映集中趋势的特征数:样本均值、中位数、众数等样本均值MEAN中位数MEDIAN众数2.反映分散程度的特征数:样本方差、样本标准差、极差、四分位差等注:上述差异特征统计量的值越小,表示离散程度越小.样本方差样本标准差Q1Q315下课了!下课了!16统计量是样本的不含任何未知数的函数,它是随机变量.统计量的分布称为抽样分布定理§9.3抽样分布一、有限总体的抽样分布设总体中个体总数为N,样本容量为n(<N)且总体有有限均值μ,方差σ2,则:(1)(2)当抽样是有放回时,当抽样是无放回时,统计量17正态总体样本均值的分布设总体,是X的一个样本,则样本均值服从正态分布1.U-分布二、数理统计的四大重要分布正态总体样本均值的分布设总体18概率分布的分位数(分位点)P{X≥x

}=

定义对总体X和给定的

(0<

<1),若存在x

,使:则称x

为X分布的上侧

分位数或上侧临界值.P{X≥x

}=

概率密度函数阴影部分的面积为X分布的上侧

分位数概率分布的分位数(分位点)P{X≥x}=定义对总体X和19概率分布的分位数(分位点)定义若存在数

1、

2,使:P{X≥

1}=P{X≤

2}则称

1、

2为X分布的双侧

分位数或双侧临界值概率密度函数X分布的双侧

分位数概率分布的分位数(分位点)定义若存在数1、2,使:P{X20双侧

分位数或双侧临界值的特例当X的分布关于y轴对称时,则称为X分布的双侧

分位数或双侧临界值若存在使概率密度函数双侧分位数或双侧临界值的特例当X的分布关于y轴对称时,则21U—分布的上侧分位数对标准正态分布变量U~N(0,1)和给定的

,上侧

分位数是由:P{U≥u

}=即P{U<u

}=1-

(u

)=1-

确定的点u

已知:=0.05u0.05=1.645确定的点u

P{U≥u

}=0.05=0.05U—分布的上侧分位数对标准正态分布变量U~N(0,22U—分布的双侧分位数的点u

/2为标准正态分布的双侧

分位数或双侧临界值u

/2可由P{U≥u

/2}=

/2针对变量U~N(0,1)和给定

的,称满足条件:P{|U|≥u

/2}=

(u

/2)=1-

/2反查标准正态分布表得到

(x)Ou/2

/2-u/2

/2x例如:求u0.05/2P{U≥u0.05/2}=0.05/2u0.05/2=1.96U—分布的双侧分位数的点u/2为标准正态分布的双侧23标准正态分布的分位数在实际问题中,

常取0.1、0.05、0.01.常用到下面几个临界值:u0.05=1.645,u0.01=2.326u0.05/2=1.96,u0.01/2=2.575标准正态分布的分位数在实际问题中,常取0.1、0242.

分布设X1,X2,…,Xn为独立标准正态变量,称随机变量U=X12+X22+…+Xn2的分布为自由度n的分布,记作注意:(1)分布的自由度是指独立随机变量的个数(2)分布的密度函数为:(3)分布的期望和方差为:E(U)=n,D(U)=2n

2.分布设X1,X2,…,Xn为独立标25n=1n=4n=10图形随自由度n的不同而有所改变

2分布表分布的概率密度函数f(y)的图形n=1n=4n=10图形随自由度n的不同而有所改变2分布表26满足的数称为

2分布的上

分位数或上侧临界值f(y)是

2分布的概率密度f(y)xO

在自由度n取定以后,的值只与

有关.例:n=21,=0.05时,32.67即

2分布的上

分位数查表:满足27

2分布的双侧

分位数f(x)xO为

2分布的上分位数为

2分布的上分位数例:若n=8,

=0.052.1817.53满足的数和称为

2分布的双侧

分位数或双侧临界值2分布的双侧分位数f(x)xO为2分布的281.

2分布的数学期望与方差:设

2~

2(n),则E(

2)=n,D(

2)=2n.2.

2分布的可加性:设且相互独立,则:

2分布的性质设(X1,X2,…,Xn)为取自正态总体X~N(

,

2)的样本,则:1.2分布的数学期望与方差:设2~2(n),则29设(X1,X2,…,Xn)为来自正态总体X~N(

,

2)的样本,则(1)样本均值与样本方差S2相互独立;(2)设(X1,X2,…,Xn)为来自正态总体X~N(30下课了!下课了!313.t分布(1)t分布的概率密度函数为设随机变量X~N(0,1),Y~

2(n)

,且X与Y相互独立,则称统计量服从自由度为n的t分布或学生分布,记作T~t(n).(2)当n较大时,t分布近似于标准正态分布.注意:3.t分布(1)t分布的概率密度函数为设随机变量X~N(321.t分布的数学期望与方差:设T~t(n),则E(T)=0,D(T)=t分布的性质2.设(X1,X2,…,Xn)为来自正态总体X~N(

,

2)的样本,则统计量1.t分布的数学期望与方差:设T~t(n),则E(T)333.设(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2)分别是来自正态总体N(

1

,

2)和N(

2

,

2)的样本,且它们相互独立,则统计量其中、分别为两总体的样本方差.3.设(X1,X2,…,Xn1)和(Y1,Y2,…,Yn234t

分布的上

分位数对于给定的

(0<

<1),称满足条件的数t

(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论