理论分布与抽样分布_第1页
理论分布与抽样分布_第2页
理论分布与抽样分布_第3页
理论分布与抽样分布_第4页
理论分布与抽样分布_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

理论分布与抽样分布第一页,共四十八页,编辑于2023年,星期日Section3.1

二项分布

TheBinomialDistributions第二页,共四十八页,编辑于2023年,星期日一、二项分布设定

TheBinomialSetting固定的观察次数n。n次的观察都独立,每次的观察都不会对其他观察提供任何信息。每次的观察都只有两种可能的结果,多假设为“成功”或“失败”两种。每次的观察“成功”的概率都一样,设定为p。第三页,共四十八页,编辑于2023年,星期日二、二项分布

BinomialDistribution满足二项分布设定的试验,以X记录n次观察中“成功”的次数,则称X的分布为参数为n与p的二项分布(binomial),记为B(n,p)。X的所有可能取值为{0,1,…,n}。对应的概率函数为P(X=x)=P(x)。第四页,共四十八页,编辑于2023年,星期日

[例]有一批食品,其合格率为0.85,今在该批食品中随机抽取6分该食品,求正好有5份食品合格的概率?

由前述所知,在二项分布中n辞试验正好有k次发生的概率公式就:

三、二项分布概率的计算第五页,共四十八页,编辑于2023年,星期日若问最多有4个合格的概率为多少?则应该应用累积函数,即第六页,共四十八页,编辑于2023年,星期日四、二项分布的期望值与标准差期望值:E(X)=np方差: Var(X)=np(1-p)标准差:第七页,共四十八页,编辑于2023年,星期日Section3.2

NormalDistributions

正态分布第八页,共四十八页,编辑于2023年,星期日一、特点正态曲线所有正态曲线都有相同的外型具有对称、单峰及钟形的特性。正态曲线所代表的分布即为正态分布(normaldistribution)每一正态分布都有其平均值μ与标准差σ

第九页,共四十八页,编辑于2023年,星期日ms第十页,共四十八页,编辑于2023年,星期日正态曲线σ较大ms第十一页,共四十八页,编辑于2023年,星期日正态曲线的拐点拐点落在一个σ处拐点落在-σ处第十二页,共四十八页,编辑于2023年,星期日二、为什么这么重要Gooddescriptionsforsomedistributionsofrealdata身高,体重,考试成绩GoodapproximationstotheresultsofmanykindsofchanceoutcomesTossingacoinmanytimesManystatisticalinferenceproceduresarebasedonnormaldistributions第十三页,共四十八页,编辑于2023年,星期日三、68-95-99.7规则正态分布有其特定的数据分布规则:平均值为μ,标准差为σ的正态分布68%的观察资料落在m的1σ之内95%的观察资料落在m的2σ之内99.7%的观察资料落在m的3σ之内第十四页,共四十八页,编辑于2023年,星期日0123-1-2-3mm+sm+2sm+3sm-sm-2sm-3s68%的资料95%的资料99.7%的资料第十五页,共四十八页,编辑于2023年,星期日四、变量标准化(Standardization)令观察值x服从平均值为μ,标准差为σ的分布,则x的标准化值(standardizedvalue)定义为标准化值又称为z-值(z-score)。第十六页,共四十八页,编辑于2023年,星期日标准化变量可以证明z的平均值为0z的标准差为1

第十七页,共四十八页,编辑于2023年,星期日五、标准正态分布变量X服从平均值为μ,标准差为σ的正态分布,简记为X~N(μ,σ2)。X经过标准化后为Z(=(X-μ)/s),则Z也服从正态分布,并且平均值为0,标准差为1,即Z

~N(0,1)。我们称Z服从标准正态(standardnormal)。第十八页,共四十八页,编辑于2023年,星期日六、标准正态表z表列数字是z左边的面积z=-0.44z左边的面积为0.33-0.440.33第十九页,共四十八页,编辑于2023年,星期日z表列数字是z左边的面积z=0.44z左边的面积为0.67第二十页,共四十八页,编辑于2023年,星期日七、双侧临界值在标准正态曲线图下,右方与左方的面积和为a,则称为标准正态分布概率为a的双侧临界值。可查表。m=0面积为a/2面积为a/2第二十一页,共四十八页,编辑于2023年,星期日八、单侧临界值在标准正态曲线图下,右方的面积为a,则称为标准正态分布概率为a的单侧临界值。可查表。m=0面积为a第二十二页,共四十八页,编辑于2023年,星期日

[例]假定y是一随机变数具有正态分布,平均数

=30,标准差=5,试计算小于26,小于40的概率,介乎26和40区间的概率以及大于40的概率。首先计算:先将x转换为u值

九、计算第二十三页,共四十八页,编辑于2023年,星期日同理可得:

FN(40)=0.9773

所以:P(26<x≤40)=FN(40)-FN(26)=0.9773-0.2119=0.7654

P(x>40)=1-P(x≤40)=1-0.9773=0.0227查附表,当u=-0.8时,FN(26)=0.2119,说明这一分布从-∞到26范围内的变量数占全部变量数的21.19%,或者说,x≤26概率为0.2119.第二十四页,共四十八页,编辑于2023年,星期日[例]在应用正态分布时,经常要讨论随机变数x离其平均数的差数大于或小于若干个值的概率。例如计算离均差绝对值等于小于和等于大于1的概率为:也可以简写为

第二十五页,共四十八页,编辑于2023年,星期日相应地,离均差绝对值等于小于2、等于大于2、等于小于3和等于大于3的概率值为:第二十六页,共四十八页,编辑于2023年,星期日[例]计算正态分布曲线的中间概率为0.99时,其y或u值应等于多少?

因为正态分布是对称的,故在曲线左边从-∞到-

u的概率和在曲线右边从u到∞的概率都应等于1/2(1-0.99)=0.005。查表,u=-2.58时,fN(x)

=0.00494≈0.005。于是知,当±2.58时,在其范围内包括99%的变量,仅有1%变量在此范围之外。上述结果写作:第二十七页,共四十八页,编辑于2023年,星期日同理可求得:第二十八页,共四十八页,编辑于2023年,星期日同理,亦可写成:以上

乃正态曲线下左边一尾x从-∞到

上的面积和右边一尾y从到∞上的面积之和,亦可写成:第二十九页,共四十八页,编辑于2023年,星期日Section3.3

SamplingDistributions

抽样分布第三十页,共四十八页,编辑于2023年,星期日统计学的一个主要任务是研究总体和样本之间的关系。

两个方向从总体到样本的方向,即本节所要讨论的抽样分布。从样本到总体的方向,即统计推断问题。抽样分布(samplingdistribution)是统计推断的基础。第三十一页,共四十八页,编辑于2023年,星期日一、统计数的抽样及其分布参数从总体中随机抽样得到样本,获得样本观察值后可以计算一些统计数,统计数分布称为抽样分布。抽样

复置抽样,指将抽得的个体放回总体后再继续抽样不复置抽样,指将抽得的个体不放回总体而继续进行抽样第三十二页,共四十八页,编辑于2023年,星期日(一)样本平均数的抽样及其分布参数总体随机样本123无穷个样本……

如图从一个总体进行随机抽样可以得到许多样本,如果总体是无限总体,那么可以得到无限多个随机样本。

第三十三页,共四十八页,编辑于2023年,星期日如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到个样本(所有可能的样本个数)。抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数,如等。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。除平均数抽样分布外还有总和数、方差的抽样分布等。第三十四页,共四十八页,编辑于2023年,星期日新总体与母总体在特征参数上存在函数关系。以平均数抽样分布为例,这种关系可表示为以下两个方面。

(1)该抽样分布的平均数与母总体的平均数相等。(2)该抽样分布的方差与母总体方差间存在如下关系:

其中n为样本容量。抽样分布的标准差又称为标准误,它可以度量抽样分布的变异。第三十五页,共四十八页,编辑于2023年,星期日设有一总体N=3(例2,4,6)。以样本容量n=1、n=2、n=4及n=8,从总体中进行复置抽样,抽出全部样本于表1。表1中列出这些不同样本容量的抽样分布,并在图1用方柱形图表示其分布形状。由表中第一列当N=3,n=1的总体平均数和方差为:

当样本容量依次为2、4、8时,其相应为4、4、4;其相应为4/3、2/3、1/3。即,。第三十六页,共四十八页,编辑于2023年,星期日n=1n=2n=4n=8yffff24611123456123212.02.53.03.54.04.55.05.56.0141016191610412.002.252.502.753.003.253.503.754.004.254.504.755.005.255.505.756.001836112266504784101611071016784504266112368139816561平均数4444方差8/34/32/31/3表1各种不同样本容量的样本平均数()的抽样分布

第三十七页,共四十八页,编辑于2023年,星期日n=1n=2图4.15各种不同样本容量的

分布方柱形图第三十八页,共四十八页,编辑于2023年,星期日图4.15各种不同样本容量的

分布方柱形图n=4n=8第三十九页,共四十八页,编辑于2023年,星期日(二)两个独立随机样本平均数差数的抽样及其分布参数如果从一个总体随机地抽取一个样本容量为n1的样本,同时随机独立地从另一个总体抽取一个样本容量为n2的样本,那么可以得到分别属于两个总体的样本,这两个独立随机抽取的样本平均数间差数()的抽样分布参数与两个母总体间存在如下关系:(1)该抽样分布的平均数与母总体的平均数之差相等。(2)该抽样分布的方差与母总体方差间的关系为:第四十页,共四十八页,编辑于2023年,星期日二、正态总体的抽样分布(一)样本平均数的分布从正态总体抽取的样本平均数的分布一般为N(,)。图1给出样本容量n=1,4与9时的分布,从图中可以看出随着样本容量的增加,分布的集中程度增加了,说明方差减少了。图1不同样本容量的抽样分布第四十一页,共四十八页,编辑于2023年,星期日由中心极限定理知,只要样本容量适当大,不论总体分布形状如何,其的分布都可看作为正态分布,且具平均数和方差。在实际应用上,如n>30就可以应用这一定理。

平均数的标准化分布是将上述平均数转换为u变数。第四十二页,共四十八页,编辑于2023年,星期日(二)两个独立样本平均数差数的分布假定有两个正态总体各具有平均数和标准差为,和,,从第一个总体随机抽取n1个观察值,同时独立地从第二个总体随时机抽取n2个观察值。这样计算出样本平均数和标准差,s1和,s2。从统计理论可以推导出其样本平均数的差数()的抽样分布,具有以下特性:

(1)如果两个总体各作正态分布,则其样本平均数差数()准确地遵循正态分布律,无论样本容量大或小,都有N(,)。第四十三页,共四十八页,编辑于2023年,星期日(2)两个样本平均数差数分布的平均数必等于两个总体平均数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论