2章 理论分布与抽样分布_第1页
2章 理论分布与抽样分布_第2页
2章 理论分布与抽样分布_第3页
2章 理论分布与抽样分布_第4页
2章 理论分布与抽样分布_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章理论分布与抽样分布第一节理论分布一、正态分布的定义

正态分布或称高斯(Gauss)分布,是一种常见的连续型随机变量的概率分布。食品科学中所涉及的许多变量都是服从或接近正态分布的。正态分布布概率密度度函数::x:所研研究的变变数;:x的函函数值,,称为概概率密度度函数;;:总体平平均数;;:总体标标准差其中μ,σ2是两个常常数,正正态分布布记为N(,,)),表示具有有平均数数为μ,方差为为的的正正态分布布。2、f(x))在μ处达到最最大值,,且3、f(x))是非负函函数,以以横轴为为渐进线线,分布布从-∞到+∞,且曲线线在μ±σ处各有一一个拐点点。二、正态态分布曲曲线的特特征:1、正态分布布曲线是是以平均均数μ为中心左左右对称称分布的的单峰悬悬钟形曲曲线,在在平均数数的左右右两侧,,只要((x-μ)的绝对对值相等等,f(x))值就相等等。4、正态态分布曲曲线是以以参数μ和σ2的不同而而表现的的一系列列曲线,,所以正正态分布布曲线是是一个曲曲线族,,不是一一条曲线线。5、正态态分布的的次数多多数集中中于算术术平均数数的附近,,离平均均数愈远远,相应应的次数数愈少,,在-≥3以外次数数极少。。6、曲线线f(x))与横轴之之间所围围成的面面积等于于1,,即正态分布布的分布布函数F(x))为:二、标准准正态分分布由于正态态分布是是依赖于于参数μ和σ2的一簇分分布,正正态曲线线的位置置由于上上述参数数的变化化而不同同。因此此,在研研究具体体的正态态分布时时,需要要将一般般的正态态分布标标准化,,转换成成为μ=0,σ2=1的正正态分布布,我们们称μ=0,σ2=1的正正态分布布为标准正态态分布((standardnormaldistribution),记作::N(0,1)。标准正态态分布的的概率率密度函函数记为为(u):标准正态态分布的概率分分布函数数记为φ(u):对称随机机变量u服从标准准正态分分布,记记作u~N(0,1),其密度曲曲线如图图。任何一个个服从正正态分布布N(μ,σ2)的随机机变量x都可以以通过标标准化变变换,将将其转化化为服从从标准正正态分布布的随机机变量u,u称称为标准准正态离离差或标标准正态态变量((standardnormaldeviate))。按标准正正态分布布的分布布函数公公式计算算,对不不同的u值编成成函数表表,称为为标准正正态分布布表(附附表1)),从中中可以查查到任意意一个区区间内曲曲线下的的面积概概率值。。三、正态态分布的的概率计计算根据正态态分布的的性质,,变量在在两个定定值间取取值的概概率等于于曲线与与其x轴轴在该区区间围成成的面积积。因此概率率的计算算即正态态分布概概率密度度函数的的定积分分计算。。是一个曲曲线系统统。为了了一般化化的应用用,需将将正态分分布标准准化。1.标准准正态分分布的概概率计算算设u服从从标准正正态分布布,则[[u1,u2)内取值值的概率率为:Φ(u1)和Φ(u2)可由附表表1查得得。由上述公公式及正正态分布布的对称称性可推推出下列列关系式式,再借借助附表表1便能能方便地地计算有有关概率率:例1,已已知u~N(0,1),试试求:P(u<-1.64)=??,P((u≥2.58)=??,P(︱u︱≥2.56)=??,P((0.34≤U<1..53))=?利用公式式,查附附表1得得:P(u<<-1..64))=0..5050P(u≥2.58)=Φ(-2..58))=0..004940P(︱u︱≥≥2.56)=2Φ(-2..56))=2×0.005234=0.010468P(0..34≤u<1..53))==Φ(1.53)--Φ(0.34)=0.93699-0.6331==0.30389关于标准准正态分分布,以以下几种种概率应应当熟记记:P(-1≤u<1))=0..6826P(-2≤u<2))=0..9545P(-3≤u<3))=0..9973P(-1.96≤u<1..96))=0..95P(-2.58≤u<2..58))=0..99U变量在在上述区区间以外外取值的的概率分分别为::P(︱u︱≥≥1)==1-P(-1≤u<<1)==1-0.6826==0.3174P(︱u︱≥2)=1-P((-2≤≤u<2)=1-0..9545=0.0455P(︱u︱≥3)=1-P(-3≤u<<3)==1-0.9973==0.0027P(︱u︱≥1.96)=1-P(-1.96≤u<<1.96)=1-0.95=0..05P(︱u︱≥2.58)=1-P(--2.58≤u<2..58))=1-0.99=0..012.一般般正态分分布的概概率计算算正态分布布曲线和和横轴围围成的区区域面积积为1,,表明了了随机变变量x在在(-∞,+∞)之间取取值,是是一个必必然事件件,其概概率为1。若随机变变量x服服从正态态分布N(μ,σ),则x的取值值落在任任意区间间[x1,x2)的概率率,记作作P(x1≤x<x2)。即:对上式作作变换u=(x-μ)/σ,得dx=σdu,故故有:由上述证证明,服服从正态态分布的的变量x落在[[x1,x2)内的概概率,等等于服从从正态分分布随机机变量u落在[[(x1–μ)/σ,(x2-μ)/σ)即[u1,u2)的概率率。故,计算算一般的的正态分分布的概概率时,,只要将将区间的的上、下下限标准准化,就就可用查查标准正正态分布布表的方方法求概概率值。。例:已知知x~N(100,22),求P(100≤x<102)==?由上述证证明方法法可得::P(100≤x<102)=P[(100--100)/2≤(x--100)/2<(102--100)/2]=P(0≤u<1))=Ф(1)--Ф(0)=0.8413-0..5000=0.3413关于一般般正态分分布,以以下几个个概念计计算是经经常用到到的:P(μ-σ≤x<μ+σ)=0..6826P(μ-2σ≤x<μ+2σ)=0..9545P(μ-3σ≤x<μ+3σ)=0..9973P(μ-1.96σ≤x<μ+1.96σ)=0..95P(μ-2.58σ≤x<μ+2.58σ)=0..99x小于26:=(26-30)/5=--0.8查附表1,【例如】有一随机机变数X服从正态态分布,,平均数数=30,标准差差=5,试计算算X小于26,大于40,介于26-40区间的概概率。大于40:=(40-30)/5=2查表1,,由正态分分布左右右对称性性,则x介于26与40之间间:【例如】】已知某某正态分分布=30,,=5,,试计算算x偏离离平均数数达9.8和和14..9以上的概概率?计算标准化查附表1,得知知它们对对应的概概率分别别为0..05和和0.01,即即P(|x-μ||≥9..80))=P((|x--μ|≥≥1.96σ))=P[(x-)≥1..96σσ]+P[(x-)≤-1.96σ]=0.05P(|x-μ||≥14.90)=P(|x-μ||≥2..58σσ)=P[(x-)≥2..58σσ]+P[(x-)≤-2.58σ]=0.01以上两式式等号右右侧的前前一项为为右尾概概率,后后一项为为左尾概概率,其其和概率率为两尾尾概率。。统计学::1、总总体样样本抽抽样分分布2、样本本总总体统统计推断断一、样本本平均数数的抽样样分布复置抽样样(返置置抽样))不复置抽抽样(不不返置抽抽样)抽样误差差第二节抽抽样分分布总体体(μ,σ2)…….样本1样本2样本n抽样误差差:由同同一总体体进行抽抽样获得得的多个个样本平平均数,,与原总总体平均均数相比比具有不不同程度度的差异异,这种种差异是是由于随随机抽样样造成的的,称为为抽样误误差(samplingerror)。样本平均均数也是是随机变变量,其其概率分分布叫作作样本平均均数的抽抽样分布布。有样本本平均数数构成的的总体称称为样本平均均数的抽抽样总体体,其平均均数和标标准差分分别计为为:是样本平平均数的的抽样总总体的标标准差,,简称标标准误差差(standarderror)统计学上上已证明明:样本本平均数数())总总体的参参数,,与与x变量量总体的的两个参参数有有如如下关系系:例如,设有一一个N==4的有有限总体体,其变变量值为为2、3、3、、4。总体的平平均数、、方差和和标准差差为证明这这一结论论,进行行模拟抽抽样试验验当以样本本容量n=2进进行独立立抽样,,抽取的的所有可可能样本本数,,其平均均数、方方差和标标准差如如下表。。样本观察察值x2222333333334444234323342334∑x455656675667677823342.02.52.53.02.53.03.03.52.53.03.03.53.03.53.54.00.00.50.52.00.50.00.00.50.50.00.00.52.00.50.50.00.000.250.251.000.250.000.000.250.250.000.000.251.000.250.250.00s0.0000.7070.7071.4140.7070.0000.0000.7070.7070.0000.0000.7071.4140.7070.7070.00096488..04.08..484以自由度度(n--1)作作分母计计算的样样本方差差之之均数::以样本容容量n作作分母计计算的样样本方差差之之均数::样本标准准差S之之均数:各样本均均数总和和之均数:如果所有有可能样样本的某某一统计计数的平平均数等等于该总总体的相相应参数数,则称该统统计数为为总体参参数的无偏估计计值(unbiasedestimate)。是的的无无偏估计计值;是的的无偏估估计值;;以n为分母得得到的样样本方差差不不是是的的无偏估计计值;S不是的的无无偏估计计值;因此,为为了得到到的的无偏估估计值,,估算样样本方差差时,必必须以自自由度df=n-1而不用n做分母。。抽样结论论按上述抽抽样方法法,再以以n=4,从上上述有限限总体2,3,,3,4中抽出出全部所所有样本本,同样样可以计计算出所所有样本本的平均均数、方方差和标标准差。。各种不同同样本容容量的样样本平均均数的的抽抽样分布布n=1234f121n=2f2.02.53.03.54.014641n=4f2.002.252.502.753.003.253.503.754.0018285670562881各种不同同样本容容量的的分布布图f234210ff2346543210234706050403020100n=1;;2=1/2n=2;;2=1/4n=4;;2=1/8从上述的的表和图图来看,,从总体体抽出的的全部所所有样本本的平均均数,当当n增大大时,其其方柱形形图逐渐渐趋向于于正态分分布曲线线形状,,说明样样本平均均数是做做正态分分布的。。样本平均均数分布布的平均均数、、标准差差与与其原原总体平平均数、标准差差的关系为为:根据次数数表,n=2抽抽样的样样本平均均数为::

样本平均均数的方方差为::当n=4时,同同理可得得:由此可获获得下列列两个定定理:从正态总总体抽出出的样本本,无论论样本容容量的大大小,其其样本平平均数的的抽样样分布必必然呈正正态分布布,具有有平均数数和和方差差,,而且且方差随随样本容容量的增增大而降降低。平平均数的的分布一一般记为为:。。如果总体体不是正正态分布布,但如如具有一一定量的的方差差2和平均数数,那那么,当样本容容量足够够大时,,从这这一总体体抽出的的样本平平均数的的抽样样分布也也必趋近近于正态态分布,,具有平平均数和和方差,,这称为为中心极限限定理。二、均数数标准误误均数标准准误(平平均数抽抽样总体体的标准准差)的大小反反映样本本数的抽抽样误差差的大小小,即精精确性的的高低。。标准误(())大,,说明各各样本数数())间间差异程程度大,,样本平平均数的的精确性性低;反反之,小小,,说明间间的差差异程度度小,样样本平均均数的精精确性高高。在实际工工作中,,总体标标准差往往往是未未知的,,因而无无法求得得。此时时,可用用样本标标准差S估计总总体σ。若样本中中各观察察值为x1,x2,x3……xn,则样本本标准误误或均数数标准误误为注意:样样本标准准差与样样本标准准误两个个统计量量之间的的区别::1.样本本标准差差(S)是是反映样样本中各各变数x1,x2,x3……xn之间变异异程度大大小的一一个指标标,它的的大小说说明了对对该样样本代表表性的强强弱。2.样本本标准误误是样本本平均数数的标准差差,它是是抽抽样误差差的估计计值,其其大小说说明了样样本间变变异程度度的大小小及精确性的的高低。。设有两个个总体::抽k个样样本容量量为n1抽m个样样本容量量为n2三、两样样本均数数差数的的抽样分分布N1(μ1,σ12)N2(μ2,σ22)样本平均均数差数数分布表3.6抽样平均均数次数数分布表表f1f22.011..012.541..523.062..033.542..524.013..01∑169表3.7样本平均均数差数数(d)的分布及及其平均均数与方方差计算算ff-1.01--1.04.004.0-0.56--3.02..2513.50.0170..01.0017.00.530150.257.51.036360.000.01.530450.257.52.017341.0017.02.56152..2513.53.013.04..004..0∑14414415.0084..0样本平均均数差数数的平均均数必等等于两个个总体平平均数的的差数::若x1和x2所在总体体呈正态态分布,,其平均均数分别别为1和2,方差分分别为12和22,不论样样本容量量大小,,则两样样本平均均数的差差数呈正正态分布布,具有有平均数数d和方差d2。样本平均均数差数数的方差差必等于于两个总总体平均均数方差差的总和和:四、样本本均数差差数标准准误实际中,,总体方方差常是是未知的的,通常常的作法法是用样样本的方方差分别别来估计计总体的的方差。。所以:常常用估估计,记记为:简称为均均数差数数标准误误(也称称均数差差数标准准差)上式中,,S12与S22分别是样样本含量量为n1及n2的两个样样本方差差。如果它们们估计的的各自总总体方差差σ12与σ22相等,即即σ12=σ22=σ2,那么S12与S22都是σ2的估计值值,这时时应将S12与S22的加权平平均值S02作为σ2的估计值值较为合合理。所以:五、t-分布对于未知知总体进进行抽样样,由于于人力、、物力、、材料的的限制,,只能用用样本统统计数s2作总体2的估计值值,则其其标准化化离差的的分布不不呈正态态分布,,而作具具有df=n-1的t--分布((t-distribution))t-分布的概概率密度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论