统计推断的理论基础_第1页
统计推断的理论基础_第2页
统计推断的理论基础_第3页
统计推断的理论基础_第4页
统计推断的理论基础_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章统计推断的理论基础统计推断就是根据样本所提供的信息,运用概率的理论,在一定的可靠程度上对总体的分布特征进行估计和推测的方法。

统计推断的理论基础共55页,您现在浏览的是第1页!节统计推断的基本问题许多实际问题都可以抽象为对总体参数的求取或验证,都可以抽选适当的样本作为总体的代表,并以样本的数据信息去推断总体的统计特征。例如,验血;汽车产品碰撞性试验;多媒体辅助教学效果等。统计推断的理论基础共55页,您现在浏览的是第2页!统计推断的目标要求目标——通过选取适当的样本作为总体的代表,去推断总体的统计特征。要求——样本要对总体有良好的代表性。关键——找到样本与总体的特定关系,并用数学语言表达出来,也就是要建立数学模型。统计推断的理论基础共55页,您现在浏览的是第3页!一、随机现象与随机事件随机现象是指,当一定条件具备时,某种结果可能出现也可能不出现的现象。例如,小麦种子在播种后可能发芽也可能不发芽。随机现象的每一个可能结果称为随机事件。随机事件一般用大写字母A,B,C,……表示。例如:A——到十字路口恰好遇到红灯;

B——恰好抽到一张草花

C——考试分数在90到100之间统计推断的理论基础共55页,您现在浏览的是第4页!问题与思考随机事件虽然带有偶然性,但出现的可能性大小是不一样的。有些事件比较容易发生,有些结果却很难出现。怎样才能描述这种随机现象的规律呢?统计推断的理论基础共55页,您现在浏览的是第5页!(二)概率的性质概率P(A)的取值范围:[0,1]P(A)

=1,表示必然事件;P(A)

=0,表示不可能事件;P(A)

~0,表示小概率事件。(“小概率原理”)统计推断的理论基础共55页,您现在浏览的是第6页!三、随机变量用以记录各种随机事件的变量称为随机变量,通常用X、Y来表示。例如:种子发芽数X;考试分数Y;三枚硬币出现的结果Z。统计推断的理论基础共55页,您现在浏览的是第7页!(二)连续型随机变量若随机变量X在一个实数区间上可以连续取值,且存在一个实函数,使得对任一区间(a,b),有则称X为连续型随机变量,称为X的概率密度函数。统计推断的理论基础共55页,您现在浏览的是第8页!一个赌博实例口袋中有8黑8白共16个玻璃球,从中随机抽取8个玻璃球,如果刚好抽到4黑4白,庄家赢,其他任何情况,庄家都会不同程度的输。统计推断的理论基础共55页,您现在浏览的是第9页!概率分布的类型概率分布是针对着随机变量而言的。一个离散型随机变量的概率分布是指这个随机变量所有取值点的概率的分布情况。一个连续型随机变量的概率分布是指这个随机变量在定义域上的各个区间内取值的概率分布情况。统计推断的理论基础共55页,您现在浏览的是第10页!二项分布二项分布是一种典型的离散型随机变量的概率分布,实际应用不多,留作大家看书自学。统计推断的理论基础共55页,您现在浏览的是第11页!连续变量的概率分布示例XP80~8575~8070~7565~7060~6555~600.030.120.250.380.170.05合计1.00统计推断的理论基础共55页,您现在浏览的是第12页!正态分布的密度函数一般正态分布,其密度函数可写成以下形式:

式中:X为连续性随机变量;e是自然对数的底;π是圆周率;μ为这个分布的平均数;σ为这个分布的标准差。由此可见,正态分布是由它的平均数和标准差惟一决定的,因此我们也常记一个正态分布为N(,)

统计推断的理论基础共55页,您现在浏览的是第13页!正态分布的特点正态分布的图形和密度函数,可以分析出以下几个特点:1.正态分布曲线图,形若“古钟”。

2.正态分布图左右对称。

3.μ决定曲线在坐标轴上的位置,σ决定图形的形状,σ大曲线扁平,σ小曲线尖峭。统计推断的理论基础共55页,您现在浏览的是第14页!正态分布曲线形态的变化统计推断的理论基础共55页,您现在浏览的是第15页!标准正态分布图-3–2–10123统计推断的理论基础共55页,您现在浏览的是第16页!标准正态分布表P值示意图统计推断的理论基础共55页,您现在浏览的是第17页!正态分布的一个重要性质如果X~N(μ,),则

P(μ-σ<X<μ+σ)=68%

P(μ-1.96σ<X<μ+1.96σ)=95%

P(μ-2.58σ<X<μ+2.58σ)=99%统计推断的理论基础共55页,您现在浏览的是第18页!正态分布的应用(一)求正态分布中一定区间的个体数量(二)求正态分布中一定数量个体所占有的区间统计推断的理论基础共55页,您现在浏览的是第19页!例题3某企业招收青年工人,有600人参加考试,拟录用120名。考试结果,平均成绩为70分,标准差为10分,成绩服从正态分布,试确定最低录取线约为多少分?解:p=120/600=0.2,查表得z=0.84x=μ+σz=70+10*0.84=78.4统计推断的理论基础共55页,您现在浏览的是第20页!一、抽样分布的概念区分三种不同的分布:总体分布:总体内数据的频数分布;样本分布:样本内数据的频数分布;抽样分布:样本统计量组成的频数分布。设总体容量为N,样本容量为n,则每一个总体中产生的样本数为,例如,=6010674609(六十亿)

=4.19×1015

统计推断的理论基础共55页,您现在浏览的是第21页!中心极限定理的理解三层含义:样本平均数抽样分布的形态;样本平均数抽样分布的平均数;样本平均数抽样分布的标准差(标准误)。统计推断的理论基础共55页,您现在浏览的是第22页!平均数抽样分布的标准误某种统计量在抽样分布上的标准差称为标准误。平均数抽样分布的标准误记为:标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本推断总体的可靠性越大。统计推断的理论基础共55页,您现在浏览的是第23页!例题已知某区中学二年级语文测验分数的标准差为10.6,从中抽取10份卷子,算得平均数为72分,求平均数的标准误,并求全区此次测验95%的置信区间。解:SE=10.6/3.16=3.350.95置信区间的下限:72-1.96×3.35=65.430.95置信区间的上限:72+1.96×3.35=78.57统计推断的理论基础共55页,您现在浏览的是第24页!(一)T分布在样本平均数的抽样分布中,若σ未知,而且又是小样本,抽样分布将服从t分布。T分布的图象呈单峰对称状(以Y轴为对称轴),非常接近标准正态分布,峰部比标准正分布低,两端比标准正态分布高,当自由度n很大时(n>30),T分布与标准正态分布近似。所以T分布常常用于样本容量小于30的小样本,故也称T分布理论为小样本理论。统计推断的理论基础共55页,您现在浏览的是第25页!T分布概率表(附表2)

查T分布概率表时,按自由度及相应的概率去找到对应的t值。例如T0.05(8)的查表方法就是,在列找到自由度8这一行,在行中找到概率0.05这一列,行列的交叉处即是2.306。统计推断的理论基础共55页,您现在浏览的是第26页!卡方(χ2)分布图统计推断的理论基础共55页,您现在浏览的是第27页!(三)F分布

F分布是由两个卡方分布构造而成的一个新的分布。若随机变量,F=S12/S22,则F函数的分布规律称为F(n1,n2)分布,其中参数n1、n2是两个自由度,任意一个自由度不同就是另一个F分布。F分布在一象限内,呈正偏态,随着两个自由度的增大,趋近于正态分布。

统计推断的理论基础共55页,您现在浏览的是第28页!F分布概率表(附表3)附表3是F分布的双侧概率表,只给出了两个概率值(这里用α表示),0.05和0.01,编表规则如图所示:一般要求分子的方差大于分母的方差。

统计推断的理论基础共55页,您现在浏览的是第29页!例题:抛掷三枚硬币试验随机事件A

——出现三个正面B——出现二正一反C——出现一正二反D——出现三个反面博弈规则A、D为甲组,B、C为乙组,任意选一组。抛掷三枚硬币,出现哪一个组的结果(事件),押中者为赢。统计推断的理论基础共55页,您现在浏览的是第30页!二、概率(probability)(一)概率的定义随机事件发生的可能性大小称为概率。某一事件A发生的次数m与总次数n之比被定义为该事件A发生的概率。记为:P(A)=m/n统计推断的理论基础共55页,您现在浏览的是第31页!(三)概率的加法和乘法概率的加法定理

两个互不相容事件A、B之和的概率,等于两个事件概率的和。即P(A+B)=P(A)+P(B)

概率的乘法原理

两个独立事件同时出现的概率等于这两事件概率的乘积。即:P(AB)=P(A)*P(B)

统计推断的理论基础共55页,您现在浏览的是第32页!(一)离散型随机变量若随机变量X只可能在有限个点上取值,则称X为离散型随机变量。统计推断的理论基础共55页,您现在浏览的是第33页!四、概率分布要掌握随机变量的变化规律,首先要了解它可能取什么值,其次,还要知道取这些值的概率大小。概率分布就是描述随机变量统计规律的重要工具。统计推断的理论基础共55页,您现在浏览的是第34页!经过计算,找规律Xw8w7bw6b2w5b3w4b4w3b5w2b6wb7b8P(X)1/128700.5%6%24%38%24%6%0.5%0.0078%统计推断的理论基础共55页,您现在浏览的是第35页!离散变量的概率分布离散型随机变量的概率分布列变量yiy1y2y3…yn概率p(y)P1P2P3…Pn统计推断的理论基础共55页,您现在浏览的是第36页!连续变量的概率分布若已知连续型随机变量的密度函数f(x),则通过定积分可求得连续型随机变量在某一区间的概率。统计推断的理论基础共55页,您现在浏览的是第37页!第三节正态分布及其应用正态分布最初由高斯在研究误差理论时发现,其特点是随机变量在变化范围的中部取值的概率最大,从中部到两侧取值的概率逐渐下降,并趋于零。例如:考试分数、身高、智商等统计推断的理论基础共55页,您现在浏览的是第38页!正态分布曲线统计推断的理论基础共55页,您现在浏览的是第39页!正态分布曲线位置的变化统计推断的理论基础共55页,您现在浏览的是第40页!标准正态分布将一般正态分布作转换:得到标准正态分布。统计推断的理论基础共55页,您现在浏览的是第41页!标准正态分布表的使用本书附表1就是标准正态分布表。表头中Z是标准分数的取值,表中的数据是正态分布图中阴影部分的面积,也就是随机变量取值从零到所查Z值之间的概率。统计推断的理论基础共55页,您现在浏览的是第42页!例题1(1)P(0<Z<1.15)=0.37493(2)P(-0.54<Z<0.82)

=P(0<Z<0.54)+P(0<Z<0.82)

=0.20540+0.29389

=0.49929(3)P(0.25<Z<0.97)

=P(0<Z<0.97)―P(0<Z<0.25)

=0.33398+0.09871

=0.23527统计推断的理论基础共55页,您现在浏览的是第43页!正态分布图统计推断的理论基础共55页,您现在浏览的是第44页!例题2已知一项考试的成绩服从平均数82,标准差为8的正态分布,问成绩落在80~90分之间考生占多大比例?解:此题实质上求成绩落在80分和90分之间的概率。必须先把原始分转化成标准分:Z1=-0.25,Z2=1通过画示意图,可以发现我们所求的是两块可查表面积的和:P(Z1<Z<Z2)=P(-0.25<Z<1)=P(0<Z<0.25)+(0<Z<1)=0.09871+0.34134=0.44005保留两位小数

P=0.44即:考试成绩落在80~90分之间的考生占44%的比例。统计推断的理论基础共55页,您现在浏览的是第45页!第四节抽样分布抽样分布是由样本数据推断总体特征的理论依据。抽样分布:样本统计量组成的频数分布。统计推断的理论基础共55页,您现在浏览的是第46页!二、中心极限定理样本平均数抽样分布与总体分布的关系,在大量的实践和理论研究中得出了一条极为重要的定理——中心极限定理:从平均数为μ,标准差为σ的正态总体中,抽取容量为n的样本,(如果总体非正态,要求n足够大),则样本平均数统计推断的理论基础共55页,您现在浏览的是第47页!不同总体的平均数抽样分布统计推断的理论基础共55页,您现在浏览的是第48页!三、参数估计——总体平均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论