第三章理论分布与抽样分布_第1页
第三章理论分布与抽样分布_第2页
第三章理论分布与抽样分布_第3页
第三章理论分布与抽样分布_第4页
第三章理论分布与抽样分布_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章理论分布与抽样分布统计概率得概念当n充分大时,事件A得频率作为该事件概率得近似值,称为统计概率。概率得基本性质:任一事件得概率不可能大于1,也不可能小于0[0≤P(A)≤1];必然事件得概率等于1[P(A)=1];不可能事件得概率等于0[P(A)=0]假设检验假设检验就就是根据总体得理论分布和小概率原理,对未知或不完全知道得总体提出两种彼此对立得假设,然后由样本得实际结果,经过一定得计算、作出在一定概率意义上应该接受得那种假设得推断。如果抽样结果使小概率发生。则拒绝假设、如抽样结果没有使小概率发生,则接受假设。一般认为小于0、05或0、01得概率为小概率。通过假设检验,可以正确分析处理效应和随机误差,作出可取得结论。随机事件得概率表示了随机事件在一次试验中出现得可能性大小。若随机事件得概率很小,例如小于0、05、0、01、0、001,称之为小概率事件。小概率事件实际不可能性原理小概率事件虽然不就是不可能事件,但在一次试验中出现得可能性很小,不出现得可能性很大,以至于实际上可以看成就是不可能发生得。在统计学上,把小概率事件在一次试验中看成就是实际不可能发生得事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理就是统计学上进行假设检验(显著性检验)得基本依据。假设检验得步骤1、提出假设无效假设(nullhypothesis):备选假设(alternativehypothesis):“无效”指处理效应与总体参数之间没有真实得差异,试验结果中得差异乃误差所致。引进一醋的新曲种,以原生产标准为对照,已知原生产标准醋酸含量为=9.75%,采用新曲种酿造10个样本的醋酸含量平均数为11.99%,标准差S为1.3%,试分析采用新曲种是否提高了醋酸的含量。假设:

即:是来自随机误差2、确定显著水平以多大概率接受或否定无效假设?通常规定5%()和1%()为测试差异是否显著的概率标准,称为检验水平或显著标准,一般以a表示。3、推断就是否接受假设当时,认为差异显著,标记为“*”,否定;当时,便认为差异非常显著,标记“**”号;当时,则认为其差异不显著,其差值为零,差值是来自误差,接受9大家应该也有点累了,稍作休息大家有疑问的,可以询问和交流二、概率得运算法则1、概率得加法定理:互斥事件。某种产品得正品率与次品率。2、概率得乘法定理:互不排斥或相容得事件。某生产流水线上第一道工序产品与第二道工序产品得正品率。第二节二项分布有些总体得各个个体得某种性状,只有两种结果,非此即彼,此和彼就是对立事件。这种由非此即彼事件构成得总体,叫做二项总体。这些资料得理论分布为二项分布。二项分布得概念

如某实验中小白鼠染毒后死亡概率P为0、8,则生存概率为=1-P=0、2,故对一只小白鼠进行实验得结果为:死(概率为P)或生(概率为1-P)

对二只小白鼠(甲乙)进行实验得结果为:甲乙均死(概率为P2)、甲死乙生[概率为P(1-P)]、乙死甲生[概率为(1-P)P]或甲乙均生[概率为(1-P)2],概率相加得P2+P(1-P)+(1-P)P+(1-P)2=[P+(1-P)]2

依此类推,对n只小白鼠进行实验,所有可能结果得概率相加得Pn+cn1P(1-P)n-1+、、、+cnxPx(1-P)n-x+、、、+(1-P)x=[P+(1-P)]n其中n为样本含量,即事件发生总数,x为某事件出现次数,cnxPx(1-P)n-x为二项式通式,cnx=n!/x!(n-x)!,P为总体率。

因此,二项分布就是说明结果只有两种情况得n次实验中发生某种结果为x次得概率分布。其概率密度为:

,x=0,1,、、、n。

二项分布得应用条件每次实验只有两类对立得结果;n次事件相互独立;每次实验某类结果得发生得概率就是一个常数。二项分布得形状(1)二项分布图形得形状取决于P和n得大小;(2)当P=0、5时,无论n得大小,均为对称分布;(3)当P<>0、5,n较小时为偏态分布,n较大时逼近正态分布。二项分布得参数平均数和标准差二项分布得平均数µ=np,二项分布得标准差为np(1-p)得算术平方根。正态分布

1、正态分布也称高斯(Gauss)分布,就是一种连续型随机变量得理论分布。她得分布状态就是多数变量都围绕在平均值左右,由平均值到分布得两侧,变量数减少。正态分布的概率函数为:

为正态分布得概率密度函数,表示某一定x值出现得概率密度。表示总体平均数,表示总体方差。

正态分布就是一种在统计理论和应用上最重要得分布。试验误差得分布一般服从于这种分布,许多生物现象得计量资料均近似服从这种分布。正态分布记为N(,)。

当时,f(x)值最大,所以正态分布曲线就是以平均数为中心分布。当得绝对值相等时,f(x)值也相等,所以正态分布就是以为中心向左右两侧对称得分布。标准离差u=得绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x轴为渐近线,x得取值区间为。正态分布曲线完全由位置参数和形态参数来决定。确定正态分布曲线在x轴上得中心位置,确定正态分布得变异度。正态分布具有以下特征:

值不同,值相同的三条正态分布曲线值相同,值不同的三条正态分布曲线标准正态分布记为N(0,1)

标准正态分布为了方便,令即可将的正态分布转化为的标准正态分布。欲求一定区间标准正态分布曲线下得面积只需查附表1即可。有一批面包,重量平均为100g,标准差为1、2g,试求其单个面包重量从100g到102g得概率就是多少?根据公式得:查表得当u=1、66时,对应得概率P=0、451,从100g到102g得面包占总面包数量得45、1%t分布

当样本容量较大(),用样本方差估计。但当样本容量不大()时,如果仍用估计,这时标准离差就不呈正态分布,而就是服从自由度为得t分布。

t分布具有以下特征:

t分布曲线也是左右对称的,以0为中心向两侧递降。t分布受自由度df=n-1的制约,每个自由度都有一条t分布曲线。和正态分布相比,t分布的顶部偏低,尾部偏高,自由度df>30时,其曲线就比较接近正态分布曲线,当时则和正态分布曲线重合。抽样误差系统误差和随机误差系统误差就是指测定值得数学期望与真值之差用ε表示。

ε=x∞-x真值

随机误差就是指n次测量中各次测量值x与测量数学期望之差。用σi表示:

σi=xi-x∞

数学期望:指当测量次数n趋向无穷大(n→∞)时算术平均值得极限。用x∞表示:

x真值、x∞和xi关系得示意图。从图中得知,随机误差σi说明各次测量值与x∞得离散程度,即精密度,σi越小说明数据得重复性好、精密度高;而系统误差ε可做为x∞与真值x真值偏离得尺度,ε越小,即准确度越高。平均误差与标准误差平均误差可用下式表示:

其中:;用平均误差表示测量误差,计算方便,但由于采用平均值得方法,容易掩盖个别质量不高得测量。

标准误差σ又称均方根误差。通常真值x就是未知得,而且测量次数n有限,这时可以用贝塞尔(Bessel)式得出在有限次测量情况下,单次测量值得标准离差S,且把测量得标准离差(S)作为标准误差(σ)得估计,σ≈S,这样标准误差σ就表示为:

绝对误差与相对误差绝对误差就是测量值与真值之间得偏差,某次实验得绝对误差可用下式计算:

绝对误差=测量值-真值

视测量值与真值相比较大小不同,绝对误差可以就是正值,也可以就是负值,她得单位与测量得单位相同。

相对误差就是绝对误差与真值得比值(百分数表示),某次实验得相对误差可用下式计算:样本异常值得判断和处理

1、概念

样本异常值就是指样本中得个别值,其数值明显偏离她所在样本得其余观测值。

异常值可能仅仅就是数据中固有得随机误差得极端表现,也可能就是过失误差。异常值检验得显著性水平

,推荐得

值为1%。2、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论