第三章理论分布与抽样分布_第1页
第三章理论分布与抽样分布_第2页
第三章理论分布与抽样分布_第3页
第三章理论分布与抽样分布_第4页
第三章理论分布与抽样分布_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章理论分布与抽样分布第一节概率-频率的稳定性一、统计概率的概念事件的概率:在相同条件下进行n次重复试验,事件A发生的次数为α,则α与n之比,称为事件A的频率,如果试验次数逐渐增多,事件A的频率越来越稳定地接近定值ρ,ρ就称为事件A的概率。P(A)=ρ统计概率的概念当n充分大时,事件A的频率作为该事件概率的近似值,称为统计概率。概率的基本性质:任一事件的概率不可能大于1,也不可能小于0[0≤P(A)≤1];必然事件的概率等于1[P(A)=1];不可能事件的概率等于0[P(A)=0]假设检验假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算.作出在一定概率意义上应该接受的那种假设的推断。如果抽样结果使小概率发生。则拒绝假设.如抽样结果没有使小概率发生,则接受假设。一般认为小于0.05或0.01的概率为小概率。通过假设检验,可以正确分析处理效应和随机误差,作出可取的结论。随机事件的概率表示了随机事件在一次试验中出现的可能性大小。若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件。小概率事件实际不可能性原理小概率事件虽然不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大,以至于实际上可以看成是不可能发生的。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。假设检验的步骤1.提出假设无效假设(nullhypothesis):备选假设(alternativehypothesis):“无效”指处理效应与总体参数之间没有真实的差异,试验结果中的差异乃误差所致。引进一醋的新曲种,以原生产标准为对照,已知原生产标准醋酸含量为=9.75%,采用新曲种酿造10个样本的醋酸含量平均数为11.99%,标准差S为1.3%,试分析采用新曲种是否提高了醋酸的含量。假设:

即:是来自随机误差2.确定显著水平以多大概率接受或否定无效假设?通常规定5%()和1%()为测试差异是否显著的概率标准,称为检验水平或显著标准,一般以a表示。3.推断是否接受假设当时,认为差异显著,标记为“*”,否定;当时,便认为差异非常显著,标记“**”号;当时,则认为其差异不显著,其差值为零,差值是来自误差,接受二、概率的运算法则1.概率的加法定理:互斥事件。某种产品的正品率与次品率。2.概率的乘法定理:互不排斥或相容的事件。某生产流水线上第一道工序产品与第二道工序产品的正品率。第二节二项分布有些总体的各个个体的某种性状,只有两种结果,非此即彼,此和彼是对立事件。这种由非此即彼事件构成的总体,叫做二项总体。这些资料的理论分布为二项分布。二项分布的概念

如某实验中小白鼠染毒后死亡概率P为0.8,则生存概率为=1-P=0.2,故对一只小白鼠进行实验的结果为:死(概率为P)或生(概率为1-P)

对二只小白鼠(甲乙)进行实验的结果为:甲乙均死(概率为P2)、甲死乙生[概率为P(1-P)]、乙死甲生[概率为(1-P)P]或甲乙均生[概率为(1-P)2],概率相加得P2+P(1-P)+(1-P)P+(1-P)2=[P+(1-P)]2

依此类推,对n只小白鼠进行实验,所有可能结果的概率相加得Pn+cn1P(1-P)n-1+...+cnxPx(1-P)n-x+...+(1-P)x=[P+(1-P)]n其中n为样本含量,即事件发生总数,x为某事件出现次数,cnxPx(1-P)n-x为二项式通式,cnx=n!/x!(n-x)!,P为总体率。

因此,二项分布是说明结果只有两种情况的n次实验中发生某种结果为x次的概率分布。其概率密度为:

,x=0,1,...n。

二项分布的应用条件每次实验只有两类对立的结果;n次事件相互独立;每次实验某类结果的发生的概率是一个常数。二项分布的形状(1)二项分布图形的形状取决于P和n的大小;(2)当P=0.5时,无论n的大小,均为对称分布;(3)当P<>0.5,n较小时为偏态分布,n较大时逼近正态分布。二项分布的参数平均数和标准差二项分布的平均数µ=np,二项分布的标准差为np(1-p)的算术平方根。正态分布

1、正态分布也称高斯(Gauss)分布,是一种连续型随机变量的理论分布。它的分布状态是多数变量都围绕在平均值左右,由平均值到分布的两侧,变量数减少。正态分布的概率函数为:

为正态分布的概率密度函数,表示某一定x值出现的概率密度。表示总体平均数,表示总体方差。

正态分布是一种在统计理论和应用上最重要的分布。试验误差的分布一般服从于这种分布,许多生物现象的计量资料均近似服从这种分布。正态分布记为N(,)。

当时,f(x)值最大,所以正态分布曲线是以平均数为中心分布。当的绝对值相等时,f(x)值也相等,所以正态分布是以为中心向左右两侧对称的分布。标准离差u=的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x轴为渐近线,x的取值区间为。正态分布曲线完全由位置参数和形态参数来决定。确定正态分布曲线在x轴上的中心位置,确定正态分布的变异度。正态分布具有以下特征:

值不同,值相同的三条正态分布曲线值相同,值不同的三条正态分布曲线标准正态分布记为N(0,1)

标准正态分布为了方便,令即可将的正态分布转化为的标准正态分布。欲求一定区间标准正态分布曲线下的面积只需查附表1即可。有一批面包,重量平均为100g,标准差为1.2g,试求其单个面包重量从100g到102g的概率是多少?根据公式得:查表得当u=1.66时,对应的概率P=0.451,从100g到102g的面包占总面包数量的45.1%t分布

当样本容量较大(),用样本方差估计。但当样本容量不大()时,如果仍用估计,这时标准离差就不呈正态分布,而是服从自由度为的t分布。

t分布具有以下特征:

t分布曲线也是左右对称的,以0为中心向两侧递降。t分布受自由度df=n-1的制约,每个自由度都有一条t分布曲线。和正态分布相比,t分布的顶部偏低,尾部偏高,自由度df>30时,其曲线就比较接近正态分布曲线,当时则和正态分布曲线重合。抽样误差系统误差和随机误差系统误差是指测定值的数学期望与真值之差用ε表示。

ε=x∞-x真值

随机误差是指n次测量中各次测量值x与测量数学期望之差。用σi表示:

σi=xi-x∞

数学期望:指当测量次数n趋向无穷大(n→∞)时算术平均值的极限。用x∞表示:

x真值、x∞和xi关系的示意图。从图中得知,随机误差σi说明各次测量值与x∞的离散程度,即精密度,σi越小说明数据的重复性好、精密度高;而系统误差ε可做为x∞与真值x真值偏离的尺度,ε越小,即准确度越高。平均误差与标准误差平均误差可用下式表示:

其中:;用平均误差表示测量误差,计算方便,但由于采用平均值的方法,容易掩盖个别质量不高的测量。

标准误差σ又称均方根误差。通常真值x是未知的,而且测量次数n有限,这时可以用贝塞尔(Bessel)式得出在有限次测量情况下,单次测量值的标准离差S,且把测量的标准离差(S)作为标准误差(σ)的估计,σ≈S,这样标准误差σ就表示为:

绝对误差与相对误差绝对误差是测量值与真值之间的偏差,某次实验的绝对误差可用下式计算:

绝对误差=测量值-真值

视测量值与真值相比较大小不同,绝对误差可以是正值,也可以是负值,它的单位与测量的单位相同。

相对误差是绝对误差与真值的比值(百分数表示),某次实验的相对误差可用下式计算:样本异常值的判断和处理

1、概念

样本异常值是指样本中的个别值,其数值明显偏离它所在样本的其余观测值。

异常值可能仅仅是数据中固有的随机误差的极端表现,也可能是过失误差。异常值检验的显著性水平,推荐的值为1%。2、异常值的处理

A、异常值保留在样本中参加其后的数据统计计算。B、允许剔除异常值,即把异常值从样本中排除。C、允许剔除异常值并追加适宜的观测值代入样本。D、在找到实际原因时修正异常值。处理规则为:(1)对于任何异常值,若无充分的技术上的原因,则不得剔除或修正。(2)异常值中除有充分的技术上的或实验上的理由外,在统计上表现为高异常,才允许剔除或修正。3、简单的坏值及其剔除原则

(1)拉依达原则

如果某个测量值Xd的离差Ud满足:

Ud>3

就认为Xd是含有过失误差的坏值,须剔除,误差绝对值大于3的概率为0.26%.(2)肖维勒准则

如果某个测量值Xd的离差Ud满足:

Ud>Wn

式中wn与测量值的测试次数n有关

坏值Xd应剔除。肖维勒系数wn数值表

4、单个异常值的检验——狄克松检验准则

一组观测值中单个异常值的检验有多种方法,狄克松(Dixon)法是应用最广泛的一种,由于该法简便且适用于小样本观测值的检验,故已成为国际标准化组织(ISO)和美国材料试验协会(ASTM)的推荐方法。狄克松检验法适用于一组观测值的一致性检验和剔除一组观测中的异常值。狄克松检验的要点如下:六、测量结果的有效数字测量结果的有效数字位数与测量的精密度密切相关,有效数字位数不能多写,也不能少写。一般情况下,要根据相对误差来确定有效数字的位数,其关系式为:

(Z+1)Ex

10S

式中,Z为第一位数字;Ex为相对误差;S为指数的最大值;

有效数字与S的关系是:

有效数字=S+1*当第一位数字甚小时,可以增加一位有效数字。*当数值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论