版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一节概率-频率的稳定性一、统计概率的概念事件的概率:在相同条件下进行n次重复试验,事件A发生的次数为α,则α与n之比,称为事件A的频率,如果试验次数逐渐增多,事件A的频率越来越稳定地接近定值ρ,ρ就称为事件A的概率。P(A)=ρ第一页,共三十五页。统计概率的概念当n充分大时,事件A的频率作为该事件概率的近似值,称为统计概率。概率的基本性质:任一事件的概率不可能大于1,也不可能小于0[0≤P(A)≤1];必然事件的概率等于1[P(A)=1];不可能事件的概率等于0[P(A)=0]第二页,共三十五页。假设检验假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算.作出在一定概率意义上应该接受的那种假设的推断。如果抽样结果使小概率发生。则拒绝假设.如抽样结果没有使小概率发生,则接受假设。一般认为小于0.05或0.01的概率为小概率。通过假设检验,可以正确分析处理效应和随机误差,作出可取的结论。第三页,共三十五页。随机事件的概率表示了随机事件在一次试验中出现的可能性大小。若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件。小概率事件实际不可能性原理第四页,共三十五页。小概率事件虽然不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大,以至于实际上可以看成是不可能发生的。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。第五页,共三十五页。假设检验的步骤1.提出假设无效假设(nullhypothesis):备选假设(alternativehypothesis):“无效”指处理效应与总体参数之间没有真实的差异,试验结果中的差异乃误差所致。引进一醋的新曲种,以原生产标准为对照,已知原生产标准醋酸含量为=9.75%,采用新曲种酿造10个样本的醋酸含量平均数为11.99%,标准差S为1.3%,试分析采用新曲种是否提高了醋酸的含量。假设:
即:是来自随机误差第六页,共三十五页。2.确定显著水平以多大概率接受或否定无效假设?通常规定5%()和1%()为测试差异是否显著的概率标准,称为检验水平或显著标准,一般以a表示。第七页,共三十五页。3.推断是否接受假设当时,认为差异显著,标记为“*”,否定;当时,便认为差异非常显著,标记“**”号;当时,则认为其差异不显著,其差值为零,差值是来自误差,接受第八页,共三十五页。二、概率的运算法则1.概率的加法定理:互斥事件。某种产品的正品率与次品率。2.概率的乘法定理:互不排斥或相容的事件。某生产流水线上第一道工序产品与第二道工序产品的正品率。第九页,共三十五页。第二节二项分布有些总体的各个个体的某种性状,只有两种结果,非此即彼,此和彼是对立事件。这种由非此即彼事件构成的总体,叫做二项总体。这些资料的理论分布为二项分布。第十页,共三十五页。二项分布的概念如某实验中小白鼠染毒后死亡概率P为0.8,则生存概率为=1-P=0.2,故对一只小白鼠进行实验的结果为:死(概率为P)或生(概率为1-P)
对二只小白鼠(甲乙)进行实验的结果为:甲乙均死(概率为P2)、甲死乙生[概率为P(1-P)]、乙死甲生[概率为(1-P)P]或甲乙均生[概率为(1-P)2],概率相加得P2+P(1-P)+(1-P)P+(1-P)2=[P+(1-P)]2
依此类推,对n只小白鼠进行实验,所有可能结果的概率相加得Pn+cn1P(1-P)n-1+...+cnxPx(1-P)n-x+...+(1-P)x=[P+(1-P)]n其中n为样本含量,即事件发生总数,x为某事件出现次数,cnxPx(1-P)n-x为二项式通式,cnx=n!/x!(n-x)!,P为总体率。
因此,二项分布是说明结果只有两种情况的n次实验中发生某种结果为x次的概率分布。其概率密度为:
,x=0,1,...n。
第十一页,共三十五页。二项分布的应用条件每次实验只有两类对立的结果;n次事件相互独立;每次实验某类结果的发生的概率是一个常数。第十二页,共三十五页。二项分布的形状(1)二项分布图形的形状取决于P和n的大小;(2)当P=0.5时,无论n的大小,均为对称分布;(3)当P<>0.5,n较小时为偏态分布,n较大时逼近正态分布。第十三页,共三十五页。第十四页,共三十五页。二项分布的参数平均数和标准差二项分布的平均数µ=np,二项分布的标准差为np(1-p)的算术平方根。第十五页,共三十五页。正态分布
1、正态分布也称高斯(Gauss)分布,是一种连续型随机变量的理论分布。它的分布状态是多数变量都围绕在平均值左右,由平均值到分布的两侧,变量数减少。正态分布的概率函数为:
为正态分布的概率密度函数,表示某一定x值出现的概率密度。表示总体平均数,表示总体方差。
正态分布是一种在统计理论和应用上最重要的分布。试验误差的分布一般服从于这种分布,许多生物现象的计量资料均近似服从这种分布。正态分布记为N(,)。
第十六页,共三十五页。当时,f(x)值最大,所以正态分布曲线是以平均数为中心分布。当的绝对值相等时,f(x)值也相等,所以正态分布是以为中心向左右两侧对称的分布。标准离差u=的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x轴为渐近线,x的取值区间为。正态分布曲线完全由位置参数和形态参数来决定。确定正态分布曲线在x轴上的中心位置,确定正态分布的变异度。正态分布具有以下特征:
第十七页,共三十五页。第十八页,共三十五页。值不同,值相同的三条正态分布曲线值相同,值不同的三条正态分布曲线第十九页,共三十五页。标准正态分布记为N(0,1)
标准正态分布第二十页,共三十五页。为了方便,令即可将的正态分布转化为的标准正态分布。欲求一定区间标准正态分布曲线下的面积只需查附表1即可。第二十一页,共三十五页。有一批面包,重量平均为100g,标准差为1.2g,试求其单个面包重量从100g到102g的概率是多少?根据公式得:查表得当u=1.66时,对应的概率P=0.451,从100g到102g的面包占总面包数量的45.1%第二十二页,共三十五页。t分布
当样本容量较大(),用样本方差估计。但当样本容量不大()时,如果仍用估计,这时标准离差就不呈正态分布,而是服从自由度为的t分布。
第二十三页,共三十五页。t分布具有以下特征:
t分布曲线也是左右对称的,以0为中心向两侧递降。t分布受自由度df=n-1的制约,每个自由度都有一条t分布曲线。和正态分布相比,t分布的顶部偏低,尾部偏高,自由度df>30时,其曲线就比较接近正态分布曲线,当时则和正态分布曲线重合。第二十四页,共三十五页。抽样误差第二十五页,共三十五页。系统误差和随机误差系统误差是指测定值的数学期望与真值之差用ε表示。
ε=x∞-x真值
随机误差是指n次测量中各次测量值x与测量数学期望之差。用σi表示:
σi=xi-x∞
数学期望:指当测量次数n趋向无穷大(n→∞)时算术平均值的极限。用x∞表示:
第二十六页,共三十五页。x真值、x∞和xi关系的示意图。从图中得知,随机误差σi说明各次测量值与x∞的离散程度,即精密度,σi越小说明数据的重复性好、精密度高;而系统误差ε可做为x∞与真值x真值偏离的尺度,ε越小,即准确度越高。第二十七页,共三十五页。平均误差与标准误差平均误差可用下式表示:
其中:;用平均误差表示测量误差,计算方便,但由于采用平均值的方法,容易掩盖个别质量不高的测量。
第二十八页,共三十五页。标准误差σ又称均方根误差。通常真值x是未知的,而且测量次数n有限,这时可以用贝塞尔(Bessel)式得出在有限次测量情况下,单次测量值的标准离差S,且把测量的标准离差(S)作为标准误差(σ)的估计,σ≈S,这样标准误差σ就表示为:
第二十九页,共三十五页。绝对误差与相对误差绝对误差是测量值与真值之间的偏差,某次实验的绝对误差可用下式计算:
绝对误差=测量值-真值
视测量值与真值相比较大小不同,绝对误差可以是正值,也可以是负值,它的单位与测量的单位相同。
相对误差是绝对误差与真值的比值(百分数表示),某次实验的相对误差可用下式计算:第三十页,共三十五页。样本异常值的判断和处理
1、概念
样本异常值是指样本中的个别值,其数值明显偏离它所在样本的其余观测值。
异常值可能仅仅是数据中固有的随机误差的极端表现,也可能是过失误差。异常值检验的显著性水平,推荐的值为1%。第三十一页,共三十五页。2、异常值的处理
A、异常值保留在样本中参加其后的数据统计计算。B、允许剔除异常值,即把异常值从样本中排除。C、允许剔除异常值并追加适宜的观测值代入样本。D、在找到实际原因时修正异常值。处理规则为:(1)对于任何异常值,若无充分的技术上的原因,则不得剔除或修正。(2)异常值中除有充分的技术上的或实验上的理由外,在统计上表现为高异常,才允许剔除或修正。第三十二页,共三十五页。3、简单的坏值及其剔除原则
(1)拉依达原则
如果某个测量值Xd的离差Ud满足:
Ud>3
就认为Xd是含有过失误差的坏值,须剔除,误差绝对值大于3的概率为0.26%.(2)肖维勒准则
如果某个测量值Xd的离差Ud满足:
Ud>Wn
式中wn与测量值的测试次数n有关
坏值Xd应剔除。第三十三页,共三十五页。肖维勒系数wn数值表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海市市辖区(2024年-2025年小学五年级语文)统编版小升初真题((上下)学期)试卷及答案
- 人教版九年级化学上册复习教案
- DB11T 1132-2014 建设工程施工现场生活区设置和管理规范
- 广东省阳江市高新区2024-2025学年高一上学期11月期中英语试题(含答案)
- 职业学院建筑钢结构工程技术专业人才培养方案
- 工业用碾碎机产业深度调研及未来发展现状趋势
- 医用香膏市场需求与消费特点分析
- 冲压机产业深度调研及未来发展现状趋势
- 低音鼓槌产业规划专项研究报告
- 护发油产业规划专项研究报告
- 三叉神经微血管减压术的手术配合专家讲座
- 中考数学一轮复习课件全等三角形
- 国测省测四年级劳动质量检测试卷
- 2024-2029年安徽省家具行业分析及发展前景预测报告预测
- 国旗国徽国歌知识讲座
- 露营基地合同协议书
- 中建测评2024二测题库
- 心理危机评估的自我保护与边界管理
- 生产前的准备工作
- 六年级上册数学心得体会
- 机械制图教案(完整版)
评论
0/150
提交评论