




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
概率及概率分布第一页,共三十一页,编辑于2023年,星期日第一章要点提示本章择要讲授概率论的基本常识和随机变量最典型的三种概率分布。学习时①应了解随机事件相互关系并熟悉概率运算的基本法则;②掌握两种间断性变量的概率分布类型,即古典概型和贝努利概型;③牢固树立研究误差的思想,重点掌握误差作为连续性变量的概率分布规律——正态分布,熟练地运用在某些取值区间如左尾、右尾、双侧或中间概率的计算方法。为下一章学习一类特殊的连续性变量——抽样误差的概率分布作准备。涉及教材内容:第一章第二、三节,第四章第一~四节。作业布置:教材第二、三章内容(P12~P33)自习。
第二页,共三十一页,编辑于2023年,星期日第一节事件及其相互关系一、随机现象在一定条件下,有多种可能的结果发生,但事先并不能100%地肯定发生哪一种结果的现象。随机事件:泛指随机现象的任一种可能发生的结果,简称“事件”。用大写字母A、B、C……或A1、A2、A3……表示。随机现象有多少种可能发生的结果,就有多少个随机事件。基本事件:指不能再分割的随机事件,否则就是复合事件。概率论:研究随机现象统计规律性的学科。属于应用数学范围。第三页,共三十一页,编辑于2023年,星期日
第一节事件及其相互关系二、概率的三种定义随机试验:对某随机现象进行的一次观察同时具备三条:⑴事先可以明确几种可能出现的结果;⑵不能断言将出现哪一种结果;⑶在相同条件下可以重复进行。统计定义:假定在相同或相似条件下,重复进行同一个试验(或观察),某一事件A发生的次数a与总观察次数n之比值a/n当n→∞时稳定接近的值p就叫A的统计概率。记为P(A)=p
或简述为“频率的极限值”、“频率的稳定值”。此外还有概率的古典定义和几何定义。第四页,共三十一页,编辑于2023年,星期日第一节事件及其相互关系三、古典概型即古典概率分布类型,是针对有以下两个特征的试验而言:①只有有限个不同的基本事件;②各基本事件发生的概率均等。例1.1、从随机数字表中任一位点抽得一位数字是0、1、2、……或9的概率是均等的,都为0.1。即n=10个基本事件发生的可能性相等,若事件A由其中的m个基本事件组成,则P(A)=m/n,这就是概率的古典定义。如定义A为2≤y≤8,则P(A)=7/10=0.7。弄清楚古典概率能帮助我们正确使用随机数字表。如将4个编号进行随机排序时,按照取除以4以后的余数规则,遇到9、0就不要读;再如将12个编号进行随机排序时,按照取除以12以后的余数规则,遇到97、98、99、00也不要读。第五页,共三十一页,编辑于2023年,星期日
第一节事件及其相互关系四、统计概型实际应用中,仅研究基本事件是不够的,还要了解复合事件及其相互关系。事件间的相互关系有包含关系、和与积的关系、互斥及对立关系等。这些关系可以用一个最简单的随机试验模型予以说明。如右边文本所示。
观察甲、乙两粒种子发芽情况,发芽记为“1”,没有发芽记为“0”
甲乙
ω111……A=A1·A2ω210…B>A1·A2
ω301…B>A1·A2
ω400……C=A1·A2注:甲发芽记为“A1”、不发芽记“A1”;乙发芽记为“A2”、不发芽记“A2”。第六页,共三十一页,编辑于2023年,星期日第二节概率计算法则一、加法定理P(A+B)=P(A)+P(B)-P(AB)例1.2考察甲乙两人分别使用手枪和步枪朝同一靶标射击的结果。定义A为“甲击中”,B为“乙击中”。假定统计次数n=100得P(A)=0.6,P(B)=0.8,P(A·B)=0.48,求:P(A+B)。解“A+B”意为“靶标至少被一人击中”
P(A+B)=0.6+0.8-0.48=0.92
结果表明:100次观察中只有8次没有被击中,进一步分析如右。靶标被击中92次又分三种情况:⑴两人同时击中:
n·P(A·B)=48⑵甲击中且乙未击中:
n·P(A)-n·P(A·B)=12⑶乙击中且甲未击中:
n·P(B)-n·P(A·B)=32
将⑴、⑵、⑶的三个等式左右两边分别累加,得到公式:n·P(A)+n·P(B)-n·P(AB)=92将该公式两边除以n就是加法法则。第七页,共三十一页,编辑于2023年,星期日第二节概率计算法则二、乘法定理
P(A·B)=P(A)·P(B/A)
=P(B)·P(A/B)例1.3将0.5kg辛夷花籽经水选分级,上浮部分1000粒,播种后发芽率仍有10%,下沉部分2500粒,播种后的发芽率也只有80%,两向分组小计如右。解定义从3500粒种籽中随机抽取的一粒是“下沉籽”为事件A发生,是“发芽籽”为事件B发生,则有:P(A·B)=5/7×0.8=0.6×20/21P(A)=2500÷3500=5/7P(B)=2100÷3500=0.6P(A·B)=2000÷3500=4/7P(B/A)=2000÷2500=0.8P(A/B)=2000÷2100=20/21
水选分级发芽数未发芽数Σ上浮部分1009001000下沉部分20005002500Σ210014003500第八页,共三十一页,编辑于2023年,星期日第二节概率计算法则三、加法定理推论⑴互斥事件的加法法则:
P(A+B+C+……+N)=P(A)+P(B)+P(C)……+P(N)⑵对立事件的减法法则:
P(A)=P(Ω)-P(A)=1-P(A)四、乘法定理推论⑴事件独立的充分必要条件是:
P(A1A2A3……An)=P(A1)P(A2)P(A3)……P(An)在试验统计中用得多的往往不是加法定理或乘法定理本身,而是其推论。第九页,共三十一页,编辑于2023年,星期日第二节概率的计算法则例1.4已知一批饲用小麦种出苗率为0.8,现随机观察其中的两粒,问:两粒出苗(A)、仅一粒出苗(B)和两粒都不出苗(C)的概率各为多少?解设籽甲出苗为A1,不出苗为A1
籽乙出苗为A2,不出苗为A2
依题意,A1、A2相互独立,即:
P(A1)=0.8,P(A1)=0.2P(A2)=0.8,P(A2)=0.2
P(A)=P(A1A2)=0.64=P(A1)P(A2)P(B)=P(A1A2+A1A2)
=P(A1A2)+P(A1A2)
=P(A1)P(A2)+P(A1)P(A2)
=0.8×0.2+0.2×0.8=0.32P(C)=P(A1A2)=0.04=P(A1)P(A2)“至少一粒出苗的概率”有两种算法:P(A+B)=1-P(C)=0.96第十页,共三十一页,编辑于2023年,星期日第三节贝努利概型一、随机变量及其性质将随机事件数量化,建立起一一对应的实数值Yi,则称之为随机变量,简称“变量”。用符号y表示。再将随机变量y的任意一个取值Yi称为“观察值”。如例1.4中的0·1·2
将随机变量y取任意一个实数值Yi的概率称为概率函数。记号f()。再将随机变量y取值小于或等于某一个实数值Yi的概率称为累积概率函数。记号F()。如表述例1.4中“A”指“两粒籽发芽”的概率时就有三种方式:⑴P(A)=p或P(A)=0.64⑵P(y=Yi)=p,P(y=2)=0.64⑶f(Yi)=p或f(2)=0.64
再表述例1.4中“少于一粒籽发芽”的概率时也可有两种方式:P(y≤Yi)=P(y≤1)=1-0.64F(Yi)=F(1)=f(0)+f(1)=0.36
按所取观察值变化特点的不同,变量分间断性变量和连续性变量第十一页,共三十一页,编辑于2023年,星期日第三节贝努利概型二、贝努利概型贝努利试验(序列)是独立试验序列中最简单的类型。观察一次贝努利试验时(仅有两种可能的结果),事件A发生的概率与其对立事件发生的概率所表现出来的两点分布类型,叫做贝努利分布。其概率值的分割比例实际由概率的(统计)定义给出。多次贝努利试验中事件A在其中若干次发生的概率所表现出来的多点分布类型,叫做二项分布。其概率函数f(y)由牛顿二项式定理给出。第十二页,共三十一页,编辑于2023年,星期日第四节数据整理一、误差的概念总体指研究对象全体,即具有相同性质和特征的个体(可供抽样观察的基本单位)所组成的集团。总体拥有的个体数目叫总体容量(N),统计学中的个体与生物个体不是一个概念。有时候总体“由一切可能的观测结果组成”,此时的总体与个体只存在于特定的时空,可以想象,但既“看不见,又摸不着”,如多次称量同一物体的质量。样本:随机从总体中抽出来用于研究总体的那一部分个体(抽样单位)。样本拥有的个体数叫样本容量(n)。误差的本义是指随机变量的任意一个观察值与其真值的差异,即Yi-μ。但统计学不是把误差当作常量来研究(因为实际工作中真值往往是未知数或无法计算其具体数值),而是把它放在一定条件下作为随机变量来对待,即利用概率分布理论来描述误差在任一范围取值的可能性大小,所以误差实际被表述为“
y–μ”。由于误差的取值已不再局限于间断性数据,其概率分布研究必须从连续性变量的实例作为出发点。第十三页,共三十一页,编辑于2023年,星期日第四节数据整理例1.5研究广西“霞烟鸡”品种的母鸡所生鸡蛋的个头大小,将所得N=623个鸡蛋一个个地称重,再将得到的数据进行分组归类并统计各组次数如右。利用次数分布表计算出反映果实平均大小和彼此悬殊程度(变异度)的指标,即总体平均数μ=43.5g和总体标准差σ=4.65g,它们也是“单个鸡蛋重”这一连续性变量的两个最重要的参数,实际决定其概率分布的特征。第十四页,共三十一页,编辑于2023年,星期日第四节数据整理讨论:如果说用公式(μ=ΣYi/N)计算总体真值μ来反映鸡蛋大小的平均水平很自然的话,用σ2=Σ(y–μ)2/
N计算σ就显得非常特别,因为反映类似鸡蛋悬殊程度(简称变异度,反过来讲就是整齐度)时也有人用所谓的“平均误差”来表示过,其算式(Σ|y–μ|/
N)虽然比计算标准差的公式还简单,但实际研究中已不再有人用它,原因是总体标准差不仅能从数值上显示“变异度”的大小,更重要的它还是用作描述误差概率分布的尺度。例1.5:μ=43.5gσ=4.65g第十五页,共三十一页,编辑于2023年,星期日第四节数据整理二、次数分布及特征数对样本(或总体)的全部观察值进行分组(归类)并统计各类次数的过程叫做数据整理,其结果通常都以次数分布表(或图)的形式体现出来。当样本(或总体)的观察值较多时,进行数据整理一方面可以更直观地描述变量取值的分布规律,另一方面便于用加权法计算数据的特征数。数据的特征数包括(总体或样本)平均数和(总体或样本)标准差,还可以是标准误,标准差和标准误(平均数的标准差)都是反映数据变异性的数量指标,各自蕴藏着误差和抽样误差(如样本平均数和真值的差异)变异幅度的信息,但它们决非(抽样)误差本身。间断性数据(含质量性状的指标)大多可依据其性状自然归组。连续性数据则需要人为地进行分组,方法是先根据观察值(也称原始数据)的个数确定大致的组数,然后按数据的极差范围计算组距、调整组数,最后依最大的观察值和最小的观察值确定组限。第十六页,共三十一页,编辑于2023年,星期日第四节数据整理继续按贝努利概型分析五粒以上种子发芽的统计概率分布,绘成条形图。可以看出,服从二项分布的间断性变量不论p是否等于q,只要n足够大,则所得到的概率分布条形图显示的概率函数值总是以其中间的某一、两项为最大,而后往两边依次递减,当n越来越大时,概率分布图也是愈趋对称,和上一节连续性变量表现出来的频率(或次数)分布规律殊途同归,呈现出两头低、中间高的变化模式。这正说明间断性变量和连续性变量存在着某种必然的联系,正态分布本身及其发现和重新发现的过程就是这种联系的最好证明。
第十七页,共三十一页,编辑于2023年,星期日第四节数据整理第十八页,共三十一页,编辑于2023年,星期日第五节正态分布fN(y)N(μ,σ2)μ-3σμ-2σμ-σμμ+σμ+2σμ+3σ-3σ-2σ-1σ01σ2σ3σyy-μ第十九页,共三十一页,编辑于2023年,星期日第五节正态分布μ=0μ=1μ=2标准差(σ=1)相同而平均数各不相同的三种情形fN(y)y第二十页,共三十一页,编辑于2023年,星期日第五节正态分布σ=1σ=1.5σ=2平均数(μ=0)相同而标准差各不相同的三种情形fN(y)y第二十一页,共三十一页,编辑于2023年,星期日第五节正态分布一、正态分布的概率函数二、正态分布概率函数曲线的特性⑴对称性:绝对值相等的正负误差出现的机会(概率)均等。
讨论:这里提到误差取某个“值”的概率问题,也就是连续性变量取某个观察值的概率究竟有没有意义?高等数学论及连续性变量取某一个实数的概率时,都认定是在概率函数图中用某个点上的垂线求面积,无疑应该等于“0”。但应用中获得的观察值不能简单地理解为“一个”实数,而应当视为在精度有限的条件下,由最后一位有效数字按四舍五入规则决定的虽然小却确实存在的区间。
第二十二页,共三十一页,编辑于2023年,星期日第五节正态分布⑵钟形:简称“两头低,中间高”,即从+∞和-∞两个远端朝接近μ的方向递增(并在“拐点”处曲线由“凹”转“凸”),表明绝对值小的误差出现的概率大,绝对值大的误差出现的概率小。
⑶非负性:≮0,即曲线总在横坐标轴上方,两尾以横轴为渐进线,和横轴围成的总面积就是P(Ω)=1。⑷特异性:随机变量的两个参数μ和σ分别决定曲线的位置和形状,表明正态分布是一组曲线系统。N(μ,σ2)fN(y-μ)-3σ-2σ–σ0σ2σ3σy-μ第二十三页,共三十一页,编辑于2023年,星期日第五节正态分布0.50000.1586μ-2σμ-σμ
μ+σ
μ+2σy-2σ-σ0σ2σy-μφ(u)fN(y-μ)fN(y)-2-1012u第二十四页,共三十一页,编辑于2023年,星期日第五节正态分布0.68270.13590.02270.1586fN(y)(μ=0σ=1)N(0,1)φ(u)u第二十五页,共三十一页,编辑于2023年,星期日第五节正态分布三、标准分布的累积函数例1.6假定y~N(μ,σ2),μ=30.26,σ2=5.12
,试计算:P(y≤21.64)、P(y≤32.98)、P(21.64<y≤32.98)和P(y>32.98)。解:根据附表1查得的Φ(u)即标准分布曲线的左尾面积(概率)P(y≤21.64)=(21.64)=Φ[(21.64-30.26)÷5.1]
=Φ(-1.69)=0.04551P(y≤32.98)=(32.98)=Φ[(32.98-30.26)÷5.1]
=Φ(0.53)=0.7019P(21.64<y≤32.98)=(32.98)-(21.64)=0.6564P(y>32.98)=1-(32.98)=1-0.7019=0.2981
由此例可得到正确使用附表1的口诀:小于某数直接查,大于某数1减它;区间概率大减小,两边临界一反查。例1.7给定中间概率为0.90或0.95时,u值应等于多少?第二十六页,共三十一页,编辑于2023年,星期日第五节正态分布
0.045510.65640.2981yfN(y)21.6432.98第二十七页,共三十一页,编辑于2023年,星期日第五节正态分布0.900.0250.0250.05fN(y)(μ=0σ=1)N(0,1)φ(u)u第二十八页,共三十一页,编辑于2023年,星期日第五节正态分布到此为止,本章内容的讲授已顺着变量→连续性变量→误差的路径完成了知识结构由概率论(正概率)→→统计学(逆概率)的转变,其内容也由“描述变量的概率分布”→→“推断误差变量(任一区间)取值的概率”。在学习下一章内容之前,请一定先记牢三个要点:㈠将前三节树立的研究随机变量的思路深化到研究连续性变量的层次,且不论用y(教材)还是用x
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年育婴师考试内容详解试题及答案
- 信息系统项目技术文档重要性试题及答案
- 信息系统项目管理师考试知识点试题及答案
- 乡村全科医疗科目试题及答案
- 信息系统项目管理师复习指导手册试题及答案
- 2025医疗卫生系统整合的必要性试题及答案
- 2024年系统规划与管理师考试常见复习方法试题及答案
- 2024年信息系统项目管理师考试错误改正的重要性试题及答案
- 2025年会计师考试阶段性复习计划试题及答案
- 健康教育的有效传播策略试题及答案
- 绿色供应链与可持续采购培训
- 吉林交通职业技术学院单招职业技能测试参考试题库(含答案)
- 《合同知识培训》课件
- 12 清贫 课件教学课件
- 中建盘扣式落地卸料平台施工方案
- 临时用电申请审批表
- 儿童常见病中医治疗
- 外科学教学课件:结、直肠与肛管疾病
- 水利工程模块设备设施风险分级管控清单
- 中国古代建筑历史图说
- 检验危急值在急危重症病人的临床应用课件整理
评论
0/150
提交评论