




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
【例题1】有一小麦品比试验,共有8个品种,用A、B、C、D、E、F、G、H作为品种代号,其中A为对照品种。采用随机区组设计,设置三次重复,小区面积25m2。试作分析。小麦品比试验(随机区组)的产量结果(kg)区组ⅠⅡⅢTt平均品种A(CK)10.99.112.232.210.7B10.812.314.037.112.4C11.112.510.534.111.4D9.110.710.129.910.0E11.813.916.842.514.2F10.110.611.832.510.8G10.011.514.135.611.9H9.310.414.434.111.4Tr83.191.0103.9278【例题2】为了了解我国小麦品种的产量变异情况,今从品种资源库中随机抽取8个品种,用A、B、C、D、E、F、G、H作为品种代号,进行品比试验。采用随机区组设计,设置三次重复,小区面积25m2。试作分析。坚强是什么?是长夜漫漫泪水流尽,依然早起拥抱新的太阳乐观是什么?是暴雨倾盆没有带伞,就笑着跑着来一场淋浴游戏第四章理论分布和抽样分布概率基础知识几种常见的理论分布离散型随机变量的理论分布
二项分布泊松分布
连续性随机变量的理论分布
正态分布抽样分布
第一节事件、概率和随机变量一、事件和事件发生的概率
在科学试验和生产实践中,人们会观察到各种各样的现象,每种现象出现的可能结果称为事件。必然事件:在一定条件下必然出现的现象。用U表示。不可能事件:在一定条件下必然不出现的事件,用V表示。随机事件:相同条件下重复进行试验,而事前无法预言其随后结果(可出现也可不出现)的现象。
随机事件的特点:
(1)试验可以在相同条件下多次重复进行;(2)每次试验的可能结果不止一个,并且
事先知道会有哪些可能的结果;(3)每次试验总是恰好出现这些可能结果
中的一个,但在一次试验之前却不能
肯定这次试验会出现哪一个结果。一次或少数试验,结果呈现偶然性。大量重复试验,试验结果呈现某种规律性——频率的稳定性。例如:抛掷一枚硬币发生正面朝上的频率试验结果试验的次数频率1.000.000.250.500.750255075100125
概率(probability)
一个事件发生的可能性,称为概率。
事件A的概率表示方法为P(A)。
1、对于任何事件A,有0≤P(A)≤1;2、必然事件的概率为1,即P(U)=1;3、不可能事件的概率为0,即P(V)=0。
小概率原理若随机事件的概率很小,称之为小概率事件。
例如:统计学一般将概率小于0.05、0.01、0.001,称为小概率。■在一次试验中不可能发生;■大量试验中,一定发生。
小概率事件在一次试验中看成是实际不可能发生的事件,称为小概率事件实际不可能性原理,亦称为小概率原理。小概率原理是统计学上进行假设检验(显著性检验)的基本依据。
二、事件间的关系(P48)
三、计算事件概率的法则(P49)
四、随机变量(randomvariable)
作一次试验,其结果有多种可能。每一种可能结果的出现都具有一定的随机性和偶然性,这些变量叫随机变量。
随机变量常用X、Y和Z等表示.离散型随机变量(discreterandomvariable);
如果随机变量X的结果是明确的,并可一一列出,当X取某一值时,其概率是确定的,则称X为离散型随机变量。离散型随机变量的概率分布
要了解离散型随机变量的统计规律,就必须知道它的一切可能值xi及取每种可能值的概率pi。
常用分布列来表示:x1x2…xi…p1p2…pi…
pi≥0,Σpi=1连续型随机变量(continuousrandomvariable)。
如果表示试验结果的变量X,其可能取值为某范围内的任何数值,且X在其取值范围内的任一区间中取值时,其概率是确定的,则称X为
连续型随机变量。连续型随机变量的概率分布
连续型随机变量(如产量、株高)的概率分布不能用分布列来表示,因为其可能取值是不可数的。我们改用随机变量X在某个区间内取值的概率P(a≤x<b)来表示。P(a≤x<b)=
连续型随机变量概率分布的性质:
1、f(x)≥0;2、
(c为任意实数)因而,对于连续型随机变量,仅研究其在某一个区间内取值的概率,而不去讨论取某一个值的概率。3、
第二节二项分布一、二项总体和二项分布生物学研究中经常碰到离散型的随机变量,常常可以把某个性状分成两种类型,例如,种子的发芽与不发芽、穗子有芒与无芒、哺乳动物的雄性与雌性等。由对立事件构成的总体,称为二项总体。贝努里试验:试验的对象只有两种结果,事件A和A。事件A的概率是p,事件A的概率是q。而且p+q=1事件A和A是可以计数的。从二项总体中连续抽取n个个体,将结果是A的次数记为X。以x表示事件A在n个个体中出现的次数,则x是一个离散型随机变量。它的所有可能取值为0,1,2,…,n,其概率分布函数为:称P(x)为随机变量x的二项分布,记作B(n,p),也叫贝努里分布。如果连续进行N次同样的抽样,得到某一观察值xi的理论次数则为:理论次数=
N·P(xi)二项分布的概率累积函数:F(x)=∑P(x=i)
i=0x二项分布的特征:
(1)每个试验只有两个对立结果。(2)若其中一个结果的概率为p,则其对立结果的概率为q=1-p(3)n次试验是互相独立的,即每个试验结果不会影响到其它试验结果。二、二项分布的概率计算
【例题1】豌豆红花与白花杂交,根据孟德尔遗传理论,F2代中红花与白花的比率为3:1。若一次随机观察12株,有7株红花的概率是多少?若连续观察50次,理论上有几次出现7株红花?解:n=12,p=3/4=0.75,
q=1/4=0.25。设12株豌豆中红花的株数以x表示,则x为服从二项分布B(12,0.75)的随机变量。于是12株豌豆中有7株是红花的概率为:P(7)=C127.p7.q5=792×0.757×0.255=0.1032若观察50次(N),出现7株红花的理论次数为理论次数=N×P(7)=50X0.1032=5.16(次)例题2某小麦品种在田间出现自然变异植株的概率为0.0045,试计算:(1)观察100株,获得两株或两株以上变异植株的概率是多少?(2)期望有0.99的概率获得1株或1株以上的变异植株,至少应观察多少株?解:已知变异株概率p=0.0045非变异株的概率q=1-p=0.9955
n=100
(1)获得0个变异株概率,
x=0,P(0)=0.6370 获得1个变异株概率,
x=1,P(1)=0.2879
获得2株或以上变异株概率为:
x≥2,P(x≥2)=1-P(0)-P(1)=0.0751(2)如果期望调查n株中至少有1株是变异株的概率是0.99,则获得非变异株的概率:P(0)=1-0.99=0.01即:x=0,P(0)=因为q=0.9955,所以,因此,至少应观察1021株才能满足要求。三、二项分布的形状和参数1.二项分布的形状
由n和p两个参数决定(1)当p值较小且n值不大时图形是偏畸的。随着n值的增大,分布逐渐趋于对称。(2)当p值趋于0.5时,分布趋于对称。
2、二项分布的参数
二项总体次数分布的参数
若随机变量(次数X)服从二项分布B(n,p)平均数μx=np
标准差(例题):豌豆花色遗传,F2代红花P=0.75。每次观察10株,观察100次,由此形成一个二项分布。求出现红花的平均次数及标准差。
以p=0.75,n=10代入上式得:μx=np=10×0.75=7.5(株)
=1.37(株)四、泊松分布---二项分布的一种极限分布
1、泊松分布的意义在生物学研究中,当许多事件出现的概率很小,而样本的容量或试验次数却往往很大,即有很小的p值和很大的n值时,二项分布就变成了一种特殊的分布——泊松分布(Poissondistribution)。泊松分布也是一种离散型随机变量的分布,其分布的概率函数为:式中,λ为参数,λ=np,x=0,1,2,…,∞。称x服从参数为λ的波松分布,记为x~P(λ)。泊松分布的平均数和方差、标准差为:
μ=λ σ2=λ
μ=σ2=λ
是泊松分布的重要特征二项分布中,一般当P<0.1和np<5时,可用泊松分布来近似计算。
2、波松分布的概率计算
由上式可知,波松分布的概率计算,依赖于参数λ的确定。但是在大多数服从波松分布的实例中,分布参数λ往往是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为λ的估计值。进而计算出x=0,1,2,…时的各事件概率。
泊松分布是描述在一定空间或时间内,稀少点子散布状况的一种理论分布。在农业生物学上有着较广泛应用。μ=σ2=λ
是泊松分布的重要特征解:100m2麦田中,平均杂草株数μμ=1×100/10=10(株)因此根据进而可求出100m2麦田中有x株杂草的概率.例题1:麦田内,平均每10m2有1株杂草,现在要问每100m2麦田中,有0株、1株、2株…的概率是多少?杂草数(x)≤5678910概率P(x)0.06700.06310.09010.11260.12510.1137杂草数(x)11121314≥15概率P(x)0.11370.09480.07290.05210.0835每100m2麦田中杂草株数的概率第三节正态分布一种很重要的连续型随机变量的概率分布:(1)生物现象中有许多变量是服从或近似服从正态分布的。因此许多统计分析方法都是以正态分布为基础的。(2)还有不少随机变量的概率分布在一定条件下以正态分布为其极限分布。因此在统计学中,正态分布无论在理论研究上还是实际应用中,均占有重要的地位。一、正态分布的定义
若连续型随机变量x的概率分布密度函数为:
其中μ为平均数,σ2为方差,则称随机变量x服从正态分布(normaldistribution),记为x~N(μ,σ2)。
μ是位置参数。当σ恒定时,μ愈大,则曲线沿x轴愈向右移动;反之,μ愈小,曲线沿x轴愈向左移动。σ是变异度参数。σ愈大,表示x的取值愈分散,曲线愈“胖”;σ愈小,x的取值愈集中在μ附近,曲线愈“瘦”。
二、正态分布的特征
1、正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为x=μ;2、f(x)在x=μ处达到极大,极大值为;
3、f(x)是非负函数,以x轴为渐近线,分布从-∞至+∞;
5、正态分布有两个参数,即平均数μ和标准差σ。6、分布密度曲线与横轴所夹的面积为1,即:4、曲线在x=μ±σ处各有一个拐点,即曲线在(-∞,μ-σ)和(μ+σ,+∞)区间是下凸的,在[μ-σ,μ+σ]区间是上凸的;
二、标准正态分布
正态分布是依赖于参数μ和σ2(或σ)的一簇曲线。这就给研究具体的正态总体带来困难,需将一般的N(μ,σ2)转换为μ=0,σ2=1的正态分布。
我们称μ=0,σ2=1的正态分布为标准正态分布(standardnormaldistribution)。
标准正态分布的概率密度函数记作f(u):
随机变量u服从标准正态分布,记作u~N(0,1),分布密度曲线如下页图。
对于任何一个服从正态分布N(μ,σ2)的随机变量x,都可以通过标准化变换:u=(x-μ)/σ将其变换为服从标准正态分布N(0,1)的随机变量u。
u称为标准正态变量或标准正态离差(standardnormaldeviate)。
三、正态分布的概率计算(一)标准正态分布的概率计算在连续性随机变数中,不能计算某一定值的概率,只能计求某一区间或范围的概率。在标准正态分布曲线下,变量u在[a,b]区间的概率可用曲线下区间的面积来表示。区间的概率可用下式表示P(a≤u<b)
正态分布曲线下一∝到u的面积,可以通过定积分得出,即:
F(ui)称为标准正态分布的累积函数。它是变量u小于某一定值ui的概率。因此,正态分布任一区间的概率可以如下式计算:
P(u1≤u<u2)=F(u2)-F(u1)
由于标准正态分布的概率累积函数具有广泛的应用,所以,统计学家已计算好实际需要的各个F(ui)值,列于附表1(P336)。学习查表例如,u=1.75,累计概率F(1.75)是多少?从第一列中找到1.7,在第一行中找到0.05。行与列相交处的数值为0.95994,所以
F(1.75)=0.95994有时会遇到给定F(u)值,反过来查u值。
例如:
F(u)=0.284,u值是多少?
这只要在附表2中找到与0.284最接近的值0.2843,对应行的第一列数-0.5,对应列的第一行数值0.07
即相应的u值为u=-0.57。
由正态分布的对称性可推出下列关系式,再借助附表2,便能很方便地计算有关概率:
P(0≤u<u1)=
P(u≥u1)=
P(|u|≥u1)=
P(|u|<u1)=
F(u1)-0.5F(-u1)2F(-u1)1-2F(-u1)
关于标准正态分布,以下几种概率经常用到:
P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545
P(-3≤u<3)=0.9973
P(-1.96≤u<1.96)=0.95P(-2.58≤u<2.58)=0.99
u变量在上述区间以外取值的概率分别为:
P(|u|≥1)=2F(-1)=1-P(-1≤u<1)=1-0.6826=0.3174P(|u|≥2)=2F(-2)=1-P(-2≤u<2)=1-0.9545=0.0455P(|u|≥3)=1-0.9973=0.0027
P(|u|≥1.96)=1-0.95=0.05P(|u|≥2.58)=1-0.99=0.01
从上述计算可知,虽然正态分布u的取值区间为(一∝,十∝),但实际上|u|>2.58的概率只有0.0l,|u|>1.96的概率也只有0.05,即:在u±1.96和u±2.58范围内已分别包含了95%和99%的变量值。(二)标准正态分布的两尾概率和单尾概率以上在计算P(|u|≥1)和P(|u|≥2.58)等概率时,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《语文园地一》教学设计-2024-2025学年语文六年级上册统编版
- 22我们奇妙的世界(教学设计)2023-2024学年统编版语文三年级下册
- 河大音像版(2020)五年级上册信息技术 第15课 璀璨的星空(二)教学设计
- 统编版七年级语文下册教学计划(及进度表)
- 六年级英语下册 Module 2 Unit 2 It will snow in Harbin教学实录设计(pdf) 外研版(三起)
- 43周年结婚纪念日祝福语
- 2025年抗痛风药项目合作计划书
- Unit5 Healthy lifestyle integration教学设计-2024-2025学年译林版英语七年级上册
- 提升生产车间安保力度计划
- 学校社团工作计划活动收获
- 2025年北京平谷区高三一模高考数学模拟试卷(含答案详解)
- 2025年铁岭卫生职业学院单招职业倾向性测试题库新版
- 2025年安徽水利水电职业技术学院单招职业技能测试题库参考答案
- 特色水产养殖手册
- 宫颈癌筛查与预防:2025年健康教育
- 绵阳市高中2022级(2025届)高三第二次诊断性考试(二诊)语文试卷(含答案)
- 四川省成都市2025届高三一诊考试英语试卷含解析
- 数据库租赁协议合同
- 2024年民法知识考试全套复习提纲
- 公司绿色可持续发展规划报告
- 《安全生产治本攻坚三年行动方案(2024-2026年)》子方案合集
评论
0/150
提交评论