




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二节正态分布与抽样分布1.频率
Frequency
定义
Definition:在大量重复试验中,事件A已发生的次数a占试验总次数的比率。
特点(Characteristics):一个事件的频率不是常数,但随重复试验或观察次数
n
增加,频率的波动会不断减小,逐步趋于稳定,称为频率的稳定性。一、频率与概率
Frequencyandprobability2.概率
Probability性质
Property1)0≤P(A)≤12)P(A)=1,表明该事件为必然事件;
P(A)=0,表明该事件为不可能事件;
0<P(A)<1,表明该事件为随机事件。
定义
Definition:同一条件下,试验或观察次数n
无限增大,随机事件A
发生的频率a
/n
必然稳定接近某一常数P,P就称为随机事件A的概率。
取值
Evaluation:一般情况下P
的取值不可能准确获得,以n
充分大时事件A
发生的频率α/n
作为
P
的近似值。1)若事件A的概率为P(A),那么其对立事件B
的概率为:
P(B)=1-P(A)运算法则
Calculationrule2)若事件A和
B
是互斥的,其概率各为P(A)
和P(B),那么两事件的和事件的概率为:
P(A+B)=P(A)+P(B)3)若事件A
和B是独立的,其概率各为P(A)和P(B),那么两事件同时出现的概率为:
P(A·B)=P(A)·P(B)二、频数与频率分布
Numberandfrequencydistribution1.频数与频率分布在一定条件下,总体或样本中某观察值或某区间(Interval)的观察值所出现的次数。总体或样本中某观察值或某区间的观察值出现的次数在整个区间的分布情况。总体或样本中某观察值或某区间的观察值出现的频率整个区间的分布情况。频数Number
频数分布
Numberdistribution频率分布Frequencydistribution2.统计方法Presentationmethodofdata(1)求出极差(R)(2)确定组数(G)及组距(B)
组数:n≥100时,G:8~15n<100时,G:不少于6组;
n很大时,G:不大于30组。组距:B=R/G
对于连续变量,组距精度与观察值相同;对于非连续变量,组距取整数。(3)确定组限Grouplimit
组限就是每一组的上限(Upperlimit)和下限(Lowerlimit)
。(4)统计频数和频率
通常是采用制作频数(频率)分布表或频数(频率)分布图的方法。例1:有一小麦品种,随机采集100株,量其株高,试说明不同株高的理论分布规律。行号株高行号株高行号株高行号株高行号株高190218341986194811002104229942996210282963103231014393639583944102249344101649384945106259945946597859161062693469366888696783279047946791879681062895488968948885910529102499269104899610993095509870989093119931905110371979110112933291528672100928613102339653957392939714101349854857499949515943590559675889597169636955696769896991797379957957798979518105389358967895989619893995599779949910420964010660918010410096表1100株小麦株高(cm)(1)求出极差:R=106-83=23cm表2100株小麦株高频数与频率分布表(2)确定组数(G)及组距(B)
组数:G=9
组距:B=23/9=2.56cm(3)确定组限第1组:81.5~
84.49
第2组:84.5~
87.49
第3组:87.5~
90.49……(4)统计频数和频率组号组限中值数频数频率%181.5-84.498322284.5-87.498644387.5-90.498988490.5-93.49921414593.5-96.49953030696.5-99.49982020799.5-102.4910110108102.5-105.49104889105.5-108.4910744图1100株小麦的频数分布图2
100株小麦的频率分布三、正态分布Normaldistribution1.概念
Definition1)概念正态分布随机变量的概率密度函数为:式中:——正态分布中的随机变量;
——2.718,是自然对数的底数;
——正态分布总体的平均数,是曲线最高点的横坐标;
——正态分布总体的标准差,其大小表达曲线高低胖瘦程度。概率密度函数
Probabilitydensityfunction
定义:当试验次数无限增加,直方图趋近于光滑曲线,曲线下包围的面积表示概率。该曲线称为概率密度函数。分布函数Distributionfunction设X是一个随机变量,x是任意实数,函数F(x)=P{X≤x}
如果将X看成是数轴上的随机点的坐标,那么,分布函数F(x)在x
处的函数值就表示X落在区间(-∞,x]上的概率。正态分布的密度函数的图形是关于直线x=μ对称的;在x=μ处达到最大值重点了解(1)什么样?(2)两个参数(3)正态分布曲线的解释3)正态分布曲线的特点
Characteristicsofthecurveofnormaldistribution(1)图中μ为总体平均数,σ为总体标准差。当样品数越来越多,处于无穷多时,就构成了以总体平均数为轴的正态分布形式。变数的次数分布规律是以平均数为轴心形成对称的分布规律,变数值越靠近平均数,出现的次数越多,远离平均数值的变数次数越少。落入()的概率:68.3%;落入()的概率:95.4%;落入()的概率:99.7%;落入()的概率:95%;落入()的概率:99%。(2)正态分布总体观察值落入以下特殊区间的概率(3)数学家根据有关公式,计算出了正态曲线下不同距离内的面积和概率积分表以备应用。
P336附表2正态分布表(4)t
检验、方差分析等,采用的0.05、0.01显著性判断,其原理就是来源于此。正态分布的应用例2测得一小麦品种的株高为120cm,试问这个小麦品种株高和例1所选样品小麦株高有无本质差异?例1小麦品种平均株高为95.9cm,标准差为5.2cm,用正态曲线概率分布判断:x±2*5.2cm,即株高在90.7-101.1cm范围内的概率占95.5%,x±3*5.2cm,即株高80.3-111.5cm范围内的概率占99.74%。而这一小麦品种株高为120cm,显然不在其范围内。说明二者有极显著的差异,这种判断有99.74%以上的把握性,判错的可能性只有0.26%。4)正态分布标准化为了便于计算概率和一般化应用,将正态分布标准化。令:且以为度量单位,则概率密度函数可被标准化为:
式中叫做标准正态离差、正态离差或概率度。任何正态分布都可以根据以上变换转化为标准正态分布。
u 0.00 -0.02 -0.04 -0.06 -0.08-3.0
0.0013 0.0013 0.0012 0.0011 0.0010-2.5 0.0062 0.0059 0.0055 0.0052 0.0049-2.0 0.0228 0.0217 0.0207 0.0197 0.0188-1.9 0.0287 0.0274 0.0262 0.0250 0.0239-1.6 0.0548 0.0526 0.0505 0.0485 0.0465-1.0 0.1587 0.1539 0.1492 0.1446 0.1401-0.5 0.3085 0.3015 0.2946 0.2877 0.2810
0 0.5000 0.4920 0.4840 0.4761 0.4681标准正态分布曲线下面积(u)0u例:某正态总体的,求落入区间(1.08,1.21)的概率。查附表2:P336(二)小概率事件和小概率原理
在生物统计学中,把概率小于5%的事件,称为小概率事件(Smallprobabilityevent)。
小概率事件在一次试验中几乎是不可能事件,这一规律称为小概率原理(Thesmallprobabilityprinciple)。四、抽样分布Samplingdistribution1.概念
Definition1)抽样
Sampling从总体中抽取个体组成样本进行研究以了解总体特性的过程。抽样分布Samplingdistribution
从总体中独立抽取随机样本的统计数的概率分布,称为抽样分布。统计推断Statisticalpostulation从一个样本或一系列样本所得到的统计数,去推断原总体的参数,称为统计推断。(1)样本均值抽样分布的均值等于总体均值几个重要的结论:(2)样本均值抽样分布的方差等于原总体方差与样本容量之比样本的平均数所构成的新总体的标准差──均数标准差:五、置信限与置信区间1.概念置信区间
Confidenceinterval
在一定概率保证下,误差的合理存在范围或区间称为置信区间或置信距。区间的上下限称为置信限。置信概率
Confidencelevel
保证误差合理存在范围的概率,称为置信概率、置信度。用P表示。否定区间Negationinterval
不属于合理误差的范围或区间,称为否定区间。否定概率
Negationprobability
不合理误差存在范围或区间的概率,称为否定概率,或显著性水平。用α表示。2.置信限和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 出资共同经营合同样本
- 共同承揽合同样本
- 农村铺面收购合同标准文本
- 农村自建厕所转让合同标准文本
- 书独家出版发行合同范例
- 划拨土地房屋出售合同标准文本
- 出售桩机配件合同标准文本
- 全媒体合作合同标准文本
- 传媒策划活动合同样本
- 农场改造合同标准文本
- 湖南新高考教学教研联盟暨长郡二十校联盟2025届高三年级第二次联考英语试题及答案
- 小学生校园安全教育
- 2025年徽商集团校园招聘12人笔试参考题库附带答案详解
- 保洁施工方案新
- 2024年至2025年湖南省娄底市公开招聘警务辅助人员辅警结构化面试高频必考题库一卷含答案
- (沪粤版)八年级物理下册《7.4同一直线上二力的合成》同步测试题带答案
- 2025-2030中国责任保险行业市场分析及竞争形势与发展前景预测研究报告
- 三人合伙开店合同范本
- 2025年郑州卫生健康职业学院单招职业适应性测试题库带答案
- 15 青春之光 公开课一等奖创新教学设计
- 2024年全国中学生数学奥林匹克竞赛内蒙古赛区初赛试卷(解析版)
评论
0/150
提交评论