版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
正态分布T分布生物统计学1正态分布T分布生物统计学1正态分布2正态分布2样本有几个特别重要的数字特征,这些数字是描述样本频率分布特征的,称之为样本特征数而在生物统计学中,样本特征数使用频繁的有以下几个1.算术平均数,简称平均数()。3样本有几个特别重要的数字特征,这些数字是描述样本频率分布特征2.样本方差:样本中各数据与样本平均数的差的平方和的平均数。3.样本标准差:样本方差的算术平方根做。42.样本方差:样本中各数据与样本平均数的差的平方和的平均数。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。方差和标准差是测算离散趋势最重要、最常用的指标。5样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或正态分布的概念如果把数值变量资料编制频数表后绘制频数分布图(又称直方图,它用矩形面积表示数值变量资料的频数分布,每条直条的宽表示组距,直条的面积表示频数(或频率)大小,直条与直条之间不留空隙。),若频数分布呈现中间为最多,左右两侧基本对称,越靠近中间频数越多,离中间越远,频数越少,形成一个中间频数多,两侧频数逐渐减少且基本对称的分布,那我们一般认为该数值变量服从或近似服从数学上的正态分布。6正态分布的概念6当n∞,直方条面积(频率)各自的概率然后组距0时,直方条的宽度0,直方条垂直线,各个直方条顶点间的连线构成一条光滑的曲线,即:概率密度曲线,而曲线下(直方条)的总面积始终为1,在区间[a,b]的概率=对应曲线段下的面积(直方条面积)。7当n∞,直方条面积(频率)各自的概率7正态分布的概念8正态分布的概念8正态曲线的定义:函数称f(x)的图象称为正态曲线式中:л=3.1416e=2.71828x----表示变量μ---表示理论平均数δ---表示总体标准差δ2—表示总体方差这个公式表示x变量区间内发生的概率9正态曲线的定义:函数称f(x)的图象称为正态曲线9如果变量X的概率密度函数服从上述函数,则称该变量服从正态分布。记做10如果变量X的概率密度函数服从上述函数,则称该变量服从正态分布
在σ不变的情况下函数曲线形状不变,若μ变大时,曲线位置向右移;若变小时,曲线位置向左移,故称μ为位置参数。11
在σ不变的情况下11在μ不变的情况下函数曲线位置不变,若σ变大时,曲线形状变的越来越“胖”和“矮”;若σ变小时,曲线形状变的越来越“瘦”和“高”,故称σ为形态参数或变异度参数。12在μ不变的情况下12012-1-2xy-3μ=-1σ=0.5012-1-2xy-33μ=0σ=1012-1-2xy-334μ=1σ=2正态曲线的性质(1)曲线在x轴的上方,与x轴不相交.(2)曲线是单峰的,它关于直线x=μ对称.(3)曲线在x=μ处达到峰值(最高点)(4)曲线与x轴之间的面积为1(5)当x<μ时,曲线上升;当x>μ时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近.(6)当μ一定时,曲线的形状由σ确定.σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.13012-1-2xy-3μ=-1σ=0.5012-1-2xy而整个正态分布则应该是各区间密度函数的累计积分.
一种连续的分布不可能求某项(某点)的概率,而只能求某个区间的概率.任意两点x1,x2且(x1x2),X在(x1,x2)范围内取值的概率P,即正态分布曲线在(x1,x2)下面积14而整个正态分布则应该是各区间密度函数的累计积分.
14标准正态分布正态分布由μ和σ所决定,不同的μ、σ值就决定了不同的正态分布密度函数,因此在实际计算中很不方便的。需将一般的N(μ,σ2)转换为μ=0,σ2=1的正态分布。我们称μ=0,σ2=1的正态分布为标准正态分布(standardnormaldistribution)就是由正态分布密度函数得到标准正态分布密度函数:15标准正态分布正态分布由μ和σ所决定,不同的μ、σ值就
由于正态分布的概率密度函数比较复杂,积分的计算也比较麻烦,最好的解决办法:将正态分布转化为标准正态分布,然后根据标准正态分布表直接查出概率值。
对于服从任意正态分布N(μ,σ2)的随机变量,欲求其在某个区间的取值概率,需先将它标准化为标准正态分布N(0,1)的随机变量,然后查表即可。16由于正态分布的概率密度函数比较复杂,积分的计算也比较正态分布转化为标准正态分布可以将x作一变换,令u称为标准正态变量或标准正态离差,服从标准正态分布的随机变量这个变换称为标准化或u变换,由于x是随机变量,因此u也是随机变量,所得到的随机变量U也服从正态分布,因此,由任意正态分布随机变量标准化得到的随机变量的标准正态分布常称为u分布。17正态分布转化为标准正态分布u称为标准正态变量或标准正态离差,变换后的正态分布密度函数为:标准正态分布均具有μ=0,σ2=1的特性如果随机变量u服从标准正态分布,可记为:u~N(0,1)18变换后的正态分布密度函数为:标准正态分布均具有μ=0,σ2=标准正态函数012-1-2xy-33μ=0σ=119标准正态函数012-1-2xy-33μ=0σ=119事实上,上面的计算已经制成了表格,只要知道了平均数和标准差即可查出相应的区间概率.20事实上,上面的计算已经制成了表格,只要知道了平均数和标准差即特殊区间的概率:若X~N,则对于任何实数a>0,概率
为如图中的阴影部分的面积,对于固定的和而言,该面积随着的减少而变大。这说明越小,落在区间的概率越大,即X集中在周围概率越大。m-am+ax=μ特别地有21特殊区间的概率:若X~N,则
我们从上图看到,正态总体在以外取值的概率只有4.6%,在以外取值的概率只有0.3%。由于这些概率值很小(一般不超过5%),通常称这些情况发生为小概率事件。22我们从上图看到,正态总体在T分布
几个重要概念从一个正态总体中抽取的样本统计量的分布样本平均数和样本方差S2是描述样本特征的两个最重要的统计量如果原总体的平均数为μ,标准差为σ,那么样本平均数抽样总体:平均数为:标准差为:为样本平均数抽样总体的标准误差简称为标准误,标准误表示平均数抽样误差的大小,反映样本平均数与新总体平均数之间的离散程度。
23T分布
几个重要概念从一个正态总体中抽取的样本统计量的经计算得出两个重要结论抽样的样本平均数的平均数等于总体平均数,即抽样的抽样平均数的标准差等于总体标准差除以样本单位数的平方根。即24经计算得出两个重要结论抽样的样本平均数的平均数等于总体平均数4.t-分布(不要求)设有服从正态分布的随机变量x,正态分布的标准化公式为:
对于总体方差σ2已知的总体,根据公式可以知道样本平均数在某一区间内出现的概率,公式为:附:服从标准正态分布254.t-分布(不要求)设有服从正态分布的随机变量x,正态分假如σ2未知,而且样本容量又比较小(n≤30)时:
标准化公式可变换为:它不再服从标准正态分布T分布类似于正态分布,也是一种对称分布,它只有一个参数,就是自由度所谓自由度是指独立观测值的个数,应为计算标准差时所使用的n个观测值,受到平均数x的约束,这就等于有一个观测值不能独立取值,因此自由度为df=n-1服从具有n-1自由度t-分布26假如σ2未知,而且样本容量又比较小(n≤30)时:标准化公T分布的密度函数为:T分布的计算已列成表格,应用时可根据需要由t值,自由度查概率;也可以由概率,自由度查t值.27T分布的密度函数为:T分布的计算已列成表格,应用时可根据需要t分布的双侧分位点假定X~t(n),给定:0<<1,如果一个数c满足:P{|X|>c}=,/2
oxtn(x)t/2(n)–t/2(n)/2则称这个数c是自由度n的t分布的双侧分位点(数),记成
t/2(n)。对称分布的双侧分位点就是上侧/2分位点28t分布的双侧分位点假定X~t(n),/2标准正态分布N(0,1)
的双侧分位点/2
ox
(x)u/2
–u/2
/2
记为:u/2
如:双侧0.05分位点u0.025
=1.9629标准正态分布N(0,1)
的双侧分位点/2t-分布的特点
(1)t分布为对称分布,关于t=0对称;只有一个峰,峰值在t=0处;与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平(2)t分布曲线受自由度df的影响,自由度越小,离散程度越大(3)t分布的极限是正态分布。df越大,t分布越趋近标准正态分布
当n>30时,t分布与标准正态分布的区别很小;n>100时,t分布基本与标准正态分布相同;n→∞时,t分布与标准正态分布完全一致30t-分布的特点
(1)t分布为对称分布,关于t=0对称;正态分布T分布生物统计学31正态分布T分布生物统计学1正态分布32正态分布2样本有几个特别重要的数字特征,这些数字是描述样本频率分布特征的,称之为样本特征数而在生物统计学中,样本特征数使用频繁的有以下几个1.算术平均数,简称平均数()。33样本有几个特别重要的数字特征,这些数字是描述样本频率分布特征2.样本方差:样本中各数据与样本平均数的差的平方和的平均数。3.样本标准差:样本方差的算术平方根做。342.样本方差:样本中各数据与样本平均数的差的平方和的平均数。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。方差和标准差是测算离散趋势最重要、最常用的指标。35样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或正态分布的概念如果把数值变量资料编制频数表后绘制频数分布图(又称直方图,它用矩形面积表示数值变量资料的频数分布,每条直条的宽表示组距,直条的面积表示频数(或频率)大小,直条与直条之间不留空隙。),若频数分布呈现中间为最多,左右两侧基本对称,越靠近中间频数越多,离中间越远,频数越少,形成一个中间频数多,两侧频数逐渐减少且基本对称的分布,那我们一般认为该数值变量服从或近似服从数学上的正态分布。36正态分布的概念6当n∞,直方条面积(频率)各自的概率然后组距0时,直方条的宽度0,直方条垂直线,各个直方条顶点间的连线构成一条光滑的曲线,即:概率密度曲线,而曲线下(直方条)的总面积始终为1,在区间[a,b]的概率=对应曲线段下的面积(直方条面积)。37当n∞,直方条面积(频率)各自的概率7正态分布的概念38正态分布的概念8正态曲线的定义:函数称f(x)的图象称为正态曲线式中:л=3.1416e=2.71828x----表示变量μ---表示理论平均数δ---表示总体标准差δ2—表示总体方差这个公式表示x变量区间内发生的概率39正态曲线的定义:函数称f(x)的图象称为正态曲线9如果变量X的概率密度函数服从上述函数,则称该变量服从正态分布。记做40如果变量X的概率密度函数服从上述函数,则称该变量服从正态分布
在σ不变的情况下函数曲线形状不变,若μ变大时,曲线位置向右移;若变小时,曲线位置向左移,故称μ为位置参数。41
在σ不变的情况下11在μ不变的情况下函数曲线位置不变,若σ变大时,曲线形状变的越来越“胖”和“矮”;若σ变小时,曲线形状变的越来越“瘦”和“高”,故称σ为形态参数或变异度参数。42在μ不变的情况下12012-1-2xy-3μ=-1σ=0.5012-1-2xy-33μ=0σ=1012-1-2xy-334μ=1σ=2正态曲线的性质(1)曲线在x轴的上方,与x轴不相交.(2)曲线是单峰的,它关于直线x=μ对称.(3)曲线在x=μ处达到峰值(最高点)(4)曲线与x轴之间的面积为1(5)当x<μ时,曲线上升;当x>μ时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近.(6)当μ一定时,曲线的形状由σ确定.σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.43012-1-2xy-3μ=-1σ=0.5012-1-2xy而整个正态分布则应该是各区间密度函数的累计积分.
一种连续的分布不可能求某项(某点)的概率,而只能求某个区间的概率.任意两点x1,x2且(x1x2),X在(x1,x2)范围内取值的概率P,即正态分布曲线在(x1,x2)下面积44而整个正态分布则应该是各区间密度函数的累计积分.
14标准正态分布正态分布由μ和σ所决定,不同的μ、σ值就决定了不同的正态分布密度函数,因此在实际计算中很不方便的。需将一般的N(μ,σ2)转换为μ=0,σ2=1的正态分布。我们称μ=0,σ2=1的正态分布为标准正态分布(standardnormaldistribution)就是由正态分布密度函数得到标准正态分布密度函数:45标准正态分布正态分布由μ和σ所决定,不同的μ、σ值就
由于正态分布的概率密度函数比较复杂,积分的计算也比较麻烦,最好的解决办法:将正态分布转化为标准正态分布,然后根据标准正态分布表直接查出概率值。
对于服从任意正态分布N(μ,σ2)的随机变量,欲求其在某个区间的取值概率,需先将它标准化为标准正态分布N(0,1)的随机变量,然后查表即可。46由于正态分布的概率密度函数比较复杂,积分的计算也比较正态分布转化为标准正态分布可以将x作一变换,令u称为标准正态变量或标准正态离差,服从标准正态分布的随机变量这个变换称为标准化或u变换,由于x是随机变量,因此u也是随机变量,所得到的随机变量U也服从正态分布,因此,由任意正态分布随机变量标准化得到的随机变量的标准正态分布常称为u分布。47正态分布转化为标准正态分布u称为标准正态变量或标准正态离差,变换后的正态分布密度函数为:标准正态分布均具有μ=0,σ2=1的特性如果随机变量u服从标准正态分布,可记为:u~N(0,1)48变换后的正态分布密度函数为:标准正态分布均具有μ=0,σ2=标准正态函数012-1-2xy-33μ=0σ=149标准正态函数012-1-2xy-33μ=0σ=119事实上,上面的计算已经制成了表格,只要知道了平均数和标准差即可查出相应的区间概率.50事实上,上面的计算已经制成了表格,只要知道了平均数和标准差即特殊区间的概率:若X~N,则对于任何实数a>0,概率
为如图中的阴影部分的面积,对于固定的和而言,该面积随着的减少而变大。这说明越小,落在区间的概率越大,即X集中在周围概率越大。m-am+ax=μ特别地有51特殊区间的概率:若X~N,则
我们从上图看到,正态总体在以外取值的概率只有4.6%,在以外取值的概率只有0.3%。由于这些概率值很小(一般不超过5%),通常称这些情况发生为小概率事件。52我们从上图看到,正态总体在T分布
几个重要概念从一个正态总体中抽取的样本统计量的分布样本平均数和样本方差S2是描述样本特征的两个最重要的统计量如果原总体的平均数为μ,标准差为σ,那么样本平均数抽样总体:平均数为:标准差为:为样本平均数抽样总体的标准误差简称为标准误,标准误表示平均数抽样误差的大小,反映样本平均数与新总体平均数之间的离散程度。
53T分布
几个重要概念从一个正态总体中抽取的样本统计量的经计算得出两个重要结论抽样的样本平均数的平均数等于总体平均数,即抽样的抽样平均数的标准差等于总体标准差除以样本单位数的平方根。即54经计算得出两个重要结论抽样的样本平均数的平均数等于总体平均数4.t-分布(不要求)设有服从正态分布的随机变量x,正态分布的标准化公式为:
对于总体方差σ2已知的总体,根据公式可以知道样本平均数在某一区间内出现的概率,公式为:附:服从标准正态分布554.t-分布(不要求)设有服从正态分布的随机变量x,正态分假如σ2未知,而且样本容量又比较小(n≤30)时:
标准化公式可变换为:它不再服从标准正态分布T分布类似于正态分布,也是一种对称分布,它只有一个参数,就是自由度所谓自由度是指独立观测值的个数,应为计算标准差时所使用的n个观测值,受到平均数x的约束,这就等于有一个观测值不能独立取值,因此自由度为df=n-1服从
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新石器课件教学课件
- 人力资源部门招聘劳动合同模板
- 个人著作权质押贷款协议
- 《宠物医院物业管理方案范本》
- 企业员工离职管理
- 互联网旅游合同协议书范本
- 临沂虚拟现实行业劳动合同模板
- 传媒合作结束协议书
- 企业健康医疗共建协议
- 上海个人租房合同-机场附近
- 建筑施工作业活动风险分级管控清单
- 基于DCS的温度控制系统的设计与应用(共35页)
- XX区畜禽养殖屠宰无害化处理企业洗消中心建设项目实施方案.docx
- 大猫英语分级阅读 六级1 A Letter to New Zealand课件
- 科创板知识测评含答案
- 带电作业规程PPT
- 第几和几专项训练
- 北京市海淀区2021-2022学年七年级上学期期末考试语文试卷(word版含答案)
- (完整版)心理健康教育五年工作规划
- 四川省工程建设统一用表(新版监理单位用表)
- 作业流程分析ppt课件
评论
0/150
提交评论