研-统计3抽样误差t分布ppt课件_第1页
研-统计3抽样误差t分布ppt课件_第2页
研-统计3抽样误差t分布ppt课件_第3页
研-统计3抽样误差t分布ppt课件_第4页
研-统计3抽样误差t分布ppt课件_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、概念: 频数分布以均数为中心,左右两侧根本对称,接近均数两侧频数较多,离均数愈远,频数愈少,构成一个中间多,两侧逐渐减少的对称分布。是一种延续型分布。又称高斯分布。高斯(Johann Carl Friedrich Gauss,生于1777年4月30日于不伦瑞克,卒于1855年2月23日于哥廷根,德国著名数学家、天文学家、大地丈量学家、物理学家。被以为是最重要的数学家,并有数学王子的佳誉。 正态分布(normal distribution).正态分布用N(, )表示,其位置与均数有关,外形与规范差有关。医学景象许多呈正态分布,或近似正态分布:如正常人的生理,生化目的变量,等.从直方图到正态曲线的

2、过渡.对称分布正右偏分布负左偏分布几种常见的频数分布.正态分布之所以重要, 三个主要缘由:1. 正态分布在分析上较易处置。2. 正态分布之概率密度函数p.d.f.,probability density function的图形为钟形曲线(bell-shaped curve), 对称, 很适宜当做不少事件之机率方式。3. 正态分布可当做不少大样本的近似分布。 .正态分布的密度函数:式中为均数;为规范差;为圆周率;为自然对数的底,即2.71828。以上均为常数,仅x为变量。.规范正态分布:为了运用方便,常将式进展变量变换,即:u变换. 所得到的新变量u的分布即为规范正态分布。u的含义:变量到均数间

3、的间隔相当于规范差的倍数。.规范正态分布的概率密度函数:.u变换后,=0,=1,使原来的正态分布变换为规范正态分布standard normal distribution亦称u分布。规范正态分布 N(0,1).正态分布的特征和分布规律: 1曲线在x轴的上方,与x轴不相交,当x=时,曲线位于最高点。 f(u=0)=0.39892曲线关于直线x=左右对称。3正态分布有两个参数:均数,规范差;规范正态的参数分别为:0, 14正态分布的面积分布有一定规律。.正态曲线下面积的分布规律正态曲线下,横轴上一定区间的面积,等于该区间的频数发生的概率即一切随机事件发生的概率。面积可用积分求得。F(x)为正态变量

4、X 的累积分布函数,反映正态曲线下,自- 到x的面积,即左侧累积面积。 .统计学家曾经按 编成了附表,规范正态分布曲线下的面积。运用时留意:1当总体 , 知时,先计算u值,再用u值查表,得出所求区间面积占总面积的比例。假设未知,常分别用样本均数和样本规范差来估计。2曲线下对称于0的区间,面积相等。如:区间- ,-2.58与区间2.58, 的面积相等。3曲线下横轴上的总面积为100% 或为1。根据后两个特征,可计算右侧累积面积。.正态分布标准正态分布面积(或概率) -1_ +1 -1_+168.27%1.96_+1.96-1.96_+1.9695.00% 2.58_+2.58-2.58_+2.5

5、899.00%正态分布和规范正态分布曲线下面积分布规律.-1,1,68.27%-1.96,1.96,95%-2.58,2.58,99%双侧概率.单侧概率.正态曲线下面积的分布规律的运用:一、确定医学参考值范围意义:是正常人目的测定值的动摇范围,可用于划分正常,或异常。步骤:1、抽样 2、控制丈量误差 3、取单侧或双侧 4、选定适宜的百分界限 5、资料正态性检验 6、进展参考值估计常用方法:正态分布法,对数正态分布法,百分位数法.95%正常值范围的估计适用对象双侧界限单侧上界单侧下界正态分布法正态、近似正态对数正态法对数正态、近似正态百分位数法偏态.正常值范围的上下限单侧下限单侧上限.双侧界限.

6、例:用正态分布法求血糖值95%的参考值范围。解:1、求样本的均数4.653、规范差0.401。2、按照双侧95%范围,确定参考值范围为:3、将样本的均数、规范差数值代入计算,得出范围。 .对数正态分布(log normal distribution):很多医学资料呈偏态分布,经过对数变换用原始数据的对数值lgx替代x)后,服从正态分布,就说 x服从对数正态分布。如:环境中假设干有害物质的浓度,食品中有些农药的残留量,某些临床检验结果,某些疾病的埋伏期,医院病人的住院天数,都呈偏态分布。但对数转换后,为正态分布。按照正态分布规律处置。.例题某市某年调查200例正常人血铅含量ug/100g,双硫腙

7、分光比色法,试估计血铅值的95%上限。资料服从对数正态分布,求血铅对数值的均数,规范差。.二、确定概率分布:例:某市2000年110名7岁男童身高,知均数 =119.95厘米,规范差S=4.72厘米,估计:该地7岁男童身高在110厘米以下者占该地7岁男童总数的百分数。按:求u值,查表:找到-2.1,上方找到0.01,二者相交处为0.0174,概率为0.0174=1.74%,即该地7岁男童身高在110厘米以下者,估计占1.74%,不到2%。.三、质量控制:实验中,常以 作为上下警戒值,以 作为上下控制值。正态分布是很多统计方法的实际根底 .均数的抽样误差,t分布,参数估计Sampling err

8、or of mean,t-distribution,parameters estimation .一、均数的抽样误差和规范误均数的抽样误差sampling error of mean 由于总体中存在个体变异,抽样研讨中所抽取的样本,只包含总体中一部分个体,因此样本均数或率往往不等于总体均数或率,样本均数之间也互不相等,这种由抽样引起的差别称为均数的抽样误差的表达。即:.如何估计抽样误差? 规范误 standard error,SE以样本均数为例:SE 越大,均数的抽样误差越大,样本均数与总体均数间的差别越大。.当样本例数一定时,样本均数的规范误与原始数据的规范差成正比;当规范差一定时,规范误与

9、样本含量 n 的平方根成反比。添加样本含量可以减小抽样误差。与规范差的区别:规范差:表示普通个体值的离散程度;规范误:特别阐明统计量的离散程度。.规范误的运用1、用来衡量抽样误差的大小: 规范误越小,样本均数与总体均数越接近,样本均数的可信度越高;2、结合规范正态分布与 t 分布曲线下的面积规律,估计总体均数的置信区间。3、用于假设检验。.假定2003年汕头市15岁女学生的身高服从均数155.4cm、规范差5.3cm的正态分布。用计算机做抽样模拟实验,从N(155.4, 5.32)的总体中,每次抽出10个数字样本含量为10,组成一个样本,求出样本均数 、样本规范差 S。 再求得此100个样本均

10、数的均数、样本均数的规范差。抽样分布.样本均数的规范差是什么?.规范误.100个样本均数构成一个新的分布,也是正态分布。即使原分布为偏态分布,当样本含量足够大时,新分布也近似正态分布。新分布的集中趋势用均数的均数来表示,离散趋势用规范误表示N( , ) 。各样本均数的均数等于总体均数。.正态总体中抽样样本量5正态总体中抽样样本量10正态总体中抽样样本量30抽样时样本量大小决议了样本均数分布的外形,当样本量足够大时,均数分布趋向正态分布。.二、t 分布t-distribution).还记得吗?.u转换将正态分布转换为规范正态, N(0, 1)。同理:将样本均数的分布也可以转换为规范正态分布 。即

11、:.实践任务中,总体规范差往往未知,常用S替代 计算规范误,因此:为了和u分布区别,就变为: .均数的分布也是这样假设我们采用另一个正态变量:于是,均数的分布变成了规范正态分布: .但是,条件发生了变化我们通常用替代 然而, 随着样本量的变化而变化,所以,我们称之为 t-分布,虽然它是正态分布,但只需当样本量自在度无穷大的时候,它才是规范正态分布,此时,u=t.t分布曲线t分布是一簇对称于0的单峰分布曲线。自在度越小相当于规范差大,曲线的中间越低,两边越高;随自在度增大, t分布曲线逐渐逼近于规范正态分布曲线。当自在度无穷大时, t分布就是规范正态分布曲线。每一条t分布曲线,都对应于相应的自在

12、度。t分布模拟实验.t分布曲线下的面积规律与规范正态曲线下的面积规律类似:在某一个自在度下,两侧外部总面积为5%的界限的t值称为t0.05/2(),把两侧外部总面积为1%的界限的t值称为t0.01/2()。因此,中部占95%面积的t值范围:t0.05/2()- t0.05/2(),中部占99%面积的t值范围:- t0.01/2()- t0.01/2()。.当自在度确定时,占一定面积的t界限值,可以查表得出。例如:查当自在度=20,两侧概率之和为0.05时,对应的t值:t0.05/220=2.086,单侧概率为0.05时,对应的t值:t0.0520=1.725,.普通, t 0.05/2v1.9

13、6 ,t 0.01/2v 2.58自在度越小,曲线越低平,t 比1.96,2.58大的多;自在度变大,t接近于1.96,2.58;自在度无穷大,t=1.96,2.58.运用t值表留意:同一自在度下, P越小,t值越大;P值一样时,自在度越大,t越小;当自在度无穷大时,t值与u值相等。这也是u分布与t分布的区别。.t分布的主要运用:总体均数置信区间估计;t检验;.三、总体均数置信区间的估计统计推断:参数估计,假设检验参数估计:点估计point estimation):用样本统计量作为对总体参数的估计值() 。比如均数的估计。区间估计(interval estimation):根据选定的置信度估计总体均数所在的区间a 50)足够大也可参考u分布进展95%置信区间:99%置信区间:.3、总体规范差未知,样本例数较小按t分布原理,根据自在度,查出某个概率相应的t界值,中部占95%面积的t值范围:- t0.05/2()_ t0.05/2(),占99%面积的t值范围:- t0.01/2()_ t0.01/2()进展估计。.由于:95%的样本满足:95%置信区间:99%置信区间:.95%置信区间的意义:实际上,用一次抽样所得的样本均数估计总体均数,犯错误的概率为5%.或进展100次

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论