




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、均数的抽样误差,均数的抽样误差,t分布,参数估计分布,参数估计Sampling error of mean,t-distribution,parameters estimation 张建军张建军汕大医学院预防医学教研室汕大医学院预防医学教研室Tel:mail: 主要内容主要内容 均数的抽样误差均数的抽样误差 t分布分布 参数估计参数估计 概念:概念: 频数分布以均数为中心,左右两侧基本对称,频数分布以均数为中心,左右两侧基本对称,靠近均数两侧频数较多,离均数愈远,频数愈少,靠近均数两侧频数较多,离均数愈远,频数愈少,形成一个中间多,两侧逐渐减少的对称分布。形成一个
2、中间多,两侧逐渐减少的对称分布。 是一种连续型分布。又称高斯分布是一种连续型分布。又称高斯分布. 回顾:正态分布(normal distribution) 正态分布用正态分布用N(, )表示,其位置与均数有关,表示,其位置与均数有关,形状与标准差有关。形状与标准差有关。 医学现象许多呈正态分布,或近似正态分布:如医学现象许多呈正态分布,或近似正态分布:如正常人的生理,生化指标变量,等正常人的生理,生化指标变量,等2 正态分布的密度函数:式中正态分布的密度函数:式中为均数;为均数;为标为标准差;准差;为圆周率;为圆周率;为自然对数的底,即为自然对数的底,即2.71828。以上均为常数,仅。以上均
3、为常数,仅x为变量。为变量。x 2()1( )21( )2xf xe(1) 标准正态分布标准正态分布: 为了应用方便,常将式进行变量变换,即:为了应用方便,常将式进行变量变换,即:u变换变换. 所得到的新变量所得到的新变量u的分布即为标准正态的分布即为标准正态分布。分布。 u的含义:变量到均数间的距离相当于标准差的含义:变量到均数间的距离相当于标准差的倍数。的倍数。xux 标准正态分布的概率密度函数:标准正态分布的概率密度函数:(2)u 2()21( )2uue 正态分布的特征和分布规律:正态分布的特征和分布规律: (1)曲线在)曲线在x轴的上方,与轴的上方,与x轴不相交,当轴不相交,当x=时
4、,曲线位于最高点。时,曲线位于最高点。 f(u=0)=0.3989 (2)曲线关于直线)曲线关于直线x=左右对称。左右对称。 (3)正态分布有两个参数)正态分布有两个参数:均数均数,标准差标准差;标准正标准正态的参数分别为态的参数分别为:0, 1 (4)正态分布的面积分布有一定规律。)正态分布的面积分布有一定规律。正态分布正态分布标准正态分布标准正态分布面积面积( (或概率或概率) ) -1_ +1 -1_ +1 -1_+1-1_+168.27%68.27%1.96_+1.961.96_+1.96-1.96_+1.96-1.96_+1.9695.00%95.00% 2.58_+2.58 2.5
5、8_+2.58-2.58_+2.58-2.58_+2.5899.00%99.00%正态分布和标准正态分布曲线下面积分布规律正态分布和标准正态分布曲线下面积分布规律(-1,1),68.27%(-1.96,1.96),95%(-2.58,2.58),99%双侧概率双侧概率单侧概率单侧概率请思考:请思考: 抽样?抽样? 统计量?统计量? 抽样分布?抽样分布?一、均数的抽样误差和标准误一、均数的抽样误差和标准误均数的抽样误差均数的抽样误差sampling error of mean 由于总体中存在个体变异,抽样研究中由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,所抽取的样本,
6、只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数因而样本均数(或率)往往不等于总体均数(或率),样本均数之间也互不相等,(或率),样本均数之间也互不相等,这种这种由抽样引起的差异称为均数的抽样误差的体由抽样引起的差异称为均数的抽样误差的体现现。即:即:iXijXX 如何估计抽样误差如何估计抽样误差? 标准误标准误 standard error,SE 以样本均数为例:以样本均数为例: SE 越大,均数的抽样误差越大,样本均数与越大,均数的抽样误差越大,样本均数与总体均数间的差异越大。总体均数间的差异越大。XSSnXn 当样本例数一定时,样本均数的标准误与原当样本例数一定时,样本均数
7、的标准误与原始数据的标准差成正比;当标准差一定时,始数据的标准差成正比;当标准差一定时,标准误与样本含量标准误与样本含量 n 的平方根成反比。增加的平方根成反比。增加样本含量可以减小抽样误差。样本含量可以减小抽样误差。 与标准差的区别:与标准差的区别: 标准差:表示一般个体值的离散程度;标准差:表示一般个体值的离散程度; 标准误:特别说明统计量的离散程度。标准误:特别说明统计量的离散程度。再思考一个问题:再思考一个问题: 其它的统计量有抽样误差吗?其它的统计量有抽样误差吗? 它们的计算公式怎样?它们的计算公式怎样?XnXSSn标准误的应用标准误的应用1、用来衡量抽样误差的大小、用来衡量抽样误差
8、的大小: 标准误越小,样本均数与总体均数越接近,标准误越小,样本均数与总体均数越接近,样本均数的可信度越高;样本均数的可信度越高;2、结合标准正态分布与、结合标准正态分布与 t 分布曲线下的面积规分布曲线下的面积规律,估计总体均数的置信区间。律,估计总体均数的置信区间。3、用于假设检验。、用于假设检验。 假定假定2003年汕头市年汕头市15岁女学生的身高服从均岁女学生的身高服从均数数155.4cm、标准差、标准差5.3cm的正态分布。用计的正态分布。用计算机做抽样模拟试验,从算机做抽样模拟试验,从N(155.4, 5.32)的总体的总体中,每次抽出中,每次抽出10个数字(样本含量为个数字(样本
9、含量为10),),组成一个样本,求出样本均数组成一个样本,求出样本均数 、样本标、样本标准差准差 S。 再求得此再求得此100个样本均数的均数、样个样本均数的均数、样本均数的标准差。本均数的标准差。X抽样分布抽样分布 样本均数的标准差是什么?样本均数的标准差是什么?.标准误标准误 100个样本均数构成一个新的分布,也是个样本均数构成一个新的分布,也是正态分正态分布。布。 即使原分布为偏态分布,当样本含量足够大时,即使原分布为偏态分布,当样本含量足够大时,新分布也新分布也近似正态分布近似正态分布)。新分布的集中趋势用)。新分布的集中趋势用均数的均数均数的均数来表示,离散趋势用来表示,离散趋势用标
10、准误标准误表示表示N( , ) 。 各样本均数的均数等于总体均数各样本均数的均数等于总体均数。2X0501001502002503003504004502.082.342.612.873.143.403.663.934.194.464.724.985.25均数频数0501001502002503003504004502.082.342.612.873.143.403.663.934.194.464.724.985.25均数频数0501001502002503003504004505002.082.342.612.873.143.403.663.934.194.464.724.985.25均数频
11、数正态总体中抽样正态总体中抽样(样本量(样本量5)正态总体中抽样正态总体中抽样(样本量(样本量10)正态总体中抽样正态总体中抽样(样本量(样本量30)抽样时样本量抽样时样本量大小决定了样大小决定了样本均数分布的本均数分布的形状,当样本形状,当样本量足够大时,量足够大时,均数分布趋向均数分布趋向正态分布。正态分布。二、二、t 分布(分布(t-distribution)还记得吗?还记得吗?xu u转换将正态分布转换为标准正态转换将正态分布转换为标准正态, N(0, 1)。 同理:将样本均数的分布也可以转换为标准正态同理:将样本均数的分布也可以转换为标准正态分布分布 。 即:即:2,()(0,1)X
12、NNXXu 实际工作中,总体标准差往往未知,常用实际工作中,总体标准差往往未知,常用S代替代替 计算计算标准误,因此:为了和标准误,因此:为了和u分布区别,就变为:分布区别,就变为: /XXXtSSn均数的分布也是这样均数的分布也是这样 如果我们采用另一个正态变量如果我们采用另一个正态变量: 于是,均数的分布变成了标准正态分布于是,均数的分布变成了标准正态分布: XXu2,()(0,1)XNNxu但是,条件发生了变化 我们通常用代替我们通常用代替 然而,然而, 随着样本量的变化而变化,所以,我随着样本量的变化而变化,所以,我们称之为们称之为 t-分布,虽然它是正态分布,但只有分布,虽然它是正态
13、分布,但只有当样本量(自由度)无穷大的时候,它才是标当样本量(自由度)无穷大的时候,它才是标准正态分布,此时,准正态分布,此时,u=t/XXXtSSnXXuXXSXSt t分布曲线分布曲线 t t分布是一簇分布是一簇对称于对称于0的单峰分布曲线。的单峰分布曲线。 自由度越小(相当于标准差大),曲线的中间越自由度越小(相当于标准差大),曲线的中间越低,两边越高;随自由度增大,低,两边越高;随自由度增大, t t分布曲线逐渐分布曲线逐渐逼近于标准正态分布曲线。逼近于标准正态分布曲线。 当自由度无穷大时,当自由度无穷大时, t t分布就是标准正态分布曲分布就是标准正态分布曲线。线。 每一条每一条t
14、t分布曲线,都对应于相应的自由度。分布曲线,都对应于相应的自由度。 t t分布模拟试验分布模拟试验t t分布曲线下的面积规律分布曲线下的面积规律 与标准正态曲线下的面积规律相似:与标准正态曲线下的面积规律相似: 在某一个自由度下,两侧外部总面积为在某一个自由度下,两侧外部总面积为5%5%的界的界限的限的t t值称为值称为t t0.05/2()0.05/2(), ,把两侧外部总面积为把两侧外部总面积为1%1%的界限的的界限的t t值称为值称为t t0.01/2()0.01/2()。 因此,中部占因此,中部占95%95%面积的面积的t t值范围:值范围:- t t0.05/2()0.05/2()-
15、 t- t0.05/2()0.05/2(), ,- 中部占中部占99%99%面积的面积的t t值范围:值范围:- t- t0.01/2()0.01/2()- t- t0.01/2()0.01/2()。 当自由度确定时,占一定面积的当自由度确定时,占一定面积的t界限值,界限值,可以查表得出。可以查表得出。 例如:查当自由度例如:查当自由度=20,两侧概率之和为,两侧概率之和为0.05时,对应的时,对应的t值:值: t0.05/2(20)=2.086, 单侧概率为单侧概率为0.05时,对应的时,对应的t值:值: t0.05(20)=1.725, 一般,一般, t 0.05/2(v)1.96 ,t
16、0.01/2(v) 2.58 自由度越小,曲线越低平,自由度越小,曲线越低平,t 比比1.96,2.58大大的多;自由度变大,的多;自由度变大,t接近于接近于1.96,2.58;自;自由度无穷大,由度无穷大,t=1.96,2.58 使用使用t值表注意:值表注意: 同一自由度下同一自由度下, P越小,越小,t值越大;值越大;P值相同时,自值相同时,自由度越大,由度越大,t越小;当自由度无穷大时,越小;当自由度无穷大时,t值与值与u值相等。这也是值相等。这也是u分布与分布与t分布的区别。分布的区别。t t分布的主要应用:分布的主要应用: 总体均数置信区间估计;总体均数置信区间估计; t t检验;检
17、验;三、总体均数置信区间的估计三、总体均数置信区间的估计 统计推断:参数估计,假设检验统计推断:参数估计,假设检验 参数估计:参数估计: 点估计(点估计(point estimation):用样本统计量作为对用样本统计量作为对总体参数的估计值总体参数的估计值() 。比如均数的估计。比如均数的估计。 区间估计区间估计(interval estimation):根据选定的置信:根据选定的置信度估计总体均数所在的区间(度估计总体均数所在的区间(a 50)足够大足够大 也可参考也可参考u分布进行分布进行 95%置信区间:置信区间: 99%置信区间:置信区间:2.58,2.58XXXSXS1.96,1.
18、96XXXSXS 3、总体标准差未知,样本例数较小、总体标准差未知,样本例数较小 按按t分布原理,依据自由度,查出某个概率相分布原理,依据自由度,查出某个概率相应的应的t界值,界值, 中部占中部占95%95%面积的面积的t t值范围:值范围: - t- t0.05/2()0.05/2()_ t_ t0.05/2()0.05/2(), , 占占99%99%面积的面积的t t值范围:值范围: - t- t0.01/2()0.01/2()_ t_ t0.01/2()0.01/2()进行估计。进行估计。 因为:因为: 95%95%的样本满足:的样本满足: 95%95%置信区间:置信区间: 99%99%置信区间:置信区间:XXtS0.05 / 2,0.05 / 2,XXXtSXtS0.01 / 2,0.01 / 2,XXXtSXtS0.05 / 2|,vXXtS 95%置信区间的意义:置信区间的意义: 理论上,用一次抽样所得的样本均数估计总体理论上,用一次抽样所得的样本均数估计总体均数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国有线领夹式麦克风市场调查研究报告
- 2025至2031年中国纯氮行业投资前景及策略咨询研究报告
- 2025年中国数控打圈机市场调查研究报告
- 2025至2031年中国精密冲模行业投资前景及策略咨询研究报告
- 新疆科信职业技术学院《鄂南竹木工艺文创》2023-2024学年第一学期期末试卷
- 肇庆市实验中学高中生物三:生态系统的结构第课时导学案
- 肇庆市实验中学高中历史三:第一单元测验题
- 新疆科信职业技术学院《智慧物流设施与设备》2023-2024学年第一学期期末试卷
- 新疆农业职业技术学院《国际商务英语》2023-2024学年第二学期期末试卷
- 新疆维吾尔乌鲁木齐市2025届数学五年级第二学期期末预测试题含答案
- GB/T 4008-2024锰硅合金
- 鳌虾和蝗虫的比较解剖专家讲座
- 2024年个人信用报告(个人简版)样本(带水印-可编辑)
- 2024急性脑梗死溶栓规范诊治指南(附缺血性脑卒中急诊急救专家共识总结归纳表格)
- 《鸿门宴》公开课一等奖创新教学设计 统编版高中语文必修下册
- DZ∕T 0202-2020 矿产地质勘查规范 铝土矿(正式版)
- 2024年高中学业水平合格性考试数学模拟试卷试题(含答案详解)
- 能源英语面面观 知到智慧树网课答案
- 经典导读与欣赏-知到答案、智慧树答案
- 运动损伤与康复智慧树知到期末考试答案2024年
- 数学建模与系统仿真智慧树知到期末考试答案2024年
评论
0/150
提交评论