总体均数的估计与假设检验要求及方法_第1页
总体均数的估计与假设检验要求及方法_第2页
总体均数的估计与假设检验要求及方法_第3页
总体均数的估计与假设检验要求及方法_第4页
总体均数的估计与假设检验要求及方法_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、总体均数的估计与假设检验要求及方法教学内容:第一节 均数的抽样误差与标准误第二节 t分布第三节 总体均数估计第四节 假设检验基本原理与步骤第五节 t检验第六节 假设检验的注意事项第七节 正态性与方差齐性检验2抽样研究(sampling study) 很多情况下研究者无法对无限总体的每一个观察对象都进行观测很多情况下由于人力、物力、财力的限制也无法对有限总体的每个个体进行观测;有时也没有必要对总体的每一个个体的变量值都进行测量在大多数情况下,研究者并不知道总体的参数,而是在总体中随机抽取一定数量观察单位作为样本进行抽样研究 而取得样本信息后(统计量)人们更希望由此推算总体的相应信息(参数),这是

2、抽样研究的基本目的3 统计推断(statistical inference) 采用抽样研究的方法,由某总体中随机抽取一个有代表性的样本,并根据样本提供的信息(统计量)推断总体特征、性质(参数)的过程称为统计推断 4总体样本抽取部分观察单位 统计量 参 数 统计推断统计推断 statistical inference5如:样本均数 样本标准差S 样本率 P如:总体均数 总体标准差 总体率内容:参数估计(estimation of parameters) 包括:点估计与区间估计2. 假设检验(test of hypothesis)统计学研究特点:研究的是样本,要对总体作出推断利用“小概率原则”作出

3、统计推断需进行参数估计和假设检验 抽样研究 抽样误差6问题:已知某市健康儿童共125万人,想知道其平均血糖水平是多少?求(参数)的问题7Population:125万人方法一:普查(125万人)总体均数(参数) =4.86mmol/L13方法二:随机抽样(50人) A= 4.66mmol/L(样本统计量)参数估计风 险8怎么样由 估计?利用了一个规律,“抽样分布”的规律9教学内容均数的抽样误差与标准误t 分布 . 总体参数的估计 .10一、均数的抽样误差与标准误11一、均数抽样误差和标准误 已知某地高中三年级男生的身高满足正态分布,其平均身高为厘米,这里,将该地高中三年级男生的身高视为一个总体

4、。现从该总体中随机抽样5次,每次抽取一个样本含量n=10的样本,得到的5个样本的数据及各样本均数如下:1213样本号样本含量(n=10) m=168.15cm样本均数1161.1173.7173.7167.3162.2162.2166.6166.6157.4157.4164.822166.8159.1159.1166.1173.3173.3169.1169.1165.2165.2166.633157.4174.0172.3175.8166.6182.1163.1159.4159.4177.3168.744174.5182.1168.5171.3174.1165.6173.7171.9167.5

5、164.1171.335164.1166.6169.6169.6173.8173.2164.3166.6182.1165.4169.53样本均数的特点各个样本均数之间都不相同抽样误差表现形式之一各个样本均数都不等于总体均数,有的比总体均数大,有的比它小抽样误差表现形式之二相对于各样本的个体值,样本均数间的变异程度较小14抽样误差(sampling error):由于抽样造成的样本统计量与样本统计量,以及样本统计量与总体参数间的差别,称为。原因:个体变异特征:A. 不可避免性 B. 可控性15样本均数的抽样分布 仍以某地高三男生的身高为例,设身高变量为x,假定x服从正态分布,记为xN(168.1

6、5, 62)从总体X中反复随机抽样,样本含量分别为n=4,n=16和n=36,分别随机抽10000个样本并计算样本均数,把同一样本含量的10000个样本均数视为一个新的样本资料作频数图1617 从正态分布总体N(168.15,62)中随机抽样10000次的结果曲线是正态总体N(168.15,62)的概率密度曲线直方图为正态分布总体N(168.15,62)的样本均数的频率密度图样本含量n=36样本含量n=16样本含量n=4样本均数的分布规律大多数的样本均数相互之间存在差异,绝大多数的样本均数不等于x的总体均数样本均数的集中趋势位置与个体资料x的集中趋势位置较为接近,样本均数的频数图均呈现出中间多

7、、两边少且基本对称的正态分布特征。样本均数的分布范围较个体值小;随着样本含量的增大,样本均数的频数分布范围越来越窄每种样本量的10000个样本均数值所计算出的样本均数的标准差都非常接近 (为个体资料x的总体标准差,n为个体数) 18样本均数的分布规律 理论上可以证明:从正态分布的总体 中随机抽取样本含量为n的一批样本,样本均数 有如下性质 :样本均数 服从正态分布 样本均数 的总体均数为 19 所以若随机变量X服从XN ( , s2) 的正态分布,则以之随机抽样计算的样本均数所构成的分布也呈正态分布。1. 样本均数的总体均数仍等于原来的总体均数。 2. 样本均数的标准差 叫做标准误 (stan

8、dard error of mean, SEM),记作 ,是描述均数的抽样误 差大小的指标。20中心极限定理【实验】:下图是一个正偏态分布,用电脑从中随机抽取样本含量分别为5、10、30、50的样本各1000次,计算样本均数,绘制直方图,并观察其样本均数的分布。非正态分布样本均数的抽样分布21n = 5n = 10n = 30n = 5022当样本容量足够大时(n 60) ,样本均数的抽样分布逐渐趋于正态分布偏态分布总体Xmmx=snsx=23 从偏态总体中抽样,当n足够大时(n大于60),其均数也近似于正态分布。样本均数的总体均数仍等于原来的总体均数。样本均数的标准差 仍叫做标准误,记作 。

9、24中心极限定理计算公式仍是:样本均数的标准误证明*25标准误 (standard error of mean,SME或SE)概念:样本均数的标准差简称标准误(standard error,SE)是描述均数的抽样误差大小的指标。数理统计研究表明,标准误 即抽样误差的大小具有一定的规律性,样本均数26标准误的意义:(1)标准误(standard error)是描述均数的抽样误差大小的指标,可用来衡量样本均数的可靠性;标准误越小,说明抽样误差越小,样本均数代表总体均数就越可靠。(2)用于参数估计。(3)用于假设检验。27标准误 (standard error,SE)概念:即样本均数的标准差,是描述

10、均数的抽样误差大小的指标。标准误的计算:标准误的理论值标准误的理论值的估计值s抽样误差n抽样误差 前提:无限总体完全随机抽样28举例:大规模普查得某地健康成年男子血红蛋白总体均数为 =135g/L,。若在其中进行随机抽样,样本量n=100,样本均数X=130g/L,S,求其理论标准误和样本均数的估计标准误。2. 样本均数的估计标准误:1.理论标准误:xsns=10020.5= 2.05g/LxSn S=10023.4= 2.34g/L解:29均数;标准差N(,2 )抽出n个的样本随机抽样原总体X1, X2, X3Xn样本均数X1, X2, X3Xn标准差与标准误的区别与联系均数;标准误 N(,

11、 2 ) XsXs30 = 50 =10X总体分布抽样分布X50=xmn =162.5=xs原变量样本均数31标准差与标准误的区别与联系标准差 标准误区别公式与n 关系n 增大,标准差趋于稳定。n 越大,标准误越小概念描述的是样本个体观察值的变异程度大小。描述的是样本均数的变异程度和抽样误差大小。意义小说明变量值围绕均数的波动小,均数对一组变量值的代表性好。小表示样本均数围绕总体均数的波动小,用样本推断总体的可靠性越强。用途与均数结合,描述观察值的分布范围,常用于估计医学参考值范围、计算变异系数、标准误等。均数结合,用于估计总体均数可能出现的范围,即可信区间,并用于假设检验。联系1.都是描述变

12、异程度的指标2.标准误与标准差成正比, n一定时,标准差越大,标准误也越大。32既往资料表明某市区新生女婴的平均出生体重为,标准差为0.59kg ;某研究者从该市区中随机抽取一个由100个女婴组成的样本,测得样本均数超过的可能性有多大?33 在正态总体N(168.18,62)中随机抽样,样本量分别取n =5,n =100,均抽10000个样本,分别计算u值和u值,其结果如下: 样本量统计量平均值P2.5P97.5n=5u0.0149031-1.9500671.969157u0.0319309-2.6542142.838163n=100u0.0033231-1.9508861.971245u0.

13、0347047-1.9811832.00040734样本含量n=5样本含量n=100(a) (b)u统计量的频数分布图(10000个样本),轮廓曲线为标准正态分布曲线35样本均数u转换中的实际问题 并不满足标准正态分布!在样本含量较大时它与标准正态分布接近,但是当样本含量较小时,它与标准正态分布相差较远36二、t分布37均数;标准差 N(,2 )原总体X1, X2, X3Xn样本均数X1, X2, X3Xn抽出n个的样本随机抽样均数;标准误N(, ) = 50 =10X总体分布抽样分布n =16X样本均数50=xm2.5=xs原变量38任意正态分布曲线 XN(,2)标准正态分布曲线XN(0,1

14、)u 变换 对于正态变量X 标准正态分布 39对样本均数的正态分布进行标准化t 分布若对抽样分布 进行标准化变换,有总体标准误40 实际工作中, 是未知的,所以常需以 代替。41 W.S.Gosett 研究它的分布规律,提出它不服从标准正态分布的规律,而服从=n-1的t 分布,后人用其笔名student命名,称之为students t-distribution,简称 t 分布。t分布:1-=nn=S-XmX-XmSnu分布t 分布故:42【实验】:从前述13岁女学生身高这个正态总体中分别作样本量为3或50的随机抽样,各取1000份样本,分别得到1000个样本的均数及其标准误,对它们分别作t 转

15、换,将t 值绘成直方图: 。n =3时的t分布n=50时的t分布所以,不同的自由度(=n-1)即有不同的 t 分布43【实验三】:从前述13岁女学生身高这个正态总体中分别作样本量为3或50的随机抽样,各取1000份样本,分别得到1000个样本的均数及其标准误,对它们分别作t 转换,将t 值绘成直方图: 。n =3时的t分布n=50时的t分布所以,不同的自由度(=n-1)即有不同的 t 分布 不同自由度的t 分布的曲线t 分布图形的特征:441. t分布的密度曲线呈单峰,曲线在t =0处最高,并以t=0为中心左右对称;t值可是正数,也可是负数。2. 与标准正态分布相比,曲线最高处较矮,两尾部较高

16、。3. t分布的概率密度曲线是一簇曲线,它只有一个参数 自由度;一但确定,其曲线形状即也确定。 越小,则t值越分散,曲线越低平,尾部越高;随着的逐渐增大, t分布曲线逐渐的逼近于标准正态曲线,t分布的极限分布是Z分布。4. t分布的概率密度曲线下面积有一定规律性,可通过查“t分布界值表”得到。t 分布图形的特征:45t 分布曲线下的整个面积为1;t 分布曲线下从a 到b 的面积为t 值分布在此范围内的百分比,即t 值落在此范围内的概率p。t 分布曲线下的面积分布规律:自由度为 的t 分布曲线ab046(三)t 界值表:以自由度为横标目,概率P为纵标目,表中数字表示当和 P确定时,对应的是正侧或

17、双侧的t 临界值表,记作t(,)或t(/2,) 。包括单侧概率的t 临界值,记作t(,)双侧概率的t 临界值,记作t(/2,)47自由度概率, P单侧:0.250.200.100.05 0.0250.01 0.005 0.00250.001 0.0005双侧:0.500.400.200.100.05 0.020.010.0050.0020.001 11.0001.3763.0786.31412.70631.82163.657127.321318.309636.619 20.8161.0611.8862.920 4.303 6.965 9.92514.089 22.327 31.599 30.7

18、650.9781.6382.353 3.182 4.541 5.841 7.453 10.215 12.924 40.7410.9411.5332.132 2.776 3.747 4.604 5.598 7.173 8.610 50.7270.9201.4762.015 2.571 3.365 4.032 4.773 5.893 6.869 60.7180.9061.4401.9432.4473.1433.7074.3175.2085.595 70.7110.8961.4151.8952.3652.9983.4994.0294.7855.408 80.7060.8891.3971.8602.3

19、062.8963.3553.8334.5015.041 90.7030.8831.3831.8332.2622.8213.2503.6904.2974.781100.7000.8791.3721.8122.2282.7643.1693.5814.1444.587110.6970.8761.3631.7962.2012.7183.1063.4974.0254.437120.6950.8731.3561.7822.1792.6813.0553.4283.9304.318130.6940.8701.3501.7712.1602.6503.0123.3723.8524.221140.6920.8681

20、.3451.7612.1452.6242.9773.3263.7874.140150.6910.8661.3411.7532.1312.6022.9473.2863.7334.073160.6900.8651.3371.7462.1202.5832.9213.2523.6864.015170.6890.8631.3331.7402.1102.5672.8983.2223.6463.965180.6880.8621.3301.7342.1012.5522.8783.1973.6103.92248附 表 2 t 界 值 表例1,求当=9,单尾概率时的 t界值表明:按t分布的规律,从正态分布总体中抽

21、取样本含量n=10的样本,则由该样本计算的t 值大于等于的概率为,或小于等于的概率亦为。查表得单尾 t,9,则: P(t 或:P(t 自由度为9 的t 分布49例1,求当=9,双尾概率时的 t界值表明:按t分布的规律,从正态分布总体中抽取样本含量n=10的样本,则由该样本计算的t值大于等于的概率为,小于等于的概率亦为。查表得单尾 t,9,则: P(t-2.228)+P(t2.228)或:P(-2.228t。自由度为9 的t 分布501. 相同 时,t 值越大,对应的尾部概率P就越小2. 相同t 值,双侧尾部概率是单侧尾部概率的2倍。51三、总体参数的估计52例:测得某地11名20岁男大学生 身

22、高,S,对该地20岁男大学生身高均数进行估计。由 估计?531.基本概念参数估计(Parameter estimation) :用样本信息估计总体参数。 包括点值估计( Point estimation ):不考虑抽样误差,直接用样本统计量 来作为总体参数 的估计值。区间估计(Interval estimation):考虑抽样误差,按一定的概率或可信度(1-)用一个区 间来估计总体参数的所在范围。54这个区间范围叫总体参数的1-的可信区间(confidence interval, CI )或置信区间。 一般取值或, 所以1-为或样本统计量 (点估计)可信区间下限上限55可信区间假设已知的样本均

23、数是从较小的m总体中抽取的,它成立的统计条件是从该总体中抽取一个样本,其均数为当前均数以及更大的可能性并非小概率事件56m=A已知的样本均数可信区间而如果从mA的总体中在一次抽样的前提下,几乎是不可能得到当前的样本的,因为它是一个小概率事件!57mB的总体中在一次抽样的前提下,几乎是不可能得到当前的样本的,因为它是一个小概率事件!59mB已知的样本均数m=B可信区间(confidence interval)因而如果m的取值在AB间,在一次抽样的前提下,是有可能得到当前的样本均数的这样就把区间(A,B)称为样本均数所来源的未知总体均数的可信区间60m=A已知的样本均数m=B可信度(confide

24、nce coefficient)我们之所以说m=A的总体像是样本所来源的总体,那是因为从它中得到该样本不是小概率事件但是小概率事件是有可能发生的,例如该样本真的来自于m100),t 分布逼近 u分布。按 u 分布原理计算置信区间。67 u -u 由于:则:所以,总体均数的100(1-)%之置信区间的通式为: 68例 测得某地110名18岁男大学生身高 =,估计该地18岁男大学生身高均数的95%可信区间。 本例n,s,双侧u=1.96 按式()计算: 69即:该地18岁男大学生身高均数的95%可信区间为173.49cm (3)已知:70故可按正态分布原理估计总体均数的可信区间,计算公式为: 未知

25、,且n小71已知:未知,但n足够大:三种情况单侧的可信区间*之前所述的可信区间均有上下限A与B;但是有时可能存在如下情况:专业知识提示样本均数不太可能从一个超过B的总体中抽取的,因为从该总体中抽取一个样本,其均数为当前均数以及更小的可能性是小概率事件;而对比B小多少却不作规定72m=B已知的样本均数只要总体均数小于B,这块阴影面积就将大于a,就不是小概率事件两总体均数差的可信区间正态分布的可加性特征:73两总体均数差的可信区间74例 测定28例结核病患者和34例对照者的脑脊液中镁(mmol/L)的含量,结果见下表,试估计结核病人和对照者的脑脊液中镁含量的总体均数之差的95%可信区间。 表 两对

26、比组脑脊液中镁含量(mmol) 组别 例数 均数 标准差结核组 对照组 75解:假定两组方差齐,根据公式3-12、13、14可得: 故两总体均数之差的95%可信区间为(0.16,0.32)mmol/L763.可信区间的确切含义77【实验】: 从前面某年某地所有女学生所构成的正态总体N 2),抽到100份随机样本,计算每份样本的95%可信区间。3.1. 1-可信度的含义: 78表 从正态总体 N 2) 抽到的100份随机样本的可信区间(n=30)样本号均数标准误95%可信区间样本号均数标准误95%可信区间1156.70.91154.8158.654155.60.92153.7157.52158.

27、10.95156.2160.155154.80.83153.1156.53155.61.6153.5158.156155.60.96153.6157.64155.21.03153.1157.357158.20.97156.2160.25155.01.01152.9157.058154.91.06152.7157.16156.41.08154.2158.659153.40.91151.5155.37154.91.12152.6157.18156.50.74154.9158.091155.10.90153.2156.99155.01.09152.8157.292156.61.03154.5158.

28、710155.90.98153.9157.993156.01.08153.8158.211156.90.98155.0158.994155.80.93153.9157.795156.10.83154.4157.849156.10.81154.5157.896152.70.75151.1154.250154.71.04152.6156.897155.10.93153.2157.051155.70.97153.7157.798155.30.90153.5157.252153.70.80152.1155.399154.60.71153.2156.153154.80.89153.0156.610015

29、6.61.16154.2159.0791-5%可信度实际含义: 从总体中进行随机抽样,共作100次抽样,每个样本可算得一个可信区间,得100个可信区间:平均有95个可信区间包括 (估计正确),只有5个可信区间不包括(估计错误)。80(1 - ) % 概率包含了; % 的概率未包含1 - aa/2a/2可信区间概念:总体均数的1-可信区间指一个范围,指该范围包含在内的可能性为1-,不包含在内的可能性为;常用1-为95%和99%,又称置信区间。可信限的概念:指可信区间的下限和上限,即两个端点值。可信区间是指以上、下可信限为界的一个范围,但不包含上下限两个值,故用( )表示,其为开区间。下可信限上可

30、信限81 95可信区间 99可信区间 公 式 区间范围 窄 宽 估计错误概率 大(0.05) 小(0.01) 区间的精确性 小 大 ( ) ( ) 99% 可信区间95%可信区间823.2.可信区间的评价我们取得未知总体参数的可信区间,如何评价这个区间到底好不好,可信不可信,实用性强不强?从可信区间的准确度与精确度两个方面进行评价83可信区间的准确度与精确度假设从13级研究生班中抽取一份样本n=10人,求得医学统计学学平均分为75分,标准差为10分,求总体平均分的可信区间?现有两位同学求得两个可信区间,甲同学为6090分 (99.9999%CI) , 乙同学的为7278分(60%CI)如何评价

31、?84可信区间的准确度与精确度从实用性角度来说,乙同学的结果应该更实用些区间的跨度只有6分,估计得很精确!但是从可靠程度来说,似乎甲同学的结果更值得信赖总体均数在该区间外的可能性几乎为0,该区间的可信度极高!85可信区间的准确度与精确度可信区间的可信度反映了其准确度,可信度越大,错误估计的可能性越小,结果越准确可信区间的跨度反映了其精确度,精确度越高,区间跨度越小,更趋于某一个点值但是,这二者的关系是“鱼和熊掌不可兼得”!86可信区间的准确度与精确度在样本含量与样本标准差固定的情况下,如果要获得精确的参数估计,则可信度必然下降极端的情况就是使用点估计,此时十分精确,但估计正确的可能性几乎为0!如果想要得到一个把握很大的参数估计,那么就要把区间扩大些,使得漏估计的可能性尽可能小,此时准确性很高极端的情况就是宣称“总体平均分应该在0100分间吧!”但是没有任何实用价值!87准确度与精确度的取舍根据研究目

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论