数值变量资料的统计推断1课件_第1页
数值变量资料的统计推断1课件_第2页
数值变量资料的统计推断1课件_第3页
数值变量资料的统计推断1课件_第4页
数值变量资料的统计推断1课件_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,一、均数的抽样误差和标准误 二、t分布 三、总体均数估计,第六章 总体均数的估计,2,现实中的研究过程,3,统计推断,采用抽样研究的方法,由某总体中随机抽取一个有代表性的样本,并根据样本提供的信息(统计量)推断总体特征、性质(参数)的过程称为统计推断 statistical inference,4,统计推断,统计推断包括两个重要的方面: 一是利用样本统计量的信息对相应总体参数值做出推断,如用样本均数估计总体均数,用样本标准差估计总体标准差等,称之为参数估计 另一个是利用样本统计量来推断我们是否接受一个事先关于总体的假设,称之为假设检验,5,使用样本统计量过程中的问题,不同的研究者对相同的总体作类似的抽样研究可能会得到不同的样本统计量 各自用样本统计量估计总体的参数,样本统计量与总体参数间是否完全相等?如何评价他们的准确性?,6,已知某地高中三年级男生的身高满足正态分布,其平均身高为168.15厘米,这里,将该地高中三年级男生的身高视为一个总体。现从该总体中随机抽样5次,每次抽取一个样本含量n=10的样本,得到的5个样本的数据及各样本均数如下:,一、均数抽样误差和标准误,7,8,各个样本均数之间都不相同抽样误差表现形式之一 各个样本均数都不等于总体均数,有的比总体均数大,有的比它小抽样误差表现形式之二 相对于各样本的个体值,样本均数间的变异程度较小,样本均数的特点,9,样本均数的抽样分布,仍以某地高三男生的身高为例,设身高变量为x,假定x服从正态分布,记为xN(168.15, 62) 从总体X中反复随机抽样,样本含量分别为n=4,n=16和n=36,分别随机抽10000个样本并计算样本均数,把同一样本含量的10000个样本均数视为一个新的样本资料作频数图,10,从正态分布总体N(168.15,62)中随机抽样10000次的结果 曲线是正态总体N(168.15,62)的概率密度曲线 直方图为正态分布总体N(168.15,62)的样本均数的频率密度图,11,大多数的样本均数相互之间存在差异,绝大多数的样本均数不等于x的总体均数 样本均数的集中趋势位置与个体资料x的集中趋势位置较为接近,样本均数的频数图均呈现出中间多、两边少且基本对称的正态分布特征。 样本均数的分布范围较个体值小;随着样本含量的增大,样本均数的频数分布范围越来越窄 每种样本量的10000个样本均数值所计算出的样本均数的标准差都非常接近 (为个体资料x的总体标准差,n为个体数),样本均数的分布规律,12,理论上可以证明:从正态分布的总体 中随机抽取样本含量为n的一批样本,样本均数 有如下性质 : 样本均数 服从正态分布 样本均数 的总体均数为,样本均数的分布规律,13,样本均数的标准误,为了与个体的标准差相互区别,样本均数的标准差又称为样本均数的标准误standard error, SE,或理论标准误 反映了样本均数间的离散程度,如果SE很大则不同的样本均数间参差不齐,同时样本均数的分布范围较大,也反映了样本均数与总体均数间的差异可能较大,因而标准误反映均数抽样误差的大小;它与总体标准差成正比,与总体中的个体数的平方根成反比 代表样本均数的标准误,其表达式为,14,均数的标准误的影响因素,从标准误的计算公式中看出它与原先个体观察值的总体标准差s有关,同时也和样本含量n有关 在固定样本含量的情况下,总体标准差越大,则样本均数间越参差不齐,抽样误差越大;但是总体标准差是参数,在抽样之前就已经存在,无法改变它的大小 故可行的方法是通过扩大样本含量减少标准误;从而减少抽样误差,15,均数标准误的估计值,由于在实际研究中,我们往往只抽一次样,得到一个样本均数,而且大多数情况下s未知,此时常用样本标准差S估计总体标准差s,这样我们就得到样本均数标准误的估计值 抽样误差越小,表示样本均数与总体均数越接近,用样本均数估计总体均数的可靠性越高;反之则越低,16,例6.1随机抽取某地正常成年男性200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L,试估计抽样误差:,17,例子6.2 两文献表述有何区别,18,在应用过程中要注意标准差和标准误的区别:,19,1)两者均为变异指标; 2)样本含量不变时,均数的标准误与标准 差成正比; 3)两者均可与均数结合使用(但描述的内 容各不相同)。,两者联系,20,二、t分布,对于某个资料,其个体变量 服从正态分布,记作:,个体值正态分布,21,u值标准正态分布,对服从正态分布的个体变量值 作下列转换: 变量值u也服从正态分布,记作,经过Z转换后的变量值u1、u2、u3,22,样本均数正态分布,23,样本均数u转换标准正态分布,u1 u2 u3,24,既往资料表明某市区新生女婴的平均出生体重为3.10kg,标准差为0.59kg 。某研究者从该市区中随机抽取一个由100个女婴组成的样本,请问出现样本均数超过2.87kg算不算是小概率事件?,25,样本均数标准正态性转换中的实际问题,要对样本均数进行u转换,必须要知道总体的标准差s;但是在实际的情况下,并没有对总体中所有的个体进行观察,所以无法得知 s;而且通常我们也只作一次抽样研究,只能得到s ,只能用样本标准误的估计值 估计 那么 是否仍然满足标准正态分布? 假定 ,我们比较一下u与u之间是否存在不同,26,在正态总体N(168.18,62)中随机抽样,样本量分别取n =5,n =100,均抽10000个样本,分别计算u值和u值,其结果如下:,u vs. u,27,28,上述10000个样本所计算出的u值和u值的平均值都非常接近标准正态分布的集中位置0 对于u值而言,无论n=5和n=100,u值的P2.5和P97.5都十分接近标准正态分布95的双侧分位点1.96 ;但对于u值而言,样本量n=5时,其P2.5和P97.5明显远离1.96,而样本量n=100时,u值的P2.5和P97.5相对比较靠近 当样本量较大时,同样可以发现统计量u的频数图与标准正态分布曲线非常接近,而当样本含量较小时,统计量u的分布与标准正态分布则有所区别峰较矮,尾部较高,数据相对u值分散,u vs. u,29,u的分布,并不满足标准正态分布! 在样本含量较大时它与标准正态分布接近,但是当样本含量较小时,它与标准正态分布相差较远,30,William Sealey Gosset (1876-1937),Gosset invented the t -test to handle small samples for quality control in brewing (Guinness). He wrote under the name “Student“.,31,t分布,32,t分布曲线是单峰的,且关于t = 0对称,这一特征与标准正态分布很相似,33,当自由度v改变时(实际上是样本含量n改变时),t分布曲线的形态也不一样,因此t分布是一簇分布;而标准正态分布是唯一的,34,v越小(n越小)则标准误越大,样本均数经过t转换后的t值越分散,t分布的峰越低矮,而且尾部翘得也越高;当自由度逼近,因s逼近s,t分布也逼近u分布,所以标准正态分布是t 分布的特例,35,t分布曲线的特征,t分布是一簇分布 t分布的形态随自由度v改变而改变 t分布是单峰分布,关于t0对称 v越小,t分布曲线也越矮胖,当v趋向无穷大时,t分布无限逼近标准正态分布(u分布),36,t分布曲线下面积,与标准正态分布曲线下面积的算法一样,都是采用微积分的方法 其含义也与标准正态分布曲线下面积接近,表示某个样本含量(自由度)的样本均数经t转换后t值落在某个区间的概率有多大 与标准正态分布不同,t分布曲线下面积为95%或99%的界值不是一个常量 ,因为对于不同的自由度取值,就有不同的t分布曲线,37,t分布曲线下面积,统计学家为了计算方便编制了t分布曲线下面积表 在t值表中,横标目为自由度 v,纵标目为概率(P或)。一侧尾部面积称为单尾概率(one-tailed probability),两侧尾部面积之和称为双尾概率(two-tailed probability),38,t分布曲线下面积,可见如果t值越远离0,它所对应的单侧或双侧尾部面积就越小 即 越大,曲线下面积a或a/2越小 通常使用不同的符号:t a ,v、 t a/2 ,v区别单侧或双侧的曲线下面积 另外如果在相同自由度的情况下,双侧0.05的曲线下面积=单侧0.025的曲线下面积,39,求自由度v为10,单尾概率a=0.05时的t界值,并简述其含义 由表中查得单侧t0.05,101.812 从一个正态总体中随机抽样,每次抽11个个体,分别计算各个样本的均数与标准差,并对之进行t转换后,理论上有P(t-1.812)= 0.05或P(t1.812)= 0.05,40,求自由度v为100,双尾概率a=0.05时的t界值,并简述其含义 由表中查得双侧t0.05/2,1001.984 从一个正态总体中随机抽样,每次抽101个个体,分别计算各个样本的均数与标准差,并对之进行t转换后,理论上有 P(t-1.984)P(t1.984)= 0.05,41,样本均数的抽样分布小结,从总体均数为m,总体标准差为s的正态分布的总体中抽样,每次样本含量均为n,样本均数X满足正态分布N( m, sx2) 如果未知总体标准差,样本均数无法作u转换,而需作t转换,t值满足自由度为n-1的t分布 在n较大(n100)时,t值接近u值,42,三、总体均数的估计,参数估计parameter estimation :用样本的统计量估计所来源总体的参数 估计的方法有以下两种:点估计与区间估计,43,点估计point estimate:用样本的估计量直接作为总体参数的估计值;例如,用样本均值直接作为总体均值的估计 其方法简单,但未考虑抽样误差的大小,点估计,44,为了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取了1岁婴儿25人,测得其血红蛋白的平均数为123.7gL,标准差为11.9gL;试估计该地1岁婴儿的血红蛋白的平均浓度 本例样本均数为123.7gL, 若用点值估计,则该地1岁婴儿血红蛋白浓度的总体均数为123.7gL 通常情况由于抽样误差的存在下样本均数并不与总体均数相等,而且不同的抽样研究样本均数也会不同;因而对于一个连续性随机变量来讲,样本均数=总体均数的可能性为0 所以对于总体均数的估计,使用点估计的方法是不理想的,45,区间估计,区间估计interval estimate:在点估计的基础上,结合抽样误差的大小,给出总体参数估计的一个区间范围(由上、下限构成的可信区间) 该区间按照一定的概率可能性,包含所推断的总体参数,46,可信区间,假设已知的样本均数是从较小的m总体中抽取的,它成立的统计条件是从该总体中抽取一个样本,其均数为当前均数以及更大的可能性并非小概率事件,47,可信区间,而如果从mA的总体中在一次抽样的前提下,几乎是不可能得到当前的样本的,因为它是一个小概率事件!,48,可信区间,假设已知的样本均数是从较大m的总体中抽取的,它成立的统计条件是从该总体中抽取一个样本,其均数为当前均数以及更小的可能性并非小概率事件,49,可信区间(confidence interval),而如果从mB的总体中在一次抽样的前提下,几乎是不可能得到当前的样本的,因为它是一个小概率事件!,50,可信区间(confidence interval),因而如果m的取值在AB间,在一次抽样的前提下,是有可能得到当前的样本均数的 这样就把区间(A,B)称为样本均数所来源的未知总体均数的可信区间,51,可信度(confidence coefficient),我们之所以说m=A的总体像是样本所来源的总体,那是因为从它中得到该样本不是小概率事件 但是小概率事件是有可能发生的,例如该样本真的来自于mA的总体,此时我们的结论:“只有总体均数取值在(A,B)间的总体才是样本所来源的”就是错误的 错误的可能性有多大?就是小概率事件发生的概率a;也就是说不发生的可能性为1-a,这就是我们结论正确的概率,所以1-a称为可信度,52,可信区间与可信度,按预先给定的概率(1-a)确定的包含未知总体参数的可能范围,该范围通常称为参数的可信区间或置信区间(confidence interval,CI); 预先给定的概率(1-a)称为可信度或置信度(confidence level),常取95或99,53,可信区间的计算方法,总体均数可信区间的计算方法,随总体标准差s是否已知、样本含量n的大小而异 ,通常有以下两种计算方法: t分布法 u分布 法,54,可信区间的计算原理u分布法,55,可信区间的计算原理u分布法,0,99% 的u值,- 2.58,2.58,95% 的u值,-1.96,1.96,56,可信区间的计算原理u分布法,由标准正态分布曲线下个面积的规律,可知:,57,可信区间的计算原理t分布法,如果总体标准差在研究开始之前无法预知(这是最常见的情况),则我们无法对样本均数作u转换,只能作t转换:,58,可信区间的计算原理t分布法,当样本含量较大(n100),由于ta/2,v与ua/2十分接近,故上述公式可以近似表达为:,59,例,某地27健康成年男性的血红蛋白均数为125g/L, 标准差为15g/L。假定血红蛋白值服从正态分布, 试估计总体均数的95%置信区间和99%置信区间 解:,60,例,248名健康成年女性血红蛋白值,其均数为118.8 g/L,标准差为10.6g/L,估计健康成年女性血红蛋白值的95%可信区间 解:,61,可信区间的评价,我们取得未知总体参数的可信区间,如何评价这个区间到底好不好,可信不可信,实用性强不强? 从可信区间的准确度与精确度两个方面进行评价,62,可信区间的准确度与精确度,假设从急救医学生中抽取一份样本n=10人,求得预防医学平均分为75分,标准差为10分,求总体平均分的可信区间? 现有两位同学求得两个可信区间,甲同学为6090分 (99.9999%CI) , 乙同学的为7278分(60%CI) 如何评价?,63,可信区间的准确度与精确度,从实用性角度来说,乙同学的结果应该更实用些区间的跨度只有6分,估计得很精确! 但是从可靠程度来说,似乎甲同学的结果更值得信赖总体均数在该区间外的可能性几乎为0,该区间的可信度极高!,64,可信区间的准确度与精确度,可信区间的可信度反映了其准确度,可信度越大,错误估计的可能性越小,结果越准确 可信区间的跨度反映了其精确度,精确度越高,区间跨度越小,更趋于某一个点值 但是,这二者的关系是“鱼和熊掌不可兼得”!,65,可信区间的准确度与精确度,在样本含量与样本标准差固定的情况下,如果要获得精确的参数估计,则可信度必然下降 极端的情况就是使用点估计,此时十分精确,但估计正确的可能性几乎为0! 如果想要得到一个把握很大的参数估计,那么就要把区间扩大些,使得漏估计的可能性尽可能小,此时准确性很高 极端的情况就是宣称“总体平均分应该在0100分间吧!”但是没有任何实用价值!,66,准确度与精确度的取舍,根据研究目的与性质取舍 如果没有特殊要求,应该以准确度为主,在保证估计准确的情况下通过适当增大样本含量的方法,改善区间的精确度 所以通常求95的CI,同时保证样本含量,67,区别点 均数的可信区间 参考值范围 意义 包含总体均的可 “正常人”的解剖、生理 能范围 生化指标的波动范围 计算公式 用途 估计总体均数 判断观察对象的某 项指标是否正常,均数可信区间与参考值范围的区别,68,第七章 假设检验,69,法官的判决,法庭上,陪审团需要建立以下两种假设: 事先并不知道哪种假设是正确的,需要根据呈庭证供,才可下结论,无罪,有罪,70,胎儿的性别,有人声称能够预测胎儿的性别,我们对此有两种假设: 事先并不知道哪种假设是正确的,需要根据她推测的结果,才可下结论,无此能力,有此能力,71,商家信誉,某商家宣称他所卖的鸡蛋绝对新鲜,可以达到“百里挑一”;是否可以相信商家信誉? 事先并不知道哪种假设是正确的,需要对其鸡蛋检验后,才可下结论,商家有信誉,商家无信誉,72,?,否定,肯定,73,胎儿性别统计学的思维方式,女士说她可以预测胎儿的性别 暂时认为她是瞎猜,每个孕妇被猜对的可能性均为50% 让她对6个孕妇作推断,结果是全部说对了;在瞎猜的情况下,全对的可能性为0.56=0.015625 在一次试验中出现小概率事件是不太可能的,故认为她真的有这种能力!,74,关于商家信誉,某商家宣称他所卖的鸡蛋绝对新鲜,可以达到“百里挑一”;结果有人买了10个鸡蛋,其中2个坏了,是否还可以相信商家广告? 暂时认为商家是有信誉的,在此前提下10个鸡蛋中出现2个或更多变质的可能性为0.004,是小概率事件! 但是对于该顾客而言,他仅仅购买了一次,就碰上了小概率事件,所以商家的信誉度值得怀疑,75,假设检验,先对总体的参数提出某种假设,然后利用样本信息判断是否拒绝该假设过程 反证法 + 小概率事件原理,76,假设检验hypothesis test:先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程 逻辑上运用反证法(暂且认为总体的情况如此,而后看样本信息是否能够驳倒原先的假设),统计上依据小概率原理(如果样本的情况属于小概率事件,那么小概率事件不应该在一次抽样的情况下发生),77,假设检验的基本步骤,例:已知一般健康男性的脉搏均数为72.0次/分,标准差为6.0次/分;某医生在某山区随机抽取了25名健康成年男性,测得他们的脉搏均数为74.6次/分,问该山区男性的脉搏均数是否高于一般健康成年男性?,78,假设检验的基本步骤,从资料提供的信息来看,样本均数74.6与总体均数72.0不相等,其原因可有以下两个方面: 样本对应的总体均数等于72.0,差别仅仅是由于抽样误差所致; 该地区的男性的脉搏均数与一般男性存在本质上的差异:高海拔导致脉搏较快? 两种情况只有一个是正确的,且二者必居其一,需要我们作出选择。,79,假设检验的基本步骤 :建立假设,步骤1:建立假设 在假设的前提下有规律可寻 无效假设null hypothesis,记为H0,表示目前的差异是由于抽样误差引起的 备择假设alternative hypothesis,记为H1,表示目前的差异是主要由于本质上的差别引起,80,研究者想收集证据予以反驳的假设 总是含有符号 “”,又称“0假设” 总是针对未知的总体参数作假设 表示为 H0,记为H0:m = 某一数值;表示样本所来源的总体参数某具体数值,无效假设,81,研究者想收集证据予以支持的假设 又称为“研究假设”,总是含有符号“ ” 同样总是针对样本所来源的总体参数 表示为H1,记为H1:m 某一数值(单侧) m某一数值(单侧) m 某一数值(双侧),对立假设,82,两种假设间的关系,对立性:两种假设是“水火不相容”,有且只有一个能成立 互补性与完整性:两种假设的集合应该包括所有的可能性(例如:H0:山区男性脉搏均数等于一般+H1:高于一般=脉搏均数不会低于一般) 无效假设是简单的;而备择假设是复杂的(未知总体均数=72.0,它所阐述的情况单一;备择假设:总体均数72.0,并没有指明具体值,那么总体的情况是很复杂的) 根据备择假设的取值趋向,将假设分为双侧或单侧(如果仅仅是含有“” ,则称为双侧;而具体指明是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论