定量的参数估计和假设检验基础_第1页
定量的参数估计和假设检验基础_第2页
定量的参数估计和假设检验基础_第3页
定量的参数估计和假设检验基础_第4页
定量的参数估计和假设检验基础_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 定量资料(zlio)的参数估计和假设检验基础医学实验班总结:周璇 张思阳习题:王燕 陈芝羽共九十三页本章(bn zhn)重点中心极限定理标准误的概念及计算均数的参数估计(置信区间与医学(yxu)参考值范围的区别)计算题共九十三页学习(xux)内容一、抽样误差二、t 分布(fnb)三、参数估计共九十三页一、抽样误差抽样误差: 总体中个体变异(biny)的存在,在抽样过程中产生的样本统计量与总体参数间的差异以及样本统计量与样本统计量间的差异。两种表现形式: 样本统计量与总体参数间的差异 样本统计量间的差异 产生的基本条件:个体变异 抽样研究 共九十三页正态总体中抽样(chu yn)时样本均

2、数的抽样(chu yn)分布特点各样本均数未必等于总体均数(155.4cm);样本均数之间存在差异;样本均数的分布很有规律: 围绕着总体均数(155.4cm),中间多、两边少,左右基本对称,也服从正态分布。 样本均数的变异较之原变量的变异(5.3cm)大大(d d)缩小。 图1 从N (155.4, 5.32)抽样得到的样本均数的频数分布频率共九十三页中心(zhngxn)极限定理(central limit theorem)从正态分布总体N (,) 中随机抽样(每个样本的含量为n),可得无限多个(du )样本,每个样本计算样本均数,则样本均数也服从正态分布。样本均数的均数为 ;样本均数的标准差

3、为返回目录共九十三页标准(biozhn)误(standard error of mean,SEM或SE) 样本均数的标准差,也被称为均数的标准误,它反映了样本均数间的离散程度,也反映了样本均数与总体均数间的差异,说明均数抽样误差的大小。样本统计量(均数或率)的标准差称为标准误。公式(gngsh):在实际应用中可通过增加n来减小样本均数的标准误,从而降低抽样误差。注:S为样本标准差,n为样本含量。 往往不知道总体标差为均数标准误的估计值返回目录共九十三页 =5.3cm标准(biozhn)误:标准(biozhn)误:共九十三页 均数标准(biozhn)误的应用1、表示均数抽样误差大小,描述(n相同

4、)样 本均数的离散程度,反映用样本均数估计或推断总体均数的可靠性; 2、与样本均数相结合,用于估计总体均数的 置信(置信)区间 ; 3、用于进行均数的假设检验。共九十三页表3 标准(biozhn)差与标准(biozhn)误的区别与联系联系: 都是表示离散程度的指标(zhbio) 都与n大小有关共九十三页均数的参数估计置信区间的概念总体均数置信区间的计算1、 t分布法未知且样本(yngbn)例数n较小时,按t分布原理。2、正态分布法(1)已知,按标准正态分布原理计算(2)未知但样本例数n足够大(n50)时 ,由t分布可知,自由度越大,t分布越逼近标准正态分布,按标准正态分布原理计算注:指总体标准

5、差;n指的是样本含量。 返回(fnhu)目录共九十三页置信区间(confidence interval, CI) 按(1-)的概率或置信度,估计总体参数所在范围,称作置信度为(1- )的置信区间。 置信区间:结合样本统计量和标准误确定,具有较大置信度( 1 )可能包含总体参数。 置信区间通常由两个(lin )置信限构成,其中较小者称为下限,记为CL,较大者称为上限,记为CU。 (CL, CU)置信度:预先给定的概率( 1 )称为可信度(置信度),常取95%或99%。若无特殊说明,一般取双侧95%。共九十三页2. 两总体(zngt)均数之差的1置信区间 双侧共九十三页均数参数估计的计算(j su

6、n)步骤first:看已知or未知,n与50的关系(gun x)。未知,n50,t分布;已知或n50,正态分布。 计算自由度:v=n-1;查t介值表;按公式计算 :双侧置信区间表达式单侧置信区间表达式t分布正态分布-za/2za/2a/2a/21.若已知共九十三页2. 两总体(zngt)均数之差的1置信区间 双侧共九十三页t分布(fnb)的概念设从正态分布N (,2)中随机抽取 含量为n的样本(yngbn),样本(yngbn)均数和标准差 分别为 和s,则: t分布, = n 1则t值服从自由度为n-1的t分布(t-distribution)。共九十三页单峰分布,曲线以0为中心,左右对称类似于

7、标准正态分布。t分布的形状与自由度有关(yugun)自由度越小,则 越大,曲线越“扁平” ;自由度越大,则 越小,曲线越“瘦高” ;当自由度为无穷大时,t分布曲线与标准正态分布曲线完全吻合,故标准正态分布是t分布的特例。 双侧t0.05/2, 92.262 表明:从正态分布总体(zngt)中随机抽样,取样本含量n=10的样本,则由该样本计算的t值大于等于2.262的概率为0.025,小于等于-2.262的概率亦为0.025。 P(t-2.262)+P(t2.262)0.05 或:P(-2.262t50共九十三页置信区间与医学(yxu)参考值的区别置信区间指的是平均数()落在范围内有( 1 )的

8、可能性(往往为95%)。医学参考值指的是个体(gt)对应的值落在范围内有( 1 )的可能性(往往为95%)。共九十三页第五章 定量资料(zlio)的t检验共九十三页 通过假设检验判断两样本均数之间的差异(chy)是由于抽样误差所致还是由于来自不同的总体所致。 1 = 2?一、假设检验(Hypothesis test)的基本(jbn)思想2. 反证法:在假定H0(1 = 2 )成立的条件下,得出一个错误的结论或小概率事件,那么就有理由推翻H0,也就是说拒绝H0 ,接受H1 (1 2 ) 。3. 小概率原理共九十三页(一)假设检验的基本(jbn)步骤假设检验的方法很多,但其检验的基本步骤是一致的1

9、、建立(jinl)检验假设及确定检验水准 共九十三页假设(jish)有两种:1、检验假设(jish) 或 无效假设 或称 零假设 (Hypothesis to be tested,null hypothesis)用H0表示;2、备择假设(alternative hypothesis),用H1表示。H0和H1都是根据统计推断的目的提出的对总体特征的假设,是相互联系且对立的一对假设。共九十三页H0和H1含义及注意事项:1、检验假设是针对总体,而非样本;2、H0和H1是互相对立,不是可有可无,而是缺一不 可;3、H0无效假设,通常是某两个或多个总体参数相同 或总体参数之差为0,或某资料(zlio)服

10、从某一分布等;4、H1的内容反映出单侧还是双侧。共九十三页单侧、双侧问题(wnt)建立假设前,先要根据(gnj)分析目的和专业知识明确单侧检验还是双侧检验以及检验水准,不能在假设检验结果得出后再加以选择。共九十三页两样本均数所代表的未知总体(zngt)均数1与2 的比较目 的 H0H1双侧检验1 = 2 ?1 = 2 1 2单侧检验1 2 ?1 = 2 1 2 1 2 ?1 = 2 1 2 共九十三页检验(jinyn)水准(size of a test)符号为;也称显著性水准(significance level);是预先规定的概率值,它确定了小概率事件的标准。一般(ybn)常取0.05或0.

11、01;方差齐性检验与正态性检验时常取0.10或0.20; 存在单、双侧问题 共九十三页共九十三页2、选定检验(jinyn)方法及计算检验(jinyn)统计量 不同(b tn)分析目的、不同(b tn)设计类型和不同(b tn)资料类型,选用不同(b tn)检验方法。样本均数与总体均数比较用单样本t检验t值共九十三页 3、 确定P 值,作出统计(tngj)推断 算出样本统计(tngj)量t值后,查相应的t界值表,确定P 值选择检验方法的根据是什么?根据实验设计类型,选择检验方法实验设计 数据类型 检验方法完全随机设计(二样本)、多样本配对设计、配伍组设计共九十三页t 分布的发现使小样本统计推断成

12、为可能;以t 分布为基础的检验称为t 检验;t 检验的主要类型:单组样本资料的t 检验配对设计(shj)资料的t 检验两组独立样本资料的t 检验二 、t 检验(jinyn)共九十三页第一节 单组样本(yngbn)t检验(One sample t test)适用于样本均数与已知总体均数0的比较,其比较目的是检验样本均数所代表的总体均数是否与已知总体均数0有差别。已知总体均数0一般为标准值、理论值或经大量观察得到的较稳定的指标值。单样t检验的应用条件(tiojin)是总体标准差未知的小样本资料(如nt,则P。共九十三页同时减小型错误和型错误,唯一的方法(fngf)就是增加样本含量n 型错误(cuw

13、)与型错误示意图 (以单侧u检验为例) 样本量一定时,愈小,愈大1a即可信度(confidence level):重复抽样时,样本区间包含总体参数的可能性;1-称为检验效能(power of a test),也称把握度,意义为,当两总体确有差别,按检验水准,假设检验能发现其差别(拒绝H0)的能力。共九十三页注意事项 1. 假设检验结论正确的前提是样本资料必须能代表相应的总体,同时各对比组具有良好的组间均衡性,即各组间除了要比较的主要因素不相同外, 其它影响结果的因素应尽可能相同或基本相近。为了保证资料的可比性,严密的试验(shyn)设计随机抽样,随机分组共九十三页 2. 检验方法的选用及其适用

14、条件,应根据分析目的、研究(ynji)设计、资料类型、样本量大小等选用适当的检验方法。 t 检验是以正态分布为基础的,资料的正态性可用正态性检验方法检验予以判断。若资料为非正态分布,可采用数据变换的方法,尝试将资料变换成正态分布资料后进行分析。共九十三页3.正确理解差别有无(yu w)显著性的统计学意义 对假设检验结论中的“拒绝H0,接受H1”称为“有统计学意义”;“不拒绝H0”称为“无统计学意义”。不应把“有统计学意义”误解为差别很大,甚至在医学实践中有重要的价值;同理,也不应把“无统计学意义”误解为差别不大,或一定相等。共九十三页拒绝H0,可能产生I型错误;不拒绝H0,可能产生II型错误。

15、另外,是否拒绝H0不仅决定于被研究事物有无本质差异,还决定于抽样误差大小、检验水准的高低以及(yj)单侧、双侧检验,样本例数。 4. 结论不能绝对化 假设检验的结论是根据P值大小 作出的,不是百分之百(bi fn zh bi)的正确。共九十三页5. 上述检验方法应用条件t检验的应用条件:未知且n较小时,要求样本来自正态分布总体;两样本均数比较(bjio)时,还要求两样本所属总体的方差相等。但在实际工作中,与上述条件略有偏离时,也可应用。 u检验的应用条件:已知或未知但n足够大(如n100)。6.假设检验和可信区间的关系 假设检验用以推断总体均数间是否相同,而可信区间则用于估计(gj)总体均数所

16、在的范围。共九十三页方差分析基本思想:把全部观察值的不同(即总变异(biny))按设计和需要分解成两个或多个部分,不同设计中总变异(biny)的分解各有不同,其中一定包括随机误差,将其他部分的变异(biny)分别于随机误差进行比较,从而判断均数间的差别是否具有统计学意义。主要包括总变异,组间变异和组内变异。共九十三页第六章 定量(dngling)资料的方差分析本章重点完全随机设计资料方差分析要求:掌握基本步骤,能看懂相关表格。可能题型:计算题(详见P63例题)有大量计算(j sun)的概率:较低共九十三页60 是采用完全(wnqun)随机化的分组方法,将全部试验对象分配到g个处理组(水平组),

17、各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。完全(wnqun)随机设计 (completely random design)共九十三页61统计分析方法(fngf)选择:1. 对于正态分布且方差齐同的资料,常采用(ciyng)完全随机设计的单因素方差分析(one-way ANOVA)或成组资料的 t 检验(g=2);2. 对于非正态分布或方差不齐的资料,可进行数据变换或采用Wilcoxon秩和检验。共九十三页方差分析的应用(yngyng)条件各样本(yngbn)是相互独立的随机样本(yngbn)各样本来自正态分布各样本方差相等,即方差齐。共九十三页

18、 例:某医生为了研究一种降血脂新药(xn yo)的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组,进行双盲试验。6周后测得低密度脂蛋白作为试验结果,见表3。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?共九十三页共九十三页建立假设,确定检验(jinyn)水准 H0:1=2=3 =4 H1:各总体均数不等或不全相等 0.05共九十三页66记总均数为 ,各处理(chl)组均数为 ,总例数为Nnl+n2+ng,g为处理组数。 共九十三页计算总的离均差平方和:SS总 即所有(suyu)病例混合后,每个病例与总的均数相减后求离均差平方和。 总=N-167其中(

19、qzhng):共九十三页将总的变异分解为误差导致的变异和其他因素导致的变异。SS总 SS误差SS其他因素。 SS误差:由于某个(mu ) 组内的病例的均有同样的非随机因素(都吃同一种药),所以组内病例间的差别就之剩下随机误差导致的变异了。 所以SS误差等于每组内的离均差平方和,然后各组相加。将SS误差称为SS组内。组内=(ni-1)gNg共九十三页SS其他因素:这里只有一个(y )非随机因素分组因素,即服药不同, 故SS其他因素可以称为SS组间。由于每组的差异可能是由于服药不同而引起。所以用每组的均数减总的均数的平方乘以组例数,再将每组加起来。 组间=g-1 均方差(fn ch),均方(mea

20、n square,MS)。 共九十三页三者之间的关系(gun x)SS总= SS组内+ SS组间总= 组内+ 组间共九十三页4、计算 (SS组间/1) _ (SS组内/ 2) F= (MS组间)/(MS组内)5、根据P值进行推断 计算出统计量F,求出对应的P值,与进行比较,以确定是否为小概率事件。 如是(r sh)小概率事件,则MS组间MS组内的可能性不大,则说明组间因素,即服用不同的降血脂药降血脂的效果是不同的。共九十三页详细(xingx)解答过程共九十三页73完全随机(su j)设计方差分析表列方差分析表共九十三页用t检验与方差分析处理(chl)资料的区别比较内容 t检验 方差分析资料的利

21、用率 低:每次仅用两组 高:每次要用全部数据对原实验设计的影响 残:割裂了整体设计 全:与原实验设计相呼应犯假阳性错误的概率 大:1-(1-0.05)6 =0.265 小:0.05结论的可靠性 低:统计量的自由度小 高:统计量的自由度大 注意(zh y): 三组或三个组以上设计的完全随机设计均数进行比较时不可用t检验!共九十三页随机区组设计(shj)资料的方差分析随机区组设计(randomized block design),又称配伍组设计。是双因素(yn s)设计的方差分析,使用多因素(yn s)方差分析的方法。实验设计中常按影响试验结果的非处理因素(如性别、体重、窝别等)配成区组(bloc

22、k),再将区组内的受试对象随机分配到各组。该法统计检验效能较高。缺点是较繁琐。共九十三页变异(biny)之间的关系:SS总= SS误差+ SS组间+ SS区组间总= 误差+ 组间+区组间离均差(jn ch)平方和与自由度的分解SS误差=SS总- SS组间-SS区组间误差=总-组间-区组间MS区组=SS区组/v区组 MS误差=SS误差/v误差共九十三页基本(jbn)步骤1. 建立假设(设有三个处理组,五个区组) 处理组间:H0: 3个总体均数全相等(xingdng) H1: 3个总体均数不全相等 区组间: H0: 五个总体均数全相等 H1: 五个总体均数不全相等2. 确定检验水准 0.053.

23、分解方差,计算F值4. 用F值进行统计推断,得到P值共九十三页分析(fnx)思路 随机区组设计总变异: 处理组间变异 (1) (1) 与 (3) 比较 区组间变异 (2) (2) 与 (3) 比较 误差变异 (3)解决问题: 1、处理因素(yn s)引起的变异有无显著性 2、区组因素(体重因素)引起的变异有无显著性 3、我们一般关心的是处理因素引起的变异共九十三页 F1=MS组间/MS误差(wch) F2=MS区间/MS误差自由度: 总=例数-1 组间=组数-1 区组间=区数-1 误差=(组数-1)(区数-1)共九十三页两两比较(bjio)问题方差分析只能对所有均数间整体有无差别而言,至于某对均数间有无差别还需要进一步分析。即尚未指出(zh ch)哪几个组均数间的差别具有或不具有统计学意义。为了得到这方面的信息,可进行多个样本间的两两比较

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论