定量资料的统计推断_第1页
定量资料的统计推断_第2页
定量资料的统计推断_第3页
定量资料的统计推断_第4页
定量资料的统计推断_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第3章定量资料统计推断第1页2统计推断(statisticalinference)总体参数估计假设检查第2页3总体Α是100例正常成年男子血红蛋白(单位:g/L),从中随机抽取样本a1

和样本a2

;总体B是另外100例正常成年男子红细胞数,从中随机抽取样本b

;三个样本含量均为10例,有关数值如下:总体µσa1/b1a2A1307.5131.9128.3B1408.2138.2第3页4当A和B总体参数已知时a1-a2抽样误差a1-b1本质差异第4页5假如事先不懂得A和B是不是同一种总体a1-b1抽样误差本质差异?A≠BA=B第5页6如何处理上述问题?其关键工作就是判断两个样本统计量间差异究竟是不是由于随机抽样所造成。假如是抽样误差所致,那么它有一定统计学规律,能够用前面所介绍正态分布、t分布等办法计算、估计;不然就表达它们间差异不是抽样造成——来自不一样总体!如何辨别两个样本是否属一种总体或两个不一样总体,并对总体作出合适结论?第6页7假设检查基本思想:女士和牛奶女士说她能够识别出加奶和水次序,为了证明她能力,请她对十杯牛奶进行辩别,成果十杯所有说对了。假设:她在耍大家假如她都是瞎猜,却所有正确。这样概率为多少呢?以为在假设成立时在一次试验中出现小概率事件是不也许,故断定假设不成立。第7页8商家和鸡蛋某商家宣称他一大批鸡蛋“变质率为1%”。为了对这批鸡蛋质量做出判断,顾客与商家商定,从中随机抽取5个做检查。成果为4个“好蛋”,1个“坏蛋”。

“变质率为1%”?第8页9该假设变质率为1%

,则在5个鸡蛋中,出现1个及以上变质鸡蛋概率为假如假设成立,发生该现象机会应当很小(0.049),即小概率事件。不过对于该顾客而言,他仅仅购买了一次,就碰上了小概率事件,因此商家信誉度值得怀疑

原假设是否成立?第9页10假设检查基本目标就是辨别两个或多种样本是否属一种总体或不一样总体,并对总体作出合适结论。

第10页11假设检查(hypothesistest)

先对总体参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立过程。逻辑上利用反证法(暂且以为总体情况如此,而后看样本信息是否能够驳倒原先假设),统计上根据小概率原理(假如样本情况属于小概率事件,那么小概率事件不应当在一次抽样情况下发生)第11页12假设检查基本思想提出一种假设假如假设成立,计算现有样本以及比它更极端也许性也许性很小(小概率事件),在一次试验中本不该得到,竟然得到了,说明我们假设有问题,回绝之。有也许得到手头成果(非小概率事件),故根据现有样本无法回绝事先假设(没理由)第12页13例1

样本:随机抽查25名男炊事员血清总胆固醇,求得其均数为5.1mmol/L,标准差为0.88mmol/L。问题:该单位食堂炊事员平均血清总胆固醇含量是否与健康成年男子平均血清总胆固醇相同(健康成年男子平均血清总胆固醇为4.6mmol/L)。第13页14假设检查一般步骤

从资料提供信息来看,样本均数5.1与总体均数4.6不相等,其原因可有下列两个方面:样本对应总体均数等于4.6,差异仅仅是由于抽样误差所致;(偶尔、随机、较小)除抽样误差外,该单位食堂炊事员与健康男性存在本质上差异:偷东西吃?。(必然、大于随机误差)两种情况只有一种是正确,且二者必居其一,需要我们作出推断。

第14页15假设检查一般步骤

步骤1:建立假设在假设前提下有规律可寻

零假设(nullhypothesis),记为H0,表达目前差异是由于抽样误差引发。备择假设(alternativehypothesis),记为H1,表达目前差异是主要由于本质上差异引发。第15页16研究者想搜集证据给予辩驳假设总是具有符号“=”,又称“0假设”总是针对未知总体参数作假设表达为H0,记为H0:m=某一数值;表达样本所起源总体参数=某详细数值原假设(nullhypothesis)第16页17研究者想搜集证据给予支持假设又称为“研究假设”,总是具有符号“≠”同样总是针对样本所起源总体参数表达为H1,记为H1:m>某一数值(单侧)

m<某一数值(单侧)

m

≠某一数值(双侧)对立假设(alternativehypothesis)第17页18建立假设前,先要根据分析目和专业知识明确单侧检验还是双侧检验。如何确定单侧检验还是双侧检验?

样本均数(其总体均数为

)与已知总体均数

0比较目标H0

H1双侧检查是否

0

=

0

0单侧检查是否

>

0

=

0

>

0或是否

<

0

=

0

<

0

第18页19假设检查一般步骤H0:

=4.6,该单位炊事员与正常人平均血清总胆固醇相等;(差异仅仅是由于抽样误差所致)H1:≠4.6,该单位炊事员与正常人平均血清总胆固醇不等。(本质上差异)

H0假设比较单纯、明确,且在该假设前提下就有规律可寻。而H1假设包括情况比较复杂。因此,检查是针对H0。

第19页20假设检查基本步骤:确定α步骤2:确立检查水准α(significancelevel)用于确定何时回绝H0

概率究竟小到什么程度才称为小概率事件是由研究者事先确定,有时取0.01,有时取0.05,甚至0.2。事实上小概率事件标准就是检查水准α

,一般情况下我们取0.05不过假如小概率事件发生了,我们结论就犯错了!错概率又是多少?就是α请注意:由于用到了小概率事件原理,我们结论最后不是完全肯定,而是带有一定概率性!第20页21假设检查一般步骤步骤3:计算检查统计量和P值计算检查统计量即计算样本与所假设总体偏离;样本均数与总体均数

0

间差异能够用统计量t来表达:

第21页22假设检查一般步骤根据抽样误差理论,在H0假设前提下,统计量t服从自由度为n-1t分布,即t值在0附近也许性大,远离0也许性小,离0越远也许性越小。第22页23本例中已知n=25,=5.1(mmol/l),s=0.88(mmol/l),

0=4.6(g/l),则检查统计量t:第23页24假设检查一般步骤计算概率PP值含义为:当H0成立情况下,取得现有统计量以及更不利于H0统计量也许性有多大即与统计量t值对应概率;即在H0成立前提下,取得现有这样大标准t离差以及更大离差|t|≥2.841也许性;查自由度为24t界值表P=P(|t|≥2.841)<0.05第24页25假设检查一般步骤0-2.0642.0640.0250.025t第25页26假如P≤a,则表达在H0成立情况下,出现目前样本以及比目前更极端情况概率是小概率事件,根据小概率事件原理,现有样本信息不支持H0,因而回绝H0若P>a,则表达在H0成立情况下,出现目前样本以及比目前更极端情况概率并非小概率事件,根据目前样本信息还不足于回绝H0因此结论要么为回绝H0,要么不回绝H0;并且它们都是有概率性,无论是两种中哪一种,都有也许患错误!

假设检查一般步骤:结论

第26页27根据t分布曲线下面积分布规律(抽样分布规律),在H0成立前提下出现现有差异或更大差异也许性P(|t|≥2.841)不大于0.05,是小概率事件,这在一次试验中是不太也许发生。然而不太也许发生事件在一次试验中竟然发生了,即现有样本信息不支持H0。因此,回绝H0。本例P<0.05,按

=0.05水准,回绝H0,接收H1,差异有统计学意义。以为该单位炊事员血清总胆固醇平均水平不等于正常人。第27页28若P>0.05,说明在H0成立前提下出现现有差异或更大差异也许性P(|t|≥2.841)不是小概率事件,因此,没有理由回绝H0。可见,抉择标准为:当P≤

时,回绝H0,接收H1;当P>

时,不回绝H0。第28页29统计推断总结(1)选择检查办法建设检查假设确定检查水准(2)计算统计量确定p值结论P≤

回绝H0,接收H1P>

不回绝H0第29页30假设检查基本步骤例:已知北方小朋友前囟门闭合月龄为14.1月;某研究人员从东北某县随机抽取36名小朋友,求得囟门闭合月龄均值为14.3个月,标准差为5.08个月;问该县小朋友前囟门闭合月龄是否大于一般小朋友?第30页31假设检查基本步骤从资料提供信息来看,样本均数14.3与总体均数14.1不相等,其原因可有下列两个方面:样本对应总体均数等于14.1,差异仅仅是由于抽样误差所致;该地域小朋友前囟门闭合时间与一般北方小朋友存在本质上差异:营养不良造成囟门闭合时间后移?两种情况只有一种是正确,且二者必居其一,需要我们作出选择。第31页32假设检查基本步骤:

建立假设H0:

=14.1,该县小朋友前囟门闭合时间与正常小朋友相同H1:>14.1,该县小朋友前囟门闭合时间比正常小朋友推迟(不过详细推迟多少不懂得)

H0假设比较单纯、明确,且在该假设前提下就有规律可寻。而H1假设包括情况比较复杂。因此,检查是针对H0。第32页33假设检查基本步骤:

确定a步骤2:确立检查水准α(significancelevel)α=0.05第33页34假设检查基本步骤:构建统计量第34页35假设检查基本步骤:

计算P值如何通过查课后附表迅速得到成果?当v=35时,单侧t0.05=1.690面积为0.05

我们成果t=0.236面积应当大于0.05

第35页36假设检查基本步骤:

计算P值当不方便求出P详细等于多少时能够采取上述办法归纳为:第36页37假设检查基本步骤:

下结论本题成果由于P>0.05,因此尚不以为该县小朋友前囟门闭合时间与正常小朋友有不一样(从均数为14.1总体中抽样,得到14.3样本均数并非小概率事件)第37页38一、t检查在假设检查中使用了t统计量,因此就称之为t检查t检查使用是有条件,假如不满足条件使用,那么构建t统计量以及使用t分布曲线下面积规律估计概率就是不合理什么样资料能够计算t值?第38页39t检查使用条件随机变量是定量变量个体值、两个配对设计总体中对应个体差值、两个完全随机设计总体个体值满足正态分布或近似正态分布假如是两个完全随机设计均值比较要求样本所起源总体方差齐性在满足上述条件下,假如总体标准差未知,并且样本含量较小,考虑使用t检查;而假如已知总体标准差或样本含量较大则能够使用U检查第39页计算公式:n50或

已知时,用u检查n50时,用t检查第40页41单样本资料t检查这里总体均数一般指已知理论值或大量观测得到稳定值。以为这是一种确定总体。要检查目标是手头样本所来自总体是否与已有总体一致。第41页42例:根据现有资料,AIDS病人平均生存时间是14月。目前使用AZT治疗后,16名病人平均生存时间为20月,标准差是13月第42页43建立检查假设H0:

=14月,AZT无效;H1:

≠14月,AZT有效。确立检查水准

=0.05,双侧;计算检查统计量查自由度为15t界值表,确定P值,t0.05,15=2.131,P>0.05;根据

=0.05检查水准下结论,不回绝H0,尚不能以为AZT能够延长AIDS患者生存时间。第43页44单样本资料t检查例如:随机抽查25名男炊事员血清总胆固醇,求得其均数为5.1mmol/L,标准差为0.88mmol/L。

问题:该单位食堂炊事员平均血清总胆固醇含量是否与健康成年男子平均血清总胆固醇相同(健康成年男子平均血清总胆固醇为4.6mmol/L)?第44页45单样本资料t检查从资料提供信息来看,样本均数5.1与总体均数4.6不相等,其原因可有下列两个方面:样本对应总体均数等于4.6,差异仅仅是由于抽样误差所致;除抽样误差外,该单位食堂炊事员与健康男性存在本质上差异:偷东西吃?。两种情况只有一种是正确,且二者必居其一,需要我们作出推断。第45页46单样本资料t检查H0:

=4.6,该单位炊事员与正常人平均血清总胆固醇相等H1:≠4.6,该单位炊事员与正常人平均血清总胆固醇不等(有也许高也有也许低,总之不相等即可)检查水准a=0.05

第46页47单样本资料t检查第47页48单样本资料t检查

由于假设是作是双侧假设,故求P值对应要求双侧P值这里P值含义为:样本均数与总体均数差超出0.5mmol/L,即概率因此P=p(t>2.841)+p(t<-2.841),通过计算机软件得出成果P=0.009025;或者通过上面介绍办法由于t=2.841>t0.05/2,24=2.064,因此P<0.05在a=0.05水准上,回绝H0,接收H1,以为该单位炊事员与正常人平均血清总胆固醇不等。第48页49配对设计t检查何为配对设计?有时影响试验或研究成果不但仅是我们所观测原因,例如要比较两种药品疗效,假如两组患者在开始时病情严重程度相差较大,那么虽然最后两药治愈情况不一样,也不能归结于药品差异;在这里患者病情称之为非处理原因或混杂原因配对设计就是研究者为了控制也许存在非处理原因对研究成果影响而采取一种“均衡”设计办法第49页50配对计量资料t检查研究原因水平1干扰原因=?Whymatched?研究原因水平2第50页51在医学科学研究中配对设计主要有下列情况:配正确两个受试对象分别接收两种处理之后数据;同同样品用两种办法(或仪器等)检查成果;同一受试对象(一种)处理前后。其目标是推断两种处理(或办法)成果有没有差异。

第51页52说明以受试对象接收处理前变量值作为对照值(相称于空白情况),接收处理后变量值作为试验值;由于前后变量值均来自于同一受试对象,因此非处理原因影响在试验前后基本能够保持一致,变量值变化直接体现处理原因效应,这是它长处不过,在实际应用中,由于作用于受试对象非处理原因如气候、饮食、心理状态等无法在长时间内保持稳定,此时成果就不完全是处理原因效应,同步还夹杂非处理原因变化对成果影响;故这种配对设计方式主要用于急性、短期试验第52页53观测序号样本1样本2差值1x11x21d1=x11-x212x12x22d2=x12-x22……………………ix1ix2idi

=x1i

-x2i……………………nx1nx2ndn

=x1n-x2n配对设计t检查数据形式第53页54配对设计t检查原理第54页55检查原理:假如两总体间没有差异,那么每个对子差均数为0,即md=0(H0)检查统计量:配对设计t检查原理第55页56配对设计t检查某儿科采取静脉注射人丙种球蛋白治疗小儿急性毛细支气管炎,用药前后免疫球蛋白含量如下所示,问治疗前后IgG有没有变化?观测序号用药前用药后差值=后-前11206.441678.44472.002921.691293.36371.67……………………111105.521728.03622.5112757.431398.86641.44第56页57配对设计t检查H0:

d=0,疗前疗后免疫球蛋白含量相同;H1:

d≠0,疗前疗后免疫球蛋白含量不一样。=0.05;双侧计算检查统计量t查表,t0.05/2,11=2.201,因此P<0.05(P=6.814×10-10);在a=0.05水准上,回绝H0,以为治疗前后免疫球蛋白含量不一样第57页58t检查单样本t检查要检查目标是手头样本所来自总体是否与已有总体一致。配对t检查为了控制也许存在非处理原因对研究成果影响而采取一种“均衡”设计办法两组独立样本资料t检查第58页59两独立样本资料t检查(成组t检查)什么是成组资料设计?

为了研究两种处理效果差异,将所搜集研究对象随机分派到两种不一样处理组中,事先没有作任何匹配常见成组情况有:

没有交代使用匹配方案,均按照成组资料设计处理;相称于将两个样本视为来自两个不一样总体,比较两个未知总体参数是否相同.第59页计算公式:两样本含量均≥50,用U检查第60页样本含量n1和/或n2<50,用t检查两总体方差相同两总体方差不一样,校正t检查第61页62例

某口腔科测得长春市13-16岁男性20人恒牙早期腭弓深度均值为17.15mm,标准差为1.59mm;女性34人均值为16.92mm,标准差为1.42mm.根据这份数据可否以为该市13-16岁居民腭弓深度有性别差异?第62页63成组t检查基本原理在本例题中,某地居民根据性别分为两个群体(总体),现分别从两个群体中抽取样本,并没有说明除了性别外(性别在本题中为分组原因)按照其他例如年纪、体重、身材、营养情况等影响原因将男、女配成对子,因此将其视为两独立样本比较第63页64成组t检查基本原理第64页65成组t检查基本原理H0:第65页66均数之差标准误()合并方差(方差加权平均)均数之差标准误第66页67成组t检查要求通过上述推导可见成组t检查使用要尤其小心,它不但要求两个样本来自两个独立正态总体(总体正态性、独立性),并且还要求两个总体方差相同(总体方差齐性)假如两个总体方差不一样,那么能够使用之后介绍近似t检查(或也称为校正t检查)以及将来介绍非参数办法第67页68方差齐性检查:F检查F检查分析两个独立样本所起源总体方差是否相等正如前面所说,假设检查以其计算统计量命名,F检查要计算是F统计量;F统计量满足是自由度为v1、v2F分布(F是以统计学家R.A.Fisher命名)第68页69方差齐性检查:F检查男性、女性样本方差不一样,那么S男≠S女究竟是由于两个样本总体方差不一样还是仅仅由于抽样误差造成统计学家发觉方差比值(样本含量分别为n1与n2)满足自由度为v1=n1-1与v2=n2-1F分布,其中v1与v2分别称为分子自由度(numeratordegreeoffreedom)与分母自由度(denominatordegreeoffreedom),记为:第69页70F分布(Fdistribution)在H0成立前提下F=S12/S22v1=n1-1、v2=n2-1可见F分布图形呈正偏态分布所有F值均大于0第70页71方差齐性检查:F检查F=S大2/S小2=4.212/1.342

=9.879.87落在回绝域内,故成果为回绝H0,以为两总体方差不相同0.10.20.30.40.50.60.70.8002468分子自由度为7,分母自由度为11F分布回绝H03.760.025回绝H00.210.025第71页72例

某口腔科测得长春市13-16岁男性20人恒牙早期腭弓深度均值为17.15mm,标准差为1.59mm;女性34人均值为16.92mm,标准差为1.42mm.根据这份数据可否以为该市13-16岁居民腭弓深度有性别差异?第72页73第73页74综合分析将20名某病患者随机分为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论