计量资料两组均数的比较检验演示文稿_第1页
计量资料两组均数的比较检验演示文稿_第2页
计量资料两组均数的比较检验演示文稿_第3页
计量资料两组均数的比较检验演示文稿_第4页
计量资料两组均数的比较检验演示文稿_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量资料两组均数的比较检验演示文稿目前一页\总数八十二页\编于九点(优选)计量资料两组均数的比较检验.目前二页\总数八十二页\编于九点主要内容假设检验的基本原理和步骤样本均数与总体均数的比较两相关样本均数的比较两独立样本均数的比较t检验的应用条件检验假设注意的问题案例讨论目前三页\总数八十二页\编于九点假设检验的概念与原理对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设,称为假设检验(hypothesistesting)。为什么要进行假设检验?假设检验能够处理哪些问题?假设检验的基本思想是什么?假设检验的基本步骤有哪些?应用假设检验还要涉及哪些问题?目前四页\总数八十二页\编于九点假设检验的思维逻辑实例:欲探讨男性成人肺炎患者的血红蛋白同男性健康成人有无区别,如果能够测量所有的男性成人肺炎患者和男性健康成人的血红蛋白数值,我们通过计算均数就可以进行大小的比较。可是,男性成人肺炎患者和男性健康成人的群体是无限大的,其血红蛋白值构成的总体也是无限的。若随机抽取两个样本,各10例:10例男性成人肺炎患者的血红蛋白(g/dl)测量值:11.9,10.9,10.1,10.2,9.8,9.9,10.3,9.3,9.8,8.9;10例男性健康成人的血红蛋白(g/dl)测量值:13.9,14.2,14.0,14.3,13.7,13.9,14.1,14.7,13.5,13.6。算得10例男性成人肺炎患者的血红蛋白均数为10.11(g/dl),

10例男性健康成人的血红蛋白均数为13.99(g/dl),差别的原因?目前五页\总数八十二页\编于九点差别的原因可能有两种:本质上的差异抽样误差只要个体之间存在差异,抽样误差就不可避免。欲想知道差别到底是本质上的差异还是纯粹的抽样误差,需进行假设检验。借助抽样误差的分布规律:均数的分布、t分布、z分布、…目前六页\总数八十二页\编于九点t变换目前七页\总数八十二页\编于九点接受无效假设拒绝H0拒绝H0tt假设检验的原理:目前八页\总数八十二页\编于九点假设检验(hypothesistest)也称显著性检验(significancetest),采用的是小概率反证法的思想,即是事先对样本统计量的分布和总体参数作出某种假设然后判定样本统计量在总体分布所处的位置和对应的概率值如果样本统计量(如)在总体分布中的位置远离假定的参数,相对应的P值也小(如小于0.05)根据“小概率事件在一次试验中一般不可能发生”的原理,统计学有理由认为样本统计量不是来自事先假定的总体

目前九页\总数八十二页\编于九点假设检验的基本步骤

已知北方农村儿童前囟门闭合月龄为14.1月。某研究人员从东北某县抽取36名儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?1.选择检验方法,建立检验假设并确定检验水准

根据研究目的、研究设计的类型和资料特点(变量种类、样本大小)等因素选择合适的检验方法。并且将需要推断的问题表述为一对关于总体特征的假设。原假设(nullhypothesis),又称无效假设,记为H0;对立假设(alternativehypothesis),又称备择假设,记为H1。目前十页\总数八十二页\编于九点H1的内容直接反映了检验单双侧。若H1中只是

0

<0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。目前十一页\总数八十二页\编于九点例建立的原假设为:μ=14.1(月),(μ为该县儿童前囟门闭合月龄总体均数),意为“总体上该县儿童前囟门闭合月龄的平均水平与一般儿童的平均水平相同”。对立假设为:μ>14.1(月),意为“该县儿童前囟门闭合月龄的平均水平高于一般儿童的平均水平”。检验水准(sizeofatest),用希腊字母α表示。实践中常取0.05或0.01等数值。它将小概率事件具体化,即规定概率不超过α就是小概率目前十二页\总数八十二页\编于九点目前十三页\总数八十二页\编于九点目前十四页\总数八十二页\编于九点如果P值大于α,在

成立的假设下发生较为可能的事件,没有充足的理由对

提出怀疑。于是做出不拒绝

的决策无论做出哪一种推断结论(接受或是拒绝

),都面临着发生判断错误的风险。这就是假设检验的两类错误目前十五页\总数八十二页\编于九点第一节样本均数与总体均数的比较基本思想与步骤:1.假设检验:H0:总体均数为μ0,即μ=μ0H1:μ≠μ0.其对立假设H1包括μ>μ0和μ<μ0两种可能。一般情况下均采用双侧检验目前十六页\总数八十二页\编于九点2.计算统计量推断样本来自的总体均数µ与已知的某一总体均数µ0(常为理论值或标准值)有无差别3.确定P值

P值的意义是:如果总体状况和

一致,统计量获得现有数值以及更不利于

的数值的可能性(概率)有多大目前十七页\总数八十二页\编于九点目前十八页\总数八十二页\编于九点目前十九页\总数八十二页\编于九点第二节两相关样本均数的比较配对设计主要适用于以下情况:同一受试对象处理前后的比较,或两个部位的数据,(若为某种处理前后的数据,需要经历的处理时间较长,测量结果稳定)同一样品(或受试对象)用两种处理方法(或测量等)检测的结果;根据非处理因素配对后,两个受试对象分别接受两种不同处理的数据目前二十页\总数八十二页\编于九点基本思想与步骤目前二十一页\总数八十二页\编于九点目前二十二页\总数八十二页\编于九点目前二十三页\总数八十二页\编于九点目前二十四页\总数八十二页\编于九点目前二十五页\总数八十二页\编于九点目前二十六页\总数八十二页\编于九点第三节两独立样本均数的比较两组独立样本(twoindependentsample)将受试对象随机分配成两个处理组,每一组随机接受的一种处理一般把这样获得的两组资料视为代表两个不同总体的样本,推断它们的总体均数是否相等从两个人群(例如某年龄组男性与女性)分别随机抽取一定数量的观察对象,测量某项指标进行比较在实际工作中这类资料也按完全随机设计的两样本比较来对待目前二十七页\总数八十二页\编于九点基本思想和步骤目前二十八页\总数八十二页\编于九点例

某职防所测定了某工厂不同工种的两个车间的氟作业工人的尿氟含量(μmol/L),资料如下,问两车间的氟作业工人的尿氟含量有无差别?

甲车间:126.12143.20139.41161.11123.21110.3398.06151.4486.7631.56

乙车间:86.7193.14106.5190.11121.32116.1456.9278.7861.14100.30目前二十九页\总数八十二页\编于九点目前三十页\总数八十二页\编于九点(二)两样本所属总体方差不等(Satterthwaite近似法)目前三十一页\总数八十二页\编于九点例

为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的20只大鼠随机分为两组。一组用硫酸氧钒治疗(DV组),另一组作对照观察(D组),12周后测大鼠血糖含量(mmol/L)。结果为,DV组12只,样本均数为6.5mmol/L,标准差为1.34mmol/L;D组8只,样本均数为13.7mmol/L,标准差为4.21mmol/L。试问两组动物血糖含量的总体均数是否相同?目前三十二页\总数八十二页\编于九点目前三十三页\总数八十二页\编于九点目前三十四页\总数八十二页\编于九点第四节t检验的应用条件

(一)图示法:P-Pplot,Q-Qplot

(二)矩法偏度系数(skewness),峰度系数(kurtosis)。

(三)

W检验法一、资料正态分布正态性检验(normalitytest)目前三十五页\总数八十二页\编于九点(一)图示法期望概率(%)期望累计概率(%)

目前三十六页\总数八十二页\编于九点图100个样本均数的P-P图

P-P图目前三十七页\总数八十二页\编于九点图100个样本均数的Q-Q图Q-Q图目前三十八页\总数八十二页\编于九点1.矩法是利用数学上的矩原理来检验偏度和峰度。偏度指分布不对称的程度和方向,用偏度系数(coefficientofskewness)衡量,样本偏度系数用g1表示,总体偏度系数用1表示;理论上,总体偏度系数1=0为对称,1>0为正偏态,1<0为负偏态;(二)统计检验法目前三十九页\总数八十二页\编于九点总体峰度系数2=0为正态峰,2>0为尖峭峰,2<0为平阔峰;样本峰度系数用g2表示只有同时满足对称和正态峰两个条件时,才能认为资料服从正态分布。

目前四十页\总数八十二页\编于九点检验偏度的统计量目前四十一页\总数八十二页\编于九点检验峰度统计量目前四十二页\总数八十二页\编于九点

试用矩法对表中计算机模拟抽样所得100个样本均数进行正态性检验。(1)建立检验假设,确定检验水准H0:1=0且2=0,即总体服从正态分布H1:1

0或/和2

0,即总体不服从正态分布=0.10(欲不拒绝H0,宜稍大以减少II型错误)

目前四十三页\总数八十二页\编于九点

(2)计算检验统计量(3)确定P值,作出推断结论峰度P>0.50,偏度P>0.50。按=0.10水准,不拒绝H0,无统计学意义。还不能认为这些样本均数的总体不服从正态分布。

目前四十四页\总数八十二页\编于九点(三)W检验由Shapiro和Wilk于1965年提出,简称为W法,适用于小样本资料。计算时需要采用常数表,大样本时计算很复杂。【例7.6】用小鼠研究正常肝核糖核酸(RNA)对癌细胞的生物学作用,测定水层RNA诱导肝癌细胞的果糖二磷酸酯酶(FDP)活性的结果如下,请分析FDP活性是否服从正态分布?目前四十五页\总数八十二页\编于九点排序后的数据一分为二目前四十六页\总数八十二页\编于九点(一)F检验二、方差齐性目前四十七页\总数八十二页\编于九点目前四十八页\总数八十二页\编于九点方差齐性检验,采用两个方差比值F分布图,F值从0起,这张图的F值在计算时分子分母没有分大小,大的可以是分子,也可以为分母,

就是双侧检验但是为了简便起见,实际应用时仅给了大于等于1的界限值(0.025的界限值),只能将大的方差当分子。所以看起来是单侧检验,实际上理论基础是双侧检验目前四十九页\总数八十二页\编于九点

某口腔医院选择(吉林市)40-50岁慢性牙周炎患者536例,测得吸烟组(201人)菌斑指数(PLI)均值为84.71、标准差为8.14;非吸烟组(335人)菌斑指数的均值为82.20、标准差为6.18,两样本数据是否具有方差齐性(两总体方差相等)?目前五十页\总数八十二页\编于九点目前五十一页\总数八十二页\编于九点目前五十二页\总数八十二页\编于九点目前五十三页\总数八十二页\编于九点目前五十四页\总数八十二页\编于九点目前五十五页\总数八十二页\编于九点目前五十六页\总数八十二页\编于九点目前五十七页\总数八十二页\编于九点目前五十八页\总数八十二页\编于九点59常用的变量变换有对数变换、平方根变换、倒数变换、平方根反正弦变换等,应根据资料性质选择适当的变量变换方法

实际资料若不满足正态性或/和方差齐性的假定,尤其当是小样本资料时,这时如用一般的t检验可能会导致偏离真实结果较远。对于明显偏离上述应用条件的资料,可通过变量变换的方法加以改善

三、当资料不满足正态性和方差齐性条件的处理方法——变量变换目前五十九页\总数八十二页\编于九点601.对数变换

X’=lgX

X’=lg(X+1),当原始数据较小或有0时

X’=lg(X+K)或X’=lg(K-X)

对数变换适用于:①对数正态分布资料②各样本标准差与均数成比例或变异系数是常数或接近某一常数的资料

目前六十页\总数八十二页\编于九点612.平方根变换

X’=

X’=或,当原始数据较小或有0时

平方根变换适用用于:①服从Poisson分布的资料,也即各样本方差与均数成比例者②轻度偏态分布的资料

目前六十一页\总数八十二页\编于九点623.平方根反正弦变换

(1)用角度表示:X’=sin-1

(2)用弧度表示:X’=()sin-1

,其中π为圆周率平方根反正弦变换适用于率或百分比的资料。4.倒数变换

X’=1/X

倒数变换适用于数据两端波动较大的资料

目前六十二页\总数八十二页\编于九点一、假设检验的两类错误第四节假设检验中需注意的问题目前六十三页\总数八十二页\编于九点m=m0m1m>m0m0H1:m=m1>m0目前六十四页\总数八十二页\编于九点ab减少(增加)I型错误,将会增加(减少)II型错误增大n

同时降低a与bα与β间的关系目前六十五页\总数八十二页\编于九点1-β称为假设检验的功效(powerofatest)。其意义是,当所研究的总体与H0确有差别时,按检验水平α能够发现它(拒绝H0)的概率如果1-β=0.90,则意味着当H0不成立时,理论上在每100次抽样中,在α的检验水准上平均有90次能拒绝H0。一般情况下对同一检验水准α,功效大的检验方法更可取目前六十六页\总数八十二页\编于九点二、正确理解P值的意义。P值很小时“拒绝H0,接受H1”,但是不要把很小的P值误解为总体参数间差异很大。拒绝H0只是说差异不为零,P值小只是说犯第Ⅰ类错误的机会远小于α何时用单侧检验,何时用双侧检验,根据专业知识、科学推理来决定,没有任何可参考的资料,用双侧稳妥目前六十七页\总数八十二页\编于九点目前六十八页\总数八十二页\编于九点(一)置信区间具有假设检验的主要功能如果无效假设d=0,1-2=0不在置信区间范围内,差别有统计学意义,否则,无统计学意义

配对资料差值d双侧95%置信区间

两独立样本资料总体均数差值(1-2)的双侧(1-)置信区间:

目前六十九页\总数八十二页\编于九点利用前例资料,估计儿童血红蛋白在健康教育干预措施前后差值的总体均数的可信区间为:

利用前例计算两个总体均数间差值的置信区间为:目前七十页\总数八十二页\编于九点2.置信区间可提供假设检验没有提供的信息

图7-1置信区间可以提供的信息目前七十一页\总数八十二页\编于九点3.假设检验提供,而置信区间不提供的信息在统计推断结论为拒绝H0时,假设检验可以报告确切的P值,从而较为精确地说明检验结论的概率保证。置信区间只能在预先确定的置信度100(1-α)%水平上进行推断在不能拒绝H0的场合,假设检验可以对检验的功效做出估计,从而可以评价是否在识别差异能力较强的情形下不拒绝H0的。而置信区间并不提供这方面的信息置信区间与相应的假设检验既能提供相互等价的信息,又有各自不同的功能。把置信区间与假设检验结合起来,可以提供更为全面、完

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论