版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 福建医科大学公共卫生学院福建医科大学公共卫生学院 流行病学与卫生统计学系流行病学与卫生统计学系 林征林征 2016.22假设检验中如果无效假设针对总体均数(此处假设检验中如果无效假设针对总体均数(此处指的是算术均数),通常的方法有指的是算术均数),通常的方法有t检验(专检验(专门用于不超过门用于不超过2组的资料)与方差分析(用于组的资料)与方差分析(用于三组及以上)三组及以上)如果针对的总体参数是中位数,可以考虑采用如果针对的总体参数是中位数,可以考虑采用秩和检验秩和检验3在假设检验中使用了在假设检验中使用了t统计量,所以就称之为统计量,所以就称之为t检验检验t检验的使用是有条件的,什么样的
2、资料可以检验的使用是有条件的,什么样的资料可以计算计算t值?值?4数值数值(计量资料、定量变量计量资料、定量变量)变量变量正态分布或近似正态分布正态分布或近似正态分布总体方差齐性总体方差齐性(两样本资料两样本资料)在满足上述条件下,如果总体标准差未知,而在满足上述条件下,如果总体标准差未知,而且样本含量较小(且样本含量较小(n100),考虑使用),考虑使用t检验;检验;而如果已知总体标准差或样本含量较大(而如果已知总体标准差或样本含量较大(n100)则可以使用)则可以使用Z检验检验某医生测量了某医生测量了农村农村40名名新生儿,测得平均新生儿,测得平均体重为体重为3.27kg,标准差,标准差0
3、.44kg;从该地的;从该地的既往记录求得新生儿的总体均数为既往记录求得新生儿的总体均数为3.36kg问问该地农村新生儿的出生体重是否与该地该地农村新生儿的出生体重是否与该地新生儿的平均出生体重不同新生儿的平均出生体重不同?5从资料提供的信息来看,样本均数从资料提供的信息来看,样本均数3.27与总体均数与总体均数3.36不相等,其原因可有以下两个方面:不相等,其原因可有以下两个方面:样本对应的总体均数等于样本对应的总体均数等于3.36,仅仅是由于抽样,仅仅是由于抽样误差所致这种差别;误差所致这种差别;非抽样误差,二者的确有别?非抽样误差,二者的确有别?两种情况只有一个是正确的,且二者必居其一,
4、需两种情况只有一个是正确的,且二者必居其一,需要我们作出推断。要我们作出推断。,农村新儿体重与该地平均水平相同,农村新儿体重与该地平均水平相同 ,二者不同,二者不同 (有可能高也有可能低,总(有可能高也有可能低,总之不相等即可)之不相等即可)检验水准检验水准 22HxN(3.36, )40 xN(3.36t=,)40z3.273.36 1.294 401390.44/40/xnsn 根根据据0 0,新新生生儿儿体体重重服服从从正正态态分分布布:;从从该该总总体体中中随随机机抽抽样样,在在的的情情况况下下样样本本均均数数也也将将服服从从正正态态分分布布 既既然然满满足足正正态态分分布布就就可可以
5、以作作 转转换换,但但是是总总体体标标准准差差未未知知,而而且且样样本本例例数数较较少少,所所以以只只能能作作t t转转换换:P/ / 2 2P / / 2 2-1.2941.2941/21/2 由于由于t=-1.294t0.05/2,35=-2.023,因此虽然无法,因此虽然无法准确得出准确得出P值,但仍然可以推断值,但仍然可以推断P0.05(经(经过计算机软件得出结果过计算机软件得出结果P=0.203 )在在a a=0.05的水准上,不拒绝的水准上,不拒绝H0,尚不认为农,尚不认为农村新生儿的出生体重与该地村新生儿的出生体重与该地平均水平不同。平均水平不同。何为配对设计?何为配对设计?有时
6、影响试验或研究结果的不仅仅是我们所观察有时影响试验或研究结果的不仅仅是我们所观察的因素,例如要比较两种药物的疗效,如果两组的因素,例如要比较两种药物的疗效,如果两组患者在开始时的病情严重程度相差较大,那么即患者在开始时的病情严重程度相差较大,那么即使最终两药的治愈情况不同,也不能归结于药物使最终两药的治愈情况不同,也不能归结于药物差别;在这里患者的病情称之为非处理因素或差别;在这里患者的病情称之为非处理因素或“混杂混杂”因素因素配对设计就是研究者为了控制可能存在的非处理配对设计就是研究者为了控制可能存在的非处理因素对研究结果的影响而采用的一种因素对研究结果的影响而采用的一种“均衡均衡”的的设计
7、方法设计方法常见的配对方法之一:常见的配对方法之一:将受试对象配成特征相近的对子,而后让每将受试对象配成特征相近的对子,而后让每个对子中的两个对象随机接受不同的处理方个对子中的两个对象随机接受不同的处理方案,例如:比较两种疗法的患者生化指标,案,例如:比较两种疗法的患者生化指标,医生将年龄接近、性别一致、病情相同的患医生将年龄接近、性别一致、病情相同的患者配成对子,而后让一位患者接受甲处理另者配成对子,而后让一位患者接受甲处理另外一位患者接受乙处理外一位患者接受乙处理1314常见的配对方法之二:常见的配对方法之二:将同一份样品分成两份(或同一机体不同部将同一份样品分成两份(或同一机体不同部位)
8、,同时、随机接受两种不同的处理方案位),同时、随机接受两种不同的处理方案,例如:牙医分别用两种方法对相同患者的,例如:牙医分别用两种方法对相同患者的牙龈取模,比较两种方法的精确度牙龈取模,比较两种方法的精确度有种有种“治疗前后的自身配对治疗前后的自身配对”,它是以受试对象接,它是以受试对象接受处理前的变量值作为对照值(相当于空白情况)受处理前的变量值作为对照值(相当于空白情况),接受处理后的变量值作为实验值。,接受处理后的变量值作为实验值。但是,在实际应用中,由于作用于受试对象的非处但是,在实际应用中,由于作用于受试对象的非处理因素如气候、饮食、心理状态等无法在长时间内理因素如气候、饮食、心理
9、状态等无法在长时间内保持稳定,此时结果就不完全是处理因素的效应,保持稳定,此时结果就不完全是处理因素的效应,同时还夹杂非处理因素改变对结果的影响;故这种同时还夹杂非处理因素改变对结果的影响;故这种配对设计的方式主要用于配对设计的方式主要用于急性、短期急性、短期试验。试验。2idd2dddddddddd N( ,)dd dN( ,),nStd- t=t(n -1)nsn,根根据据前前面面的的介介绍绍,差差值值 的的样样本本均均数数将将满满足足正正态态分分布布,表表达达为为但但是是由由于于未未知知,只只知知;所所以以只只可可作作 变变换换,如如下下:,其其中中为为对对子子数数检验的原理:如果两总体
10、间没有差别,那么检验的原理:如果两总体间没有差别,那么每个对子的差的总体均数为每个对子的差的总体均数为0,即,即 d=0(H0)检验的统计量检验的统计量: (1)0 ,其其中中为为对对子子数数,因因为为,化化简简后后得得到到课课本本公公式式:dddddddddtt nnsndtsn 24名儿童接种卡介苗,按照年龄、性别配成名儿童接种卡介苗,按照年龄、性别配成12对,每对中的一对,每对中的一人接种新制品,另外一人接种标准品;经相同部位注射,人接种新制品,另外一人接种标准品;经相同部位注射,72小小时后观察结核菌素皮肤反应的直径,请问两种疫苗的反应结果时后观察结核菌素皮肤反应的直径,请问两种疫苗的
11、反应结果有无差别有无差别?20H0 : d0, 两种疫苗的反应结果相同两种疫苗的反应结果相同 H1 : d0, 两种疫苗的反应结果不同两种疫苗的反应结果不同 a a0.05;双侧;双侧计算检验统计量计算检验统计量 t 查表,查表,t 0.05/2,11 = 2.201,所以,所以P0.1,故结果为不拒,故结果为不拒绝绝H0,尚不认为两组总体方差不同,尚不认为两组总体方差不同前面阐述了方差齐性的情况下,如何进行两个样前面阐述了方差齐性的情况下,如何进行两个样本均数比较的本均数比较的t检验检验如果方差不齐,很多学者建议在这样的情况下采如果方差不齐,很多学者建议在这样的情况下采用自由度校正的方法计算
12、用自由度校正的方法计算t分布的概率,或者直接分布的概率,或者直接采用非参数检验采用非参数检验(Satterthwaite, 1941, 1946; Aspin 1948, 1949)分别提出了使用校正分别提出了使用校正自由度自由度的方法计的方法计算算t值所对应的概率值所对应的概率P他们提出的自由度计算方法为现在大多数统他们提出的自由度计算方法为现在大多数统计学软件所采用,公式如下计学软件所采用,公式如下 222112212 2222221211221212/ /11 snsnxxttvsssnsnnnnn区间估计与假设检验是统计推断的两个基本方法,区间估计与假设检验是统计推断的两个基本方法,它
13、们之间有共同之处它们之间有共同之处二者的基本思想都是利用二者的基本思想都是利用样本信息来对总体的一些性样本信息来对总体的一些性质进行推断质进行推断。二者的推断过程都二者的推断过程都应用了小概率事件的原理应用了小概率事件的原理,难以保,难以保证统计推断的结论百分之百正确。证统计推断的结论百分之百正确。二者都是利用概率分布的原理推导计算的,所以假设二者都是利用概率分布的原理推导计算的,所以假设检验可以看成是可信区间的另一种表达方式;置信区检验可以看成是可信区间的另一种表达方式;置信区间可看作是所有可能接受的假设的集合;例如:间可看作是所有可能接受的假设的集合;例如: 12/2,10/2,112/2
14、,212 / /011 0a aa aa a 是是否否包包含含是是 样样本本均均数数与与总总体体均均数数比比较较的的 检检验验配配对对 检检验验成成组组 检检验验否否包包含含是是否否包包含含dnnddnncxtSndtSnxxSnntttt虽然二者间有共同点,但是它们还是有区别虽然二者间有共同点,但是它们还是有区别的的二者的思维二者的思维方向不同方向不同:假设检验使用反证法:假设检验使用反证法(逆向思维);而在计算可信区间时,对未(逆向思维);而在计算可信区间时,对未知参数没有任何了解,但能以一定的置信度知参数没有任何了解,但能以一定的置信度给出未知参数的置信区间或其所在的范围给出未知参数的置
15、信区间或其所在的范围 (正向思维)。(正向思维)。二者各具特色,例如:在配对二者各具特色,例如:在配对t检验中,拒绝检验中,拒绝无效假设,认为使用药物后患者的血压较使无效假设,认为使用药物后患者的血压较使用前降低了,差别有统计学意义,但是能否用前降低了,差别有统计学意义,但是能否说药物有效呢?临床上要说明降压要有效,说药物有效呢?临床上要说明降压要有效,指服用后至少可以使血压降低指服用后至少可以使血压降低5mmHg,此,此时假设检验无法回答这个问题,但是可信区时假设检验无法回答这个问题,但是可信区间可以;计算差值的间可以;计算差值的95可信区间,看该区可信区间,看该区间是否在间是否在5以上;也
16、就是说大多数的假设检以上;也就是说大多数的假设检验只能回答可信区间中是否有验只能回答可信区间中是否有0(H0假设假设)的问的问题,而至于区间的具体位置是无法回答的,题,而至于区间的具体位置是无法回答的,如下图:如下图:A:不拒绝不拒绝H0假设,前后差值的假设,前后差值的CI包含包含0B:拒绝拒绝H0假设,血压有变化,但差值假设,血压有变化,但差值的的CI提示没有临床意义提示没有临床意义H0: d=0C:拒绝拒绝H0假设,血压有变化,差值的假设,血压有变化,差值的CI提示提示可能有临床意义可能有临床意义D:拒绝拒绝H0,血压有变化,差值的,血压有变化,差值的CI提示有临床意义提示有临床意义 d5mmHg假设检验过程中如果拒绝假设检验过程中如果拒绝H0,则可通过,则可通过P值精确说明值精确说明出现较当前情况更为极端的概率,作为拒绝出现较当前情况更为极端的概率,作为拒绝H0的把的把握度;越小的握度;越小的P值意味着越有理由拒绝值意味着越有理由拒绝H0。而可信。而可信区间只能在原先给定的可信度情况下进行区间估计区间只能在原先给定的可信度情况下进行区间估计在不拒绝在不拒绝H0的情况下,假设检验可以提供
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度高端建筑用无缝钢管采购协议2篇
- 2025版大型养殖场专用鸭苗采购合同模板3篇
- 2025版智能交通信号系统建设与运营服务合同3篇
- 2025版情侣恋爱情感培养合同模板9篇
- 2025年度钢管行业产业链整合与升级合同2篇
- 2025-2030全球防篡改技术行业调研及趋势分析报告
- 2025-2030全球全自动电池包装机行业调研及趋势分析报告
- 2024年全国现场流行病学调查职业技能竞赛考试题库-上部分(600题)
- 2025-2030全球真空度测试仪行业调研及趋势分析报告
- 2024年禁毒知识竞赛试题库(多选题)
- 2024年九省联考新高考 数学试卷(含答案解析)
- 红色历史研学旅行课程设计
- 下运动神经元损害综合征疾病演示课件
- 北师大版三年级数学(上册)看图列式计算(完整版)
- 2024年云南省中考英语题库【历年真题+章节题库+模拟试题】
- 2023中考地理真题(含解析)
- 麻醉药品、精神药品月检查记录表
- 浙江省宁波市海曙区2022学年第一学期九年级期末测试科学试题卷(含答案和答题卡)
- 高考英语词汇3500电子版
- 建院新闻社成立策划书
- JJF 1101-2019环境试验设备温度、湿度参数校准规范
评论
0/150
提交评论