版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一单元绪论
一、预防医学概述
L定义:是医学的一门应用学科,研究环境因素对人群健康的影响及其规律,提出改善不良环境的卫生要求和保健措施,
以达到预防疾病、增进健康,延长寿命,提高劳动生产能力的目的。
♦研究因素:环境因素(自然、社会和心理环境)
♦研究对象:个体和群体
♦工作模式:环境-人群-健康
♦研究工具:运用基础医学、临床医学、环境卫生学、卫生统计学和流行病学等学科的理论和方法来探究环境因素对人
群健康作用的影响及其规律;制定防治对策,并采取各种有效的公共卫生措施。
♦研究目的:预防疾病、增进健康、延长寿命、提高人群生活质量。
2.内容
♦空间:从宏观到微观
♦时间:过去、现在和将来
♦服务对象:个人、家庭、社会
♦个人:从出生到死亡
具体包括:
(1)研究各种疾病和健康状况的三间分布特点
不同的空间,时间和人群间(性别、年龄、职业)的分布特点并比较其差异。
(2)研究环境对健康的影响及其规律
改善环境中的有害因素、利用环境中的有利因素,为防制疾病,增进健康提供理论依据。
(3)研究制定增进健康、防治疾病的对策和措施,并对措施的效果加以考核和评价。
3.特点
(1)‘研究的对象包括个体和群体,工作的重点是健康人和无症状患者。临床医学面对的是单个病人,采取抢救治疗措
施。
如发生传染病疫情,预防工作者应采取:
♦传染源:病人、病原携带者、接触者、动物传染源等进行隔离、医学观察等
♦传播途径:消毒、杀虫、灭鼠
♦易感人群:免疫预防、药物预防
(2)预防医学把环境和机体联系在一起,作为一个系统加以研究。
例如:在克山病患者的研究中,预防医学就是研究环境因素对克山病患者的影响。在低硒的基础上,各种综合因素相互
作用。
(3)预防医学的对策和效益产生于疾病发生之前。比临床医学具有更大的人群健康效益。而临床医学的对策和效益产
生于疾病发生之后■>
(4)研究方法上注重宏观和微观相结合,更侧重向宏观领域发展。而临床医学更侧重向微观领域发展。
4.预防医学发展简史:三个阶段
(1)个体预防:多限于个体为对象进行治疗和预防,卫生学。
(2)群体预防:主要目标以防治传染病和寄生虫为主,是个体预防向群体预防发展的标志。第一次卫生革命,主要任
务是预防传染病。
(3)社会预防:随着医学模式的转变,将单纯从生物医学模式,扩大到生物-心理-社会医学模式,并将三者视为一个
整体。第二次卫生革命,疾病预防的重点从传染病转向慢性病,主要任务是预防慢性病。
二、健康及其影响因素
1.医学模式
(1)定义:指在不同历史阶段和科学发展水平条件下,人们对自身生命、生理、病理、治疗、预防等问题的基本观点
和看法。
(2)发展阶段:五个阶段
♦神灵主义医学模式:
♦自然哲学医学模式
♦机械论医学模式
♦生物医学模式
♦生物-心理-社会医学模式
(3)现代医学模式的主要表现:四个扩大
♦从治疗服务扩大到预防服务
♦从技术服务扩大到社会服务
♦从院内服务扩大到院外服务
♦从生理服务扩大到心理服务
2.健康观:即人们对健康的看法,是在一定医学模式基础上人们对健康和疾病本质的认识。
♦生物医学模式:认为无病即健康。
♦生物-心理-社会医学:健康观注重心理和社会因素对健康的影响。
♦当代健康的定义:健康不仅仅是没有疾病或虚弱,而是在身体、精神和社会适应方面均处于完好状态。
3.影响健康的主要因素:四大类12项
(1)环境因素:自然环境、社会环境、心理环境因素。
(2)行为生活方式:消费类型、生活危害和职业危害
不健康的行为生活方式如吸烟、酗酒、不良饮食习惯和缺少体育锻炼。
(3)医疗卫生服务:预防、治疗和康复。
(4)生物遗传因素:遗传、成熟老化和复合内因。
研究证明:环境因素起主要作用,行为生活方式对健康影响所占的比重越来越大。
当今严重威胁人类健康的心脑血管病、恶性肿瘤、糖尿病、艾滋病等都与行为生活方式有密切关系。
4.健康决定因素生态学模型
三、疾病的三级预防
1.定义:一个人从健康到发病,从发病到功能障碍,其发生发展都有一定的规律。针时无病期、发病期及障碍期开展的
疾病预防,称为疾病的三级预防。
2.三级预防
(1)第一级预防:病因预防,是在无病期针对病因或致病因素所采取的预防措施,主要是消除或减少控制各种危害健
康的因素,并采取增进健康的各种措施,以防止健康人群发病。
如针对病因明确的传染病(预防接种)、职业病(改善劳动环境)和某些地方病(食盐加碘预防碘缺乏病)等。
(2)第二级预防:也称临床前期预防,三早预防,即在疾病的临床前期做好早发现、早诊断、早治疗,以预防疾病的发
展和恶化,防止复发和转为慢性病等。
♦对于致病因素不完全明确或致病因素经过长期作用而发生的慢性病,如肿瘤、心血管疾病等。应以二级预防为重点。
♦做到“三早”的根本方法:对群众进行宣传教育,提高医务人员的诊断水平和采用微量、敏感的诊断方法和技术。
♦第二级预防的措施:普查、高危人群筛检、定期健康检查等。
(3)第三级预防:又称临床期预防,主要是对已患病者采取各种积极有效的治疗和康复措施,防止病情恶化,预防并
发症和伤残,促进康复,恢复劳动和生活能力。
例题:
预防医学的研究对象是
A.个体
B.病人
C.健康人
D.群体
E.个体和群体
答案:E
现代医学模式是
A.神灵主义医学模式
B.自然哲学医学模式
C.机械论医学模式
D.生物医学模式
E.生物-心理-社会医学模式
答案:E
生物-心理-社会医学模式认为
A.心身是统一的
B.心理对健康和疾病有能动作用
C.心理因素、社会因素和生物因素都影响人体健康和疾病的发生
D.在健康和疾病问题上应将人视为一个整体
E.以上都是
答案:E
一、基本概念和基本步骤
医学统计学:运用数理统计和概率论的原理和方法,结合医学实际,研究数据的搜集、整理和分析的一门学科。
(-)基本概念
1.变量:具有变异的数据,分为两类:
(1)数值变量:连续变量,可测量,一般有度量衡单位,如身高、体重、血压等。
(2)分类变量:离散,表现为互不相容的类别,如性别、血型、民族、职称等。包括:
♦无序分类变量:取值间无大小、强弱、优劣等程度之别。如性别、血型等。又分为:
•两项分类:如性别分男、女,化验结果分阴性、阳性等;
•多项分类:如血型分为A型、B型、AB型、0型等。
♦有序分类变量:取值间有大小、强弱、优劣等程度之别。如疗效可分为治愈、显效、好转、无效,尿蛋白化验结果分
为-、+、++、+++等。
2.总体与样本
(1)总体:根据研究目的确定的同质观察单位某个变量值的全体。分:
♦有限总体:在时间和空间上都能确定有限个观察单位。
♦无限总体:没有时间和空间限制,观察单位数是不可数的。
(2)样本:总体中随机抽取的、有代表性的一部分观察单位。
3.误差:测量值和真值的差别为误差:包括:系统误差;随机误差。
(1)系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,
这种误差称为系统误差.
♦原因:
•仪器标准试剂未经校正和统一;
・测量者掌握尺度不同;
・测量者的某种感官障碍所导致测量结果呈倾向性偏大或偏小。
♦特点:①有倾向性;②可避免。
(2)随机误差:由于一些非人为的偶然因素使得结果或大或小。随测量次数增加而减小。分随机测量误差和抽样误差。
♦抽样误差:由抽样引起的样本统计量与总体参数之间的差异。抽样研究中随机误差就体现为抽样误差。
•特点:无倾向性;不可避免,但可估计大小。
•控制方法:改进抽样方法,增强样本的代表性。整群抽样>单纯随机抽样〉系统抽样〉分层抽样;增加样本量;选择
变异程度较小的研究指标。
4.资料类型
(1)计量资料:对观察单位进行测量取得数值,具有度量衡单位。数值变量构成计量资料。如身高、体重、血压等。
♦一般有计量单位
♦用平均数指标描述
(2)计数资料:先按类别汇总,然后清点各类的观察单位数。无序分类变量构成计数资料。如性别、血型等。
♦无计量单位
♦用相对数指标描述
(3)等级资料:变量的不同取值间有大小、强弱、优劣等程度之别。有序分类变量构成等级资料。如疗效可分为治愈、
显效、好转、无效。
♦无计量单位
♦用频数及平均秩次描述
♦有程度差异
5.概率:描述随机事件发生的可能性大小。
(1)表示方法:P
(2)取值范围:。〜1之间
(3)意义
♦P越遑近1,说明某事件发生的可能性越大;
♦P越接近0,说明某事件发生的可能性越小。
(4)小概率事件:如果某随机事件发生的概率PWO.05,表示该事件发生的可能性很小。
(二)基本步骤
(1)设计:根据研究目的,提出全面具体的计划和要求,作为统计工作实施的依据,以便用尽可能少的人力、物力和
时间获得准确可靠的结论。统计学设计:抽样、样本量、统计方法。
(2)搜集资料:及时、准确、完整。
来源:报表资料、医疗卫生机构的日常工作记录、专题调查和实验数据。
(3)整理资料:整理资料是把搜集到的资料进行适当的分组,把性质相同的资料归纳到一起,用表格或图形的方式展
示出来,以反映研究对象的规律性。
(4)分析资料:通过计算有关的统计指标,对资料进行概括的、全面的描述,以及从样本信息推断总体特征,如估计
总体参数、进行假设检验。
例题:
下列资料何为计数资料
A.体重(Kg)
B.血型(A、B、0、AB)
C.身高(cm)
D.每日吸烟量(0、1〜5支、6〜10支、10支以上)
E.白细胞数(个/L)
答案:B
二、数值变量数据的统计描述
(一)集中趋势指标
1.定义:描述一组观察值的平均水平。
2.统计指标:算术均数、几何均数和中位数。
(1)算术均数:简称均数。_
♦表示方法:总体均数用希腊字母□表示,样本均数用了表示。
♦适用范围:正态分布或近似正态分布资料
♦计算方法:直接法(原始数据)和加权法(频数表数据)
万=2或受工整
♦计算公式:*
(2)几何均数(G):
♦适用范围:原始数据呈倍数关系或偏态分布资料;呈对数正态分布资料。
♦计算方法:直接法和加权法
C7=kg(=--------)%G=L«g——)
♦计算公式:
(3)中位数
将一组观察值按从小到大的顺序排列,位置居中的数。
♦适用范围:偏态分布;分布类型不明资料。
♦计算方法
①由原始资料
排序XlWX2W…WXn
n为奇数:位次居中两者
n为偶数:位次居中观察值的均数
②由频数表资料计算,关键找对中位数所在组段。
(4)集中趋势指标的应用
♦算术均数一正态分布或近似正态分布资料
♦几何均数一原始数据呈倍数关系或偏态分布资料•;呈对数正态分布资料。
♦中位数一偏态分布或分布类型不明资料
(-)离散趋势指标
1.定义:描述一组观察值的变异程度。离散程度越大,集中趋势指标代表性越差;离散程度越小,其代表性就越好。
2.统计指标:极差、四分位数间距、标准差、变异系数。
(1)极差(R):全距,一组观察值中最大值与最小值之差。
♦不稳定(受两端值影响,与样本量无关)
♦浪费了n-2个数据的信息
(2)四分位数间距(Q):是下四分位数P25与上四分位数P75之差。中间一半数据的极差。
♦用于描述偏态分布和“开口型”资料的变异程度
♦较极差稳定,但仍有浪费信息的缺陷。
(3)标准差:用。表示总体标准差,用S表示样本标准差。用于描述个体观察值的离散程度;与均数结合描述资料的
分布情况;求参考值范围;计算标准误。
♦离均差:总体中每个观察值与总体均数的差。
♦方差:离均差平方和除以观察数据的个数。
♦计算方法:方差的算术平方根,直学法和加权法
♦计号公式:,*-I1*-1或
(4)变异系数(CV)
♦定义:标准差与均数的百分比。
♦适用范围:当两组资料单位不同或均数相差较大时。
(7K=£xt0i»4
♦计算公式:X
(三)正态分布的特点、面积分布规律
L定义:频数分布的两种类型:对称分布和偏态分布。偏态分布又有正偏态和负偏态。正态分布是对称分布的一种,描
述连续型随机变量分布,又称Gauss分布。
2.特点
(1)在直角坐标中,正态曲线为位于x轴上方的钟形曲线,且以X=N为对称轴,左右对称。
(2)正态分布有两个参数u,。;U决定着正态曲线在x轴上的位置,称为位置参数;。决定着正态曲线的形状,若
口恒定,。越大,则曲线越平坦,。越小,曲线越陡峭。
(3)对应于正态分布参数口和。的不同取值,正态曲线的位置和形状会千变万化,但都可经标准化变换。
3.正态曲线下面积的分布规律
(1)x轴与正态曲线下面积等于1。
(2)在区间口土。上,正态曲线下的面积为68.27%;在区间U±1.96。上,正态曲线下的面积为95.00%;在区间口土
2.58。上,正态曲线下的面积为99.00%。
正态曲线下面枳的分布规律
(四)典型实例
1.比较身高和体重两组数据变异度大小宜采用()
A.全距
B.四分位数间距
C.方差
D.变异系数
E.标准差
答案:(D)
2.中位数与四分位数间距适用于()
A.正态分布资料
B.偏态分布资料
C.正偏态资料
1),负偏态资料
E.对称分布资料
答案:(B)
3.均数与标准差适用于()
A.正偏态分布
B.负偏态分布
C.正态分布
D.偏态分布
E.不对称分布
分案:(C)
;均数与标准差之间的关系是()
A.标准差越小,均数代表性越大
B.标准差越小,均数代表性越小
C.均数越大,标准差越小
D.均数越大,标准差越大
E.标准差越大,均数代表性越大
答案:(A)
5.决定正态分布的参数是()
A.变异系数
B.标准差
C.标准误
D.全距
E.组距
答案:(B)
6.X±2.58S正态曲线下的面积为()
A.68.3%
B.80.0%
C.90.0%
1).95.0%
E.99.0%
答案:(E)
7.一组变量值的标准差将()
A.随系统误差的增加而减小
B.随系统误差的减小而减小
C.随变量值的个数n的增加而增大
D.随变量值的个数n的增加而减小
E.随变量值之间的变异增加而增大
答案:(E)
四、、分类变量资料的统计描述
(-)常用的相对数
两个有联系指标的比,是事物相对关系的指标。
1.率:为频率强度指标,说明某现象发生的频率或强度。常以百分率(%)、千分率(%。)、万分率(1/万)、十万分
率(1/10万)等表示。
某时期内某具象实际发生的单位数
X10OK
目时期内某现祭可解发生的总单位数
2.构成比:又称百分比,是指事物内部各组成部分所占的比重,常以百分数表示。
舸JU内瓢象蟒单越
X1OO9C
局时嬲内拿现敏可悔贬生的不
3.相对比:又称比,是指甲乙两个有关指标之比,常以倍数或百分数表示。
小廊标的值
(-)注意事项
1.计算相对数时分母不宜过小
数量越多,计算的相对数越稳定,越能正确反映实际情况。
2.不能以构成比代替率
构成比说明事物内部各组成部分的比重或分布,率说明某现象发生的频率或强度。
3.正确计算平均率
对观察单位数不等的几个率,不能直接相加求其平均率,应由各类合计的数据来计算。
4.作率比较时要注意资料的可比性
除了所研究的因素以外,其余的重要影响因素均应相同或相近,要在相同条件下对比。需要利用标准化法处理后才能进
行比较。
5.样本资料的比较应作假设检验
对率(或构成比)进行比较必须进行假设检验
(三)典型实例
计算率而平均值时,应
A.将各个率直接相加来求平均值
B.依据各组合计栏的阳性数和观察例数计算
C.先标化,再按将各个率直接相加来求平均值法计算
D.按求中位数的方法求平均值
E.以上都不对
答案:B
率的标准化的主要目的是
A.消除内部结构的影响,使合计率具有可比性
B.使率变成实际水平
C.使率在任何情况下作对比
D.使大的率变小,使小率变大
E.以上均不对
答案:A
为说明某医院夏、秋季肠道传染病在门诊病例中的比重大小,应选用的指标是
A.率
B.构成比
C.相对比
D.均数
E.中位数
答案:B
说明两个有关联的同类指标的比即为
A.率
B.相对比
C.构成比
D.频率
E.频数
答案:B
对计数资料进行统计描述的主要指标
A.平均数
B.相对数
C.标准差
D.变异系数
E.中位数
答案:B
使用相对数时容易犯的错误是
A.把构成比作为相对比
B.把构成比作为率
C.把率作为相对比
D.把率作为构成比
E.把相对比作为构成比
答案:B
五、分类变量资料的统计推断
分类变量资料的统计推断包括总体率的估计和x2检验。
(-)总体率的估计
1.标准误:表示率的抽样误差的大小。率的标准误表示从总体率为P的总体中,随机抽取含量为n的许多个样本,所得
样本率pi,pz……p„的离散程度。
b2,用.计算公式
柏反尹后
3.总体率的可信区间
总体率95%可信区间:p±1.96Sp;总体率99%可信区间:p±2.58SP;
满足条件:np或n(1—p)均大于5。
(二)x,检验
x2检验常用于计数资料的统计推断,统计量x2值的基本公式为:
「50/
A为实际观察到的频数;T为根据检验假设确定的理论频数。x2值反映了样本实际情况与理论总体的符合程度。如果检
验假设成立,x2值不会太大;反之,若A与T差距大,x2值也大,当x2值超出一定范围,就有理由认为检验假设不成立。
1.两样本率比较的x2检验
四格表X2检验是作两样本率的比较,目的是推断两样本率所代表的总体率是否相同。
(1)四格表资料当T25且n240时,可用x2检验的基本公式或四格表专用公式,X2值与界值比较,确定P值。
_(fld-Ac)、
(2)四格表资料当1<TV5,且n240时,可用四格表的连续性校正公式计算校正x?值。
(3)四格表TV1或n<40时,校正值也不恰当,可以改用四格表的确切概率法。
举例:
某市对医院空气消毒监测,甲医院65个抽样点中52个合格,合格率80%,乙医院53个抽样点中22个合格,合格率41.51%,
结果见下表。问两医院空气消毒合格率是否不同?
两个样本率比较的问题,可用x?检验。先将实际观察频数列成四格表。因每一样本均分成合格与不合格两类,共有2义
2格,又称为四格表资料的x?检验。
两个气溶毒合格率鞘螟
不合格款台汗
5213(34.2065
22(33.24)31£19.馆)53
44ti3
H。:两总体的合格率相同,均等于合计的合格率
H,:两总体的合格率不相同
Q=0.05
根据H。,各组的合格率与合计合格率相等,据此可估计四格表中每一格的理论频数%(T的下标R指行,C指列),计
算公式为公式:
^■C=*
式中n为急、例数,nR是第R行合计数,nc是第C列的合计数。表中各格子括号内数字是理论频数。
基本公式:
_(52-40/时+03-24-的1+(22-33.24),+(3l-19.7Qa
K40.76~24.24~~33.24~
=18.00
四格表专用公式:
J(orf-bc^x
r=-------------------------------=1B.6O
2
自山度u=(2—1)(2—1)=1,查x?表,XO,O5(1)=7.88.x2越大P越小,本例x?=18.50>x>05⑴,P<0.05,
两样本率的差别有统计意义,根据实际结果可以认为甲医院的空气消毒合格率高于乙医院。
2.配对资料的x2检验
对同一个(或同一对)观察对象比较两种分类方法(或两种处理)结果有无差别。
配对设计xz检验计算公式为:
b+c讯六七之
b+cvto
举例:为了解新药的安全性,观察了100名受试者用药前后的谷丙转氨酶变化,结果治前治后均升高者25名,治前治
后均正常者60名,治前升高治后正常者6名,治前正常治后升高者9名,试分析新药效果,结果见下表。
100名受试者用药前后的谷丙转氨情况
治后
治蔚管诗
正第升高
正津609密
升高625S1
相0634
Ho:用药前后的谷丙转氨酶无变化(新药无效)
H.:用药前后的谷丙转氨酶有变化(新药有效)
检验水准a=0.05«
b+c<40
q—
1c'-R.2T
9+6
由X2界值表x2。©⑴=3.84,P>0.05,不拒绝Ho,尚不可认为新药有效。
3.行X列表资料的x2检验
(1)用于多样本率或多组样本构成比的比较。
(2)行X列表x2检验注意事项:
♦行X列表xz检验的T不能太小。要求所有格子的T大于1,同时1/5格子的T不能小于5。
♦多组有序分类资料相比较时,若要比较各组效应的大小,宜用秩和检验法。
♦行X列表X?检验,当pWa时结论为各组总体不同或不全相同,不能推论彼此间都有差别。要进一步明确结论,可用
x2分割等方法。
(三)典型实例
1.计数笳料最常用的显著性检验方法是()
A.t检验
B.正态检验
C.U检验
D.X?检验
答案:(D)
J两样本率差别的假设检验,其目的是()
A.推断两个样本率有无差别
B.推断两个总体率有无差别
C.推断两个样本率和两个总体率有无差别
D.推断两个样本率和两个总体率的差别有无统计意义
E.推断两个总体分布是否相同
答案:(B)
3.四格表资料中实际数和理论数分别用A和T表示,其基本公式和专用公式求xz的条件是()
A.A》5
B.T25
C.A25且T\5
D.A25且n>40
E.T25且n24。
答案:(E)
4.四格表x2检验的校正公式应用条件为()
A.n>40且T>5
B.n<40且T>5
C.1WT<5且n240
D.n<40且1VT<5
E.n>40且T<1
答案:(C)
六直线相关和回归
探索两个定量变量间的关系,常用直线回归与相关分析。
(-)直线回归分析的作用、回归系数及其意义
1.直线回归方程的建立
例2.40:某研究欲探讨男性腰围与腹腔内脂肪面积的关系,对20名男性志愿受试者测量其腰围(cm),并采用磁共振
成像法测量其腹腔内脂肪面积(cmb,结果如表2-36所示。试建立腹腔内脂肪面积(y)和腰围(x)的直线回归方程。
警号(»)
181.3Q9.8
289.8SL.2
985・990.3
48T.8T6.6
5T9.Q76.f
e82.fi86.4
7gs.2W2.S
8aa.i99.fi
994.49T.8
1O90.6gg
1199.5W8.2
12W9.8129.0
1397.6LW.4
1498.9123.9
Ifi99.TU5.5
WST.283.1
W94.1T2.0
1888.GWO.O
IS101.0W5.0
3088.3t2T.f
研究两个连续型变量之间数量上的线性依存关系的方法称为直线回归,它通过拟合直线回归方程来描述两变量间的关
系。
直线回归方程记为:
a+瓜
式中"多表示X取某定值时,总体均数*的估计值,也称为回归方程的预测值;X为自变量;a为回归直线的截距,也
称常数项,即x=0时y的平均估计值;b为回归直线的斜率,也称回归系数。
根据最小二乘法原理,可推导出a和b的计算公式。最小二乘法原理即保证各实测点距回归直线纵向距离平方和
一2了,最小,按该原理推导出的公式如下:
4不
工3-天
1n
式中:入5
1,J分别为x和y的离均差平方和,4为x和y的离均差积和。
以例2.40说明直线回归方程的建立步骤:
(1)由例2.40数据绘制两变量的散点图,发现二者有直线趋势,可以进行直线回归分析。
130
(
7
二
氟
@
径
密
长
a副
BRT(«»)
图24胺底内脂肠薄预和度图放点图
⑵计算]'I
3>=1819.8=—=19129
工J=166534.38=190252.97中=l7AKt.42
<=^-=90.990jr=-=^-=95.645
■"
J_C^1=950778
-H
J=-£221=7293,650
JZ一
IZ▼—(-唠U*=2006.649
(3)根据公式计算回归系数b和截距a
2006.649
21105
950.778
a=/-bx=95.645—2,105x90.990=-963894
4.列出直线回归方程:^=-96.3894+2.1105x
在x的实测值范围内,任取相距较远且易读数的两个x值80和90,代入方程得到相应的9值分别为72.5、93.6,连接
两点(80,72.5)、(90,93.6),即可绘制回归直线。
2.直线回归系数的含义及其假设检验
回归系数b的含义是自变量x改变一个单位时•,应变量y平均改变b个单位。回归系数b>0时,表示回归直线从左下
方走向右上方,即y随x增大而增大:b<0时,表示回归直线从左上方走向右下方,即y随x增大而减小;b=0时,表示
回归直线平行于x轴,即y与x无线性依存关系。
对于例2.40,回归系数b=2.1105,表示男性腰围每增加1cm,腹腔内脂肪面积平均增加2.1105cm%
无论y对x的回归关系是否成立,总可拟合出直线回归方程,3=«+加,但方程并不一定有统计学意义,故需要对方
程及回归系数进行假设检验。
对直线回归方程及回归系数的假设检验相同,常用的假设检验方法有:
(1)方差分析:为了理解回归中方差分析的基本思想,先对应变量y的离均差平方和作分解,如图2-5所示。
图应变■的离均是平方却划分示意图
图2-5中任一点p的纵坐标被回归直线与均数f截成三段,即y-5=(?-?)+(y-讨。由于p点是任意一实测点,若
将全部数据点均按上法处理,则有:
记作:SS&-SSM+SS城
相应的自由度关系为:U,©=u181+u我
式中:u怂=n—1,u“=l,u«E=n—2
SSa为y的总离均差平方和,表示未考虑x与y的回归关系时y值的总变异。SS问为回归平方和,反映了在y的总变异
中,可以用x与y的回归关系解释的那部分变异。
SS|rt|=b1xy—1xy2/1XX—b21xx
SS炖为残差平方和,表示除X对y的回归影响外,其他所有因素对y变异的影响,即在总平方和中无法用X与y的回归
关系解释的部分。
要分析x与y的回归关系是否存在,可采用统计量F。
F=----=--------,%=1,=a—2
霞残枝
式中:MS耐为回归均方;
MS残为残差均方。
若F2F一响,。皿,则PWa,按所取检验水准,拒绝H。,接受H”故可认为x与y变量间存在直线回归关系;若F<F«
(0H„«).则P>a,按所取检验水准,不拒绝H。,尚不能认为x与y变量间存在直线回归关系。
(2)t检验
式中:Sb为样本回归系数b的标准误,S、,为回归的剩余标准差。
例2.41:在例2.40中建立的直线回归方程9=一96.3894+2.1105x是否成立?
①建立检验假设,确定检验水准
Ho:B=0,即腹腔内脂肪面积与腰围之间无直线回归关系
H,:B#0,即腹腔内脂肪面积与腰围之间有直线回归关系
a=0.05
②计算检验统计量
/।==GTTT=Ijp=7293.650
碗=4235.100
〜=.―一=3058L549
工型最您理J加
耳网》/%3058.549/18
将上述结果列出方差分析表2-37。
表2-3720名男性腹腔内脂肪面积和腰围直线回归系数假设检验的方差分析表
变异舞《SS0KSP
回归4296.1001429&.WO34.924<0.01
超3068.64918109.919
融期72SS.66019
③确定P值,作出推断
按ui=1,u2=u及=n—2=18,查F界值表,F”(“,»2>=Fo.oi<i,i»>=8.28,得PVO.01,按a=0.05水准拒绝Ho,接
受H“回归方程有统计学意义,可以认为腹腔内脂肪面积与腰围之间有直线回归关系。
如对本例做t检验,贝lj
,5-0b2.1105
S.木国小0:549>20~2)亚通§
由u=n—2=18,查t界值表,得PV0.001,按a=0.05水准,拒绝%,回归方程有统计学意义,结论同上。
可以验证,讨=F,因此,同一资料回归系数的t检验与方差分析等价。
3.直线回归的应用及应注意的问题
(1)应用
①直线回归方程可用来描述两定量变量间数量依存变化的关系。
②利用回归方程进行预测预报:这是回归方程的重要应用之一。
③利用回归方程进行统计控制:统计控制是利用回归方程进行逆估计。
(2)应注意的问题
①作回归分析要有实际意义,不能把毫无关联的两种现象作回归分析,必须对两种现象间的内在联系有所认识。
②直线同归分析前应绘制散点图。只有散点图呈现直线趋势时,两变量呈直线回归关系的假定才有依据。
③两变量间存在直线关系时,不一定表明彼此之间就存在因果关系,有可能是依存关系,或仅仅是表面上.的伴随关系。
④直线回归分析的应用条件为:应变量与自变量关系为线性、误差服从正态分布、各观测值独立等。
⑤直线回归分析中反映自变量对应变量数量上影响大小的统计量是回归系数b,而不是假设检验的P值。
⑥应用直线回归方程进行预测时,自变量一般不应超出样本实测值的取值范围。
(二)直线相关分析的用途、相关系数及其意义
直线相关又称简单相关用于描述两个变量之间线性相关程度。
1.直线相关的分类
(1)正相关:两个变量x与y,绝大多数x与y同时增大或同时减小,并且x和Y呈直线变化趋势,称这种伴随同时增
大或同时减小的直线变化趋势为正相关。
(2)负相关:如果两个研究指标之间的变化关系是相反的,X增大而Y呈下降变化趋势,这种X与Y的反方向伴随直线
变化趋势称为负相关。
2.直线相关系数
直线相关是指两个随机变量之间呈直线趋势的关系。相关系数用于描述具有直线关系的两变量x,y间的相互关系,也
称Pearson积矩相关系数,说明具有直线关系的两变量间的相关方向与密切程度。样本相关系数用r表示,计算式为:
_________工冲一0符0负,嘉_______
一疟炉-0刀Miy-0?㈤
(1)相关系数r意义
描述两个变量间直线关系密切程度和相关方向的统计指标。r没有单位,取值范围为-lWrWl。两变量相关的方向用r
的正负号表示,即r>0表示正相关;rVO表示负相关。相关系数r的绝对值大小表示相关的密切程度,|r|越接近1,表示
两变量间相关关系密切程度越高。|r|=1表示完全相关,r=0表示无直线相关关系,称零相关。
(2)相关系数r的计算
例2.42:根据例2.40资料,试估计男性腰围和腹腔内脂肪面积的相关系数r。
本例L*=950.778,1,,=7293.650,l“=2006.649,代入公式:
.2006.M9
ras--yZ-s,-y1—=0.762
^50778x7293650
(3)直线相关系数的假设检验
假定从总体相关系数P=0的总体中随机抽样,由于存在抽样误差,所得样本相关系数r不一定为零。因此,求得样本
相关系数r后,需进行总体相关系数P是否为零的假设检验。常用的方法有t检验和查表法。
r—0
2
式中:S,为样本相关系数r的标准误。
亦可按u=n-2,查r界值表,得到P值,结论与t检验相同。
例2.40资料中,男性腰围和腹腔内脂肪面积相关系数r的t检验步骤如下:
建立检验假设,确定检验水准
Ho:P=0,即男性腰围和腹腔内脂肪面积无直线相关关系
H,:PAO,即男性腰围和腹腔内脂肪面积有直线相关关系
a=0.05
计算检验统计量
本例,n=20,r=0.762,代入公式:
0762=4992
-8.70
20-2
0=20-2=18
确定P值,作出推断
查t界值表,得PV0.001,按a=0.05水准,拒绝H。,接受H”可认为男性腰围和腹腔内脂肪面积有直线相关关系。
此外,以r=0.762,u=20—2=18,直接查r界值表,得PV0.001,结论同前。
应用直线相关应注意的问题:①进行相关分析前应先绘制散点图,从散点图能直观地看出两变量间有无直线趋势并发现
可能的异常点;②直线相关分析的统计推断要求两个随机变量均服从正态分布;③出现异常点时慎用相关;④相关关系不一
定是因果关系;⑤分层资料不可盲目合并,将无相关性的两样本合并后可能造成相关的假象,或者将原本具有相关性的分层
资料合并后无相关性。
二140-112=28
=140-112=28
1=
'0x7+2x6+3x5^-4x34-5x44-6x2+7x1)-
=85-112=—27
确定P值,作出推断
以n=7,r,的绝对值查”界值表,得0.002VPV0.005,按a=0.05水准,拒绝H。,接受乩,可认为当地水中含碘量与
单纯性甲状腺肿患病率有负相关关系。
七统计表和统计图
(一)、统计表
按照被说明事物指标的分组情况,统计表分为简单表和组合表。简单表只按•个特征或指标分组;组合表将两个或两个
以上特征或指标结合起来分组。
1.制表的基本原则
统计表的制表原则首先是重点突出,即•张表一般只表达•个中心内容,尽量避免把过多的内容放在同一张表里;其次,
统计表要层次清楚,即标目的安排及分组符合逻辑,便于分析比较;最后,统计表应简单明了,文字、数字和线条都应尽量
从简,如表2-39。统计表的制表原则具体体现在:
柄皿i年食物中呈性的E炯分布
月皆中毒超fcCH)
312LO9
34.01
3423.L3
10r2322LH
葡147100.00
(1).标题:高度概括表的主要内容,应包括表号、研究的时间、地点和研究内容,置于表的正上方。
(2).标目:分为横标目和纵标目,分别说明表格每行和每列内容的涵义。注意标明指标的单位。
(3).线条:多采用3条线,即顶线、底线、纵标目下横线。部分表格可在多重纵标目间用短横线分隔,其他竖线和斜
线一概省去。
(4).数字:用阿拉伯数字表示。同一指标小数位数应一致,位次对齐。表内不留空项。无数字用“一”表示,缺失数
字用“…”表示,数值为0者记为“0”。
2.制表注意事项
(1).统计表结构完整,标题高度概括,标目设置恰当,计算指标能反映被研究事物的实质。
(2).表中数字要准确,数字区内不能插入文字,也不列备注项,必须说明者用“*”号等标明,在表下方备注说明。
(二)、统计图
1.制图的基本要求
制统计图时,应根据资料性质和分析正确选用统计图。除圆图外,一般用直角坐标系的第一象限作为图域(制图空间)。
绘制图形应注意准确、美观和清晰。具体要求如下:
(1).标题:应高度概括资料的时间、地点和主要内容,一般放在图的正下方,并加图号。
(2).标目:分为横标目和纵标目,分别表示横轴和纵轴的涵义,一般有度量衡单位。
(3).刻度:指在横轴和纵轴上的坐标尺度。刻度数值按从小到大的顺序排列,横轴由左向右,纵轴山下向上。纵横轴
的比例一般5:7或7:5为宜。
(4).图例:说明统计图中各种图形所代表的事物。当统计图用不同线条和颜色表示不同事物的指标时,通常需要附图
例加以说明。
2统计图的正确选择及其注意事项
(1).条图:用相同宽度的直条长短表示相互独立的统计指标的数值大小和它们之间的对比关系。指标既可以是绝对数,
也可以是相对数。常用的条图有:①单式条图:具有一个统计指标,一个分组因素,如图2-6;②复式条图:具有一个统计
指标,两个或两个以上的分组因素,如图2-7。
阳某地JW彳年工粒泊化率统金色眸《r电七■率
绘制条图时应注意:①直条尺度必须从0开始,且等距;②各直条的宽度相等。
(2).圆图:又称饼图。以圆的总面积表示事物的全部,将其分割成若干个扇面表示事物内部各构成部分所占的比重,
适于描述分类变量各类别所占的构成比,如图2-8»
映2-8某地2O0S年男性的死因构成
绘制圆图时应注意:圆内各部分事物一般以时钟12点位置作始点,顺时针方向按一定顺序排列。
(3).线图:用线段升降来表示数值变化,适用于描述某统计量随另一连续型数值变量变化而变化的趋势。通常横轴是
时间或其他连续型变量,纵轴是统计指标。如果横轴和纵轴都是算术尺度,称普通线图:横轴是算术尺度,纵轴是对数尺度,
称半对数线图。
如图2-9为普通线图,反映某地1996〜2005年农村和城市恶性肿瘤死亡率随时间变化而变化的趋势;图2-10为相应的
半对数线图,反映死亡率随时间变化而变化的相对趋势。
绘制线图时应注意:①普通线图纵轴一般以0点作起点,否则需作特殊标记或说明;②不同指标或组别可以用不同线段,
如实线、虚线等表示;③各测定值标记点间用直线连接,不可修匀成光滑曲线。
一
冬
:
.'
£
S旅
益T
门小
]航疝
W
c:sfe
向5f
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论