版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学理论复习交通大学医学院生物统计学教研室分机776444zhang
1一.
基本概念统计学是研究怎样去有效地收集,整理和分析带有随机性的数据,以对所的问题作出推断和,直至为采取一定的决策和行动提供依据和建议的科学。医学统计学的主要内容有统计研究设计,统计描述,统计推断,因素间的关系、分类和检测等研究。2实验设计3一、基本要素1处理因素
2受试对象
3实验效应二、基本原则对照的原则空白、安慰剂、自身、实验、标准对照重复的原则个别/偶然
普遍/必然
(样本含量大小)随机化原则统计描述指用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进定和描述,不涉及由样本推断总体问题。统计推断指用样本推断总体。一个统计问题所研究的对象的全体称为总体。按随机的方式从总体中抽取若干
构成一个样本。45用于描述总体分布的数字特征的量称为参数,例如总体均数μ、总体标准差σ、总体率π、总体回归系数β、总体相关系数ρ等都是总体的参数,总体参数一般是未知的。不包含总体中任何未知参数的样本指标和样本数据的函数称为统计量,例如样本均数、样本标准差S、样本率P、样本回归系数b、样本相关系数r等都是统计量。6统计推断可以分为二个部分:参数估计和假设检验。参数估计就是根据总体中所抽得的样本,由样本统计量估计总体分布中的未知参数。可分为点估计和区间估计。选择一个适当的样本统计量作为总体参数的估计值称为点估计。根据一定的正确度和精确度要求确定一个概率水平,由样本统计量计算出一个适当的区间作为未知总体参数真值所在的范围,称为区间估计。称此概率水平为度或置信度,也水平,或置信水平。所估计的区间区间或置信区间,区间的端点称为可可称为称为
信限。区间的大小与样本含量及小有关,一般地说,随着
度的加大,度的大区间也加大,随着样本含量的加大,
区间缩小。7假设检验又称显著性检验,先对总体的参数或分布作出某种假设,假设有两种(1)检验假设用H0表示,(2)对立假设或备择假设用H1表示,H0与H1是相互联系、相互对立的假设。然后选择适当的样本统计量,进行统计推断,究竟是
H0,还是不
H0。其基本步骤为:12建立H0,H1。选择合适的统计检验方法,计算统计量。3
根据检验统计量的分布,计算概率P值,或者根据其临界值表,决定P的大小。89P值是H0成立的情况下,由于抽样误差得到的样本之差异大于等于计算出的统计量的概率。如果P>0.05,结论为差异无统计学意义;如果P≤0.05,结论为差异有统计学意义。单侧检验和双侧检验与假设检验的目的有关。当H0:μ1=μ2,H1:μ1≠μ2时,就是双侧检验;当H0:μ1=μ2
,H1:μ1>μ2或H1:μ1<μ2时,就是单侧检验。其主要区别在备择假设H1上面。如果H1:μ1≠μ2时就用到二侧(即μ1>μ2
,或μ2>μ1);如果μ1>μ2就只用到一侧。如t值表中由于
t分布左右对称,双侧的概率P就是单侧概率P之二倍,单侧概率P较小,
故易于产生
H0之统计推断。因而单侧检验如果误认为是双侧的,就不易
H0;而双侧检验如误用单侧就较易
H0了。10必须根据实际问题本身决定使用单侧还是双侧,决不能因为单侧易于
H0就盲目选用。通常进行的都为双侧检验;进行单侧检验时必须特别说明,要有充分的理由,并且在实验设计阶段就要预先规定好。11由假设检验作出统计推断时,不论是
H0,还是不 H0,都有可能发生误差(或称错误),根据所犯误差的性质,可以区分为第一类误差(用α表示)和第二类误差(用β表示)。当
类错误,不了实际上成立的H0时,称为犯第一实际上不成立的H0时,称为犯第二类错误。12用假设检验作统计推断时,第一类误差α常是已知的,β常常未知,1-β又称为检验的效能,即当H0实际上不成立时假设检验
H0的概率。当1-β很大时,表明该统计检验效能很高。影响效能的四要素:客观上两组效应差异越大,效能越大。间标准差越小,效能越大。样本量越大,效能越大。第Ⅰ类误差的概率越大,效能越大。要同时降低α,β值的唯一办法是加大样本。1314资料一般可分成三大类,即计量资料、计数资料和等级资料。计量资料又称测量资料,它是测量每个观察单位某项指标值的大小所得的资料。计数资料,将观察单位按某种属性或类别分组计数,得到各类别观察单位计数的资料,称为计数资料。等级资料又称为半定量资料,它是将观察单位按某种属性的不同程度分组计算所得出的各个不同程度的观察单位计数的资料。15不同的资料类型,其统计指标、统计检验的方法是不相同的。计量资料的统计指标为均数,标准差等,统计检验方法为t检验,方差分析等;当不符合条件时用非参数统计分析法。计数资料的统计指标为率,构成比等,统计检验方法为χ2检验;等级资料的统计指标也为率,构成比等,统计检验方法为非参数统计分析法。正态分布(normal
distribution)记为N(μ,σ2),标准正态分布:N(0,1)均数μ:位置参数,μ增大,曲线向右移动...标准差σ:形状参数,σ增大,数据分散,曲线低平...16正态曲线下的面积规律-417-3
-2
-1012
34-3-2-
+
+2
+3S(-,
-)=3210.)5=0.0152128738S(-,
+)=211)=0.695798772正态曲线下的面积规律2.5%2.5%95%+1.96-1.9618正态曲线下的面积规律5%5%90%+1.96-1.9619正态曲线下的面积规律0.5%0.5%99%-2.58+2.5820二.计量资料的统计指标正态分布资料的平均水平和离散程度常用均数和标准差表示。非正态分布资料的平均水平和离散程度常用中位数和四分位数间距表示。几何均数适用
倍数关系的资料,如抗体滴度、效价等,也用于对数正态分布的资料如某些传染病的潜伏期等。2122百分位数主要用于描述一组资料在各个百分位置上的水平,用一组百分位数如P5,P25,P50,P75,P95,可以描述总体或样本的分布特征,如集中位置、变异度等。百分位数还可用以确定医学正常值范围。变异系数无量度单位,而且消除了原始资料的平均水平的影响,因此常用于比较量度单位不相同的指标或者平均水平相差悬殊的指标的变异程度。统计量的标准误描述样本统计量抽样误差,标准误小,表示抽样误差小,统计量较稳定,与参数较接近。对
称:skewness=0;正偏态:skewness>0;峰偏左,长尾向右。个别数据特别大(右)负偏态:skewness<0;峰偏右,长尾向左。
个别数据特别小(左)23偏态系数(skewness)评价正态分布对称性的指标偏态负偏态正偏态24峰态系数(kurtosis)评价正态分布正态峰的指标。正态峰:kurtosis=0;平阔峰:kurtosis<0;尖峭峰:kurtosis>0;扁平分布尖峰分布峰度与标准正态分布比较!众数、中位数和均数的关系对称分布均数=中位数=众数负偏态均数
中位数
众数正偏态众数
中位数
均数2526三.t检验要检验总体均数是否为某值:用样本均数与总体均数比较的t检验。配对资料的两组比较,或处理前后的比较:用配对t检验。按完全随机化设计的两个样本均数的比较:用团体t检验。抽样分布:t分布用途:t检验、回归系数及相关系数检验等。标准正态分布df=t
(df
=
13)t
(df
=
5)Zt不同度的t
分布27t分布的特征t分布为一簇单峰分布曲线t分布以0为中心,左右对称t分布与
度有关,
低,而两侧尾部翘得越高;度越小,t分布的峰越度逐渐增大时,t分布逐渐
近标准正态分布;当
度为无穷大时,t分布就是标准正态分布。2829t检验条件样本均数与总体均数比较的t检验要求样本来自正态分布的总体。配对t检验要求差值d来自正态分布的总体。
团体t检验要求两个样本都来自正态分布并具有相同的方差。如不符合要求可作变量置换或用非参数统计分析方法。小样本团体t检验如方差不齐时可用t'检验。四.方差分析方差分析主要用于检验计量资料中两个或两个以上均数间差别显著性的方法。要求各样本都来自正态总体,且有一个相同的方差σ2,仅仅均数可以不相同;还需假定每一个观察值都由若效果可分成若分累加而成,也即总的分,而每一部分都有一个特定的含义,称之谓效应的可加性。方差分析的应用条件:可加性、方差齐性、正态性、独立性。30方差分析法的基本思想为:根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总度也被分为相应的各个部分,各部分的离均差平方和除以相应
度得出各个均方,然后列出方差分析表算出F值,作出统计推断。分解越细致,各部分含义就越明确。效率也越高。3132若发现方差不齐性时,先从实验本身检查,能否找到可能的解释,如果找不到适当的理由,可考虑作变量置换。对于服从对数正态分布的资料可用对数变换,即将主要变量取对数值后再作方差分析;对于服从泊松分布的资料可用平方根变换;对于表达成百分数的资料可用平方根反正弦变换。如果变量置换也无法克服方差不齐性,或者变量置换方法在实验中无法得到合理的解释时,可使用非参数统计分析方法。33单因素方差分析用于按完全随机化设计资料的样本均数的比较。随机单位组设计方差分析用于比较某因素各水平的样本均数,同时控制另一个分类因素的作用。拉丁方设计方差分析用于比较某因素各水平的样本均数,同时控制另二个分类因素的作用。34五.直线相关与回归在医学研究中常常要分析两个变量间的关系,
两变量间如果存在一定的因果关系,则常可将一个变量看作自变量,而另一个变量则看作为应变量,然后以一个直线方程将两者联系起来,利用这方程可以由自变量的值来估计应变量的值,这种方程称为直线回归方程,研究这类问题的方法称为回归分析。如果两变量间虽有一定的关系存在,但不是因果关系,此时就只能进行相关分析,这种关系就称为相关。35相关关系的图示
负线性相关-1
<
r
<0
非线性相关
完全负线性相关完全正线性相关
r
=
1正线性相关0<
r
<
1r
=
-1
不相关r
=
0A
BCr
=
0相关分析只是以相关系数来描述两个变量间线性相关的程度和方向,并不阐明事物间存在联系的本质,也不是两事物间存在联系的
。要阐明两事物间的本质联系,必须凭专业知识从理论上加以论证。36xyn
n(x
,
y
)1
1(x
,
y
)(x2
,
y2)(
xi
,
yi
)P}i
i(y
–^y
)yˆ
a
bx最小二乘法b
lxy
/
lxx
(x
x)(
y
y)
/[(x
x)2
]a
y
bx得出直线回归程:yˆ
a
bx3738两变量间如果存在回归关系,则它们之间也必然是相关的。H0:β=0,H1:β≠0,与H0:ρ=0,H1:ρ≠0,是完全一致的。所以通常作直线回归分析时,只须利用计算器直接求得b,a和r后,再查r界值表判定r的显著性后,即可得知回归方程是否有显著意义,不必另行检验。39决定系数R2:表示Y的变异中可由方程中的自变量组合所决定的部分占多少。R2越接近1,说明回归方程的效果越好,即Y的变异中可由方程中的自变量组合所决定的部分越多;R2越接近0,说明回归方程的效果越差,即Y的变异中只有很少一部分能由方程中的自变量组合所决定,即使该方程有显著意义,也不能认为该方程的效果可以令人满意,启示我们还应进一步寻找其他对Y可能有显著作用的变量或变量组合。八.计数资料的统计分析计数资料的描述性统计指标主要是:率和构成比。,率说明某种现象发生的频率或强度。构成比表示事物或现象
各构成部分的通常以100作为比例基数,
故常称为百分比。构成比和率是两个不同的相对数,不能。4041四格表和2×K表卡方检验用于两个或多个率差异的比较。行×列表卡方检验用于两个或多个构成比差异的显著性检验以及两种属性间独立性检验。0.00.10.20.30.40.503615189¿¨·½Ý׸ß
×ÔÓÉ×ÔÓÉ
×ÔÓÉ×ÔÓɶÈ
£½
1¶È
£½
2¶È
£½
3¶È
£½
62
2
/
2(
/
21)1
ef
(
2
)
2(
/
2)
23.847.8112.5912α
=0.05的临界值4243四格表卡方检验当总例数大于等于40,各理论频数大于等于5,不须校正。当总例数大于等于40,有一格理论频数小于5,但大于等于1,用卡方校正公式。当总例数小于40,或有一格理论频数小于1,不能用卡方检验,必须用确切概率计算。常用Fishe
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 办公软件培训
- 《安全气囊》课件
- 儿童医疗保健
- 《员工职业规划培训》课件
- 《员工关系案例》课件
- 《呼吸囊的使用》课件
- 《组运营商体系》课件
- 多处外伤的急救护理
- 《天狮牙膏系列宣讲》课件
- 《述职报告模板》课件
- 电子产品回收处理协议
- 三角函数2024-2025学年高中数学一轮复习专题训练(含答案)
- 2024秋期国家开放大学《当代中国政治制度》一平台在线形考(任务一至四)试题及答案
- T-CECS120-2021套接紧定式钢导管施工及验收规程
- 2024年浙江省单独考试招生文化课考试数学试卷真题(含答案详解)
- 2025届甘肃省庆阳市庆城县陇东中学高考考前提分物理仿真卷含解析
- 2024至2030年中国补肾市场销售前景模及消费需求潜力分析报告
- 2024-2030年中国水循环利用行业市场发展趋势与前景展望战略分析报告
- 2024年秋新人教版七年级上册数学教学课件 第三章 代数式 数学活动
- 石油钻采设备采购与供应链管理考核试卷
- 联想数字化转型及新IT白皮书-Lenovo
评论
0/150
提交评论