复习指导整理(咪哥牌)_第1页
复习指导整理(咪哥牌)_第2页
复习指导整理(咪哥牌)_第3页
复习指导整理(咪哥牌)_第4页
复习指导整理(咪哥牌)_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、绪论基本数据类型:计量资料,计数资料,等级资料总体:根据研究目的确定的同质研究对象的全体。当研究有具体而明确的指标时,总体是指该项变量值的全体。样本(sample):是总体中抽取的有代表性的一部分。频率(relativefreguency):一次随机试验有几种可能结果,在重复进行试验时,个别结果看来是偶然发生的,但当重复试验次数相当多时,将显现某种规律性。概率:描述随机事件发生的可能性大小的数值,用大写的P表示;取值[0,1]。二、计量资料的统计描述(一)、描述集中趋势的特征数(平均指标)总称为平均数(average)反映了资料的集中趋势(centraltendency)。常用的有:

1.算术均数(arithmeticmean),简称均数(mean)符号:总体u样本

适用条件:资料呈对称分布,尤其是正态或近似正态。

计算:

(1)直接法(2)频数表法

2.几何均数(geometricmean)适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料

3.中位数(median)适用条件:适合各种类型的资料。尤其适合于①大样本偏态分布的资料;②资料有不确定数值;③资料分布不明等。先将观察值按从小到大顺序排列,再按以下公式计算:频数表资料的中位数均数、中位数二者关系正态分布时:均数=中位数正偏态分布时:均数>中位数负偏态分布时:均数<中位数(二)、描述离散趋势的特征数反映数据的离散度(Dispersion)。即个体观察值的变异程度。常用的指标有:

1.极差(Range)(全距)适用范围:任何计量资料;是参考变异指标

2.百分位数与四分位数间距PercentileandQuartilerange适用条件:可用于各种分布的资料,特别对偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。

3.方差Variance适用条件:见标准差4.标准差StandardDeviation适用条件:方差和标准差适用于对称分布的资料,特别对正态分布或近似正态分布资料,常把均数和标准差结合起来全面描述资料集中趋势和离散趋势标准差与均数的单位相同,最常用,适合于近似正态分布5.变异系数CoefficientofVariation适用条件:①观察指标单位不同,如身高、体重②同单位资料,但均数相差悬殊三、定性资料的统计描述常用相对数指标1、构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布,常以百分数表示。2、强度通常指一段时间内的平均概率。强度是单位时间内某现象发生的频率。3、相对比是指任何两个相关联的变量A和B之比,说明A为B的若干倍或百分之几。两个指标可以是性质相同,也可以是性质不同。A和B可以是绝对数、相对数和平均数。四、常用统计图各常用统计图的适用场合(1)条图:适用资料:相互独立的资料(资料有明确分组,不连续)。(2)圆图:适用资料:构成比资料(3)百分条图:百分条图的作用与圆图相同。但更适用于多组百分比的比较。(4)线图:适用于随时间变化的连续性资料。(用线段的升降表示某事物在时间上的发展变化趋势。)半对数线图:适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用。(半对数线图中线段的升降是用来表示某事物发展速度(或者说是相对比)。)(5)直方图:用于表达连续性资料的频数分布。(6)箱式图:用于描述连续型变量资料的分布特征。(7)散点图:适用资料:双变量资料。(8)统计地图:适宜描述研究指标的地理分布。(9)误差线图:计量资料五抽样误差和几种常见分布1、抽样误差的概念:由于抽样原因造成的样本指标与总体指标之间的差别。标准差VS标准误内容SDSE性质表示个体变异大小统计量的标准差,表示抽样误差大小控制个体变异或自然变异,增大样本含量可减少方法不可通过统计方法来控制。算式用途求参考值范围求可信区间与n关系随n增大渐趋于稳定随n增大渐趋于0联系同为变异指标,n不变时标准差增大→标准误增大2、正态分布、t分布、卡方分布的特征和联系(一)正态分布的特征(1)正态分布的形式是对称的,对称轴是经过平均数点的垂线。(2)中央点最高,然后逐渐向两侧下降,曲线的形式是先向内弯,再向外弯。(3)正态曲线下的面积为1。。(4)正态分布有两个参数,即均数和标准差。是位置参数,当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动。是形状参数,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭。(二)t分布的图形特征•分布特征①t分布曲线是单峰的②关于t=0对称③t分布与正态分布的关系:自由度v较小时,t分布与标准正态分布相差较大,并且t分布曲线的尾部面积大于标准正态分布曲线的尾部面积;当自由度ν→∞时,t分布逼近于标准正态分布。(三)卡方分布特征①卡方曲线所围的面积和为1②卡方分布为在大于等于0(正数)范围的正偏分布③不同的自由度决定不同的卡方分布④卡方分布只有一个参数即自由度,为ν。卡方分布的平均数ν与方差2ν⑤卡方分布随着自由度增加而逐渐趋于对称,当自由度趋近于无穷大时,卡方分布趋近于正态分布⑥卡方分布的加法定理:两个独立的卡方随机变量相加所得的随机变量仍满足卡方分布,其自由度为其自由度之和。3、几个常用的界值概率0.050.01双侧1.962.33单侧1.642.58六、可信区间与参考值范围的区别与联系参考值范围可信区间含义当α=0.05时,CI以95%的可“正常人”的解剖、生理、生能性包含总体均数。化某项指标个体值的波动范围。算σ未知:计正态分布:式σ已知或σ未知但为大样本:偏态分布:PX~P100−X用途总体均数的区间估计绝大多数(如95%)观察对象某项指标的分布范围七假设检验的一般步骤和注意事项1.建立假设、确定单双侧检验和检验水准α2.求检验统计量(及自由度)3.求P值,下结论(统计/专业结论)何谓ⅠⅡ类错误,其联系P114假设检验时,拒绝实际上成立的H0,犯Ⅰ类错误,俗称“弃真”错误;不拒绝实际上不成立的H0,犯Ⅱ类错误,俗称“取伪”错误。犯第Ⅰ类错误的概率用α表示,假设检验时,根据研究者的要求来定;犯第Ⅱ类错误的概率用β表示,假设检验时,它只有与特定的H1结合起来才有意义。对于某一具体的检验来说,当样本量n一定时α越小β越大;α越大β越小。P值:在H0成立前提下,某事件(如“︱t︱≥2.138”八、计量统计量分析一组:样本与总体→单样本t检验两组:配对→配对t检验/配对Wilcoxon符号秩和检验非配对→两样本t检验/Wilcoxon符号秩和检验九、计量资料的统计分析多组均数:完全随机设计→方差分析/Kruskal-Wallistest配伍组方差分析→方差分析多因素分析:析因设计、拉丁方设计、重复测量资料的ANOVA十、计数资料的统计分析一组:样本率与总体率比较→u检验两组:配对→配对McNemar检验非配对→卡方检验/u检验/确切概率法多组:两个(多个)构成比→卡方检验多个率比较→卡方检验十一、等级资料的统计分析两组:配对→配对符号秩和检验非配对→Wilcoxon秩和检验多组:完全随机设计→Kruskal-Wallistest配伍组设计十二、相关与回归重点是二者的区别与联系(如应用、检验方法、决定系数等)直线相关与回归的区别与联系☞区别资料类型不同:相关分析要求两个变量均服从正态分布。而回归分析则有两种不同的模型:一是事先规定X值的Y值必需服从正态分布,此为I型回归;另一类是X和Y都服从正态分布,称为II型回归。应用情况不同系数的求法不同对于同一份资料,只能计算一个相关系数而II型回归可以建立由X推Y,或由Y推X的两个不同的回归方程。系数的意义:-1≤r≤1,没有单位;b的取值没有限制,b有单位☞联系对于同一样本资料若同时计算r与b,二者的正负号是一致的。对于同一样本资料r与b的假设检验结果是等价的r与b可以互相换算相关系数的平方,成为决定系数。r2是回归平方和在总平方和中所占的比重,即应变量YZ在多大程度上决定于自变量X的变化。r2愈接近1,说明回归效果愈好。在实际应用时,分析两变量之间的相关关系不能只看其r相关是否显著,还要看其r2大小。十三、生存分析何谓生存资料生存资料包括是否生存以及生存长短两个方面生存资料的类型;完全数据和删失数据常见删失原因失访、退出、其他与研究无关的原因、研究终止生存率的估计方法寿命表法、Kaplan-Meier两条生存曲线的比较Log-rank检验是生存曲线的非参数方法之一,其基本思想是当H0成立时,根据ti时点的死亡率,可以计算各组的理论死亡数十四、观察性研究如何区分观察性研究和实验研究根本区别在于研究者是否人为地设置处理因素,即是否对研究对象施加了干预措施常见的几种观察性研究方法按调查涉及的对象多少可分为:全面调查(普查)、抽样调查和典型调查按调查的时间顺序可分为:回顾性调查、现况调查、前瞻性调查、历史前瞻性调查按时间的长短可分为:横断面调查和纵向调查按抽取样本的方式可分为:概率抽样调查(简单随机抽样、系统抽样、分层随机抽样、整群抽样等)和非概率抽样调查(偶遇抽样、判断抽样、定额抽样、雪球抽样)。常见的几种随机抽样调查方法各有何优缺点P289表15-2病例-对照研究资料的分析:假设检验及OR的计算假设检验:H0:OR=1,H1:OR≠1OR=ad/bc(配对:OR=b/c)队列研究资料的分析:假设检验及RR的计算假设检验:H0:RR=1,H1:RR≠1RR=P1/P0RR和OR的区别与联系(本题仅供参考)RR表明暴露组发病/死亡的危险是对照组的多少倍,RR↑暴露的效应↑暴露与结局关联强度↑——RR=1,相同、>1,是RR倍、小于1,暴露是保护因素

OR即比值比,表示疾病与暴露之间关联强度的指标,含义类似RR,指暴露者的疾病危险性是非暴露者的多少倍。OR=病例组暴露值/对照组暴露值=(a/c)/(b/d)=ad/bc

OR>1—疾病的危险度因暴露而增加,暴露与疾病之间正关联,<1—疾病的危险度因暴露而减少,暴露与疾病之间是负关联。疾病率<5‰,OR是RR极好的近似值。OR恒=ad/bc十五、实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论