医学统计学重点_第1页
医学统计学重点_第2页
医学统计学重点_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学:是运用统计学原理和方法研究生物医学资料的搜索整理分析和推断的一门学泊iiN统计学的主要内容1.医学研究统计设计2.分布理论3.统计描述4.参数估计和假设检验5.相关于回归。回茎:性质相同的事物。变工:由于一种或多种不可控制因素(已知或未知的)以不同程度,不同形式作用于物体的综合表现。星庄:根据研究目的确定的同质的研究对象的全体(集合)。个体:构成总体的最基本观察单位。样本:从总体中随机抽取的部分研究对象。样本中所包含的个体数称为样本含量。随机分为1.抽样随机2.分组随机3.实验顺序随机。随机变量(变量):由于个体的特征或指标存在个体差异,观察结果的测量前不能准确预测。统计量:样本所

2、算出的统计指标或特征值。旺:又称全距,用R表示,是数据集中最大值与最小值之差。变异系数(cv):亦称离散系数,为标准差与均数只比,常:CV=s/x统计推断医学研究往往是从总体中随机抽取一定含量的样本进行研究,目的是通过样本的信息判断总体的特征,这一过程称为统计推断抽样误差:从某总体中随机抽取一个样本来进行研究,而所的样本统计量与总体参数常不一致,这种由抽样引起的样本统计量与总体参数间的差异称为抽样误差。抽样误差的两个基本条件:1.抽样研究2.个体变异。标准误:反映均数抽样误差大小的指标,是样本抽样误差的标准差。系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向

3、性的偏大或偏小,这种误差称为系统误差随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(可靠度(reliabiliy)也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响正态分布定:又称高斯分布,是一条中间高,两头低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。点估计是直接用样本统计量作为对应的总体参数的估计值区间估计是按一定的概略或可信度用一个区间估计总体参数所在范围。医学参考值范围:指绝大多数正常

4、人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。最常用的是95%参考值范围。95%的可信区间:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间未包括总体均数。1、医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。5、频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析常见的统计资料的类型有:计量资料;计数资料;等级资料7、*t检验的应用条件是:

5、正态分布:当样本含量较小时,要求样本来自正态总体。方差齐性:两样本均数比较时,要求两总体方差相等。U检验的应用条件是:大样本(如n50);小样本,b已知且样本来自正态总体。8、.描述分类变量常用的指抗有率、构成比、相对数。9、虫是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,常用来描述某种现象发生的频率大小或强度构成比是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,常用来描述某一事物内部各组成部分所占的比重或分布。10、四格表卡方专用公式应用条件n40,且Tmin5研究事物或现象间的线性关系用相关分析,研究事物或现象间的线性数量依存

6、关系用回归分析。12、是反映两变量线关系间相关的密切程度与相关方向的指标。取值范围为-1WE1回归系数b意义是:X每增加(减)一个单位,Y平均改变b个单位从总体中抽取样本,一定要遵循科学原则:代表性;随机性;可靠性编制频数表的步骤:确定全距;确定组距;确定组段;正字化记:1.计量资料统计分析中,常用的集中趋势指标有哪些?适用条件有何不同?算术均数、几何均数、中位数,统称为平均数,均反映集中趋势。算术均数应用:主要适用于对称分布,尤其适合正态分布资料。几何均数:应用于对数正态分布,也可应用于呈倍数关系的等比资料。在医院中主要用于抗原(体)滴度资料。中位数:、适合条件:a、极偏态资料b、有不确定的

7、数据(有或)c、有特大值或特小值d、分布不明的资料2.离散趋势的指标及适用范围极差适用条件:除了两端有不确定数据之外,均可计算极差。四分位数间距:用于描述偏态分布资料。方差和标准差:用于描述正态分布计量资料的离散程度。变异系数适用条件:a、均数相差较大,b、单位不同3. 标准差和标准误的联系和区别有哪些?概念不同:标准差是描述观察值(个体值)之间的变异程度,S越小,均数的代表性越好;标准误是描述样本均数的抽样误差,越小,均数的可靠性越高;用途不同:标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。与样本含量的关系不同:当样本含量n足够大时

8、,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0联系:标准差、标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。4. 简述非参数检验的适用范围?分布未知未知的计量资料;等级资料;有不确定的数值;各总体方差不齐。5. I型错误和n型错误的区别和联系?区别I型错误(弃真):拒绝实际成立的H0,型错误的概率记为“。(1a)即置信度:重复抽样时,样本区间包含总体参数(W)的百分数。当pa而拒绝H0时,只能犯n型错误,不可能犯I型错误。联系对同一资料,a与3反方向变化,若要同时减小a与3,唯一的办法是增加样本含量。6. 正态分布的特征?.在x=处最高,以为中心的对称分布左右完全对称下降,

9、但不与横轴相交.两个参数决定位置和变异.曲线下面积分布有规律3.能否说假设检验的p值越小,比较的两个总体指标间差异越大?为什么?答:不能,因为P值的大小与总体指标间差异大小不完全等同。P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作3.方差分析的基本思想是什么?答:方差分析的基本思想就是把全部数据的总变异分解成两个或多个组成部分,注意不同设计类型的总变异分解有所不同,但其中都包括随机误差部分,分别将各部分的变异与随机误差进行比较,通过F值及相应的P值来判断均数间的差别是否具有统计学意义。中主要反映在样本量大小上。7

10、. 何谓假设检验,一般步骤?假设检验:是对总体做出某种假定,然后根据样本信息推断总体是否成立的一类统计学方法总称。假设检验有三个基本步骤:建立假设和确定检验水准,选择检验方法和计算检验统计量确定P值和做出统计推断结论8. 假设检验注意事项?假设检验的前提是要有严密的抽样设计,保证样本是从同质总体中随机抽取。并且,组间的均衡性和资料的可比性应予特别注意,除了对比的因素外,其它影响结果的因素应尽可能相同或基本相同。选用的检验方法应符合其应用条件。正确理解差别有无统计意义的涵义。结论不能绝对化。正确选用单侧还是双侧检验。报告结论时,应列出现有样本检验统计量值,说明采用的单侧还是双侧检验,并列出P值的

11、确切范围。9. 应用相对数时的注意事项计算相对数时分母不能太小分析时不能以(构成)比代(替)率总率(平均率)的计算:不能直接相加求和资料的可比性:两个率要在相同的条件下进行.研究方法相同、研究对象同质、观察时间相等、地区、民族、年龄、性别等。率也有抽样误差,要进行假设检验10. 什么是率的标准化?标准组的选择原则是什么?标准化的注意事项?当比较的两组资料内部各小组率明显不同,且各小组观测例数的构成比也明显不同时,直接比较两个合计率是不合理的。因为期内部构成比不同,往往影响合计率的大小,需要统一的内部构成进行调整后计算标准化率,使其具有可比性,这种方法称为率的标准化。标准组的选择原则:任意一组;

12、两组之和;有代表性的人口标准化的注意事项:标准不同得到的标化值内部各小组比较时,可不标化标化后的数值不再反映实际水平,反映相对水平。标化率也存在抽样误差,要进行假设检验。12.直线相关与直线回归的联系和区别?区别(1)资料:相关分析要求X、Y服从双变量正态分布;回归分析要求丫为正态随机变量,X为选定变量(2)应用:研究事物或现象间的线性关系用相关分析;研究事物或现象间的线性数量依存关系用回归分析。(3)意义:r是反映两变量线关系间相关的密切程度与相关方向的指标;b意义是:X每增加(减)一个单位,Y平均改变b个单位(4)计算:b=Lxy/Lxx,(5)取值范围:-ooboo,-1wy1(6)单位

13、:b有单位;r没有单位。联系(1)一致:r与b的正负号一致。(2)假检验等价:tr=tb(3)回归解释相关判断直线回归的效果:(1)散点图:回归效果好,散点呈直线趋势。(2)确定系数r2指的是应变量Y的总变异中归因与X的部分,若r2=1则SS回归。=0则各点严格遵守函数关系。(3)标准估计误差即剩余标准差Syx,它越小,回归效果越好。(4)残差(Y-X),即实测值Y与预测值X之差,反映了X对Y的影响之外的一切因素对Y的变异影响,也就是在总平方和中无法用X解释的部分。14.制定参考值步骤:(1)从正常人总体中抽样(2)控制测量误差(3)判定是否需要分组确定参考值范围(4)决定单侧还是双侧(5)选择合适的百分上限(6)对资料的分布进行正态性检验(7)根据资料的分配类型选定恰当的方法进行参考值范围的估计。卡方基本思想:X2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。X2反应实现了实际频数与理论频数的吻合程度。如果检验假设成立,则A-T一般不大,X2应很小,即出现大X2值概率很小。即X2越大,P越小,若Pa则没有理由拒绝H0。8.简述t分布的特

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论