版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计复习资料一、名词解释1 .总体:根据研究目确实定的同质观察单位的全体.是同质所有观察单位的某种变量值的集合.总体可分为有限总体和无限总体.总体中的所有单位都能够标识者为有限总体,反之为无限总体.2 .样本:从总体中随机抽取局部观察单位,其实测值的集合.3 .计量资料:又称定量资料或数值变量资料.为观测每个观察单位的某项指标的大小,而获得的资料.其变量值是定量的,表现为数值大小,一般有度量衡单位.根据其观测值取值是否连续,又可分为连续型或离散型两类.4 .计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位根据某种属性或类别分组计数,分组汇总各组观察单位数后得到的资
2、料.其变量值是定性的,表现为互不相容的性或类别.分两种情形:(1)二分类:两类间相互对立,互不相容.(2)多分类:各类间互不相容.5 .等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料.其变量值具有半定量性质,表现为等级大小或属性程度.6 .随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法限制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化.7 .概率:概率(probabiHty)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(
3、A),P(A)越大,说明A事件发生的可能性越大.0<P(A)<1.频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,那么比值m/n称为随机事件A在n次试验中出现的频率(freqency).当试验重复很屡次时P(A)=m/n.8 .平均数:描述一组变量值的集中位置或水平.常用的平均数有算术平均数、几何平均数和中位数.9 .算术均数(arithmeticmean)描述一组数据在数量上的平均水平.总体均数用以表示,样本均数用X表示.10 .几何均数(geometricmean用以描述对数正态分布或数据呈倍数变化资料的水平.记为G.11 .中位数(median)Md将一组观察值由
4、小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值.反映一批观察值在位次上的平均水平.12 .方差(variance):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到.13 .标准差(standarddeviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用.14 .变异系数(coefficientofvariation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比拟.用CV表示.计算:标准差/均数*100%.15 .正态分布:正态分布又称高斯分布,是一种很重要的连续型分布,应
5、用很广.假设指标X的频率分布曲线对应于数学上的正态分布曲线,那么称该指标服从正态分布.(曲线下面积和分布规律)16 .标准误及Xs:通常将样本统计量的标准差称为标准误.许多样本均数的标准差Xs称为均数的标准误(standarderrorofmeanSEM),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小.17 .可信区间:按预先给定的概率确定的包含未知总体参数的可能范围.该范围称为总体参数的可信区间(confidenceinterval,CI).它确实切含义是:可信区间包含总体参数的可能性是1-a,而不是总体参数落在该范围的可能性为1-a.18 .假设检
6、验中P的含义:指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率.19 .相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小.如率、构成比、比等.20 .率:强度相对数,说明某现象发生的频率或强度.21,构成比:结构相对数字,表示事物内部某一局部的个体与该事物各个局部个体数的和之比.用来说明各构成局部在总体所占的比重或分布.22,相比照:简称比,是两个相关联指标之比,说明两指标间的比例关系.两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示.两指标可以是绝对数、相对数或平均数.(这几种相对数的差异)
7、23,回归系数(regressioncoefficient)即直线的斜率(slope),在直线回3方程中用b表示,b的统计意义为X每增(减)一个单位时,Y平均改变b个单位.24,相关系数r:用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标.二、需要掌握的几个公式1,均数的计算(1)算术均数X迎凶XnX(直接法)nnXf1X1f2X2fkXkfx(加权法)(2)几何均数2,中位数XnXn()(1)n为奇数时,MXn1;n为偶数时,M-年23.方差4,标准差(S):将方差取平方根,复原为与原始观察值单位相同的变异量度-2XX(反映样本值的离散程度)S<-n15.变异系数:均
8、数相差较大或单位不同的几组观察值的变异程度的比拟SCV-100%(百分数,可能大于1)X5,正态分布:X1.64S(90%);X1.96S(95%);X2.58S(99%)6,均数的标准误理论值又/布估计值SXS/而7,总体均数的可信区间计算(1)当(T未知时:根据t分布双侧1-a的可信区间为(Xt0,05/z&,X、的2,%)当侧1-a的可信区间为(XtSx,XtSx)(2)当6或未知,但是n足够大(如n>90),根据u检验双侧1-a的可信区间为X1.96Sx,当侧1-a的可信区间为XX,XX三、计算和问答1 .总体均数的估计(1)标准误:反映样本均数间变异的标准差.(反映样本
9、均数间的离散程度,也反映样本均数与总体均数的差异)理论值又/亦,但是在实际情况中,由于总体标准差常常未知,故用样本标准差s来估计,估计值SXS;n(2)区间估计:按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数.当(T未知时:根据t分布双侧1-a的可信区间为(Xt0.05/z&,Xt005/2,Sx)当侧1-a的可信区间为(Xt,Sx,Xt,Sx)当b或b未知,但是n足够大(如n>90),根据u检验双侧1-a的可信区间为X1.96Sx,当侧1-a的可信区间为Xx,Xx(3) t分布和u分布的区别t分布为抽样分布;u分布为标准正态分布,为理论分布.t分布比标准正态分布的
10、峰值低,且尾部翘得更高.随自由度的增大,t分布逐渐趋近标准正态分布.2.假设检验即显著性检验,是统计推断的重要内容,比拟总体参数之间有无差异.首先对所需比拟的总体提出一个无差异假设,然后通过样本数据去推断是否拒绝这一假设.根本步骤:建立假设和确定检验水准选择检验方法和计算检验计量确定P值,作出统计推断无效假设:H0,指需要检验的假设,如*值治疗前后无差异,即H0:d=0通常与我们要验证的结论相反,是计算检验统计量和P值的依据备择假设:是在H0成立证据缺乏的情况下而被接受的假设,即H1:pdw0双侧检验:无论正或负方向的误差,假设显著超出检验水准那么拒绝H0单侧检验:仅在正方向或负方向误差超出规
11、定的水准时拒绝H0P值:假设检验下结论的主要依据,是指在原假设成立的条件下,观察到的样本差异是由于机遇所致的概率.P>0.05不显著;0.01<P<=0.05显著;P<=0.01非常显著3 .t检验(1) t检验中的考前须知样本资料必须能代表相应总体t检验以正态分布为根底;非正态数据尝试变换为正态,或用非参数检验完全随机设计的两样本均数比拟,要求两组方差齐对同一资料作单侧检验更容易获得显著结果假设检验用于推断总体均数间是否相同;可信区间用于估计总体均数所在范围4 .方差分析将全部观测值的总变异按影响因素分为相应的假设干局部变异,在此根底上,计算假设检验的统计量F值,实现
12、对总体均数是否有差异的推断.条件:来自于正态分布总体,且总体方差相等的k个样本均数的比拟(k>=3)完全随机设计:又称单因素方差分析,将实验对象随机分配到不同处理组的单因素设计方法.只考虑一个处理因素总变异SSt.n个观测值的离均差平方和组间变异SSr:组内均值与总均值之差的平方和组内变异SSE:组内各个观测值与本组内均值之差的平方和(反映各组内样本的随机波动)随机区组设计:又称配伍组设计,先将受试对象按条件相同或相近组成m个区组,每个区组中有k个受试对象,再将其随机地分到k个处理组中.(属于无重复数据的两因素方差分析)5 .相对数两个有联系的指标之比,是分类变量常用的描述性统计指标,常
13、用两个分类的绝对数之比表示相对数学的大小.如率、构成比、比等.相对数死亡概率q某年内死亡人数某年年初人口数生存概率p某年活满一年人数某年年初人口数生存率S(tk)P(Ttk)tk时刻仍存活的例数观察总例数相对数使用的考前须知1 .构成比只能说明某事物内部各组成局部的比重和分布,不能说明该事物某一局部发生的强度和概率.2 .分母过小时相对数不稳定3 .用以比拟的资料应是同质的4 .要考虑存在的抽样误差,对总体进行推断时应作统计学检验6 .率的标准化为了比拟两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成(年龄、性别、工龄、病程长短等)的影响.27 .检验英国统计学家Peaso谯出的一
14、种用途广泛的假设检验方法.该检验以2分布为理论依据,可以推断两个或者多个总体率以及构成比直接有无差异.(1)四格表资料的2检验理论频数Trc(nR?nc).'n四格表资料2检验专用公式四格表2检验校正公式22(adbc)2n(ab)(cd)(ac)(bd)(adbcn2)2n(ab)(cd)(ac)(bd)通常规那么:n40且所有的T5根本公式(或专用公式)n40但有1T<5校正公式n<40,或T<1Fisher确切概率法(2)配对四格表资料的2检验公式:2(b-c-,=1(b+c)40bc/、2(bc1)22,=1(b+c)<40bc(3)行列表资料的2检验A
15、2专用公式:n1,二(行数-1)(列数-1)r%条件:1<T<5的格子数,不能超过总格子数的1/5;不能有T<1与分类变量的顺序无关对于有序的RC表资料不宜用2检验8 .秩转换的非参数检验如果计量满足或近似满足t检验或者F检验,优先选择t检验秩转换的非参数检验适用于:总体分布为偏态或分布未知的计量资料等级资料个别数据偏大,或数据的某一端无确定数值各组离散程度相差悬殊,即各总体方差不齐特点:适用范围广,不限方差齐性、变量类型、样本量损失了局部信息,检验效率低极度偏态,犯第二类错误的概率较大非参数检验,与参数检验的区别.答:非参数检验对总体分布不作严格的假定,不受总体分布的限制,
16、又称任意分布检验.它直接对总体分布或分布位置作假设检验.总体分布为的数学形式,对其总体参数作假设检验那么为参数检验.秩转换的非参数检验,适用情况.答:秩转换的非参数检验是先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量.其特点是假设检验的结果对总体的分布形状差异不敏感,只对总体的分布位置差异敏感.适用于:不满足正态或和方差齐性的小样本资料;分布不知是否正态的小样本资料;一端或两端是不确切数值的资料;等级资料.两组或多组等级资料的比拟,为何不用X2检验而用秩转换的非参数检验.答:X2检验只能推断两个或多个总体的等级构成比的差异.选用秩转换的非参数检验,可推断两个或多个总体的等级强
17、度差异.非参数检验:不考虑总体的参数和总体的分布类型,对总体的分布或分布位置进行检验的方法.9 .线性回归分析线性回归分析的考前须知两个内在有联系的变量,回归分析才有意义假设存在依存因果的关系,那么原因变量设为X,结果变量设为Y进行相关,回归分析前应绘制散点图因变量是服从正态分布的随机变量;自变量可随机,可给定不要把估计范围扩大到建立方程时的自变量取值范围之外线性相关与回归的区别相关系数的计算只适用于两个变量都服从正态分布的情形;回归分析中,因变量随机,自变量随机I型回归模型,两个变量都服从正态;或是给定的量R型,每个X取值对应的变量Y服从正态分布线性相关表示两个变量间的相互关系,是双向的;回归反映两个变量之间的依存关系,是单向的线性相关与回归的联系同一资料进行相关与回归分析,相关系数r与回归方程中的b正负号相同同一样本的r与b的假设检验是等价的10 .统计表和统计图1统计表结构:标题,标目横、纵,线条,数字,备注三横线表:顶线,中间线,底线标题,标目,数据2统计图结构:标题
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 动漫作品中的心理健康主题考核试卷
- 卫生洁具行业标准化与零售商质量管理案例分析考核试卷
- 2025年粤人版七年级科学上册月考试卷含答案
- 个性化定制版2024买卖协议条款精解版
- 2025年人教版九年级化学上册阶段测试试卷含答案
- 奶牛饲养与乳品市场动态分析测试考核试卷
- 2025年华师大版九年级科学上册阶段测试试卷含答案
- 20XX年新版离婚合同指南:详尽条款与规范版B版
- 二零二五年度二零二五测绘成果应用与推广合同3篇
- 三方房地产工程承包协议:2024年项目细则版B版
- 英语-辽宁省大连市2024-2025学年高三上学期期末双基测试卷及答案
- 2024年意识形态风险隐患点及应对措施
- 2025版新能源充电桩加盟代理合作协议范本3篇
- 2025年广东省揭阳市揭西县招聘事业单位人员11人历年高频重点提升(共500题)附带答案详解
- 空调年度巡检报告范文
- 培训学校 组织架构及部门岗位职责
- 静脉输液反应急救流程
- 反诈知识竞赛题库及答案(共286题)
- 2025届江苏省淮安市高三一模语文试题讲评课件
- 青岛版二年级下册数学三位数退位减法竖式计算题200道及答案
- 基础plc自学入门单选题100道及答案解析
评论
0/150
提交评论