




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学知识点整理又称为计量资料、定量资料: 观测每个观察单位某项指标的大小而 获的得资料。表现为数值X.S.p总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估第一节统计学中基本概念、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情 。况 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。变异:同质的基础上个体间的差异。“同质”是相对的,是客观事物在特定条件下的相对一致性,而 “变异”则是绝对的 二、总体与样本1 、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全 体。2、样本:是从总体中随机抽取的部分观察单位变量值的集
2、。合 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希 腊字母表示。样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉 丁字母表示。四、误差:实测值与真值之差1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。3. 非系统误差:过失误差,可以避免或清 除。五、概率是用来描述事件发生可能性大小的一个量值,常 用P 表示。概率取值 01 。统计上一般彳Pw 0.05或PW 0.01的事件称为小概率事件,表示其发生的概率很小
3、,可以认为在一次抽样中不会发生。第二节统计资料的类型这种特征能表变量: 确定总体之后, 研究者应对每个观察单位的某项特征进 行观察或测量, 现观察单位的变异性,称为变量。、数值变量资料大小,带 有度、量、衡单位 。如身高(cm)、体重(kg)、血红蛋白(g)等。二、无序分类变量资料又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。分类:二分类: +-;有效,无效;多分类:ABO 血型系统特点:没有度量衡单位,多为间断性资料例题单选】某地A、 B、 O、 AB 血型人数分布的数据资料是A.定量资料C.计数资料B. 计量资料D. 等级资料
4、答案】 C解析】 ABO 血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。例题单选】测量正常人的脉搏数所得的变量是()A .二分类变量B.多分类变量C. 定量变量D.定性变量答案】 CC。解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选 三、有序分类变量资料 半定量资料或等级资料: 将观察对象按观察对象的某种属性的不同程度分成等级后分组计数, 分组汇总各组观察单位后得到的资料。特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:+ + +第三节统计工作的基本步骤4. 统计设计5.
5、收集资料 6. 整理资料7. 分析资料:统计描述:是利用统计指标、统计表和统计图相结合来描述样本资料的数量特征及分布规律。统计推断:是使用样本信息来推断总体特征。统计推断包括区间估计和假设检验。第四节统计表与统计图 、统计表统计表的基本结构与要求 标题:高度概括表的主要内容,时间、地点、研究内容,位于表的上方,居中摆 ,放侧左加表的序号。标目:横标目和纵标目。通常采用三线表和四线表的形式。没有竖 线或斜线。数字:表内数字一律用阿拉伯数字。同一指标, 小数位数应一致,位次对齐。 无数字用 “ ”表示。暂缺用 “ ? ”表示。 “0 为”确切值。位于表的下面,通常是对表内数字的注解和说明,必要时可
6、 以用“* ”等标出。一张统计表的备注不宜太多。二、制表原则重点突出,一个表一个中心内容主谓分明,层次清楚简单明了,一切文字数字线条尽 量从简例题单选】统计表内不列的项是2010.7 )A.标目B.线条C.数字D.备注答案】 D解析】统计表内备注位于表的下面,不列在统计表内,所以本题选择三、统计图8. (1)标题( 2)标目( 3)刻度( 4)图例:不同颜色或者不同线条表示,需要说明。9. 常用统计图的适用条件与要求1 )条图:适用于比较、分析独立的或离散变量的多个组或多个类 别的统计指标。2)圆图和百分比条图:构成比的比较3)线图:描述某统计量随另一连续性数值变量变化而 变 化的趋势。4)直
7、方图:数值变量的频数分布。5)散点图:用点的密集程度和趋势 描 述2 个变量间的数量关系6)箱式图:多组数据分布的比较7)统计地图:用不同的颜色和花纹表示统计量的在地理分布上的变化,适宜描述研究指标的地理分布。图。例题填空】描述某地十年间结核病死亡率的变化趋势 宜 制绘答案】线图数值变量资料的统计分析第一节数值变量资料的统计描述、频数分布表10.编制步骤(1)计算全距(2)确定组距(3)划分组段(3)统计频数(4)确定频率与累计频率11.频数分布表的主要用途:(1 )揭示资料的分布类型(2)观察资料的集中趋势和离散趋势(3)便于发现某些特大或特小离群值(4)便于进一步计算统计指标和作统计处理二
8、、集中趋势指标 数值变量资料的集中趋势指标是用平均数来描述的,代表一组同质变量值的平均水平。常用的有算术均数、几何均数和中位数。1.算数均数适用于对称分布(正态分布)或者近似对称分布的资料。习惯上以 a表示总体均数,以X表示样本均数。2.几何均数数值变量呈倍数关系或者呈对数正态分布,如抗体效价及抗体滴度,某些传染病的潜伏期、细菌计数等,宜用几何均数(G)。几何均数常用于等比资料或对数正态分布资料。3.中位数是指将一组变量值从小到大排列,位次居中的观察值就是中位数。适用条件:变量值中出现个别特别大或特别小的数值;偏态分布资料;数值一端或两端无确定数值;资料类型不明。4.百分位数是一种位置指标,以
9、Px表示,把一组数据从小到大排列后,理论上有X%的变量比Px小,有(100-X ) %的变量值比Px大。【例题单选】描述正态分布资料集中趋势的指标是()A.中位数B.几何均数C.算术平均数D.标准差【答案】C【解析】算数均数适用于对称分布或者近似对称分布的资料。几何均数常用于等比资料或对数正态分布资料。中位数适用条件:变量值中出现个别特别大或特别小的数值;偏态分布资料;数值一端或两端无确定数值;资料类型不明。标准差描述数据的离散趋势指标。所以本题选择Co四分位数间距Q:般和中位数一起描述偏态分布资料的分布离散趋势。5.方差和标准差:方差表示样本观察值的离均差平方和的均值。表示一组数据的平均离散
10、情况。标准差是方差的正平方根。用途: 2r( x - x) 匸 x 2n = 1(1)用于表示正态或近似正态分布资料的离散度;(2)反映均数的代表性标准差越小,数据离散程度越小,均数的代表性越好。(3)确定医学参考值范围x 1. 96 s 95%医学参考值范围3.变异系数(CV)适用条件: 观察指标 单位不同,如身高、体重同单位资料,但均数相差悬殊四、正态分布与参考值范围的制定(一)正态分布1.概念:也称高斯分布,是医学和生物学最常见、最重要的一种连续性分布。2.特征:(1)在直角坐标的横轴上方呈钟型曲线,两端与X轴永不相交,且以X= U为对称轴三、离散趋势指标12.极差和四分位数间距反应变量
11、值的离散范围。极差:简记为 R,亦称全距,即一组变量值中最大值与最小值之差,CT 。均数卩描述了正态分布的集中趋势位置,若固定(7,改变U值,曲线沿着轴平行移动,其左右完全对称 (2)在x=卩处,f(X)取最大值(3)正态分布有两个参数,即均数U和标准差(7越小,曲线越陡峭;反之,7越大,曲线越平坦.故7称为形状参数或离散度参数。(4)正态曲线形状不变,故卩称为位置参数。标准差7描述了正态分布的离散程度,若固定下的面积分布有一定的规律。4. 正态曲线下面积的分布规律1(7 1.96a 238(r-258o196a -Iff 4I I J 6827% 15-00%99.00%(二)医学参考值范围
12、的制定医学参考值:是指绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。、必下*削Ml限E tt单!, -也p< *l ws'1 2S>X + 1 2SSPl,% IgX - 1 25 » 1止P ./ sK亠:M¥'EJ r,.'卩八pIV; 7右总U分仃ft注第二节数值变量资料的统计推断均数的抽样误差与标准误抽样误差:由于个体变异和抽样造成的样本统计量与总体参数和样本统计量之间的差异。均数的抽样误差:由于抽样造成的样本均数与总体均数和样本均数间的差异。标准误: 样本均数的标准差,用CTn ( 未知)二、t分
13、布LII一 _ U二-X = XS 'n Su不同,曲线形状不同t分布曲线以 0为中心,t分布为一簇单峰分布曲线,t分布与u有关,u越小,t值越分散,t分布的峰部越低,而两侧尾部翘得越高t界值表中一侧尾部面积称单侧概率(a )两侧尾部面积之和称双侧概率(a /2)如:t0.05/2,9-2.262 ,t0.05,9-1.833 在相同自由度时,1t I值增大,a减小在相同a时,单尾a对应的t值比双尾 a的小三、总体均数的区间估计 统计描述统计分析参数估计-用样本指标估计总体指标统计推断 假设检验 总体均数置信区间(可信区间)的计算区间估计:是按预先给定的概率(1- a )所确定的包含未
14、知总体参数的一个范围。小样本或(7未知按t分布i t匚(二) 1. 已知 7 - U2. (7未知,但大样本(n>60 )按u分布四、假设检验的意义和基本步骤 假设检验:先对总体的参数或分布做出某种假设,再用适当的统计方法根据样本对总体提 供的信息,推断此假设应当拒绝或不拒绝。基本步骤:1、建立检验假设,确定检验水准(1)Ho:(无效假设)a -卩0(2)Hi:(备择假设)(3)确定检验水准a -0.056. 选定检验方法,计算检验统计量7. 确定P值,作出推断结论第三节均数的t检验与u检验t检验应用条件:样本与总体/两样本均数的比较当nv60时,要求样本取自正态分布的总体,总体标准差未
15、知;2=<r 22 )。两小样本均数比较时,要求两样本总体方差相等((7 1n含量较大,u分布、单样本 t检验适用于样本均数代表的未知总体均数g和已知总体均数戸n-1LI 0 I-SZ二、配对样本t检验适用于配对设计的计量资料,常见的配对设计主要有以下情形:自身比较:同一受试对象处理前后。同一受试对象分别接受两种不同的处理。将条件近似的观察对象两两配成对子,对子中的两个个体分别给予不同的处理。前提条件:d变量服从正态分布【例题单选】作配对样本t检验的前提条件是A.两组数据独立B. 两组数据不独立C. 两组数据的差值服从正态分布D. 两组数据的差值不服从正态分布【答案】C【解析】配对样本
16、t检验样本可以是自身配对,也可以异体配对,所以数据可以独立,也可以不独立。它处理的是两样本的差值,所以差值要服从正态分布才可以应用配对样本t检验,所以本题答案选Co三、两样本 t检验适用条件:完全随机设计的两样本均数的比较。比较两样本所代表的总体均数相等。完全随机设计是将受试对象完全随机分配到两个不同处理组。要求:独立、正态、方差齐性/ "V=n, + n2-2(V )/>四、两样本 u检验完全随机设计的两样本均数的比较。适用于样本量比较大的资料(n1 > 60 且 n2 > 60)X -X21X 1X 2X 1 - X 22Sx 1五、假设检验应注意的问题1、假设
17、检验应有严格的抽样设计-同质2、要注意选用的假设检验方法的应用条件正确区分差别有无统计意义与有无专业上的实际意义结论不能绝对化假设检验的单侧检验与双侧检验的选择假设检验的两类错误第I类错误:拒绝实际上成立的第类错误:不拒绝实际上不成立的当样本含量 n 定时,a越小,Ho,犯第I类错误的概率大小为Ho,犯第类错误的概率为3越大;若想同时减少 a和1- 3称为假设检验的功效当所研究的总体与绝Ho)的概率分类变量资料的统计分析第一节分类变量资料的统计描述 、常用相对数况。3,只有增大样本含量。Ho确有差别时, 按检验水准 a能够发现它(拒率:说明某现象发生的频率或强度。构成比:说明某一事物内部各组成
18、部分所占的比重或分布。相对比:说明一个指标是另一个指标的几倍或百分之几。【例题单选】某医院住院病人中有15 %的胃癌患者,该5%是()A.患病率B.发病率C.构成比D.相对比【答案】C【解析】15 %的胃癌患者指的是胃癌患者占住院病人的15%,所以是构成比。【例题填空】构成比是说明或分布指标。率是说明或强度的指标。【答案】比重;频率 二、应用相对数时应注意的问题(2011.7简答题)13. 计算相对数时,观察单位数应足够多14. 分析时不能以构成比代替率15. 相对数的相互比较应注意可比性,不具有可比性应进化16. 样本率或构成比的比较应做假设第二节分类变量资料的统计、率的抽样误差与标准误二、
19、总体率的区间估计;T(J =pn1时(小概率事件),按二项分布原8. 查表法:当_ n较小,如-n < 50 ,特别是 p接近与0或二 P (1 P )s则估计总体率的可信区间。p9.区间估计正态近似法:当样本含量 n足够大,样本率p或1-p均不太小时 如np和n(1-P)均大于5,样本率的分布近似正态分布,总体率可信区间在(1-a )可信度下,估计为:P±U a/2SpP ±2.58Sp例:总体率 95%的可信区间: P ±1.96SP ;总体率 99%的可信区间:三、两总体率之差的区间估计条件:当样本含量n足够大,样本率P或1-P均不太小时,即np和n(
20、1-p)均大于5,样本(p 1-P 2 + U a /2 Sp1-p2 )率的分布近似于正态分布(p 1-P2 -U a /2 Sp1-P2 ,X亠X 11 2 _ +)(-n四、率的u检验一)羊本率与总体率比较的%/ I - Jt)(二)两木2第三节 X检验、四格表资料的检验(一)四格表资料的X2检验的基本思想假设两组资料率的差异来自抽样误差,用X 2值反映实际频数和理论频数吻合的程度。在X 2值较大,超过了设定的检验水准,则有理由怀疑Ho的真实性,从而拒绝Ho,接受Hi ( Hi: n 1Ho ( n 1= n 2)成立的条件下,实际频数与理论频数相差不应该很大,若实际算出的应用:推断两个
21、(或多个)总体率或构成比之间是否有差别和多个样本率间的多重比较属M处理介汁一、四个表资料的卡方检验阳件阴性1组"】2(八2)心(固定值)2组"21(721)"22 2)«2(固定值)人;n 叭叫/r四个表X2检验基本公式:A为实频数 T为理论频配对设计四个表卡方检验公式:若b+c > 40四个表 X式:2检验专用公22(ad bc) n +2检验专用公式:(a b)( a c)(b d )(c d)适用条件:两样本率比较时,Z 二二 T(二)四格表资料的 X2检验的校正公式总例数40且所有格子 T > 50.5 )/ 2(adbc n(ab)
22、(cd)( ac)(b17.当n > 40且所有的 T>5时,用X2检验的基本公式或四格表资料a时,改用四格表资料的Fisher确切概率法。18.当 n > 40 但有 1 < T<5时,用四格表资料确切概率法19.当 nV 40,或 TV I 时,d)2X佥验的专用公式;当pX2检验的校正公式或改用四格表资料的Fisher用四格表资料的 Fisher确切概率法。II. 10 K对m格表形式(三)四格表资料的确切概率法 甲 仟计四格表资料的Fisher确切概率法是一种直接计算概率的方法,理论依据是超几何分布,四二、配对四格表资料的格表资料的确切概率法不属于X检验的
23、范畴,常作为四格表资料假设检验的裤X广ff佥验广=1若 b+c V 40,H 6 - e I - y *人h + <2检验三、行X列表资料的 用于多个样本率的比较,两个或多个构成比的比较1/5理论频数不应小于1 , 1 < TV5的格子数不应超过总格子数多个样本率比较,若所得统计推断为绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间均有差别。般的X2检验不适用于有序分类资料(等级资料)等级”程度”优的比较分析。因为检验只利用了两组构成比提供的信息,损失了有序指 标包等级信息。第四节秩和检验 秩和检验是将定量数据从小到大、等级从弱到强或从强到弱转换成
24、秩后求和,计I检验统计量秩统计量,做统推断应用:不满足t检验条件的数值变量资料有序分类变量资料(等级资料)分布类型不明一端或二端无确定数值任何分布类型的资料秩和检验应用中的注意项(1)秩和检验一方面由于其方法的稳健性而具备不受总体分布限制,适用范围的优点但另一方面, 在秩转换的过程中损失了原数据的部分信息。如果已知计量资料满足(或近似满足)t检验应用条件,这时若选秩和检验,由于没有充分利用资料提供的信息,会降低验效能。即当 Ho不真时,秩和检验将不如t检验能较灵敏勺绝Ho,犯第2类错误的概率要比t检验大。(2)对于计量资料,若满足正态和方差齐性条件,应选t检验对总体均数作假设验当资料偏离假定条
25、件时,选用秩和检验才是可靠的t检验方法对平均秩次进(3)对于大样本资料,通过把原变量值或等级转换成秩后,可行检验。【答案】秩和【例题简答】秩和检验的优点【答案】秩和检验适合任何分布的资料;具有较好的稳健性。第十八章直线回归和直线相关第一节直线回归 用于分析两变量间依存变化的数量关系、直线回归方程Y = a 亠 bXY的估计值。式中的X为自变量;式中的 ?是由自变量 X推算应变量a是回归直线在 Y轴上的截距,即 X=0时的Y值;b为样本的回归系数 ,即回归直线的斜率, 表示当X变动一个单位时, Y平均变动 b个单位。a和b的估计常用最小二乘法原则(X,丫)所有的点离回归线的纵向距离最近;回归线必然通过求回归方程的的步骤:在普通坐标系中作散点图,看是否有直线趋势。求X、丫的离均差乘积和Ixy及X、Y的离均差平方和Ixx、Iyy求a和b I xyb =1 xx(X -X )(Y - Y )a Y bXXY(X)列出回归方程: ?=a+bX【例题填空】直线回归是分析间数量关系的统计方法。(2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025镀锌钢管骨架采购合同
- 2025二级建造师建设工程施工管理考点:合同管理索赔程序
- 2025年武汉单身公寓租赁合同模板
- 2025设备安装合作协议合同范本
- 2025信息安全咨询技术合同
- 2025水果收购合同书样本
- 2025【景观设计合同】景观工程设计包括内容
- 《胃镜检查技术》课件
- 2025标准简化版合同范本
- 2025标准版:员工签订长期合同协议范本
- 关于辽宁省电力有限公司收取多回路
- 四川施工组织设计(方案)报审表(共3页)
- 退休证翻译模板word
- 《爱护眼睛和耳朵》PPT课件.ppt
- SimTrade外贸实习平台快速入门
- 民间非营利组织会计制度.ppt
- 女装类直播电商脚本及直播话术(明细表)
- 镀锌钢管质量检验报告
- 热管换热器设计说明书
- 水电站防地震灾害应急预案范本
- 佛山市禅城区机动车维修项目工时费收费标准
评论
0/150
提交评论