医学统计学_重点_终极笔记_第1页
医学统计学_重点_终极笔记_第2页
医学统计学_重点_终极笔记_第3页
医学统计学_重点_终极笔记_第4页
医学统计学_重点_终极笔记_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、MedicalStatistics【Introduction】医学统计工作的内容1实验设计:最关键、最重要收集资料:最基础原始资料实验数据,现场调查资料,医疗卫生工作记录、报告、报表质量控制:精度和偏倚整理资料:资料的逻辑、一致性检查,原始数据的加工(频数分布表)分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断资料的类型计量资料:定量方法测定数值大小所得的资料计数资料:按性质或类别分组,然后计数等级分组资料:具有计数资料的特性,又有半定量的性质(-表示)变异:不同个体在相同环境下,对外界环境因素发生的不同反应,即个体差异总体:同质的个体所构成的全体。同质性,大量性,差异性样本:从总体

2、中抽取部分个体的过程称为抽样,所抽得的部分是样本。样本包含的个体数目称为样本含量样本的特征:代表性随机性可靠性*抽样的要求:代表性,随机性,可靠性,可比性完全随机设计:将受试对象随机分配到各处理组或对照组中,或分别从不同总体中随机抽样进行研究。可为两样本或多样本得比较,但样本含量不宜相差太大。随机区组设计:也称配伍设计,是配对设计的扩展。配对设计的每一“对子”中的受试对象分别随机分到两个处理组中,而配伍组设计中的每个“配伍组”,包含多个受试对象,要将它们分别随机分到各处理组中。误差:泛指观测值与真实值之差,以及样本统计量与总体参数之差系统误差:在收集资料过程中,由于仪器调整、试剂校验、医生对疗

3、效的掌握等因素,造成观察结果倾向性的偏大活偏小。要尽量查明原因,必须克服。随机测量误差:在收集资料过程中,即使系统误差已经避免,由于各种偶然因素的影响造成对同一对象多次测定的结果不完全一致。譬如操作员技术、电压、环境温度的差异。没有固定的倾向,时高时低;应采取措施加以控制。抽样误差:由抽样不同引起的样本均数与总体均数之间的差异。原因是个体之间存在变异,抽样时只能抽取总体的一部分作为样本。不可避免,要用统计方法进行正确分析。概率:描写某一事件发生可能性大小的一个度量。频率:样本实际发生率小概率事件:P=50)的情况下,无论原始测量变量服从什么分布,的抽样分布都近似服从正态分布N(,)标准误:反映

4、样本均数间变异的标准差。(反映样本均数间的离散程度,也反映样本均数与总体均数的差异)理论值估计值参数估计:由样本统计量估计总体参数。点估计:使用单一的数值直接作为总体参数的估计值。如用估计相应的,(未考虑抽样误差的影响)区间估计:按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。可信度:事先给定的概率1-通常取0.95或0.99);计算得到的是可信区间95%可信区间(,)假设检验:即显著性检验,是统计推断的重要内容,比较总体参数之间有无差别。首先对所需比较的总体提出一个无差别假设,然后通过样本数据去推断是否拒绝这一假设。基本步骤:建立假设和确定检验水准选择检验方法和计算检验计量确定

5、P值,作出统计推断无效假设:H0,指需要检验的假设,如*值治疗前后无差别即H0:=0通常与我们要验证的结论相反,是计算检验统计量和P值的依据备择假设:是在H。成立证据不足的情况下而被接受的假设即出:#0双侧检验:无论正或负方向的误差,若显著超出检验水准则拒绝H。单侧检验:仅在正方向或负方向误差超出规定的水准时拒绝H。P值:假设检验下结论的主要依据,是指在原假设成立的条件下,观察到的样本差别是由于机遇所致的概率。P0.05不显著0.01P=0.05显著P0.05,可认为总体方差齐)t检验u检验:总体标准差已知,或样本量较大时,样本均数与总体均数的比较t检验中的注意事项1样本资料必须能代表相应总体

6、t检验以正态分布为基础;非正态数据尝试变换为正态,或用非参数检验完全随机设计的两样本均数比较,要求两组方差齐对同一资料作单侧检验更容易获得显著结果5假设检验用于推断总体均数间是否相同;可信区间用于估计总体均数所在范围假设检验中的两类错误第一类错误:当为真时,拒绝接受。又称假阳性错误,阳性指两者总体参数有差异。检验水准是预先规定的犯错概率的最大值第二类错误:当为假时,不拒绝。又称假阴性错误。概率大小用表示,只取单侧,一般未知。可证,越大越小,越小越大。增大样本含量可同时减小两类错误。【方差分析】方差分析:将全部观测值的总变异按影响因素分为相应的若干部分变异,在此基础上,计算假设检验的统计量F值,

7、实现对总体均数是否有差别的推断。条件:来自于正态分布总体,且总体方差相等的k个样本均数的比较(k=3)完全随机设计:又称单因素方差分析,将实验对象随机分配到不同处理组的单因素设计方法。只考虑一个处理因素总变异:n个观测值的离均差平方和组间变异:组内均值与总均值之差的平方和组内变异:组内各个观测值与本组内均值之差的平方和(反映各组内样本的随机波动)完全随机设计的方差分析表(自由度)F=随机区组设计:又称配伍组设计,先将受试对象按条件相同或相近组成m个区组,每个区组中有k个受试对象,再将其随机地分到k个处理组中。(属于无重复数据的两因素方差分析)随机区组设计的方差分析表(自由度)【相对数及其应用】

8、相对数:比较分析现象间的发展关系。把基数化作相等,便于比较*绝对数:研究事物现象的基本资料率构成比相对比相对数使用的注意事项构成比只能说明某事物内部各组成部分的比重和分布,不能说明该事物某一部分发生的强度和概率。分母过小时相对数不稳定用以比较的资料应是同质的要考虑存在的抽样误差,对总体进行推断时应作统计学检验率的标准化:为了比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成(年龄、性别、工龄、病程长短等)的影响。标准构成:选取有代表性、较稳定、数量较大的人群构成为标准选择相互比较的各组例数合计为标准构成从比较的各组中任选其一作为标准构成死亡率:某地某年每1000人中的死亡率年龄别

9、死亡率:某地某年龄组每1000人口中的死亡数死因别死亡率:某年每10万人中,由于患某疾病死亡的人数死因构成:相对死亡比,某种死因引起的死亡人数占总死亡人数的百分比发病率:某一时期内特定人群中患某病新病例的频率患病率:某一时点某人群中患某病的频率(可大于100%)病死率:某期间内,某病患者因某病死亡的频率治愈率:接受治疗的病人中治愈的频率【检验】检验:英国统计学家Peason提出的一种用途广泛的假设检验方法。该检验以分布为理论依据,可以推断两个(或多个)总体率以及构成比之间有无差异。四格表资料的检验理论频数四格表资料检验专用公式四格表检验校正公式通常规则:n40且所有的T5基本公式(或专用公式)

10、n40但有1T5校正公式n40,或T1Fisher确切概率法配对四格表资料的检验观察结果的四种情况:A+,B+aA+,B-bA-,B+cA-,B-d公式:,=1(b+c)40,=1(b+c)40行列表资料的检验专用公式:,=(行数-1)(列数-1)条件:1VTV5的格子数,不能超过总格子数的1/5;不能有T1与分类变量的顺序无关对于有序的RC表资料不宜用检验【非参数检验】非参数检验:不考虑总体的参数和总体的分布类型,对总体的分布或分布位置进行检验的方法。适用于:总体分布为偏态或分布未知的计量资料等级资料个别数据偏大,或数据的某一端无确定数值各组离散程度相差悬殊,即各总体方差不齐特点:适用范围广

11、,不限方差齐性、变量类型、样本量损失了部分信息,检验效率低极度偏态,犯第二类错误的概率较大编秩次,求秩和依差值绝对值,两样本比较的秩和检验WilcoxonMann-Whitneytest相同资料较多时(等级资料),采用校正公式多个样本比较的秩和检验H检验【线性相关与回归】相关系数:说明具有直线关系的两个变量间相关密切程度和相关方向的统计量IXY表示X与Y的离均差平方和;相关系数r没有测量单位,-1v=rv=1线性相关分析的注意事项首先绘制散点图,若呈直线趋势,再计算相关系数和作假设检验判断相关关系两变量都服从正态分布相关系数仅是样本相关系数,不能直接估计总体相关系数不能描述因果关系线性回归回归

12、系数应用:分析两个变量之间是否存在线性依存关系利用回归方程对因变量Y进行估计利用回归方程进行统计控制线性回归分析的注意事项.两个内在有联系的变量,回归分析才有意义若存在依存因果的关系,则原因变量设为X,结果变量设为Y3因变量是服从正态分布的随机变量;自变量可随机,可给定4不要把估计范围扩大到建立方程时的自变量取值范围之外线性相关与回归的区别.相关系数的计算只适用于两个变量都服从正态分布的情形;回归分析中,因变量随机,自变量随机(I型回归模型,两个变量都服从正态);或是给定的量(II型,每个X取值对应的变量Y服从正态分布).线性相关表示两个变量间的相互关系,是双向的;回归反映两个变量之间的依存关

13、系,是单向的线性相关与回归的联系1同一资料进行相关与回归分析,相关系数r与回归方程中的b正负号相同同一样本的r与b的假设检验是等价的相关与回归可以互相解释确定系数:,越接近1,回归效果越好*等级相关(Spearman)的假设检验确定P值:n50时,由等级相关系数界值表确定n50时,可查r界值表,自由度=门-2【统计表与统计图】统计表结构:标题,标目(横、纵),线条,数字,备注三横线表:顶线,中间线,底线(标题,标目,数据)统计图结构:标题,图域,标目,图例,刻度直条图纵坐标从0开始单式复式构成图百分比条图线图:线段的升降表示指标的连续变化趋势。变化速度适用于描述一个变量随另一个变量的变化趋势半对数线图:主要数据随分组变量变化的趋势相对数指标发展趋势两组数据相差大时,表示发展速度直方图:用直条矩形面积代表各组频数,各矩形面积的总和代表频数之和。表示连续变量频

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论