统计学名词解释.doc_第1页
统计学名词解释.doc_第2页
统计学名词解释.doc_第3页
统计学名词解释.doc_第4页
统计学名词解释.doc_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

_ 名词解释:医学统计学:用统计学的原理和方法研究生物医学问题的一门学科。变量(variable):观察单位的某项特征变量值(value of variable):变量的观察结果(测量值)总体(population):是根据研究目的确定的同质的观察单位的全体,确切的说是同质的所有的观察单位某种变量值的集合。样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。随机抽样(random sample):按随机化原则从总体中抽取部分观察单位的过程。同质(homogeneity):是针对被研究指标来讲,其影响因素相同。简单地理解就是指对研究指标影响大约可以控制的主要因素应尽可能相同。变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。等级资料(ordinal data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为等级资料,如患者的治疗结果可分为治愈,好转,有效,无效,死亡。有序变量(定性变量的一种)。概率(probability):是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大,0P(A)=40且所有T=5时,用普通的2检验,若所得的P约等于0时,改用确切概率法,2,当n=40但1=T=5时,用校正2检验;3当n40或T1时,不能用2检验,改用确切概率法。22, 秩和检验的基本思想:假定从一总体中,随机抽取一个样本,可以求出T+和T-,当重复所有可能组合的样本,得T+和T-的分布,T的分布以均数为中心对称的非连续分布,当H0成立,从总体随机抽取任一样本,所得T值在均数附近的概率最大,当T值远离均数概率较小,随着n增大,T的分布逐渐逼近均数n(n+1)/4,方差n(n+1)(2n+1)/24的正态分布,当n25时,T的分布已较好地近似正态分布。23, 成组设计两个样本比较的秩和检验的基本思想n1和n2两个样本,来自同一总体和分布相同的两个总体,即假设检验H0成立,则n1样本的秩和T与平均秩和n1(N+1)/2一般相差不大,也就是u值小于u,若T与平均秩和n1(N+1)/2相差很大,则表示筹得的样本统计量T值的概率很小,因而拒绝检验假设H0。24, 直线回归方程的应用:描述两变量的依存关系;利用回归方程进行预测;利用回归方程进行统计控制。25, 应用直线回归应注意的问题:做回归分析要有实际意义,不能把毫无关联的两种现象勉强做回归分析,即使有回归关系也不一定是因果关系,还必须对两种现象间的内在联系有所认识,能从专业理论上做出合理解释或有所依据,在进行直线回归分析前,应绘制散点图,当观察点的分布有直线趋势,才适宜直线回归分析;直线回归方程的适用范围一般以自便量的取值为限,不能任意外延。26, 直线回归与相关的区别1资料要求不同:回归要求变量Y服从正态分布,X是可以精确测量和严格控制的变量,相关要求两个变量X,Y服从双变量正态分布,2应用情况不同:说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用相关3,意义不同:回归系数b表示自变量X每变化一个单位后应变量Y的平均变化量,相关系数r表示两变量相关的方向和密切程度,4取值范围不同:-1=r0.05,而非参数检验结果P0.05。推断两总体差值为0的假设未能拒绝,在参数检验中,综合了差数大小与方向的全部信息,差数大小更能提供两组数据之差有无实际意义的信息,而配对秩和检验更侧重方向的作用,设想当n对差数全部为正号时,尽管两组数据非常接近,也会出现T+很大,T-为零的局面,即P0.05的结果,这种局面虽然可以出现,但随n的增大,如果H0为真,则差数的方向是随机出现的,故T+和T-一般相差不大,其检验结果与参数检验结果多数情况下还是一致的。43, 参数检验和非参数检验所得结果不一致,以何为准?仅供参考第一章 绪论统计学(statistics),是研究数据的收集、整理、分析的一门科学,帮助人们分析占有信息。达到去伪存真、去粗存精、争取认识世界的一种重要手段。卫生统计学(health statistics):是研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。统计描述(descriptive statistics)用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行滴定和描述。统计推断(statistical inference):通过样本指标来说明总体特征,从样本获取有关总体信息的过程总体(population):是根据研究目的确定的同质观察单位的全体。样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。变量(variable):在确定总体之后,研究者则应对每个观察单位的某项特征进行测量和观察,这种特征称为变量。变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。随机抽样(random sample):按随机化原则从总体中抽取部分观察单位的过程。以避免误差和偏倚对研究结果有所影响。样本含量或样本大小(sample size):样本包含的观察单位数称为样本含量,医学上也称为样本例数。定量资料(quantitative data)是测量每个观察单位某项指标大小所得到的资料,一般均有度量衡单位。分类资料(categorical data):观察值是定性的,表现为互不相容的类别或属性。有序分类(ordinal categories):各类之间有程度的差别,给人以“半定量”的概念。概率(probability):是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大,0P(A)50),也近似正态分布。2从均数,标准差的正态或偏态总体,抽取例数为n的样本,样本均数的总体均数也为,标准差用()=统计推断包括:参数估计和假设检验。标准误的用途:可反映样品均数与总体均数距离远近,反映可靠性:与样本均数结合估计总体均数的可信区间;进行假设检验。假设检验应注意的问题:1,要有严密的研究设计2,不同变量或资料应选择不同的检验方法3,正确理解“显著性”一词的含义4,做结论不能绝对化5,统计“显著性”与医学临床/生物学“显著性”。可信区间与假设检验:1可信区间亦可回答假设检验的问题,2可信区间比假设检验可提供更多的信息。第五章 方差分析变量变换:将原始数据做某种函数转换,使各组达到方差齐性,也可使资料转换为正态分布。方差分析的基本思想:就是把全部观察值间的变异(总变异)按设计和需要分解成两个或多个组成部分,总自由度也分解成相应的几个部分,再做分析。分解的每一部分代表不同的含义,其中至少有一部分代表各均数间的变异情况,另一部分代表误差。离均差平方和除以自由度得均方,组间均方与误差均方之比为F值,F值远大于1,表示各组均数间差别有显著性,F值远小于1,表示各组均数间差别无显著性,可查F界表确定P。方差分析的用途:两个或多个样本均数的比较,分析两个或多个研究因素的交互关系以及回归方程的线性假设检验。方差分析的应用条件:1,各样本是相互独立的随机样本,2各样本来自正态总体,3各处理组总体方差齐性。变量变换:1目的:使方差性齐;资料正态化;还可用于曲线直线化;2类型:对数变换:平方根变换;倒数变换;平方根反正弦 变换等。第六章 分类资料的统计描述Relative number相对数:由两个有联系的指标之比组成的用以描述分类变量的统计指标。Rate率:又称频率指标,说明某现象发生的频率或强度。率=发生某现象的观察单位数/可能发生某现象的观察单位总数100%Proportion构成比:又称构成指标,说明某一事物内部组成部分所占的比重或分布。构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位总数100%Ratio比:又称相对比。是A,B两个有关指标之比,说明A是B的若干倍或百分之几。比=A/BStandard mortality ratio SMR标准化死亡比:指被标化组实际死亡数与预期死亡数之比。若SMR1,表示被标化人群的死亡率高于标准组:反之若SMR25,用检验1.所有数据由小到大编秩,小ni组秩和为T。查表确定p值。2. n110或n2-n110时,用检验1.所有数据由小到大编秩,求出各组秩和Ri计算H值。2.当k=3,n5时查H界值表确定p,当最小n5时,v=k-1.查X2表,确定p。注意事项编秩时,绝对值相等者,取平均秩次1.编秩时,相同数据在不同组内取平均秩次2.相同秩次较多时,需要校正。1,编秩时,相同数据在不同组内取平均秩次。2.相同秩次较多时,需校正。第十一章 回归和相关直线相关:或简单相关,描述两变量的相互关系,用于双变量正态分布资料。有正相关、负相关和零相关(非直线相关)系。相关系数:或累积相关系数,说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。样本相关系数用r表示,总体相关系数用表示。直线回归:描述两变量间的依存关系。利用回归分析方法能够找到一个描述变量之间的变化关系的数学表达式。回归系数:或直线的斜率,样本回归系数b,总体回归系数,b的统计学意义为:X每增加/减少一个单位时,Y平均改变b个单位。剩余:或残差,即实际值与估计值之差。SSB即2,为Y的离均差平方和。说明未考虑X与Y的回归关系时Y的变异。剩余平方和:SS剩,即2,它反映X对Y的线性影响之外的一切因素对Y的变异情况。也就是在总平方和中无法用X解释的部分,其值越小,说明直线回归的估计误差越小。回归平方和:SS回,即2, 它反映由于X与Y的直线关系而使Y的总变异减小的部分。也就是在总平方和中可以用X解释的部分,其值越大,说明回归效果越好。剩余标准差:指当X对Y的影响被扣除后,Y仍存在变异,此变异由抽样误差造成,与X无关。用来反映Y的剩余变异。预测:吧预报因子(X)代入回归方程对预报量(Y)进行估计,其波动范围可按求个体Y值容许区间方法计量。统计控制:利用回归方程进行逆估计,要求Y在一定范围内波动,可以通过控制X的取值来实现。决定系数:即r2=SS回/SS总.当总平方和固定不变时,回归平方和的大小取决于r2。秩相关:又称等级相关,用双变量等级数据作直线相关分析,适用于1,不服从双变量正态分布而不宜作积差相关分析,2,总体分布型未知,3,用等级表示原始数据。等级相关系数:即rs,说明两个变量间相互关系的密切程度与相关方向,用于下列资料:1,不服从双变量正态分布而不宜作积差相关分析,2,总体分布型未知,3,用等级表示原始数据。假设检验:1b,方差分析,t检验;2界值表,t检验。直线回归方程的应用:1描述两变量的依存关系;2预测;3统计控制应用直线回归应注意的问题:1. 作回归要有实际意义。2. 回归分析前绘制散点图,观察直线趋势,修正或删除异常点。3. 直线回归方程的适用范围一般以自变量的取值范围为限。相关和回归的区别:1. 资料要求不同:回归要求Y服从正态分布,X可精确测量和严格控制:相关要求双变量正态分布。2. 应用情况不同:回归依存关系:相关相互关系。相关和回归的联系:1 方向一致:r,b符号一致。2 假设检验等价:统一样本,r,b的假设检验得到的t值相同。3 用回归解释相关。A SS回越接近SS总,则r2越接近l,说明引入相关的效果越好。B 相关系数的大小与SS总及回归系数有关,所以相关系数不能作为回归估计精度的指标。秩相关的应用条件:1. 不服从双变量正态分布而不宜作积差相关分析。2. 总体分布型未知。3. 用等级表示的原始数据。第十二章 常用统计表统计表:在科技报告或论文中,常将统计资料及指标以表格列出,称为统计表。可分为简单表和复合表。统计图:是用点的位置、线段的升降、直线的长短或面积的大小等形式表达统计资料,可直观反映出事物间的数量关系。列表原则:1重点突出,简单明了2主次分明,层次清楚,符合逻辑。列表基本要求:1标题2标目3线条4数字5不列备注制图基本要求:1标题2标目3图例常用统计图统计图定义制图直条图用等宽长条的高度表示按质量分组的资料起点为0,等宽,等间距直条,按高低顺序排列。圆图以圆面积表示事物的全部,用扇形面积表示各组成部分所占比重圆面积为100%,各构成比分别乘3.6度,绘扇形面积,以12点为始,由大到小依次绘制。普通线图用线段的升降表示随时间变化的趋势,用于连续性资料X,Y轴为算术尺度,相邻两点以折线连接半对数线图用线段的升降表示随时间变化的变动速度,用于连续性资料X轴为算术尺度,Y轴为对数尺度。直方图用矩形面积表示连续性变量的频数分布。X轴表示连续性变量的组段,Y轴表示频数或频率,尺度从0开始散点图以点的密集程度和趋势表示两种事物间的相关关系。同线图,但相邻两点间不连接。第十三章 实验设计实验研究:是指研究者根据研究目的主动加以干预措施,并观察总结结果,回答假设研究所提出的问题的一种研究方法。依研究目的分为实验研究和临床试验。实验研究设计(experimental design):是以动物或标本(如血,痰,尿等)为研究对象采取干预措施的研究。临床试验(clinical trial):从统计学角度出发,只要是以人为研究对象并采取了干预措施的研究统称为临床试验,可分为临床疗效实验和社区干预实验。随机化原则:即总体中的每个观察单位都有相等的机会被选入到样本中来。随机分配(randomized allocation):为增强可比性,依型讲究假设的要求规定了纳入标准,将实验对象分入实验组和对照组中。空白对照:对照组不施加任何处理措施。安慰剂对照:在实验研究中,对照组使用一种外形与实验药物完全相同而毫无药理作用的物质,这种对照称为安慰剂对照。实验对照:对照组和实验组的处理措施区别在于:实验组加入了有效成分,而对照组则无。标准对照:用公认的有效药物、现有的标准方法或常规方法做对照。自身对照:对照和实验措施在同一实验对象上实施。相互对照:几个处理(或水平)互为对照。处理因素:是根据研究目的而施加的特定的实验措施。实验效应:主要只处理因素作用于实验对象的反应,这种效应将通过实验中观察指标显示出来。观察指标应该客观性较强,灵敏度较高。精确性较强。准确度(accuracy):观察值与真值的接近程度。精确度(precision):重复观察时:观察值与其平均值的接近程度。随机对照试验(randomized control trial):将受试对象随机分配到实验组和对照组,通过比较分析回答研究假设的问题。随机双盲对照实验(randomized double blind control trial):在随机对照试验的基础上再采用双盲法。配对设计(paired design):将实验对象按一定条件配成对子,如将年龄、体重一致的动物配成对子。再将每对中的两个受试对象随机分配到不同处理组。据以配对的因素为可能影响实验结果的主要混杂因素。系统误差:由于受试对象,研究者,仪器设备,研究方法等非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差,可以避免。偏倚:指在实验中由于某些非实验因素的干扰而形成的系统误差,歪曲了处理因素的真实效应。选择性偏倚selective bias:由于纳入观察对象的方法不正确而产生的偏倚。测量性偏倚 measurement bias:实验过程中对研究对象进行观察或测量而造成的偏倚。沾染contamination:对照组实验对象接受实验组的处理措施,提高了对照组的有效率,结果导致了实验组和对照组的差异。干扰cointervention:实验组从实验外接受了对实验因素有效的药物或措施(非处理措施),提高了实验的有效率,结果扩大了实验组和对照组的差异。依从性:compliance受试者对于干预措施及实验过程的执行程度。非依从性noncompliance:受试者为按照研究人员的规定方案执行称为非依从性。失访lost to followup:受试者在实验过程中由于各种原因退出实验称为失访。双盲法(double blind method):课题主持人采取措施使研究者和研究对象均不知道接受实验措施或对照措施。单盲法:single blind method:只有患者不知道处理措施的内容。三盲法:triple blind method:主持人/研究者/患者均不知道处理措施的内容。混杂偏倚 confounding bias:在总结分析阶段,由某些非实验因素与实验因素同时并存的作用影响到观察的结果,造成混杂因素的偏倚。实验设计的基本原则:随机化、对照、重复。对照原则的目的: 实验研究的目的是验证研究假设是否正确,只有经过比较才能鉴别其真伪,设对照组是比较的基础,没有对照很难说明研究假设是否正确;设立对照也是控制实验过程中非实验因素的影响和偏倚的一种有力措施。常用的对照有:空白对照,安慰剂对照,实验对照,标准对照,自身对照,相互对照。重复原则:含义为1足够的样本含量;2实验的次数。实验设计的三要素:处理因素、实验效应、受试对象。确定受试对象纳入标准应注意:1应纳入对处理因素的效应反应灵敏的患者。2某些处理措施对一些特殊人群产生有害作用,应排除实验之外。常用的实验设计方法:随机对照实验,配对设计,交叉设计,配伍组设计。随机对照试验有点(随机化的目的)1有效避免非实验因素的影响,使实验因素充分显示2增强各比较组间的可比性,使研究结论更可靠。3更好地控制非实验因素对实验因素的影响,有效地控制了偏倚和误差。4满足了随机化原则,使检验结果反映 真实差异。交叉设计的优点:1节约样本含量2能控制时间因素及个体差异对处理因素方式的影响3从医德观点出发,均等考虑每个患者的利益。交叉设计的注意事项:1前提是两种处理方式不能相互影响。2不适用于病程较短急性病效果的研究3应尽可能采用盲法。确定样本含量的意义:正确确定样本含量是实验设计的一个重要组成部分,估计样本含量应克服两种倾向:1片面追求增大样品含量导致人力、物力和时间的浪费,还可能引入更多的混杂因素。2样本含量偏少,检验效能偏低,导致总体本来存在的差异未能检出,导致非真实的阴性结果。样本含量大小还受个体差异和研究实验要求的精神有关。阅读专业文献时,对假设检验阴性结果有必要复核样本含量和检验效能是否偏低。以正确分析假设检验的结论。第X章 2检验2 test (Chi-square test)2是一种用途较广的假设性检验方法,可用于推断两个及多个总体率或总体构成比之间有无差别,两种属性或两个变量之间有无关联性,以及频数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论