医学统计学知识点_第1页
医学统计学知识点_第2页
医学统计学知识点_第3页
医学统计学知识点_第4页
医学统计学知识点_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

word第一章绪论1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。2、研究对象:具有不确定性结果的事物。3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。5、医学统计学根本内容:统计设计、数据整理、统计描述、统计推断。6、医学统计学中的根本概念(1)同质与变异同质,指根据研究目的所确定的观察单位其性质应大致一样。变异,指总体内的个体间存在的、绝对的差异。统计学通过对变异的研究来探索事物。(2)变量与数据类型变量,是反映实验或观察对象生理、生化、解剖等特征的指标。变量的观测值,称为数据分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。〔如身高、体重、血压、温度等〕定 性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。〔进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等〕有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。统计方法的选用与数据类型有密切的关系。〔3〕总体与样本总体,指根据研究目确实定的所有同质观察单位的全体,包括所有定义X围内的个体变量值。样本,是从研究总体中随机抽取局部有代表性的观察单位,对变量进展观测得到的数据。抽样,是从研究总体中随机抽取局部有代表性的观察单位。参数,指描述总体特征的指标。统计量,指描述样本特征的指标。〔4〕误差误差,指观测值与真实值、统计量与参数之间的差异。可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。随机测量误差,是偶然机遇所致,误差没有固定的大小和方向抽样误差,是抽样引起的统计量与参数间的差异。抽样误差主要来源于个体的变异。统计学主要研究抽样误差。〔5〕概率概率,是描述某事件发生可能性大小的量度。必然事件,事件肯定发生,概率P(U)=1;随机事件,事件可能发生,可能不发生,概率介于0WP(A)W1;不可能事件,事件肯定不发生,概率P($)=0;小概率事件,事件发生的可能性很小,概率P(A)W0.05、或P(A)W0.01。1/18word医学科研中, P(A)W0.05 作为事物差异有统计意义,P(A)W0.01作为事物差异有高度统计意义。第二章定量数据的统计描述定量数据的统计描述方法:频数表、直方图、统计指标。〔1〕频数分布频数分布的目的:了解数据的分布X围、集中位置以与分布形态等特征,以便根据资料分布情况选择适宜的统计方法。频数分布的用途:①作为陈述资料的形式;②便于观察数据的分布类型;③便于发现数据中特大或特小的可疑值;④当样本量大时,可用各组段的频率作为概率的估计值。计算全距〔range,R〕:是一组数据的最大值与最小值之差。R=Max-Min确定组数与组距样本量在100例左右,组数选择8〜15之间,一般取10组左右。组距"全距/组数确定组限第一组段必须包括最小值,最后一组段必须包括最大值。最后一组段包括最大值,且一般情况下应包含该组段上限,其余各组段区间左闭右开。计算各组段频数[frequency〕:即计算各组段内观察值的个数。计算各组段频率[percent〕:即计算各组段频数与总观察值个数之比,用百分数表示。计算累计频数〔叫巾32£丫6 frequency〕和累计频率〔 cumulativepercent〕:累计频数是由上至下将频数累加;累计频率是由上至下将频率累加。〔2〕直方图直方图,是以垂直条段代表频数分布的一种图形。〔3〕频数分布表的用途1、作为称述资料的形式,可以代替原始资料,便于进一步分析。2、便于观察数据的分布类型。资料分布类型分为:对称分布和偏态分布。在统计分析时常需要根据资料的分布形式选择相应的统计分析方法,因此对数据分布形式的判定非常重要。3、便于发现资料中某些远离群体的特大或特小值。4、当样本含量比拟大时,可用各组段的频率作为概率的估计值。集中趋势的统计指标平均数,是描述一组观察值集中位置或平均水平的统计指标,常作为一组数据的代表值用于分析和进展组间的比拟。常用的有算术均数、几何均数、中位数、百分位数等。算术均数,等于一个变量所有观察值的和除以观察值个数。总体均数用希腊字母口表示,样本均数用符号X拔表示。算术均数适用于对称分布的资料,如分布均匀的小样本数据或近似正态分布的大样本数据0算术均数易受极端值的影响,并且受极大值的影响大于受极小值的影响。几何均数几何均数婕6加6”忆mean,G〕,等于一个变量所有n个观察值的乘积的n次方根。几何均数适用于取对数后近似呈对称分布的资料,尤其是右偏态分布数据。医学研究中常2/18用于比例数据。【注】计算几何均数的观察值不能小于或等于0,因为无法求对数。中位数中位数〔巾6出2必M],是在按大小顺序排列的变量的所有观察值中,位于正中间的一个或两个数值。当数据呈偏态分布、或频数分布两端无确定数值,均宜采用中位数描述集中趋势。中位数确实定取决于它在数据序列中的位置,因此对极端值不敏感。百分位数百分位数〔percentile〕,是一个位置指标,它将一组变量值排列后划分为假如干相等局部的分割点数值。用Px表示,X用百分数表示。表示在按照升序排列的数据中,其左侧〔WPx 〕的观察值个数在整个样本中所占百分比为 X%,其右侧〔2Px〕的观察值个数在整个样本中所占百分比为(100—X)%。百分位数不论资料分布类型均可计算,在实际工作中常用于确定医学参考值X围;在假设检验中用作拒绝或不拒绝检验假设的界值。百分位数并非由全部观察值综合计算得来,因此,它不如均数和标准差准确;然而中间局部的百分位数因不受资料中个别极端数据的影响,具有较好的稳定性。小结指标意义适用场合均数个体的平均值对称分布,特别是正态分布资料。几何均数平均倍数取对数后对称分布。中位数位次居中的观察值①非对称分布;②半定量资料;③末端无确切数值;④分布不明。变异程度的统计指标变异指标,又称离散指标,用以描述一组计量资料各观察值之间参差不齐的程度。变异指标越大,观察值之间差异愈大,说明变异程度越大;反之亦然。常用的有极差、四分位数间距、方差、标准差和变异系数。极差极差〔range,R],等于一个变量所有观察值中最大值与最小值之间的差值。R=Max—Min缺点:①没有利用观察值的全部信息,不能反映其它数据的离散度;②各样本含量大小悬殊时,不宜比拟其极差;③极差的抽样误差也较大,所以不够稳定。极差仅适用于对未知分布的小样本资料作粗略的分析。四分位数间距四分位数,是统计学对特殊的三个百分位数P25%、P50%和P75%的统称四分位数间距〔quartilerange,Q〕,等于第三四分位数与第一四分位数之间的差值。Q=P75%—P25%3/18缺点:①没有利用观察值的全部信息,不能反映其它数据的离散度;四分位数间距仅用来描述大样本偏态资料的变异情况。方差方差〔variance〕,是描述一个变量的所有观察值与总体均数的平均离散程度的指标。总体方差用。2表示,样本方差用S2表示。标准差标准差〔standard deviation,S 〕,是描述一个变量的所有观察值与均数的平均离散程度的指标。总体标准差用。表示,样本标准差用S表示。标准差方差或标准差属同类变异指标,它们多用来描述均匀分布或近似正态分布的资料,大、小样本均可,其中以标准差的应用最广,通常与均数结合使用。比如在许多医学研究报告中常用X拔士S的形式表达资料。变异系数变异系数〔coefficientofvariation,CV〕,是一个度量相对离散程度的指标。CV是无量纲的指标,可以用来比拟几个量纲不同的指标变量之间的离散程度的差异,或比拟量纲一样但均数相差悬殊的变量之间的离散程度的差异。小结指标意义适用场合极差观察值的取值X围不拘分布形式,概略分析。四分位数间距居中半数观察值的极差①非对称分布;②半定量资料;③末端无确切数值;④分布不明。标准差〔方差〕观察值距离均数的平均程度对称分布,特别是正态分布资料。变异系数变异程度大小的比照①不同量纲的变量间比拟;②量纲一样但数量级相差悬殊的变量间比拟。第三章正态分布与医学参考值X围正态分布,是一种连续型随机变量常见而重要的分布。正态曲线,是一条顶峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。如果随机变量X的分布服从概率密度函数和概率分布函数称连续型随机变量X服从正态分布,记为X~N(U,。2)。n为圆周率,6为自然对数的底值,。为总体标准差,U为总体均数。正态分布的特征1、正态分布是单峰分布,以 X二口为中心,左右完全对称,正态曲线以X轴为渐近线,两端与X轴不相交。2、正态曲线在 X 二U 处有最大值,其值为4/18f(g=1/(uJ2n);X越远离u,f(X)值越小,在X二口±。处有拐点,呈现钟形。3、正态分布完全由参数口和。决定。口是位置参数,决定正态曲线在 X 轴上的位置。在。一定时,口增大,曲线沿横轴向右移动;口较小,曲线沿横轴向左移动。。是形状参数,决定正态曲线的分布形态。。越大,曲线的形状越“矮胖〃,表示数据分布越分散;。越小,曲线的形状越“瘦高〃,表示数据分布越集中。正态曲线下面积分布规律1、服从正态分布的随机变量在某一区间上的曲线下面积与其在同一区间上取值的概率相等02、曲线下的总面积为1或100%,以U为中心左右两侧面积各占50%,越靠近u处曲线下面积越大,两边逐渐减少。3、所有的正态曲线,在u左右的任意个标准差X围内面积一样。一些特殊情况,在U±oX围内的面积约为68.27%,在u±oX围内的面积约为95.00%,在U±oX围内的面积约为99.00%。标准正态分布对任意一个服从N(u,。2)分布的随机变量X,经Z=X-u/。变换都可以转为U=0、o=1的标准正态分布,也称随机变量的标准化变换。标准正态分布的应用实际应用中,经z变换可把求解任意一个正态分布曲线下面积的问题,转化成标准正态分布曲线下相应面积的问题。正态分布的应用1、制定医学参考值X围2、质量控制3、正态分布是很多统计方法的理论根底医学参考值X围医学参考值X围,指正常人的解剖、生理、生化、免疫与组织代谢产物的含量等各种数据的波动X围。医学参考值X围,习惯上是包含95%的参照总体的X围。制订的须知事项a、抽取足够例数的同质“正常人〃样本★“正常人〃的定义,样本量〔n>120],随机化。b、确定具有实际意义的统一测量标准★指标的测量方法等要有规定,控制测量误差。c、根据指标的性质确定是否要分组★根据实际情况、专业知识。d、根据指标含义决定单、双侧X围★单侧下限,过低异常;单侧上限,过高异常;双侧,过高、过低均异常。e、选择适当的百分X围★绝大多数人,一般80%、90%、95%、99%;★减少误诊,取较大X围;减少漏诊,取较小X围。f、估计参考值X围★根据资料分布类型:正态分布法、百分位数法。第四章定性数据的统计描述相对数,是两个有关的绝对数之比,也可以是两个统计指标之比。5/18word计算相对数的意义主要是把基数化作相等,便于相互比拟。相对数主要用于定性资料的统计描述。常用的指标有频率、构成比、相比照。频率频率〔rate〕,表示在一定X围内某现象的发生数与可能发生的总数之比,说明某现象出现的频率或概率。总体率用n来表示,样本率用P来表示。需要注意的是,率在更多情况下是一个具有时间概念的指标,即用于说明在一段时间内某现象发生的强度或频率。构成比构成比,表示某事物内部各组成局部在整体中所占的比重。构成比之和应为100%,某一构成局部的增减会影响其他构成局部相应的减少或增加;而某一局部率的变化并不影响其他局部率的变化,且其平均率不能简单地将各率相加后平均求得。相比照相比照,是A、B两个有关联指标之比,用以描述两者的比照水平。相对危险度〔relativerisk,RR〕,用于流行病学中队列研究资料。比数比〔。ddsratio,OR〕,用于流行病学中病例对照研究资料。小结指标计算公式适用场合频率n/N估计总体中某一结局发生的概率或可能性构成比n1/N,n2/N,…,nk/N估计总体中所有可能结局所占的比例或比重相比照A/B估计两个指标的相对大小构成比表示某事物内部各局部所占的比例或比重,频率是明确某现象发生的频率或概率。构成比的分子中的个体一定是分母中的一局部,而相比照如此不一定;构成比是同一类事物的数值之比,相比照可以是任意两个数值之比。相对数的使用注意a、区别构成比和频率★频率,强度相对数;构成比,结构相对数。b、使用相对数时分母不宜过小如分母太小,用绝对数表示,如“3例中死亡1例〃。c、注意相对数的可比性研究对象要同质,方法要一样,观察时期要一致等。d、考虑存在抽样误差对总体进展推断应作统计学检验。率的标准化标准化率,是为了在比拟两个不同人群的患病率、发病率、死亡率等资料时,消除内部构成〔如年龄、性别、工龄、病程长短等〕不同而不能直接比拟所产生的影响。标准化率仅用于相互比拟,不代表实际水平;当标准构成不同时,标准化率一般也不一样O标准构成的选取从外部取一个公认的标准构成比,如全国X围或全省X围的数据、国际间比拟时取世界6/18word通用标准。★将几个组的观察例数合并,计算出合并的构成比,以其作为标准构成比。取某一个组的构成比为标准构成比。医学中常用相对数指标死亡率,又称粗死亡率,表示某年某地每千人中的死亡人数。反映当地居民总体死亡水平0对不同地区的死亡率进展比拟时,应注意不同地区人口年龄或性别构成的影响。假如年龄或性别构成存在差异,需先将死亡率标化后再进展比拟。年龄别死亡率,表示某年某地某年龄组每千人口中的死亡数。死因别死亡率,表示某年某地每10万人中因某种疾病死亡的人数。反映各类病伤死亡对居民生命的危害程度。死亡(因)构成,也称相对死亡比,表示全部死亡人数中,死于某死因者占总死亡数的百分比。反映各种死因的相对重要性。疾病统计指标发病率,表示在一定期间内,一定人群中某病新发生的病例出现的频率。反映疾病对人群健康影响和描述疾病分布状态的一项测量指标。患病率,也称现患率,表示某一时点某人群中患某病的频率。反映病程较长的慢性病的发生或流行情况。病死率,表示某期间内,某病患者中因某病死亡的频率。反映该疾病的严重程度和医疗水平0治愈率,表示承受治疗的病人中治愈的频率。第五章统计表与统计图统计表,把反映某事物的数量特征以与相互关系的统计数字用表格的形式归纳起来。特点:①防止冗长的文字表示、减少篇幅;②便于表达事物间的内在联系和区别;③便于分析、比拟并易于发现和纠正错误。编制原如此a、重点突出,简单明了一X表表达一个中心内容或主题。b、主谓清楚,层次清楚定语在标题内,主语作为横标目,谓语作为纵标目。c、数据表达规X、文字和线条从简结构a、标题位于统计表的最上部,应包括表的编号。b、标目纵标目标示相应一列〔或数列〕的内容;横标目标示相应行的内容。c、线条不宜太多,一般为三线表;不允许使用竖线与斜线。d、数字7/18一律使用阿拉伯数字;同一指标的小数位数应一致,位次要对齐;数值为零时应写“0〃,缺省用”…〃表示,不存在或不需要用“一〃表示。e、备注不是统计表的必须项目,需要时才用;★位于统计表的最下部,表格之外,用■〃号标出。统计图统 计 图,是指用几何图形〔点、线段、直条等〕显示统计指标的大小、比照关系或变化趋势。特 点与统计表相比,统计图更加直观,更便于比拟和分析。但它不能确切地显示数字大小,因此常与统计表一并使用。常用的统计图有:条图、圆图、百分条图、线图、直方图等。制作原如此a、根据资料性质、分析目的选用适当的统计图b、一个图表达一个中心内容或主题。c、图形应准确、美观。结构a、标题★位于统计图的下方,应包括图的编号。b、图域★一般用直角坐标系第一象限的位置表示图域。c、标目★纵标目和横标目,表示纵轴和横轴数字刻度;★一般有度量衡单位。d、图例★对图中不同颜色或图案代表的指标进展注释;★图例放在横标目与标题之间,或放在图域中。e、刻度★刻度数值从小到大,纵轴由下向上,横轴由左向右。描述定量数据的统计图直方图,用于表示连续变量频数分布情况。线图,适用于描述一个变量随另一个变量变化的趋势。半对数线图,用来比拟事物之间相对的变化速度。箱 图 ,适用于比拟多组资料的集中趋势和离散趋势。一般选用五个描述统计量〔Min、P25、M、P75、Max〕来绘制。误差条图,适用于比拟多组资料的均值和可信区间。散点图,用点的密集程度和变化趋势来表示两指标之间的直线或曲线关系。条图,适用于各组资料之间指标的比拟。圆图,描述一组构成比资料。百分条图,描述多组构成比资料8/18word小结图形主要目的说明条图比拟各组之间的统计指标的差异一个坐标轴为组名称,另一个坐标轴为频率;多个指标变量可放在一个图中圆图描述变量的构成比没有坐标轴;用图例区分各局部百分条图比拟多个指标变量的构成比一个坐标轴为各变量名称,另一个坐标轴刻度为0~100%;用图例区分各局部线图描述一个变量随另一个变量变化的趋势两个变量的观察值必须一一对应;横轴为自变量,纵轴为因变量半对数线图同上因变量的变异较大时使用;其他同上箱图比拟一个变量在多个组上的分布一个坐标轴为组名称,另一个坐标轴为该变量的取值散点图描述两个指标变量之间的直线相关关系两个变量的观察值可以不一一对应;横轴为自变量,纵轴为因变量第六章参数估计抽样误差:由个体差异和抽样造成的样本统计量与总体参数的差异。包括:样本统计量与总体参数间的差异,样本统计量间的差异。具有如下特点:1、各样本均数未必等于总体均数;2、各样本均数间存在差异;3 、样本均数的分布围绕着总体均数呈现中间多、两边少、左右根本对称,近似服从正态分布;4、样本均数的变异X围较之原变量的变异X围小;5、随着样本含量的增大,样本均数的变异X围逐渐缩小。均数的标准误标准误〔standarderror,SE],指样本统计量的标准差。TOC\o"1-5"\h\z均数的标准误〔standard error ofmean,SEM〕,指样本均数的标准误。它反映样本均数间的离散程度,反映样本均数与相应总体均数间的差异,说明了均数抽样误差的大小。在n一定的情况下,标准误与标准差呈正比,说明当总体中各观测值变异较小时,抽到的X 拔 与口可能相差较小,X 拔 用估计U的可靠程度高;反之,当总体中各观测值变异较大时,可靠程度较低。标准误与样本含量的平方根呈反比,说明在同一总体中随机抽样,n越大,标准误越小。率的抽样误差率的标准误〔standard error ofrate,SER〕,指样本率的标准误。它反映样本率间的离散程度,反映样本率与相应总体率间的差异,说明了率抽样误差的大小。总体率标准误用op表示,样本率标准误用Sp表示。总体均数的估计9/18word概述点估计〔pointestimation〕,是用样本统计量直接作为其总体参数的估计值。区间估计〔intervalestimation〕,是按预先给定的概率(1-a)所确定的包含未知总体参数的一个X围。点估计:优点:表达简单缺点:未考虑抽样误差,无法评价参数估计的准确程度可信区间在区间估计中,预先给定的概率(1-a),称为可信度〔confidencelevel〕,常取95%或99%。通过可信度,计算得到的区间X围,称为可信区间[confidenceinterval,CI〕。可信区间由两个数值界定的可信限〔confidencelimit,CL〕构成,较小的数值为下限〔lowerlimit,L〕,较大的数值为上限〔upperlimit,U〕,一般表示为L~U。可信度为95%可信区间的涵义:假如重复100次样本含量一样的抽样,每个样本均按同一方法构建95%可信区间,如此理论上平均有95个可信区间包含了总体均数,只有5个可信区间未包含。可信区间估计的优劣:准确性,反映可信度1-a的大小,其值越接近1越好。准确性,用可信区间的宽度CU—CL衡量,宽度越小越好。t分布t分布:主要用于总体均数的区间估计和t检验等。丫为自由度〔degreeoffreedom,df],指能够自由取值的变量个数。t分布的特点:1、t分布图是一簇曲线,曲线的形态变化与自由度有关。2、随v的增大,曲线越来越接近标准正态分布曲线;3、当v-8时,t分布的极限分布就是标准正态分布。10/18

word4、t分布的密度曲线下面积有一定的规律性。在t界值表中,横标目为自由度,纵标目为尾部概率。一侧尾部面积称为单侧概率〔one-tailedprobability〕,两侧尾部面积之和称为双侧概率〔two-tailedprobability〕。从t界值表中看出:在一样自由度时,|t|值越大,概率P越小。小结区别总体均数的可信区间一匚■按预先给定的概率确定的未知参数渊可瞰胤“正常人*的解剖,生理,生化等某项指标的波动区别总体均数的可信区间一匚■按预先给定的概率确定的未知参数渊可瞰胤“正常人*的解剖,生理,生化等某项指标的波动总体均数的波动乂1个体值的波动X1计算。未知:±za/2S公式 计算。未知:±za/2S公式 。或沫知但n>60:(双侧)偏态分布:Px-P100-X(双侧)样本n»大,。«小;雁8, n»大,参考值X围越稳CI一0两总体均数差值的区间估计在实际工作中,常常需要估计两总体均数之差U1—U2的大小,需估计两总体均数差值的可信区间。总体率的区间估计小样本率的区间估计:在样本例数较小,且样本率接近1或0时,利用二项分布可估计其总体率的(1-a)可信区间。当nW50,样本例数n和阳性例数XWn/2时,直接查表得到95%和99%可信区间。当阳性例数X>n/2时,用n—X查表,获得总体阴性率可信区间,再用1减去总体阴性率可信区间,既为总体阳性率可信区间。大样本率的区间估计在样本例数较大,且p和1—p均不太小,如np与n(1—p)均大于5时,样本率p的抽样分布近似正态分布,可按正态分布近似法求总体率的(1-a)可信区间。两总体率差值的区间估计设两样本率分别为p1和p2,当n1与n2均较大,且p1,1—p1与p2,1—p2均不太小,如n1p1、n1(1—p1)、n2p2、n2(1—p2)均大于5时,可采用正态近似法对两总体率差值进展可信区间估计。第七章假设检验假设检验〔hypothesistesting〕也称显著性检验〔significance12/18wordtest],是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差异造成的统计推断方法。假设检验的根本思想反证法思想:先提出假设,再用适当的统计方法确定假设成立的可能性大小,如可能性小,如此认为假设不成立。小概率事件:是指在一次试验中根本上不大会发生的事件。假设检验的根本步骤建立假设无效假设〔nullhypothesis〕,记为H0,指需要检验的假设,即g=u2。确定检验水准检验水准〔levelofatest〕也称为显著性水准〔significancelevel〕,是预先规定的判断小概率事件的概率尺度,记为a。实际中一般取a=0.05或a=0.01。c、选择检验方法,计算统计量根据资料类型、研究设计方案和统计推断的目的,选择适当的检验方法和计算公式。如:t检验、u检验、F检验、x2检验。确定P值,作出统计推断结论P 值〔probabilityvalue〕,指由H0所规定的总体做重复随机抽样,获得等于与大于当前检验统计量的概率O确定P值的方法:依据检验统计量的自由度、检验水准,查检验统计量对应的界值表,通过检验界值,得到与检验统计量相对应的P值X围。如:u0.05/2=1.96对应的P值为0.05。确定P值,作出统计推断结论假设检验规定:如果一次试验结果13/18wordPWa,拒绝H0,结论为“差异有统计学意义〃。P2a,不拒绝H0,结论为“差异没有统计学意义〃。P值的习惯表述:“不显著”〔notsignificant〕;PW”显著〃[significant〕;PW"非常显著”〔highlysignificant〕。假设检验中两类错误假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立,然后在假定H0成立的条件下计算检验统计量,最后根臧值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。检验效能〔poweroftest〕,指当两总体确有差异,按a水准,假设检验能发现其差异的能力。记为1-B。a愈小,B愈大;a愈大,B愈小。假如要同时减小I型错误和II型错误,唯一方法是增加样本量。第七章单样本t检验〔onesamplet-test〕,适用于样本均 X拔与均数口0的比拟,目的是检验样本均数口0所代表的未知总体均数日是否与总体均数口0有差异。总体均数口0一般指理论值、标准值或经过大量观察所得到的稳定值。配对样本均数t检验〔pairedt-test〕,适用于配对设计的计量资料两相关样本均数的比拟,目的是检验两相关样本均数所代表的未知总体均数是否有差异。配对设计〔paireddesign〕,是将受试对象按某些重要特征相近的原如此配成对子,每对中的两个个体随机地给予两种处理。14/18配对设计处理分配方式:将同一受试对象处理前后的结果进展比拟;同一受试对象随机分配承受不同处理;同一标本的两个部位测试同一指标;两个同质受试对象分别承受两种处理。两独立样本均数t检验〔twoindependentsamplest-test〕,适用于完全随机设计两独立样本均数的比拟,目的是检验两独立样本均数所代表的未知总体均数是否有差异。完全随机设计〔pletelyrandomdesign〕:从某研究总体随机抽取一定数量的研究对象,将其随机分配到两组,承受不同的处理后,测量某指标后进展组间比拟。两独立样本均数t检验要求两样本所代表的总体方差相等 ,即方差齐性须知事项:a、假设检验结论正确的前提★作假设检验用的样本资料,必须能代表相应的总体,各比照组具有良好的组间均衡性。b、检验方法的选用与其适用条件根据分析目的、研究设计、资料类型、样本量大小等选用适当的检验方法。。、双侧检验与单侧检验的选择根据研究目的和专业知识予以选择,一般选用双侧检验。d、假设检验的结论不能绝对化列出概率确实切数值或给出X围,注明采用单侧检验还是双侧检验。e、正确理解P值的统计意义第八章方差分析方差分析,能用于两个或两个以上样本均数的比拟,还可分析两个或多个研究因素的交互作用以与线性回归方程的假设检验等。根本思想是:分析变异,也就是分解变异,即将数据总的变异分解为处理因素引起的变异和随机误差引起的变异,通过对两者进展比拟作出处理因素有无作用的统计推断。应用条件各组样本是相互独立的随机样本各组样本都来自正态总体。各组总体方差相等,即方差齐性。完全随机设计的方差分析完全随机设计,是按一个处理因素随机分组,统计分析处理因素各个水平组间均数差异有无统计学意义。a、变异的分解b、自由度分解c、估计方差〔均方〕d、F统计量的计算e、F分布与确定P值随机区组设计的方差分析随机区组设计〔randomizedblockdesign〕,是先按对试验结果有影响的非研究因素将受试对象配成假如干个区组,再分别将各区组内的受试对象随机分配到处理水平不同的各个组。多个样本均数的两两比拟经方差分析,假如各组的均数差异无统计学意义,如此不需要作进一步的统计处理,但是15/18当方差分析结果为PVa时,只说明各组总体均数不一样或不全一样,不能说明各组总体均数间有差异。如果要分析哪两组间均数有差异,需进展多组均数间的多重比拟。多个样本均数两两比拟方法选择策略第九章卡方检验方差齐性检验的作用:Bartlett检验法主要适用于正态分布资料的方差齐性检验问题。卡方检验常用于推断两个总体率〔或构成比〕之间有无差异。X2值反映了实际频数与理论频数的吻合程度。假如假设成立,实际频数与理论频数的差值较小,X2值也较小;假如假设不成立,实际频数与理论频数的差值较大,X2值也较大。配对四格表资料的卡方检验计数资料的配对设计常用于两种检验方法、培养方法、诊断方法的比拟。特点是对样本中各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果RXC列联表资料的卡方检验用于多个样本率的比拟、两个或多个构成比的比拟。根本数据为:⑴多个样本率比拟时,有R行2列;⑵两个样本构成比比拟时,有2行C列;⑶多个样本构成比比拟时,有R行C列。采用Bonferroni法进展多个样本率的两两比拟,步骤如下:①对需要比拟的行X列表资料进展X2分割,变成多个四格表;②对每个四格表进展X2检验;③采用〔a'二a/比拟次数〕计算调整的水准,其中1为事先确定的水准;④以a’调整作为检验检验水准,作出结论。RXC列表表X2检验须知事项:假如有1/5以上的格子出现1WT<5,如此增大样本含量,以达到增某某论频数的目的;③结合专业,删去理论频数太小的格子对应的行或列;④结合专业,将理论频数太小的行或列与性质相近的行或列合并;⑤用双向无序RXC表资料的Fisher确切概率法。人多个样本率比拟,假如统计推断为拒绝H0,承受H1,只能认为各总体率或构成比之间总的来说有差异。假如要进一步了解哪两者之间有差异,可用卡方分割法,或者调整检验水准。c、对于单向有序的RXC表资料,在比拟各处理组的效应有无差异时,应该用秩和检验。第十章非参数秩和检验参数检验,是基于随机样本来自某分布的总体,推断两个或两个以上总体参数是否一样的方法。常用的方法有:t检验、方差分析。特点主要有:16/18①对总体参数进展估计或检验是主要目的;②要求总体分布;③统计量有明确的理论依据;④有严格的使用条件,要求总体分布符合正态分布、总体方差齐性、数据间相互独立。非参数检验〔nonparametrictest〕,是在不考虑总体参数和分布类型的情况下,对总体的参数和分布位置进展检验的方法。常用的方法有:秩和检验、符号检验。特点主要有:①适用X围广,可应用于总体分布类型未知的计量资料、偏态分布的资料、等级资料、不满足参数检验条件的资料等;②受限条件少,更适合一般情况;③具有较好的稳健性;④方法简便,易于理解和掌握。秩和检验〔ranksumtest〕,是基于秩次的假设检验方法,属非参数检验X畴。秩

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论