医学统计学基本概念资料_第1页
医学统计学基本概念资料_第2页
医学统计学基本概念资料_第3页
医学统计学基本概念资料_第4页
医学统计学基本概念资料_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

均数可信区间和参考值范围区分区分可信区间参考值范围意义未知参数可能范围正常值波动范围公式已知或未知,但n足够大(x±u/2,sx)或(x±u/2,x)(x±u/2,sx)未知(x±t,sx)用途估量总体均数判断正异常小结:均数可信区间:均数界值×标准误个体允许区间(参考值范围):均数界值×标准差可信区间与允许区间区分:见P44假设检验基本思想:提出一个假设(H0);验证这个假设。假如假设成立,会得到现在结果吗?两种可能情况:(1)得到现在结果可能性很小(小概率)→拒绝H0(2)有可能得到现在结果(不是小概率)→没有理由拒绝H0假设检验步骤:(1)建立检验假设;(2)确定检验水准α;(3)计算检验统计量并求P值;(5)界定P值并作结论。I型错误和II型错误实际情况实际情况假设检验结果拒绝H0不拒绝H0H0成立I型错误()H0不成立把握度(1-)II型错误()差异检验和优度检验:差异检验之意义在于是否能够确认H1成立,故希望所得P值很小,因为P值越小,表示手头样本从H0总体随机取得之概率越小,即否定H0而确认H1成立把握越大。优度检验之意义在于是否能够确认H0成立,故希望所得P值较大,因为P值越大,表示手头样本从H0总体随机取得之概率越大。可信区间与假设检验区分和联络:可信区间说明量大小即推断总体均数范围,假设检验推断质不一样即判断两总体均数是否不等;可信区间可回答假设检验问题,可信区间若包含了H0,按水准,不拒绝H0;若不包含H0,按水准,拒绝H0,接收H1;可信区间不但能回答差异有没有统计学意义,还能提醒差异有没有实际专业意义;可信区间不能够完全代替假设检验。可信区间只能在预先要求概率前提下进行计算,假设检验能取得一较为确切P值。以下说法正确吗?P是H0成立概率。(错)P是I型误差概率。(错)P是H0成立时,取得现有差异概率。(错)P是H0成立时,取得现有差异以及更大差异概率。(对)统计推断时风险。(错)拒绝H0时所冒风险。(对)16.t检验应用条件:(1)独立性:各观察个体间是相互独立,不能相互影响,亦不能一方影响另一方;(2)正态性:两组均数比较时,要求两组数据服从正态分布;配对设计时,要求差值服从正态分布。(3)方差齐性:两样本所对应正态总体之方差相等。总体方差不相等t检验:(1)数据变换后进行t检验;(2)秩转换非参数检验;(3)近似t检验t'检验。两样本均数比较方法选择方差齐方差不齐小样本t检验t‘检验大样本 u检验 u检验19.方差分析基本思想:方差分析(analysisofvariance)又称为变异数分析,采取F检验统计量,也称F检验。这种方法基本思想是对变异进行分解和分析,把全部观察值之间变异—总变异,按照设计和需要分为两个或多个组成部分,再作分析,从而达成统计推断之目标。总变异=组内变异+组间变异;组内变异:抽样(随机)误差(个体差异和测量误差);组间变异:组间本质差异+抽样(随机)误差;假如组间无本质差异,则组间变异=组内变异MS 或F= Between1MS Within20.方差分析优点:(1)不受比较组数限制;(2)可同时分析多个原因作用;(3)可分析原因间交互作用。方差分析意义:是按照试验设计把总变异分成若干部分,划分得越细,各部分涵义越明确,对结论亦较易解释;同时,残余变异即误差部分越小,因而能够提升检验灵敏度和结论准确性。F分布是方差比分布,惯用于方差齐性检验,方差分析等。F分布特征:(1)F分布为一簇单峰正偏态分布曲线,与两个自由度关于。(2)若F服从自由度为(1,2)F分布,则其倒数1/F服从自由度为(2,1)F分布。自由度为(1,2)F分布,其均数为2/(2-2),与第一自由度无关。第一自由度1=1时,F分布实际上是t分布之平方;第二自由度2=∞时,F分布实际上等于2分布。每一对自由度下F分布曲线下面积分布规律,见方差分析用F界值表,表中横标目为第一自由度,纵标目为第二自由度,表中分别给出了右侧尾部概率为0.05和0.01时F界值。23.方差分析表变异起源变异起源SSvMSFP组间SS组间k-1SS组间/v组间MS组间/MS组内组内SS组内N-kSS组内/v组内总SS总N-124.方差分析与t检验关系当比较两个均数时,从同一资料算得之F值与t值有以下关系:F=t2可见在两组均数比较时,方差分析与t检验效果是完全一样。25.方差分析后两两比较(多重比较)几个方法:一、SNK-q检验(多个均数间全方面比较)二、LSD-t检验(有专业意义均数间比较)三、Dunnett检验(多个试验组与对照组比较)还有TUKEY、DUNCAN、SCHEFFE、WALLER、BON等比较方法各组间比较用SNK法;各试验组与某一对照组间比较用Dunnet法。方差分析应用条件:①各样本是相互独立随机样本;②各样原来自正态总体;③各组总体方差相等,即方差齐。方差分析和t检验要求:独立性、正态性、方差齐性。总结:均数、方差比较:样本均数与总体均数比较(t检验)配对设计样本均数比较(配对t检验)两样本均数比较(t检验,u检验,F检验,SNK,Duncan)多样本均数比较(F检验,ANOVA)•各组间比较(SNK法);各试验组与某一对照组间比较用(Duncan法)两个方差比较(F检验)多个方差比较(Bartlett检验二项分布应用条件:医学领域有许多二分类记数资料都符合二项分布(传染病和遗传病除外),但应用时仍应注意考查是否满足以下应用条件:每次试验只有两类对立结果;如阳性或阴性、生存或死亡,不允许考虑“可疑”等含糊结果,属于二项分类资料。n次事件相互独立;即每个观察单位观察结果不会影响到其它观察单位结果。如要求疾病无传染性、无家族聚集性等。每次试验某类结果发生概率是一个常数。已知发生某一结果(如阳性)概率为π,其对应概率必定是(1-π),我们知道总体率π通常是未知,在实际工作中要求π是从大量观察中取得比较稳定数值。29.二项分布应用:(1)样本率与总体率比较;(2)两样本率比较。Poisson分布特征:①非对称,但μ增大时趋于对称;②均数与方差均为μ;③分布可加性,n个独立Poisson分布相加仍符合Poisson分布,可使μ>20,使得可用正态近似。Poisson分布应用条件:(1)平稳性:X取值与观察单位位置无关;(2)独立增量性:在某个观察单位X取值与前面各观察单位上X取值独立.;(3)普通性:在充分小观察单位上X取值最多为1。Possion分布应用:(1)总体均数估量;(2)样本均数与总体均数比较;(3)两样本均数比较。33.χ2检验用途:(1)推断多个总体率之间有没有差异(2)推断几组总体组成比之间有没有差异(3)两个变量之间有没有关联性(4)频数分布拟合优度检验。χ2检验基本思想:χ2=TA2T假如H0假设成立,那么实际频数与理论频数应该比较靠近。假如实际频数与理论频数相差很大,超出了抽样误差所能解释范围,则可认为H0假设不成立,即两样本对应总体率不等。χ2值反应了实际频数与理论频数吻合程度。假如两总体率相同假设成立,则实际频数与理论频数之差异纯系抽样误差所致,故通常不会很大,χ2值也就不会很大;在一次随机试验中,出现大χ2值概率P是很小。所以,若依照实际样本资料求得一个很小P,且P≤α(检验水准),依照小概率原理,就有理由怀疑H0假设真实性,因而拒绝它;若P>α,则没有理由拒绝H0。χ2值大小除取决于︱A-T︱差值外,还与基本数据格子数关于,严格地说是与自由度关于。在x2检验中,自由度指在表中周围共计不变前提下,基本数据能够自由变动格子数。x2检验精华:检验实际频数和理论频数吻合程度。假如实际频数和理论频数越吻合,说明H0假设成立可能性就越大,反之,假如实际频数和理论频数相差越远,说明H0越不可能成立。36.普通四个表资料卡方检验公式选取条件:n≥40,且T≥5时,用未校正值2 (adbc)2n(ab)(cd)(ac)(bd)1≤T<5,且An≥T40时,宜用校正χ0.52值adbcn/2 2 2n 2 T abcdacbd3)T<1或n<40时,宜用确切概率计算法 (ab)!(cd)!(ac)!(vd)!Pa!b!c!d!n!37.行×列表χ2值计算专用公式: A2 2= nnn1 R C38.行×列表资料采取χ2检验时,注意事项:注意理论数大小。行×列表资料采取χ2检验时,对理论数要求与四格表资料相同,不能有T<1,T<5个数不能超出全部理论数个数1/5(四格表中有一个T<5即超出1/5),如出现上述情况,可用以下方法处理:增加观察例数可使实际频数增加,从而使T增大。合并相邻行或列实际数,从而使T增大。合并时应注意合理性,通常有序分类可合并,无序分类则不可合并。采取精准概率检验法或似然比χ2检验法,最小理论数求法。上述χ2检验时,采取专用公式计算χ2值无须理论数,但也必须求出最小理论数,观察其大小是否满足上述各项条件。最小理论数位于最小行列共计数相对应位置上,所以可用行、列共计数中小者相乘除以总例数即得到最小理论数。多组资料比较经χ2检验拒绝H0时只能认为多组间总看差异有统计学意义,并不说明两两之间差异都有统计学意义。若需分析两两之间组成差异有没有统计学意义,可采取χ2分割法或改变检验水准法进行分析等。配对四格表资料2检验步骤:(H0、H1写法特殊)一.H0:两法检出阳性率相同,总体B=C;H1:两法检出阳性率不一样,总体B≠C。 =0.05。二.计算统计量:2。三.查2界值表,判断P与α大小四.按=0.05水准,拒绝H0或接收H1。得出结论。列联表:将单一样本每个观察单位,同时按两种原因,进行分组,分组以后就得到R×C表。然后对这个表进行x2检验,以判断两个原因关联性。而这种配对设计而形成双向交叉排列统计表,用以描述行变量和列变量之间关系,特称为列联表。关于列联表内两个分类变量是否关于联性统计推断,依然是用x2检验,不过它检验假设有所不一样。一.列联表关联性分析2检验步骤:(结合课件看)H0:不一样矽肺期次患者肺门密度分布相同;H1:不一样矽肺期次患者肺门密度分布不一样或不全相同。=0.05。二.计算统计量:2,v。三.P=?四.按=0.05水准,拒绝H0,接收H1。认为肺门密度与矽肺期次关于。结合本资料,肺门密度有随矽肺期次增高而增加趋势。R×C表资料中行通常为研究原因不一样水平分组,列通常为研究结果(效应指标)分类。依照行和列分组或分类情况,可将R×C表资料分为以下几个情况:双向无序R×C表行和列分组或分类均为无序。此时可采取χ2检验处理。单向有序R×C表若行分组为有序(如药品剂量、患者年纪、病情轻重等),但率效应为无序分类(如染色体损伤类型、疾病证型等),此时仍可按双向无序处理,采取χ2检验;若行分组为无序(如三种药品处理),而列效应为有序(如痊愈、显效、好转、无效),此时应采取秩和检验或Ridit检验方可判断疗效上优劣。因为χ2检验不考虑有序分类变量次序。假如固定有序分类变量次序,将列频数交换后,检验结论相同,显然不合理。双向有序R×C表若行分组为有序(如年纪),效应分类也为有序(如疗效等级),可按单向有序R×C表中,列为有序分类时处理方法,采取秩和检验或Ridit检验。若行和列均为同一观察对象两个有序变量,如矽肺期次和肺门密度级别,病程与疗效等,此时为配对设计,可先采取χ2检验。资料分类数值变量资料二分类分类资料无序多分类多分类有序多分类(等级资料)参数统计和非参数统计参数统计非参数统计(parametricstatistics)(nonparametricstatistics)↓↓已知总体分布类型,对未知参数进行统计推断对总体分布类型不作任何要求↓↓不受总体参数影响,比较分布或分布位置依赖于特定分布类型,比较是参数↓适用范围广;可用于任何类型资料(等级资料,或“>50mg”)非参数检验适用情况:①总体分布形式未知或分布类型不明;②偏态分布资料:③等级资料:不能精准测定,只能以严重程度、优劣等级、次序先后等表示;④不满足参数检验条件资料:各组方差显著不齐。⑤数据一端或两端是不确定数值,如“>50mg”等。45.秩和检验适用范围:(1)等级资料;(2)定量资料,但数据某一端或两端无确定数值(开口资料);(3)定量资料,但数值分布是极度偏态,如L形分布,或个别数值偏离过大而不属于“过失误差”者;(4)定量资料,但各组离散程度相差悬殊,即使经变量变换,也难以达成方差齐性;(5)定量资料,但分布型还未确知,此时可先用秩和检验法进行分析;(6)兼有等级和定量性质资料。46.秩和检验优缺点:优点:⑴不论样本所来自总体分布形式怎样,甚至是未知,都能适用。⑵一些非参数方法计算简便。所以在急需取得初步结果时可采取。⑶易于了解和掌握。⑷可用于不能或未加精准测量资料,如等级资料或一些记数资料。缺点:⑴对适宜用参数方法资料,若用非参数法处理,常损失部分信息,降低效率。⑵即使许多非参数法计算简单,但不少问题计算仍嫌繁冗。47.样本相关系数r特征:(1)-1≤r≤1,没有单位;(2)r绝对值大小表示相关关系亲密程度;(3)r符号表示相关方向:r>0为正相关;r<0为负相关;r=0为零相关或无相关48.回归系数和回归方程意义及性质: YˆabX(1)b意义:回归系数b称为斜率,表示自变量增加一个单位时,应变量平均改变量。(2)a意义:a为截距或常数项,a值表示当X=0时,应变量Y估量值。从坐标轴上看,a对应回归直线延伸至X=0时与Y轴交点,故称为截距。(3)^Y(Y-hat)意义:^Y表示给定X时Y平均值估量。^Y涵义是均数—不一样X时Y均数估量值,与通常均数计算方法不一样,这里均数是给定X条件下,由回归方程估量得到,故又称为条件均数。(4)Y-^Y意义:Y-^Y称为剩下,又称残差,是Y观察值与对应估量值之差,在回归图中表示各散点到回归直线纵向距离。(5)(YˆY)2意义:称为残差平方和(residualsumofsquares或剩下平) 方和,是全部剩下之平方和,综合表示点距直线距离。在全部直线中,回归直线残差平方和是最小。(最小二乘)49.回归直线关于性质:直线经过均点 (X,Y)直线上方各点到直线纵向距离之和=直线下方各点到直线纵向距离之和即:(YYˆ)0各点到该回归线纵向距离平方和较到其它任何直线者为小。YYˆYˆY2YYˆ2YYYˆY2YYˆ2YY应变量Y总变异分解:SSSSSS总 回剩 SS 决定系数r2回归总 回 剩 SS 总v总=v回+v剩,v回=1,v剩=n-2。直线回归中三种假设检验间关系:在直线回归中,相关系数假设检验,回归系数假设检验,以及回归方程方差分析结果等价。 ttF可信区间与Y允许区间: r bYˆ可信区间是针对条件均数,而允许区间是针对Y取值范围。允许区间估量:给定X时Y估量值是Y均数一个估量。Yˆ给定X时Y值允许区间是Y值可能范围。回归方程应用:(1)描述两个变量间依存关系。(2)利用回归方程进行预测。(3)利用回归方程进行估量。(4)利用回归方程取得更高精度参考值。(5)利用回归方程进行控制。应用直线回归注意点:.回归分析要有实际意义:要有实际意义;充分利用散点图,判断:(1)线性趋势(2)离群值当样本含量较大时,统计学检验作用减弱;回归关系能够内插,不宜外延;自变量选择:原因轻易测量变异小年纪、身高、体重、体表面积在作回归前应先作散点图(3)内插和外延55.回归分析正确应用:.回归系数是有单位,不能依照b大小判断回归关系亲密程度。.应用条件(LINE):(1)线性(linear)(2)独立(independent)(3)给定X时,Y正态分布(normal)(4)等方差(equalvariance。)56.直线回归分析和相关分析区分与联络:区分:在资料要求上:回归要求因变量Y服从正态分布,X是能够精准测量和严格控制变量,通常称为I型回归;相关要求X和Y均服从双变量正态分布,称为II型回归。在应用上:说明两变量依存改变数量关系用回归,说明变量间相关关系用相关。联络:1)对一组数据同时计算r和b,它们正负号一致,r为+说明两变量间相互关系是同向,b为+说明X增一个单位,Y平均增b个单位。2)r和b假设检验是等价。57.研究设计定义:在进行科学研究时,对研究方案作合理安排,以降低随机误差影响。采取适当研究试验次数,降低试验成本并能对数据进行有效分析,提升研究试验可靠信,从而实现研究目标。研

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论