护理统计教学课件-几个基本概念_第1页
护理统计教学课件-几个基本概念_第2页
护理统计教学课件-几个基本概念_第3页
护理统计教学课件-几个基本概念_第4页
护理统计教学课件-几个基本概念_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

护理统计学统计中的几个基本概念

总体与样本

总体:根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。分为有限总体(观察单位数有限)和无限总体(观察单位数无限)两类。样本:是从总体中抽取的部分个体,个体数的多少称样本含量或样本例数。

频率与概率

频率:某种现象在样本中出现的比率,是样本特征。概率:随机事件发生可能性的数值度量,常用P表示,取值范围0≤<P≤1,是总体的特征。特别的,小概率事件,特指发生概率P≤0.05或P≤0.01的事件。实验设计的基本原则

对照原则:常用的对照有:空白对照、安慰剂对照、标准对照、实验对照、自身对照和历史对照等。重复原则:即研究对象要有一定的数量,或者说样本含量应足够。随机化原则:即应保证每个实验对象都有同等机会进入实验或接受某种处理。常用方法有查随机数字表和随机排列表等。均衡原则:即各处理组非实验因素的条件基本一致,以消除其影响。常用的实验设计方法

完全随机设计:将实验对象随机分配至两个或多个处理组去进行实验观察,又称单因素设计、成组设计。配对(伍)设计:将受试对象配成对子或配伍组,以消除非实验因素的影响。配伍设计又称随机区组设计。配对有自身配对和不同个体配对,配伍实际上是配对的推广。其它实验设计方法:(1)交叉设计:在配对设计基础上再加入时间因素,可分析不同阶段的效应。(2)析因设计、拉丁方设计和正交设计等。数量资料统计描述

频数分布的特征及类型:

(1)两个特征:集中趋势(centraltendency)和离散趋势(tendencyofdispersion)

(2)两种类型:对称分布(symmetricdistribution)和偏态分布(skeweddistribution)。2、集中位置的描述描述一组观察值集中位置或平均水平的指标称为平均数(average)。常用的平均数有算术均数、几何均数和中位数。3、离散程度的描述多组资料均数相同,只说明其集中趋势相同,各组数据内部观察值参差不齐的程度可能不同。此时,常用极差、四分位数间距、方差、标准差和变异系数等指标来描述资料的离散程度。分类资料统计描述

对分类变量资料进行统计描述的一般步骤,是先对观察测量得到的变量值(即观察值)进行分类汇总(即“计数”)得到分类资料频数表(属于绝对数指标),再在此基础上计算相对数指标(即两个指标之比)才能对分类变量资料进行正确的描述。一、常用的相对数指标1.比

又称相对比,其基本计算公式为:比=A/B,说明A为B的若干倍或百分之几。A、B可为绝对数、相对数或平均数。如某市某年I区的急性传染病发病数为2433人,II区的急性传染病发病数为3033人,则II区与I区急性传染病发生数之比为3033/2433=1.25。

分类资料统计描述

构成比

又称构成指标。其计算公式为:构成比=(某一组成部分的观察单位数/(同一事物各组成部分的观察单位总数)*100%。构成比用来说明事物内部各组成部分所占比重或分布。如上例中若全市的急性传染病发病数为12884人,则I区占全市急性传染病发病数的比重为2433/12884*100%=18.9%3.率

又称频率指标,计算公式为:率=(发生某现象的观察单位数)/可能发生某现象的观察单位数)*K,k为100%万/万等。率用来说明某现象发生的频率或强度。如上例I区的年平均人口数为636723人,则I区该年急性传染病发病率=(2433/636723)*100000/10万=382/10万。

医学参考值范围制定

医学参考值的概念:医学参考值又称临床参考值或正常值,是指“正常”人体和动物的各种生理常数、体液、排泄物中各种成分含量及人体对各种试验的反应值。广义的医学参考值还包括各类“卫生标准”。应注意的是,医学参考值的不是一个单一的数值,而是许多数值的集合或全体,即是一个范围。

医学参考值的作用及意义:(1)用以区分“正常”和“异常”个体,为临床诊断提供参考;(2)可用以反映不同时间、地区人群某项指标的生理变迁。制定参考值范围的基本步骤

1.

确定“正常人”对象的范围:即根据研究目的确定的未患被研究疾病的个体。2.

统一测定标准:即检验用的试剂批号、仪器、人员、条件等应相同。3.

确定分组:一般需用年龄、性别等对“正常人”对象进行分组,分组特征也可根据检验判断。4.

样本含量确定:一般来讲,正态分布资料所需的样本含量应在100以上,偏态或未知分布时样本含量应更大。5.

确定参考值范围的单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧。6.

确定百分位点:一般取95%或99%。

参考值范围的制定方法

(1)

正态分布法:据正态分布原理,一定可信度(如95%)下的正常值范围,双侧为:均数±u0.05*S;单侧上限为:均数+u0.05*S,单侧下限为:均数-u0.05*S。(2)

百分位数法:

对于偏态分布或未知分布的资料,正常值范围的确定常用百分位数法,如95%可信度下的正常值范围双侧为P2.5--P97.5,单侧上限为P95,单侧下限为P5。

常用检验方法

t检验和u检验

方差分析

卡方检验

秩和检验

回归与相关

上述两个均数不等既可能是抽样误差所致,也有可能真是环境差异的影响。

已知健康成年男性的脉搏均数为72次/分,某医生在一山区随即抽查了25名健康男性,求得其脉搏均数为74.2次/分,标准差为6.0次/分,问是否能据此认为该山区成年男性的脉搏均数高于一般成年男性。t检验过程

1.建立假设

H0:µ=µ0=72次/分,H1:µ>µ0,检验水准为单侧0.05。2.计算统计量,进行样本均数与总体均数比较的t检验时t值为样本均数与总体均数差值的绝对值除以标准误的商,其中标准误为标准差除以样本含量算术平方根的商。3.确定概率,作出判断,以自由度v(样本含量n减1)查t界值表,0.025<P<0.05,拒绝H0,接受H1,可认为该山区成年男性的脉搏均数高于一般成年男性。应注意的是,当样本含量n较大时,可用u检验代替t检验。

t检验的应用条件和注意事项

两个小样本均数比较的t检验有以下应用条件:(1)两样本来自的总体均符合正态分布,(2)两样本来自的总体方差齐。故在进行两小样本均数比较的t检验之前,要用方差齐性检验来推断两样本代表的总体方差是否相等,方差齐性检验的方法使用F检验,其原理是看较大样本方差与较小样本方差的商是否接近“1”。若接近“1”,则可认为两样本代表的总体方差齐。判断两样本来自的总体是否符合正态分布,可用正态性检验的方法。若两样本来自的总体方差不齐,也不符合正态分布,对符合对数正态分布的资料可用其几何均数进行t检验,对其他资料可用t’检验或秩和检验进行分析。方差分析(ANOVA)又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。

某克山病区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下,患者:0.841.051.201.201.391.531.671.801.872.072.11健康人:0.540.640.640.750.760.811.161.201.341.351.481.561.87问该地克山病患者与健康人的血磷值是否不同?

从以上资料可以看出,24个患者与健康人的血磷值各不相同,如果用离均差平方和(SS)描述其围绕总均数的变异情况,则总变异有以下两个来源:(1)组内变异,即由于随机误差的原因使得各组内部的血磷值各不相等;(2)组间变异,即由于克山病的影响使得患者与健康人组的血磷值均数大小不等。而且:SS总=SS组间+SS组内

v总=v组间+v组内。如果用均方(即自由度v去除离均差平方和的商)代替离均差平方和以消除各组样本数不同的影响,则方差分析就是用组内均方去除组间均方的商(即F值)与1相比较,若F值接近1,则说明各组均数间的差异没有统计学意义,若F值远大于1,则说明各组均数间的差异有统计学意义。方差分析的应用条件(1)可比性。(2)正态性。(3)方差齐性。根据资料设计类型的不同,有以下两种方差分析的方法:1.对成组设计的多个样本均数比较,应采用完全随机设计的方差分析,即单因素方差分析。2.对随机区组设计的多个样本均数比较,应采用配伍组设计的方差分析,即两因素方差分析。两类方差分析的基本步骤相同,只是变异的分解方式不同,对成组设计的资料,总变异分解为组内变异和组间变异(随机误差),即:SS总=SS组间+SS组内,而对配伍组设计的资料,总变异除了分解为处理组变异和随机误差外还包括配伍组变异,即:SS总=SS处理+SS配伍+SS误差。

整个方差分析的基本步骤(1)

建立检验假设;

H0:多个样本总体均数相等。H1:多个样本总体均数不相等或不全等。检验水准为0.05。(2)

计算检验统计量F值;(3)

确定P值并作出推断结果。

多个样本均数的两两比较

经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。1.多个样本均数间两两比较

常用q检验的方法,即

Newman-kueuls法,其基本步骤为:建立检验假设-->样本均数排序-->计算q值-->查q界值表判断结果。

两组大白鼠在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别?

卡方检验是用途很广的一种假设检验方法,这里我们主要学习它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。

是表中最基本的数据,因此上表资料又被称之为四格表资料。

卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为1*91/113=57.18,故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。

5219393四格表资料的卡方检验,四格表资料的卡方检验用于进行两个率或两个构成比的比较。

1.专用公式:若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=(ad-bc)2*n/(a+b)(c+d)(a+c)(b+d),自由度v=(行数-1)(列数-1)。

应用条件:

要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率。

行X列表资料的卡方检验,

行X列表资料的卡方检验用于多个率或多个构成比的比较。

1.专用公式:

r行c列表资料卡方检验的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]2.应用条件:要求每个格子中的理论频数T均大于5或1<T<5的格子数不超过总格子数的1/5。当有T<1或1<T<5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行X列表资料卡方检验的应用条件。而多个率的两两比较可采用行X列表分割的办法。

1234545689910111213非参数统计方法

在实践中我们常常遇到以下一些资料,如需比较患者和正常人的血铁蛋白、血铅值、不同药物的溶解时间、实验鼠发癌后的生存日数、护理效果评分等,这类资料有如下特点:(1)资料的总体分布类型未知;或(2)资料分布类型已知,但不符合正态分布;或(3)某些变量可能无法精确测量。对于此类资料,除了进行变量变换或t’检验外,可采用非参数统计方法。

参数统计与非参数统计的区别:参数统计:即总体分布类型已知,用样本指标对总体参数进行推断或作假设检验的统计分析方法。非参数统计:即不考虑总体分布类型是否已知,不比较总体参数,只比较总体分布的位置是否相同的统计方法。

非参数统计中一种常用的检验方法--秩和检验,其中“秩”又称等级、即按数据大小排定的次序号。上述次序号的和称“秩和”,秩和检验就是用秩和作为统计量进行假设检验的方法。

不同设计和资料类型的秩和检验

1.配对比较的资料:对配对比较的资料应采用符合秩和检验(Sighedranktest),其基本思想是:若检验假设成立,则差值的总体分布应是对称的,故正负秩和相差不应悬殊。检验的基本步骤为:(1)建立假设;

H0:差值的总体中位数为0;H1:差值的总体中位数不为0;检验水准为0.05。(2)算出各对值的代数差;(3)根据差值的绝对值大小编秩;(4)将秩次冠以正负号,计算正、负秩和;(5)用不为“0”的对子数n及T(任取T+或T-)查检验界值表得到P值作出判断。应注意的是当n>25时,可用正态近似法计算u值进行u检验,当相同秩次较多时u值需进行校正。

不同设计和资料类型的秩和检验

两样本成组比较:两样本成组资料的比较应用Wilcoxon秩和检验,其基本思想是:若检验假设成立,则两组的秩和不应相差太大。其基本步骤是:(1)建立假设;H0:比较两组的总体分布相同;H1:比较两组的总体分布位置不同;检验水准为0.05。(2)两组混合编秩;(3)求样本数最小组的秩和作为检验统计量T;(4)以样本含量较小组的个体数n1、两组样本含量之差n2-n1及T值查检验界值表;(5)根据P值作出统计结论。同样应注意的是,当样本含量较大时,应用正态近似法作u检验;当相同秩次较多时,应用校正公式计算u值。麦克奇尼:中国近代护理的先驱回归与相关

直线回归分析,直线回归是用直线回归方程表示两个数量变量间依存关系的统计分析方法,属双变量分析的范畴。

1.相关分析要有实际意义;2.相关关系不一定都是“因果”关系;3.相关系数r假设检验中p的大小不能说明相关的密切程度;4.直线相关和等级相关有各自不同的适用条件。1.直线回归方程的求法

(1)回归方程的概念:直线回归方程的一般形式是Ý(音yhat)=a+bx,其中x为自变量,一般为资料中能精确测定和控制的量,Y为应变量,指在x规定范围内随机变化的量。a为截距,是回归直线与纵轴的交点,b为斜率,意为x每改变一个单位时,Ý的变化量。(2)直线回归方程的求法

确定直线回归方程利用的是最小二乘法原理,基本步骤为:1)先求

b,基本公式为b=lxy/lxx=SSxy/SSxx,其中lxy为X,Y的离均差积和,lxx为X的离均差平方和;2)再求a,根据回归方程

a等于Y的均值减去x均值与b乘积的差值。(3)回归方程的图示:根据回归方程,在坐标轴上任意取相距较远的两点,连接上述两点就可得到回归方程的图示。应注意的是,连出的回归直线不应超过x的实测值范围.回归关系的检验回归关系的检验又称回归方程的检验,其目的是检验求得的回归方程在总体中是否成立,即是否样本代表的总体也有直线回归关系。方法有以下两种:(1)方差分析

其基本思想是将总变异分解为SS回归和SS剩余,然后利用F检验来判断回归方程是否成立。(2)t检验

其基本思想是利用样本回归系数b与总体均数回归系数ß进行比较来判断回归方程是否成立,实际应用中因为回归系数b的检验过程较为复杂,而相关系数r的检验过程简单并与之等价,故一般用相关系数r的检验来代替回归系数b的检验。

直线回归方程的应用(1)描述两变量之间的依存关系;

利用直线回归方程即可定量描述两个变量间依存的数量关系(2)利用回归方程进行预测;

把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间。(3)利用回归方程进行统计控制

规定Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。

1.直线相关的概念

直线相关分析是描述两变量间是否有直线关系以及直线关系的方向和密切程度的分析方法。用以描述两变量间相关关系的指标是相关系数(常用r表示),两变量间相关关系的种类有正相关(0<r<1)、负相关(-1<r<0)、零相关(r=0)、完全相关(|r|=1)等。相关分析对资料的要求是两变量(x,y)均是符合正态分布的随机变量

相关系数的计算相关系数是x,Y的离均差积和lxy除以X的离均差平方和lxx与Y的离均差平方和lyy之积的算术平方根的商。故此相关系数又被称为积差相关系数。3.相关系数的假设检验

相关系数检验的目的是判断两变量的总体是否有相关关系,方法有t检验和查表法,t检验法是样本与总体的比较,查表法是直接查相关系数界值表得到相应的概率p。

直线相关与回归的区别

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论