




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学复 习医学统计中的根本概念医学统计任务的内容实验设计 搜集资料整理资料 分析资料资料的类型医学统计资料的类型医学统计资料的类型 计量资料数值资料计量资料数值资料 分类资料分类资料 计数资料计数资料不同的统计资料应采用不同的统计分不同的统计资料应采用不同的统计分析方法。析方法。1.1.计量数据计量数据身高身高, ,体重体重, ,血压值血压值, ,脉搏数脉搏数例例1 1 某乡村地域某乡村地域20192019年年1414岁女孩岁女孩1010名的身高名的身高( (厘厘米米) )有单位有单位, ,有有1414岁女孩岁女孩1010名的身高名的身高( (厘米厘米数值大小的数据数值大小的数据. .1
2、42.3137.9142.2148.8140.5150.8140.5141.8144.0142.52.2.分类数据分类数据 记录频记录频( (个个) )数的数据数的数据. .细分为两种细分为两种: : 1 1无序分类无序分类 例如例如; ;血型,与胃溃疡和血型,与胃溃疡和胃癌的关系:胃癌的关系: 血型血型胃溃疡胃溃疡胃癌胃癌正常正常合计合计983383289242586794162625372013484570788ABAB214039100计算患病率计算患病率血型血型胃溃疡胃溃疡胃癌胃癌正常正常合计合计98323.1%3839.0%2892425867918.3%41611.2%262537
3、2013417.0%8410.7%570788计算患病率计算患病率 (2) (2) 等级有序资料等级有序资料 例如例如; ;病情的轻病情的轻, ,中中, ,重等重等. .甲亢病人与性别的甲亢病人与性别的关系。关系。 病情分布情况病情分布情况性别性别 轻轻中中重重合计合计男男14171344女女324638116计算构成比计算构成比性别性别轻轻中中重重合计合计男男1431.8%1738.6%1329.5%44女女3227.6%4639.7%3832.8%116计算构成比计算构成比(3) (3) 数据分类的转化数据分类的转化定量数据转化为分类数据定量数据转化为分类数据年龄范围年龄范围分类编码分类编
4、码0 -010 -120 -245 -3654总体和样本总体是同质的个体所构成的全体。从总体中抽取部分个体的过程称为抽样,所抽得的部分成为样本,样本所含的个体数目称为样本含量 从总体中抽取样本要遵照科学原那么 “代表性符合总体规定 “随机性每个个体被抽取有一样的概率 “可靠性实验结果要有可反复性几种常用的抽样方法 1.简单随机抽样 抽签法俗称抓阄法是最常用的简单随机抽样方法1编号做签:将总体中的N个个体编上号,并把号码写到签上; 2抽签得样本:将做好的签放到容器中,搅拌均匀后,从中逐个抽出n个签, 得到一个容量为n的样本 当总体中的个体较多时,“搅拌均匀不容易做到,这样抽出的样本的代表性就会打
5、折扣此时可以采用“随机数法抽样 概率 “可靠性实验结果要有可反复性几种常用的抽样方法 2系统抽样 当总体所含的个体较多时,可将总体分成平衡的几个部分,然后按照预先定出的规那么,从每一部分中抽取一定数目的个体这种抽样叫做系统抽样或机械抽样 概率 “可靠性实验结果要有可反复性Nn几种常用的抽样方法 3分层抽样 当总体是由有明显差别的几个部分组成时,可将总体按差别情况分成互不重叠的几个部分层,然后按各层个体总数所占的比例来进展抽样,这种抽样叫做分层抽样 对分层抽样的每一层进展抽样时,可采用简单随机抽样或系统抽样误差 系统误差校正 随机丈量误差 控制抽样误差 用统计方法进展正确分析频率与概率 频率是发
6、生某种景象的察看单位数占能够发生该景象的察看单位总数的比值概率是频率的极限,是描写某一事件发生的能够性大小的一个量度。用表示某一事件, 表示该事件能够发生的概率,可记为(A)习惯上经常将概率值小于0.05或0.01的事件成为小概率事件,小概率事件根本上不会发生 计量资料的统计描画 平均程度 算术均数适用于对称分布,尤其是正态 分布资料 几何均数适用于几何级数分布的资料 中位数适用于偏态、分布不明、分布末 端无确定值资料变异程度 规范差和方差 四分位数间距等 变异系数 CV一、描画集中趋势的统计目的一、描画集中趋势的统计目的 对于延续型定量变量对于延续型定量变量,描画集描画集中趋势常用的统计量为
7、算术均中趋势常用的统计量为算术均数、几何均数和中位数。数、几何均数和中位数。nXnXXXXXn3212 加权法其计算公式为 :ffXfffXfXfXfXkkk2122111、算术平均数、算术平均数 描画对称资料的集中位置。描画对称资料的集中位置。1直接法直接法2、几何均数、几何均数 适用于察看值间按倍数变化,如:适用于察看值间按倍数变化,如:抗体滴度、细菌计数、血清凝集效价、某抗体滴度、细菌计数、血清凝集效价、某些物质的浓度等,用几何均数来描画平均些物质的浓度等,用几何均数来描画平均程度。程度。2、几何均数、几何均数1、 直接计算法直接计算法 lglglglglglgGXXXXnXnn123n
8、XGlglg12、“加权法计算加权法计算 fXfGlglg1nnxxxG21求滴度的平均程度。求滴度的平均程度。解:解:lg2=0.301 lgG=(2lg2+2lg4+4lg8+2lg32)/10 =0.843G=6.964滴度的平均程度滴度的平均程度1: 7 例例2.4 2.4 :测得:测得1010人血清滴度人血清滴度倒数分别为倒数分别为2 2,2 2,4 4,4 4,8 8,8 8,8 8,8 8,3232,3232 胎盘浸液钩端螺旋体菌苗接种 2个月后血清lgG抗体滴度 IgG滴度倒数 例数 20 16 40 57 80 76 160 75 320 54 640 25 1280 23例
9、例2.5 某医生运用胎盘浸液钩端螺旋体菌苗对某医生运用胎盘浸液钩端螺旋体菌苗对326名农民接种名农民接种2个月后个月后,测得血清测得血清lgG抗体抗体滴度表滴度表2-4,试求平均抗体滴度试求平均抗体滴度(答案答案:)3、中位数、中位数(median) 将一组值从小到大按顺序陈列将一组值从小到大按顺序陈列: (1) 中位数的直接计算法中位数的直接计算法(2) 中位数的频数表计算法:中位数的频数表计算法: MLifNfmc5 0 %其中 M 表示中位数, L 表示中位数所在的那一组的下限, i 为该组的组距, m 表示中位数所在组的频数, fc 为该组以前的各组的累计频数 nxxxx3214、百分
10、位数、百分位数百分位数计算法百分位数计算法: cxxfxNfiLP%其中 : p 表示百分位数,L 表示百分位数所在的那一组的下限, i 为该组的组距, x 表示百分数所在组的频数, fc 为该组以前的各组的累计频数 总结总结 中位数与均数、几何均数的作用一样,都中位数与均数、几何均数的作用一样,都能用来反映一组数据的集中位置或平均程度,能用来反映一组数据的集中位置或平均程度,由于中位数的取定仅取决于它在数据序列集由于中位数的取定仅取决于它在数据序列集中的位置的那个数的程度,而不是由全部察中的位置的那个数的程度,而不是由全部察看值综合计算出来,因此不受少数特大或特看值综合计算出来,因此不受少数
11、特大或特少数值的影响,在一点上优于均数。少数值的影响,在一点上优于均数。 当频数分布呈明显偏态、或两端无确定数当频数分布呈明显偏态、或两端无确定数值时值时,运用中位数作为集中位置或平均程度较运用中位数作为集中位置或平均程度较为合理为合理. 当变量呈对称分布时当变量呈对称分布时,实际上中位数和均数实际上中位数和均数一样一样.但对于样本资料但对于样本资料,由于计算均数时利用一由于计算均数时利用一切的察看值切的察看值,所以较中位数稳定所以较中位数稳定.在统计分析中在统计分析中,中位数的用途不如均数那样广泛中位数的用途不如均数那样广泛. 百分位数可用来描画资料的察看值序列在百百分位数可用来描画资料的察
12、看值序列在百分位置的程度分位置的程度,中位数是其中的特例中位数是其中的特例. 二、描画离散程度的统计目的二、描画离散程度的统计目的 描画察看值之间的变异程度或偏离集中描画察看值之间的变异程度或偏离集中位置的程度,常用的统计量位置的程度,常用的统计量: 一类按间距计算一类按间距计算,有极差和四分位数间有极差和四分位数间距距 。 另一类按平均差距计算另一类按平均差距计算,有离均差平方和、有离均差平方和、方方 差、规范差和变异系数差、规范差和变异系数 。1 1、极差、极差( Range )( Range ) 最大值最小值最大值最小值 现有甲、乙、丙三组数据 甲组 60 70 80 90 100 乙组
13、 70 75 80 85 90 丙组 60 75 80 85 100 甲100-60=40 乙90-70=20 丙100-60=40 2 2、四分位数间距、四分位数间距 Q= P75 Q= P75 P25 P25 四分位数间距可看成中间一半察看值的极差。适用于非正态分布 !3 3、离均差平方和、离均差平方和NXXXXSS222 甲组 60 70 80 90 100 乙组 70 75 80 85 90 丙组 60 75 80 85 1002)(XXSS SS甲(60-80)2+(70-80)2+(80-80)2+(90-80)2+(100-80)2 = 1000 SS乙(70-80)2+(75-
14、80)2+(80-80)2+(85-80)2+(90-80)2 = 250 SS丙(60-80)2+(75-80)2+(80-80)2+(85-80)2+(100-80)2 = 850可见 SS甲SS丙SS乙4 4、方差、方差为总体方差为总体均数其中总体方差:222 , : NX1)(12222nnXXnXXS样本方差变异程度越大,那么离均差平方和变异程度越大,那么离均差平方和 越越大,方差也就越大。大,方差也就越大。方差越大,阐明个体变异越大,那么平方差越大,阐明个体变异越大,那么平均数的代表性就越差。反之,方差越小,均数的代表性就越差。反之,方差越小,阐明个体变异越小,那么平均数的代表阐明
15、个体变异越小,那么平均数的代表性就越好。性就越好。5 5、 规范差规范差 ( Standard of Deviation ) ( Standard of Deviation )12nXXS122nnXX其加权法计算公式为:122fffXfXS现计算上述甲、乙、丙三组的规范差,可得:8.15151000甲S9.715250乙S6.1415850丙S同样是S甲 S丙 S乙 规范差的运用规范差的运用 规范差表示察看值变异程度离散程规范差表示察看值变异程度离散程度,当两组资料均数相近,度量单位一度,当两组资料均数相近,度量单位一样的条件下,规范差较大,阐明察看值的样的条件下,规范差较大,阐明察看值的变
16、异程度较大,即各察看值较分散较远变异程度较大,即各察看值较分散较远离均数,因此均数的代表性较差;反之,离均数,因此均数的代表性较差;反之,规范差较小,阐明察看值变异程度较小,规范差较小,阐明察看值变异程度较小,即各察看值较集中在均数周围,因此均数即各察看值较集中在均数周围,因此均数的代表性较好。的代表性较好。 规范差结合均数可计算变异系数;规范差结合均数可计算变异系数; 规范差结合均数计算正常值范围。规范差结合均数计算正常值范围。6 6、变异系数、变异系数 %100XSCV变异系数是相对数,没有单位,表示相对变异变异系数也称离散系数,用变异系数也称离散系数,用CVCV表示。其计算公式为:表示。
17、其计算公式为:最正确选择题最正确选择题假设对每一个察看值都加上一个一样的值5,那么 。A. 均数改动,规范差也变B. 均数改动,规范差不变C. 均数不变,规范差变D. 均数不变,规范差也不变B最正确选择题最正确选择题假设对每一个察看值都乘上一个一样的值5,那么 。A. 均数改动,规范差也变B. 均数改动,规范差不变C. 均数不变,规范差变D. 均数不变,规范差也不变A正态分布正态分布 正态分布的密度函数 222)(21)(XeXfX正态分布的两个参数:均数数学期望规范差规范正态分布的均数为0,规范差为1-5-4-3-2-101234596.196.158.258.2%0.99%0.95%3.6
18、8正态分布曲线下的面积概率 -4-3-2-101234567123321三种不同均值的正态分布 -5-4-3-2-1012345123321三种不同规范差的正态分布规范正态分布规范正态分布u u分布与分布与t t分布区别分布区别一样点:集中位置都为0,都是单峰分布,是对称分布,规范正态分布是t分布的特例自在度是无限大时不同点:t分布是一簇分布曲线,t 分布的曲线的外形是随自在度的变化而变化,规范正态分布的曲线的外形不变,是固定不变的,由于它的外形参数为1。医学参考值范围的估计医学参考值范围指特定安康情况的人群的解剖、生理、生化等各种数据的动摇范围医学参考值范围的估计:习惯上是包括95%99%的
19、人的界值,正态分布的用正态分布法,偏态分布的用百分位数法正态分布 规范正态分布 面积%27.681111%00.9596. 196. 196. 196. 1%00.9958. 258. 258. 258. 2计量数据的统计推断计量数据的统计推断1、参数估计、参数估计 由样本均数推断总体均数所在范围。由样本均数推断总体均数所在范围。即对总体参数进展估计即对总体参数进展估计2、假设检验、假设检验 用假设检验的推理方法来判别某个用假设检验的推理方法来判别某个某些随机样天性否来源同一总某些随机样天性否来源同一总体或假设的总体体或假设的总体 1某个样天性否来自知总体某个样天性否来自知总体 2两个样天性否
20、来自同一总体两个样天性否来自同一总体 3多个样天性否来自同一总体多个样天性否来自同一总体 中心极限定理分布均数标准差总体正态分布近似正态分布样本均数总体(大样本)正态分布(标准误)nx/抽样误差抽样误差样本均数与总体均数之间的差别或样本均样本均数与总体均数之间的差别或样本均数之间的差别都是由于抽样引起的,称数之间的差别都是由于抽样引起的,称为抽样误差为抽样误差影响抽样误差大小的要素有两个:影响抽样误差大小的要素有两个:总体内各个个体间的变异程度;总体内各个个体间的变异程度;样本的含量的大小。样本的含量的大小。 抽样误差与规范误抽样误差与规范误 抽样误差不可防止样本均数的规范差称为规范误规范误是
21、表示抽样误差大小的目的NSSX总体均数的估计 参数估计是指由样本目的值统计量估计总体目的值参数,是统计推断的一个重要内容。常用的估计方法有两种:点估计和区间估计。 区间估计的概念可信区间亦称置信区间,是指按预先给定的概率估计未知总体均数的能够范围。事先给定的概率1-称为可信度 留意:总体均数区间估计与医学参考值含 义 与计算的差别 对计量资料总体均数的估计对计量资料总体均数的估计总体均数的点估计和区间估计总体均数的点估计和区间估计样本均数作为总体均数的点估计样本均数作为总体均数的点估计当足够大时,总体均数的区间估计当足够大时,总体均数的区间估计总体均数的总体均数的95%95%的置信区间的置信区
22、间XXSXSX96. 1,96. 1XXSXSX58. 2,58. 2 总体均数的99%的置信区间例:140成年男性红细胞数样本:总体均数的95%与99%的区间估计为: ( 4 . 7 8 - 1 . 9 6 0 . 0 3 , 4.78+1.960.03) 即: (4.72, 4.84)(4.782.580.03, 4.782.580.03) 即: (4.70, 4.86) 03. 014037. 0,37. 0,78. 4XSSX描写抽样误差大小的统计量称为率的规范描写抽样误差大小的统计量称为率的规范误。对计数资料,其计算公式为:误。对计数资料,其计算公式为: 对计数资料抽样误差与规范误对
23、计数资料抽样误差与规范误n)1(P其中: 表示规范误 P表示阳性率 1-p表示阴性率 n样本含量PSn)P1(PSP 计数资料抽样误差与规范误计数资料抽样误差与规范误 n北京某医院某大夫运用“乌贝散n 乌贼骨3钱,白芨3钱,川贝3钱, 甘草3钱,共研细末过120目筛,冲服n 治疗胃溃疡病出血107例,有效101例,有效率为94.4% ,求置信区间?%2 . 2107%6 . 5%4 .94)1 (PnpPS95% 置信区间为:置信区间为: 94.4 % -1.96*2.2 % ,94.4 % +1.96*2.2 % 90.1 % , 98.7 %规范差与规范误的区别和联络规范差与规范误的区别和
24、联络区别:1.含义不同:规范差描画一组变量的离散趋势,规范误是描画样本均数之间的离散趋势。2运用不同:1规范差s越小,表示变量值围绕均值分布越密集,阐明均数的代表性越好。规范误 越小,表示样本均数与总体均数越接近,阐明样本均数推断总体均数的可靠性越大。2可用 估计变量值的分布范围,可用 估计总体均数的可信区间。3.与n的关系不同: n越大,s越稳定,n越大, 越小。规范差与规范误的区别和联络规范差与规范误的区别和联络联络1. 二者均为变异度大小的统计目的,样本均数的规范差即为规范误,规范差与规范误成正比。2. 规范误 ,与规范差的大小成正比,与抽样例数的平方根成反比。 3.当n一定时,同一份资
25、料,规范差越大,规范误也越大。假设检验的根本概念 假设检验是统计推断的另一个重要内容,亦称显著性检验假设检验的根本思想假设检验的步骤 一、建立检验假设并确定检验水准 二、选择检验方法、计算统计量 三、确定概率值 四、作出推断结论 样本样本1同一总体同一总体 差别差别 抽样误差引起抽样误差引起 样本样本2总体甲总体甲 样本样本1 差别差别 本质不同引起本质不同引起本质不同本质不同 总体乙总体乙 样本样本2 假设检验假设检验不能用抽样误差来解释不能用抽样误差来解释P0.05P0.05无统计学意义有统计学意义接受0 差别能用抽样误差引起 0.05 差别无统计学意义。回绝0, , 0.05差别不能用抽
26、样误差来解 差别有统计学意义。 作出推论假设检验中的两类错误第一类错误弃真:回绝实践上成立的假设第二类错误存伪:不回绝实践不成立的假设假想象同时降低犯两类错误的能够,添加样本例数例题是非题研讨人员丈量了100例患者外周血的红细胞数,所得资料为计数资料错。外周血的红细胞数是对血液中红细胞含量的丈量值,丈量单位是109/L,属计量资料进展两均数差别的假设检验时,当P0.05时,那么接受H0,以为两总体均数无差别。错。当P0.05时,我们对两均数总体无差别这一结论无任何概率保证,因此不能贸然下无差别的结论。正确的说法是,按所取的检验水准,回绝H0接受H1)的统计证据缺乏。通常单侧检验比双侧检验更为灵
27、敏,更易检验出差别,以此宜广泛采用。错。单侧检验的运用应以专业知识为根据,它充分利用了另一侧的不能够性,故检出率高,但应慎用。四个样本率作比较,2)3(05. 02可以为各总体率均不相等错。应为均不相等或不全相等选择题对两样本作均数比较时,知两样本例数均小于30,总体方差不齐,且呈偏态分布,宜用 。A. t 检验B. u 检验C. 秩和检验D. F 检验C 在均数为 规范差为 的正态总体中随机抽样, ( )的概率为5%。 A. B. C. D. 96. 1X96. 1st05. 0Xst05. 0XB 两样本均数比较,经检验,差别有显著性时,P越小,阐明( )。A. 两样本均数差别越大B. 两
28、总体均数差别越大C. 越有理由以为两总体均数不同D. 越有理由以为两样本均数不同 C完全随即设计资料的方差分析中,必然有 。A. SS组内SS组间B. MS组间50,大样本,故可以为近似正态分布90/29. 096. 118. 496. 1XSX即4.12, 4.24) 1012/L请比较二者的不同两独立样本均数比较的两独立样本均数比较的 检验检验(two independent sample t-test) (two independent sample t-test) 统计量:统计量:tXXSXX1212SXXNXXNNNc212121222221222121121NNSScXX 例例2
29、某克山病高发区测得某克山病高发区测得11例急性克山病患者与该地例急性克山病患者与该地13名安康人的名安康人的血磷值血磷值(mg%) 如下所示,断定两组均数差别有否统计学意义。如下所示,断定两组均数差别有否统计学意义。表表5.2 急性克山病患者与当地安康者的血磷测定值急性克山病患者与当地安康者的血磷测定值mg% 急性克山病患者急性克山病患者 安康者安康者 编号编号 X1 x2 编号编号 X1 x21 4.73 22.3729 1 2.34 5.4756 2 6.40 40.9600 2 2.50 6.2500 3 2.60 6.7600 3 1.98 3.9204 4 3.24 10.4976
30、4 1.67 2.7889 5 6.53 42.6409 5 1.98 3.9204 6 5.18 26.8324 6 3.60 12.9600 7 5.58 31.4 7 2.33 5.4289 8 3.73 13.9129 8 3.73 13.9129 9 4.32 18.6624 9 4.57 20.8849 10 5.78 33.4084 10 4.82 23.2324 11 3.73 13.9129 11 5.78 33.4084 12 4.17 17.3889 x2 13 4.14 17.6 11 51.82 261.0968 13 43.61 166.71130:设克山病患者与当
31、地安康者的血磷值的均数一样。1: 设克山病患者与当地安康者的血磷值的均数不一样。计算 X1518211471.X2436113335.SXXNXXNNNc21212122222122Sc2222610968518211166711343611311 13216997.SSNNXXc1221211169971111130 534 .tXXSXX1212547.2534.035.371.4自在度 df = N1 + N2 -2 = 11+13-2 = 22查附表1可得: t 0.05(22)2.074 t 0.01(22) 2.819结论由于 t 0.01(22) 2.547t0.05(22),
32、所以0.05差别有统计学意义。可以以为克山病患者血磷的平均值明显高于当地安康人的血磷平均值。四格表资料四格表资料 2 2 检验检验例例3 3 用某种药物鼻注组与某种药物鼻注加肌注维生用某种药物鼻注组与某种药物鼻注加肌注维生 素素B12B12两种处置方法两种处置方法, , 察看大白鼠鼻咽癌发病察看大白鼠鼻咽癌发病率率 的比较如表所示的比较如表所示 处理 发癌鼠数 未发癌鼠数 合计 某种药物鼻注+维生素B12组 53 (a) 18 (b) 71 某种药物鼻注组 38 (c) 3 (d) 41 91 21 112 1. H0:药物鼻注组与某种药物鼻注加肌注维生素 B12 两 种处置方法疗效程度相等2
33、. 计算 2 值 dbcadcbaNbcad2255. 521914171112381835323. 计算自在度,查界值 自在度df =1, 20.01(1)=6.63 20.05(1)=3.844. 结论 本例 2 = 5.55 20.05(1), 故 P 0.05, 差别有统计学意义。普通来说实际值 较小或总例数 较小时,要用校正公式或确切概率法。详细的 与 的界限各书不尽一致,较多的以为:1. 1 40 时, 需求用校正公式。 校正 2 的计算公式为: 四格表四格表 校正校正 2 2 值的计算值的计算TTA220 0. .5 5dbcadcbaNbcad22N N/ /2 2或例例4 4 分别用槟榔煎剂和阿的平治疗绦虫病患者分别用槟榔煎剂和阿的平治疗绦虫病患者, , 资料资料如表如表, , 试比较两药的疗效有无差别试比较两药的疗效有无差别? ? 有效 无效 合 计 槟榔煎剂 21 (19.2) 4 (5.8) 25 阿的平 12 (13.8) 6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论