医学统计学专项课程培训课件_第1页
医学统计学专项课程培训课件_第2页
医学统计学专项课程培训课件_第3页
医学统计学专项课程培训课件_第4页
医学统计学专项课程培训课件_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学专项课程医学统计学专项课程医学统计学温医公卫学院黄陈平2医学统计学专项课程医学统计学温医公卫学院黄陈平2医学统计学专项课程医学实践中遇到的统计学问题举例(1)某中医师对某方剂进行改良,改良后的方剂治疗某病患者30例,有效率为80%,原方剂治疗30例,有效率为60%,问两者有效率有无差别?3医学统计学专项课程医学实践中遇到的统计学问题举例(1)某中医师对某方剂进行改良医学实践中遇到的统计学问题举例(2)某医师用、和三种方案治疗婴幼儿贫血患者,治疗一个月后,血红蛋白的增加克数如下表,问三种治疗方案对婴幼儿贫血的疗效是否相同?表. 三种方案治疗后血红蛋白增加量() 24 20 20 36

2、18 11 25 17 6 14 10 3 26 19 0 34 24 -1 23 4 5 4医学统计学专项课程医学实践中遇到的统计学问题举例(2)某医师用、和三种方医学实践中遇到的统计学问题举例(3)在小学生的课间餐面包中添加赖氨酸,以研究其对儿童体重和身高增长的影响,拟分析赖氨酸添加的最佳浓度和面包烤制的最佳条件。赖氨酸的浓度有五个水平:0.0%,0.2%,0.4%,0.6%,0.8%,面包烤制条件有两个水平:甲和乙。如何设计和分析?5医学统计学专项课程医学实践中遇到的统计学问题举例(3)在小学生的课间餐面包中添医学实践中遇到的统计学问题举例(4)6医学统计学专项课程医学实践中遇到的统计学

3、问题举例(4)6医学统计学专项课程医学实践中遇到的统计学问题举例(5)7医学统计学专项课程医学实践中遇到的统计学问题举例(5)7医学统计学专项课程医学实践中遇到的统计学问题举例(6) 22例期非小细胞肺癌患者在不同日期经随机化分配到放疗组和放化疗联合组,从缓解出院日开始随访,随访时间(月)如下,试比较放疗和放化疗联合两种治疗方案的疗效有无差别?放疗组 1,2,3,5,6,9+,11,13,16,26,37+放化疗联合组 10,11+,14,18,22,22,26,32,38,40+,42+8医学统计学专项课程医学实践中遇到的统计学问题举例(6) 22例医学实践中遇到的统计学问题举例(7) 欲研

4、究胃癌患者术后发生院内感染的影响因素,某医生记录了50名胃癌患者术后院内感染情况,并调查了下列可能的影响因素: 年龄(岁)、手术创伤程度(分5等级)、营养状态(分3等级)、术前预防性抗菌(分有无)、 白细胞数(109/L)、 肿瘤病理分级(19级)。1. 欲筛选哪些因素是影响胃癌患者术后发生院内感染的主要因素, 应选择何种统计分析方法?2. 经统计分析得知营养状态(X3)和肿瘤病理分级(X6)是有意义的影响因素,若一胃癌患者营养状态评分(X3)为1,肿瘤病理分级(X6)为4,则预计其术后发生院内感染的概率是多少?9医学统计学专项课程医学实践中遇到的统计学问题举例(7) 欲研究胃医学实践中遇到的

5、统计学问题举例(8)10医学统计学专项课程医学实践中遇到的统计学问题举例(8)10医学统计学专项课程学习医学统计学的要求 最低要求:知道常见的统计学方法,会模仿着去应用。基本要求:了解有关统计方法的原理,能较熟练地运用统计软件,解决常见的统计学问题。较高要求: 对较复杂的统计学问题,能独立提出系统的解决方案。11医学统计学专项课程学习医学统计学的要求 最低要求:知道常见的统计学方法,会模仿第一章 绪 论12医学统计学专项课程第一章 绪 论12医学统计学专项课程 一、什么是统计学? Whats statistics?是一门关于收集、整理和分析(统计)数据的科学。医学统计学是统计学方法在医学中的运

6、用。医学研究中观测结果多为随机事件,通过统计学方法可以揭示其内在规律。 问题1: 产生随机性的原因? 如一组七岁男童的身高。 问题2: 大量性随机现象的统计有无规律性?13医学统计学专项课程 14医学统计学专项课程14医学统计学专项课程(1)设计: design(2)收集资料 collection of data (3)整理资料 sorting data (4)分析资料 analysis of data二、统计工作的基本步骤1)专业设计2)统计设计1)统计报表2)医疗卫生工作记录3)专题调查和实验1)对数据检查、核对2)按分析要求分组、汇总1)统计描述 2)统计推断 15医学统计学专项课程(1

7、)设计:二、统计工作的基本步骤1)专业设计1)统计报表1用定量方法测定得到,有大小之分,有度量衡单位。三、 统计资料类型(一)计量资料 measurement data16医学统计学专项课程用定量方法测定得到,有大小之分,有度量衡单位。三、 统计资料将观察单位按属性或类型分组计数所得的资料。分为:1、二项分类资料; 2、多项分类资料。(二)计数资料 enumeration count data17医学统计学专项课程将观察单位按属性或类型分组计数所得的资料。(二)计数资料 18医学统计学专项课程18医学统计学专项课程(三)等级资料 ranked ordinal data将观察单位按某属性不同程度

8、分组计数所得的资料。19医学统计学专项课程(三)等级资料 ranked ordinal data将例:测得一群人Hb值(g/dL),此资料为 ; 按正常和异常分为两组,此时资料为 ; 按量的多少分为: 16 (Hb增高)。此时资料为 。资料间的相互转化20医学统计学专项课程例:测得一群人Hb值(g/dL),此资料为 四、统计学的基本概念(一)同质与变异同质(homogeneity) 指各观察指标受相同因素影响的部分。变异(variation) 在同质的基础上个体间的差异。21医学统计学专项课程四、统计学的基本概念(一)同质与变异同质(homogenei例某地某年用随机抽样方法检查了140名健康

9、成年男子的红细胞数(1012/L),检测结果如下表:4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.

10、595.084.824.93观察指标的同质部分:“某地某年健康成年男子”观察指标的变异部分:各个体间红细胞数间的差异22医学统计学专项课程例某地某年用随机抽样方法检查了140名健康成年男子的红细胞数医学统计学的基本概念(二)总体与样本(population & sample)总体:是根据研究目的所确定的同质观察单位(某种变量值)的全体。 1)有限总体(有时间、空间限制) 例研究2008年温州市肝癌死亡率。 2)无限总体 例研究某药对高血压病的疗效。样本:从总体中随机抽取一部分个体所组成的集合。23医学统计学专项课程医学统计学的基本概念(二)总体与样本(population 医学统计学的基本概念

11、(三)随机抽样1.单纯随机抽样2.系统(机械)随机抽样3.整群随机抽样4.分层随机抽样 从总体中随机遇而定抽取部分个体的过程。(总体中每一个观察单位均有同等的机会被抽取到) 随机抽样是样本客观反映总体情况的前提。 随机抽样方法:24医学统计学专项课程医学统计学的基本概念(三)随机抽样1.单纯随机抽样 从总单纯随机抽样 即先将调查总体的全部观察单位编号,再随机抽取部分观察单位组成样本。例:欲了解某单位职工HBsAg阳性率,该单位有职工1000人,试按单纯随机抽样法,抽取一例数为100的样本。25医学统计学专项课程单纯随机抽样 即先将调查总体的全部观察单位编号系统随机抽样又称等距抽样或机械抽样,即

12、先将总体的观察单位按某一顺序号等分成n个部分,再从第一部分随机抽第k号观察单位,依次用相等间隔,机械地从每一部分各抽一个观察单位组成样本。例:欲了解某单位职工HBsAg阳性率,该单位有职工1000人,试按系统抽样法,抽取一例数为100的样本。26医学统计学专项课程系统随机抽样又称等距抽样或机械抽样,即先将总体的观察单位按某整群随机抽样 先将总体划分为n个群,每个群包括若干观察单位,再随机抽取k个群,并将被抽取的各个群的全部观察单位组成样本。例:某校有80个班级,各班学生50人,现用锡克氏试验调查该校学生白喉易感率,随机抽查了8个班的全部学生。27医学统计学专项课程整群随机抽样 先将总体划分为n

13、个群,每个群包括若分层随机抽样按有关影响因素把观察对象分成若干层次,然后将同一层次的观察对象进行随机抽取。例:欲了解某地人群HBsAg阳性率情况,按年龄段、职业、性别等因素分层后进行抽样。28医学统计学专项课程分层随机抽样按有关影响因素把观察对象分成若干层次,然后将同一医学统计学的基本概念(四)误差 主要有:粗差、系统误差、随机误差(如测量误差、 抽样误差等)问题:某中医师对某方剂进行改良,改良后的方剂治疗某病患者30例,有效率为80%,原方剂治疗30例,有效率为60%,问两者有效率有无差别? 抽样误差:抽样引起的总体参数与样本统计量之间sampling error 的差别。29医学统计学专项

14、课程医学统计学的基本概念(四)误差问题:某中医师对某方剂进行改良医学统计学的基本概念(五)参数与统计量 (parameter & statistic) 参数: 统计量: 检验统计量:总体的特征量,如总体均数、总体标准差等。样本的统计指标如样本均数、标准差等。用于统计检验的样本指标。 如 t、u、x2、F 等30医学统计学专项课程医学统计学的基本概念(五)参数与统计量 (parameter均表示某事件发生可能性大小的量。(六)频率和概率但:频率为变量,fn(A) =m/n 概率P(A)为常数。 若n足够大, fn(A) P(A)小概率事件 P(A) 0.05“小概率事件一次是不太可能发生的”医学

15、统计学的基本概念31医学统计学专项课程均表示某事件发生可能性大小的量。(六)频率和概率但:频率为变第二章 计量资料的统计描述32医学统计学专项课程第二章 计量资料的统计描述32医学统计学专项课程第一节 计量资料的统计描述一、计量资料的频数表二、集中趋势的描述三、离散程度的描述33医学统计学专项课程第一节 计量资料的统计描述一、计量资料的频数表33医学统计4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.

16、784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.93例某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如下表:34医学统计学专项课程4.765.265.615.954.464.574.315.1、频数表的编制2、频数分布的特征3、频数分布的类型4、频数表的用途一、计量资料的频数表35医学统计学专项课程1、频

17、数表的编制一、计量资料的频数表35医学统计学专项课程(1)求全距或极差(R) (2)定组段和组距(i) 1. 频数表的编制36医学统计学专项课程(1)求全距或极差(R) (2)定组段和组距(i) (3)列出频数表某地140名正常男子红细胞数的频数表红细胞数(1012/ L)频数3.80 24.00 64.20114.40254.60324.80275.00175.20135.40 45.60 25.80 137医学统计学专项课程(3)列出频数表某地140名正常男子红细胞数的频数表红细胞数2. 频数分布的特征(1)集中趋势(2)离散趋势38医学统计学专项课程2. 频数分布的特征(1)集中趋势38

18、医学统计学专项课程(1)对称分布 其中一种常见的类型为正态分布.(2)偏态分布 有正偏态、负偏态之分.3. 频数分布的类型39医学统计学专项课程(1)对称分布3. 频数分布的类型39医学统计学专项课程4. 频数表的用途(1)了解资料的分布类型.(2)发现异常值.(3)在频数表的基础上计算有关指标。40医学统计学专项课程4. 频数表的用途40医学统计学专项课程1、算术均数 ,X2、几何均数 G3、中位数 M二、集中趋势的描述41医学统计学专项课程1、算术均数 ,X二、集中趋势的描述41医学概念: 数值的平均.计算: 1)直接法: 例2.1 求某地140名正常成年男子红细胞数均值为1. 均数(me

19、an) ,X 42医学统计学专项课程概念: 数值的平均.例2.1 求某地140名正常成年男子2)加权法:RBC(1012/ L)组中值 X频数 ffX3.803.90 27.804.004.10 624.64.204.301147.34.404.5025112.54.604.7032150.44.804.9027132.35.005.101786.75.205.301368.95.405.50 422.05.605.70 211.45.805.90 15.9合计140( f)669.8 fx应用: 对 称分布,尤其是正态分布.43医学统计学专项课程2)加权法:RBC(1012/ L)组中值 X

20、频数 f概念:指一组数据的倍数平均。计算:(1)直接法: 2. 几何均数 ( geometric mean, G )44医学统计学专项课程概念:指一组数据的倍数平均。2. 几何均数 ( geomet 例:5份血清的抗体效价为1:10,1:100,1:1000,1:10000,1:100000,求其平均效价。 或者: 1:10,1:100,1:1000,1:10000,1:100000的指数部分为:-1,-2,-3,-4,-5,其平均值为-3,故G =10-3=1:1000 45医学统计学专项课程 例:5份血清的抗体效价为1:10,1:100,1:1000(2)加权法:46医学统计学专项课程(2

21、)加权法:46医学统计学专项课程何谓对数正态分布? 某资料由变量值 X1,X2, Xn组成,已知其分布呈偏态。若每个变量值取对数,如Y1=lgX1,Y2=lgX2, Yn=lgXn,且Y1,Y2, Yn呈正态分布。 此时,将对数值还原为原始数值,则:应用: (1)变量值呈倍数关系 (2)对数正态分布47医学统计学专项课程何谓对数正态分布?将对数值还原为原始数值,则:应用: 3. 中位数 M概念:是一组由小到大按顺序排列的观察 值中位次 居中的数值。计算:(1)直接法: n为奇数时, n为偶数时, 某病患者9人发病潜伏期为2,3,3,3,4,5,6,9,16天, 求中位数。若在第20天又发现1例

22、患者,则其中位数为:3. 中位数 (median M)48医学统计学专项课程 3. 中位数 M概念:是一组由小到大按顺序排列的观察 利用百分位数计算公式进行计算. 百分位数(PX)是一种位置指标, 。中位数是一个特定的百分位数,即M= P50 。(2)频数表法:49医学统计学专项课程 利用百分位数计算公式进行计算.(2)频数表法:49医百分位数计算公式:50医学统计学专项课程百分位数计算公式:50医学统计学专项课程百分位数计算公式:M51医学统计学专项课程百分位数计算公式:M51医学统计学专项课程M52医学统计学专项课程M52医学统计学专项课程P2553医学统计学专项课程P2553医学统计学专

23、项课程P7554医学统计学专项课程P7554医学统计学专项课程55医学统计学专项课程55医学统计学专项课程应用:(1)偏态分布资料;(2)资料分布一端或两端有未确定值。56医学统计学专项课程应用:56医学统计学专项课程57医学统计学专项课程57医学统计学专项课程三、离散程度的描述例: 三组同性别、同年龄儿童的体重(Kg)如下,分析其集中趋势与离散趋势。 甲组:26 28 30 32 34 均数:X=30 Kg 乙组:24 27 30 33 36 均数:X=30 Kg 丙组:26 29 30 31 34 均数:X=30 Kg三、离散趋势的描述甲乙丙三组儿童体重的离散程度58医学统计学专项课程三、

24、离散程度的描述例: 三组同性别、同年龄儿童的体重(K只用平均数描述资料的弊病 It has been said that a fellow with one leg frozen in ice and the other leg in boiling water is comfortable。 ON AVERAGE !59医学统计学专项课程只用平均数描述资料的弊病 It has been sa描述离散程度的常用指标1、全距(极差) (R)2、四分位数间距(QR)3、方差(2 S2)和 标准差(、S)4、变异系数 (CV)60医学统计学专项课程描述离散程度的常用指标1、全距(极差) (R)60医

25、学统 反映一组同质观察值个体差异的范围。 R甲=8; R乙=12; R丙=8。 缺点(1)不能反映组内其它观察值的变异度。 (2)样本含量越大,则全距可能也越大。1. 全距(极差)61医学统计学专项课程 反映一组同质观察值个体差异的范围。1. 全距(极差)61即P75P25 四分位数可看作是一组同质观察值居中的50%变量值的变异范围。2. 四分位数间距(quartile range, QR) 62医学统计学专项课程即P75P252. 四分位数间距(quartile ran 不受极值影响,较稳定。与全距比较有何优点?应用: (1)偏态分布; (2)资料一端或两端有未确定值。63医学统计学专项课程

26、 不受极值影响,较稳定。与全距比较有何64医学统计学专项课程64医学统计学专项课程变量值的离散程度可看作是各个变量值距离中心点(均数)的远近问题。 用算式表示: x 但: x=0 则求: x2 (离均差平方和) x2 大小与变异度有关外,还与变量值个数(N)有关。 故:3. 方差(2 S2)和 标准差(、S)(variance & standard deviation) 65医学统计学专项课程变量值的离散程度可看作是各个变量值距离中心点(均数)的远近问医学统计学专项课程培训课件 实际工作中经常得到的是样本资料,总体均数是不知道的,只能用样本均数来估计,这样: 用 xx2 代替 x2 n 代替

27、N 但这样算得结果常比真实低。 因此,统计学家提出用 n - 1 来校正。67医学统计学专项课程 实际工作中经常得到的是样本资料,总体均数是不知道的即:样本标准差(S) S2 称为 样本方差68医学统计学专项课程即:样本标准差(S) S2 称为 样本方差6 式中n-1称为自由度,用希腊字母 (ju:psilen)表示。自由度的概念: 是指随机变量能自由取值的个数。 例:X+Y+Z=10 = 2 又例: 当样本均数一定时,随机变量可以自由取值的变量值个数只能是n - 1 个。69医学统计学专项课程 式中n-1称为自由度,用希腊字母 (计算: 1)不分组资料:例: 三组同性别、同年龄儿童的体重(K

28、g)如下,分析其集中趋势与离散趋势。 甲组:26 28 30 32 34 均数:X=30 Kg 乙组:24 27 30 33 36 均数:X=30 Kg 丙组:26 29 30 31 34 均数:X=30 Kg计算得:S甲=3.16,S乙=4.74,S丙=2.9270医学统计学专项课程计算:例: 三组同性别、同年龄儿童的体重(Kg)如下,分析其 2)分组资料: 计算得:S = 0.38(1012/ L)RBC(1012/ L)组中值 X频数 ffXfX23.803.90 27.8030.424.004.10 624.64.204.301147.34.404.5025112.54.604.7032150.44.804.9027132.35.005.101786.75.205.301368.95.405.50 422.05.605.70 211.45

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论