




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1医学统计学
(medicalstatistics)2绪论3观察单位的特征—变量
变量的测定值—变量值(资料)
定量资料(计量资料)(quantitativedata)
分类资料(categoricaldata)
无序分类(unorderedcategories)(计数资料)二项分类
多项分类
有序分类(orderedcategories)(等级资料)统计资料的类型P.24
表100例高血压患者治疗后临床记录患者年龄性别治疗组舒张压体温疗效编号X1
X2
X3
X4X5
X6137男A11.2737.5显效
245女B12.5337.0有效
343男A10.9336.5有效
459女B14.6737.8无效
┆10054男B16.8037.6无效标识变量用于数据管理分析变量-表示试验效应或观察结果大小的
变量或指标分组变量反应变量56
72024/6/278资料间的相互转化例:以人为单位,测得一群人Hb值(g/L),此资料为
;按Hb量的多少分为:<60(重度贫血),60~(中度贫血),90~(轻度贫血),120~160(正常)及>160(Hb增高)。此时资料为
。按Hb正常和异常分为两类,此资料为
;分类资料数量化:性别:男—0女—1贫血程度:正常—0,轻度贫血—1,中度贫血—2,重度贫血—3。9统计数据的录入格式P.606
数据库文件:dBASE、FoxBASE、Epidata,等Excel文件统计应用软件的相应数据文件:SPSS(.sav),等数据录入原则:便于录入、便于核查、便于转换、便于分析。案例:大学生伤害调查研究10casevariable11统计工作的步骤P.4
设计收集资料整理资料分析资料1)专业设计2)统计设计1)统计报表2)医疗卫生工作记录3)专题调查和实验1)对数据检查、核对2)按分析要求分组、汇总1)统计描述2)统计推断1213
定量资料的统计描述如何选用正确的统计指标描述一个定量资料?例2.2某年某市抽样调查的120名5岁女孩身高(cm),资料如下14105.5118.6110.5104.2110.9107.9108.199.1104.8116.5110.4105.7118.2117.0112.3116.5113.2107.9104.8109.6109.1108.1109.4118.2103.9116.0110.199.6109.3107.5108.6100.6108.8103.895.3104.4102.7101.0112.1118.7……………………………………124.0……………104.1109.1108.8111.0106.8120.2105.8103.1105.0115.0第一节频数分布15定量资料的频数表和频数图(直方图)图2.1某市城区120名5岁女孩身高频数分布表2.2某市120名5岁女孩身高频数表组段(cm)频数(f)95-198-7101-10104-18107-25110-21113-15116-15119-7122-1251合计120161、频数分布的特征(1)集中趋势(centraltendency)(2)离散趋势(dispersion)17(1)对称分布其中一种常见的类型为正态分布。(2)偏态分布有正(左)偏态、负(右)偏态之分。2、频数分布的类型18表2.2某市120名5岁女孩身高频数表组段(cm)频数(f)95-198-7101-10104-18107-25110-21113-15116-15119-7122-1251合计1201920第二节集中趋势的描述——平均数21常用平均数的意义及其应用场合平均数意义应用场合均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布几何均数平均增减倍数①等比资料;②对数正态分布资料中位数位次居中的观察值水平①偏态资料;②分布不明资料;③分布一端或两端出现不确定值221.均数(mean):
应用:正态分布或近似正态分布的定量资料。
计算:1)直接法:2)加权法:式中:f—各组段的频数(相同观察值的个数)
X—各组段的组中值=(下限值+上限值)/2SPSS232.几何均数(geometricmean):G计算:(1)直接法:(2)加权法24
例:6份血清的抗体效价为1:10,1:20,1:40,1:80,1:80,1:160,求其平均效价。
先求平均效价的倒数:该6份血清抗体的平均效价为1:45。SPSS25(2)加权法:例SPSS26
应用:(1)变量值呈倍数关系(2)对数正态分布何谓对数正态分布?已知:X1,X2,……Xn呈偏态分布。设:Y1=lgX1,Y2=lgX2,……Yn=lgXn。则:Y1,Y2,……Yn呈正态分布。
此时,将对数值还原为原始数值,则:273.中位数(median):M概念:是一组由小到大按顺序排列的观察值中位次居中的数值。计算:(1)直接法:某病患者发病潜伏期为2、3、3、3、4、5、6、9、16天,求中位数。若在第20天又发现1例患者呢?n为奇数时,n为偶数时,28(2)频数表法:
利用百分位数计算公式进行计算.
百分位数(PX)是一种位置指标,PX将一组观察值分为两部分, 有X%的观察值比它小,有(100-X)%的观察值比它大。中位数是一个特定的百分位数,即M=P50
。
29百分位数计算公式:30应用:(1)偏态分布资料;(2)资料分布一端或两端有未确定值。31例:SPSS32第三节离散趋势的描述33描述离散程度的常用指标全距(极差)
(R)2、四分位数间距(Q)3、方差(
2,S2)和标准差(、S)4、变异系数(CV)意义指标数值越小,说明观察值的变异度越小,平均数的代表性越好。主要用于偏态分布的资料用于正态分布用于两组或多组间的比较1.全距(极差)(range,R)意义:
反映一组同质观察值个体差异的范围。计算:R=Xmax-XminR甲=8;R乙=12;R丙=8。
缺点:(1)不能反映组内其它观察值的变异度。(2)样本含量越大,则全距可能也越大。34352.四分位数间距(interquartilerange,IQR)
即P75-P25
四分位数可看作是一组同质观察值居中的50%变量值的变异范围。与全距比较有何优点?不受极值影响,较稳定。应用:(1)偏态分布;(2)资料一端或两端有未确定值。363.方差(variance,
2,
S2)和标准差(standarddeviation,S)
374.标准差:
标准差或方差越大,说明个体差异越大,则均数的代表性越差。•应用:对称分布,尤其是正态分布38样本标准差(S)直接法:加权法:
S2称为——
样本方差
式中n-1称为自由度,用希腊字母表示。SPSS395.变异系数(CV)•应用:(1)比较单位不同的几组资料的变异程度(2)比较均数相差悬殊的几组资料的变异程度40
例某地调查120名5岁女孩,其身高均数为110.15cm,标准差为5.86cm;其体重均数为17.71kg,标准差为1.44kg,试比较两者变异度。说明体重的变异程度较身高大。41第四节
正态分布及其应用一、正态分布的概念4243(1)在横轴上方,均数处最高,为单峰分布(2)以均数为中心,左右对称(3)有两个参数,µ
和σ。X~N(μ,σ)(4)正态曲线下面积分布有一定规律二、正态分布的图形与特征4445正态曲线下某一区间的面积占总面积的百分数有何意义?即该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。三、正态曲线下面积分布的规律4647四、标准正态分布X~N(0,1)——标准正态分布标准化变换:z~N(0,1)标准正态曲线下的面积,φ(z)值(P.695附表1)z=u48五、正态分布的应用1.估计频数分布2.制定参考值范围3.质量控制4.统计处理方法的基础49估计频数分布例2.2出生体重低于2500克为低体重儿。若由某项研究得某地婴儿出生体重均数为3100克,标准差为300克,估计该地当年出生低体重儿所占比例。出生体重X~N(3100,300)查附表1得:φ(-2.00)=0.0228即X≤2500的比例为2.28%。50制定参考值范围1)一定数量(n>100)符合条件的观察对象2)选定适当的百分界限;
如80%、90%、95%和99%,常用为95%。3)确定单侧或双侧51双侧:P2.5~P97.5单侧:若高不正常,则<P95若低不正常,则>P5双侧:单侧:若高不正常,则<若低不正常,则>4)方法:a:正态分布法b:百分位数法以取95%界限为例52如何判断资料是否呈正态分布?频数表和频数图P-P图或Q-Q图正态性检验53偏态分布:
中位数(四分位数间距)小结:如何描述一个定量资料?正态分布:
均数±标准差偏态分布:
小结:如何估计正常值范围?以双侧95%为例。正态分布:
P2.5~P97.55657585960611.区分计量资料与计数资料实例1:“小儿皮肤血管瘤雌、孕激素受体的研究”(中华××××杂志×年×月第3期)。该研究采用免疫组化方法对毛细血管瘤、混合型血管瘤、海绵状血管瘤、淋巴管瘤及正常皮肤组织的雌激素受体ER、孕激素受体PR进行检测。全部标本经10%福尔马林固定,常规石蜡包埋。每例选一典型蜡块,4-6切片,进行免疫组化染色,高倍镜下每例肿瘤区内计数500个细胞,计数ER、PR阳性细胞百分率,资料见表1。计量资料统计描述实例作者采用卡方检验比较各组间的差异。
分析:一般认为带有“率”的资料就是定性资料,似应判断为定性资料。然而问题的关键在于,原作者的观察单位并不是细胞本身,而是每一个病例标本,作者关心的是4种疾病病例标本和一组正常人标本的ER、PR阳性细胞率之均值是否相同,从每一个病例标本中得到的是ER和PR的阳性细胞率,他们是具体的数值,因而应属于定量资料。
结论:判断资料性质的关键是把资料还原为基本观察单位的具体取值形式,而不要被资料的表现所迷惑。本资料的受试对象为病例标本,测量指标为“阳性细胞百分率”,因而应为定量资料。
66实例2:某研究人员为了评价一项新的治疗方法的效果,将8个病人随机等分为两组,分别接受两种治疗方法(传统方法、新方法)。由于疗效不适合用客观指标直接测量,因此,研究者请专家为不同组的病人治疗效果进行评分,最低为0分,最高为4分,分数越高说明治疗效果越好。各组得分结果的原始记录如下,见表2:67作者将上述实验结果表达如下:
传统方法组:1.05±0.19(n=4)新方法治疗组:2.15±0.44(n=4)68
分析:评分一般情况下是可以当作计量资料的,比如学生考试成绩就是一种评分,可以用来表示。但本例中的评分严格来说是一种等级资料。当作计数资料进行统计描述和处理更为合适。69思考题下面是300名肝硬化患者的有关资料:编号X1(病程,天)X2(出血次数)X3(血型)X4(性别)X5(疗法)X6(白蛋白,g/L)001910B男A35002350A男B40003541O男B2500482A女C41…………………1、请指出各指标(编号除外)对应的变量类型;2、现欲对上述肝硬化患者的白蛋白测定结果进行统计描述,请写出你的统计分析思路。71第十章统计表与统计图一、统计表
statisticaltable二、统计图
statisticalchart72一、统计表statisticaltable(一)统计表的结构(二)制表的基本要求(三)统计表的种类73表号标题纵标目 横标目合计顶线标目线合计线底线*(一)统计表的结构统计表由5个部分组成:
标题、标目、线条、数字、备注7475(二)制表的基本要求1.标题概括说明表的内容,必要时包括时间地点。位于表的正上方。
某年某地不同型流脑病死率比较
病型病人数死亡人数病死率(%)菌血型5946.78
脑型778486.17混合型784394.97
合计1621915.61762.标目有横标目、纵标目之分。
横标目:是统计表的主语部分,位于左侧;
纵标目:是统计表的谓语部分,位于上侧。
某年某地不同型流脑病死率比较
病型病人数
死亡人数病死率(%)菌血型
5946.78
脑型
778486.17混合型
784394.97
合计1621915.61773.线条一般为3~4条横线,不能出现竖线或斜线。
某年某地不同型流脑病死率比较
病型病人数死亡人数病死率(%)菌血型5946.78
脑型778486.17混合型784394.97
合计1621915.61784.数字注意同一指标的小数位数要一致,位次对齐。表内不宜留空格。暂缺用“…”表示,无数字用“——”表示。
某年某地不同型流脑病死率比较
病型病人数死亡人数病死率(%)菌血型5946.78
脑型778486.17混合型784394.97
合计1621915.61795.备注必要是可用符号如“*”引出,写在表的下方,但不宜过多。
某年某地不同型流脑病死率比较
病型病人数死亡人数病死率(%)菌血型5946.78
脑型778486.17混合型784394.97
合计1621915.61*:各型流脑病死率比较:P>0.0580(三)统计表的种类1、简单表simpletable
按一个特征或标志分组的统计表。2、复合表combinativetable
按两个或两个以上特征或标志分组统计表。81
某年某地不同型流脑病死率比较
病型病人数死亡人数病死率(%)菌血型5946.78
脑型778486.17混合型784394.97
合计1621915.611、简单表82
某年某地不同型及不同病情流脑病死率比较
轻中重病型病人数死亡病死率病人数死亡病死率病人数死亡病死率人数(%)人数(%)人数(%)菌血型2500.002700.007
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 研究针对性护理干预在接受长程视频脑电图监测患者中的临床应用价值
- 市场新员工培训
- 2024-2025学年佛山市高二语文上学期期末教学质量检测试卷
- 2025年小提琴专业水平测试卷:国内外著名小提琴曲演奏分析试题
- 2025年法律职业资格考试民法法律咨询专项试题卷
- 2025年小学语文毕业升学考试全真模拟卷(基础夯实版)-小学语文阅读理解能力训练实战
- 统计质量管理在现代制造业中的应用-2025年统计学期末试卷
- 2025年网络安全培训考试题库:网络安全防护技术与应用实践试题
- 热水锅炉定期检验工作制度
- 1200×650mm真空蒸镀技术协议
- 总复习(教案)2023-2024学年数学 四年级下册 北师大版
- 2022 年山东省职业院校技能大赛高职组复杂部件数控多轴联动加工技术赛项-试题图纸
- 【青松雪】中考数学几何模型【模型08】费马点最值模型
- 【项目方案】湖北省石首楚源“源网荷储”一体化项目方案
- DL∕T 241-2012 火电建设项目文件收集及档案整 理规范
- 2024风电场架空线路融冰技术规范
- 浅谈国家国家中小学智慧教育平台在初中数学教学中的运用
- 化学运行值班员试题库
- 济南泛华AI-6000介损仪说明书
- 2024-2029年中国β-内酰胺类抗生素行业市场现状分析及竞争格局与投资发展研究报告
- 北京海淀区-第2学期高二数学教概率统计教材分析-(64)课件
评论
0/150
提交评论