医学研究的数据管理与分析——第十二章_第1页
医学研究的数据管理与分析——第十二章_第2页
医学研究的数据管理与分析——第十二章_第3页
医学研究的数据管理与分析——第十二章_第4页
医学研究的数据管理与分析——第十二章_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十二章 常用统计图形的软件实现SPSSSPSS软件统计图形软件统计图形 统计表(statistical table)是表达统计分析结果中数据和统计指标的表格形式; 统计图(statistical graph)是用点、线、面等各种几何图形来形象化表达统计数据。 统计表统计表 一、统计表的意义与制作原则1统计表的意义 统计表用简明的表格形式,有条理地罗列数据 和统计量,方便阅读、比较和计算。 2制表原则:重点突出、层次清楚 3制表的基本要求 (1)标题:概括表的主要内容,包括研究的时间、地点和研究内容,放在表的上方。(2)标目:分别用横标目和纵标目说明表格每行和每列数字的意义,注意标明指标的单位

2、。(3)线条:至少用三条线,表格的顶线和底线将表格与文章的其它部分分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。部分表格可再用横线将合计分隔开,或用横线将两重纵标目分割开。其它竖线和斜线一概省去。(4)数字:用阿拉伯数字表示。无数字用“”表示,缺失数字用“”表示,数值为0者记为“0”,不要留空项。数字按小数位对齐。(5)备注:表中数字区不要插入文字,也不列备注项。必须说明者标“*”号,在表下方说明。1.简单表 统计表的主语只有一个层次 二、统计表的种类组别 例数 治愈数 治愈率(%) 治愈天数(SX ) 试验组 107 93 86.9 5.71.3 对照组 108 84 77.8

3、 6.41.2 表1 某年某地喷昔洛韦软膏治疗颜面单纯疱疹疗效比较2. 组合表 统计表的主语有两个以上层次 城市 乡村 年龄组 检查数 阳性数 阳性率() 检查数 阳性数 阳性率() bar Simple:简单条形图,用于表现单个指标的大小; Clustered:分组条形图,用于表现两个或多个指标,比如同时比较男、女生身高和体重; Stacked:分段条形图,用于表现每个指标各取值的构成情况。 在以上三种样式中,用鼠标单击相应的图标,则选中了相应的样式。 “Data in Chart Are”框用于选择条图中数据的类型:oSummaries for groups of cases按同一变量取值

4、不同做分组汇总,条形图中每一直条代表变量的一个分类;oSummaries of separate variables按不同变量汇总,条形图中每一直条代表一个变量,至少需要两个或两个以上变量生成相应的条形图;oValues of individual cases 反映个体观测值,条形图中每一直条代表一个观测值。对话框左侧为通用的侯选变量列表框,对话框左侧为通用的侯选变量列表框,右侧的对话框元素依次解释如下:右侧的对话框元素依次解释如下: 【Bars Represent】用于定义条图中直条所代表的含用于定义条图中直条所代表的含义义pN of cases:频数频数p% of cases:频率频率pC

5、um n of cases:累计频数累计频数pCum% of cases:累计频率累计频率基本操作基本操作2 Define:定义简单条形图定义简单条形图pOther summary function:其余汇总函数其余汇总函数上部:上部:包括大多数常用统计汇总函数,包括大多数常用统计汇总函数, 如均数、标准差、中位数、方差、众数、如均数、标准差、中位数、方差、众数、 最大、最小值、样本例数、变量值之和、最大、最小值、样本例数、变量值之和、 累计变量值。累计变量值。中部:中部:可对各记录按大小进行筛选,可对各记录按大小进行筛选, 如上侧百分之多少,或者只选择小于某个数如上侧百分之多少,或者只选择小

6、于某个数 值的记录。具体的数值在值的记录。具体的数值在value框中输入。框中输入。下部:下部:可按数值大小值选择取值在某个范围内的可按数值大小值选择取值在某个范围内的 记录,具体的范围在记录,具体的范围在low和和high框中输入。框中输入。基本操作基本操作 Values are grouped midpoints: 当选中当选中median of values或或percentile 单选框时该框变为可选,选中则表单选框时该框变为可选,选中则表 明数据为频数表格式,所输入的数值为组中值。明数据为频数表格式,所输入的数值为组中值。基本操作基本操作 【Category Axis】 用于选择所需

7、的分类变量,此处必选。用于选择所需的分类变量,此处必选。 【Template】 用于选择绘制条图的模板,一般较少用。用于选择绘制条图的模板,一般较少用。 【Titles】 用于输入统计图的标题和脚注,最多可以输入用于输入统计图的标题和脚注,最多可以输入 两行主标题,一行副标题,两行脚注。两行主标题,一行副标题,两行脚注。 基本操作基本操作pMissing Values:缺失值的处理缺失值的处理pDisplay groups defined by missing values: 显示缺失值作为分组显示缺失值作为分组pDisplay charts with case labels: 在图形中显示个

8、案标识在图形中显示个案标识pDisplay error chart:显示误差图显示误差图 【Options】 弹出弹出Options对话框,用于定义相对话框,用于定义相关的选项,关的选项,基本操作基本操作误差条图误差条图(error bar chart) (error bar chart) 【panel by】 按一个或多个变量将数据进行分组按一个或多个变量将数据进行分组, 分别绘制条形图分别绘制条形图基本操作基本操作例例12-2-1 (1)实例实例 分组条图和分段条图分组条图是指两条或两条以上小直条组成条组的条形图,各条组之间有间隙,组内小条之间无间隙。分段条图是以条形的全长代表某个变量的整

9、体,各分段的长短代表各组成部分在整体中所占比例的统计图,每一段之间没有间隙,并用不同线条或颜色表示。与简单条图相比,这两种条图多了一个分组因素或分段因素,定义对话框中就相应多了一个变量选项框。分组条图和分段条图分组条图和分段条图例例12-2-1 (2)饼图(pie Chart)1.也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形2.主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用3.绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定的20.55.65.222.56.418.121.7早

10、产先天异常先天心其它颅内出血肺炎出生窒息 图2 某年某地城市婴儿死因构成比 Graphs=Pie 基本操作基本操作 nSlices Represent: 饼块所代表的内容饼块所代表的内容nDefine Slices by: 定义分块变量定义分块变量 上面的窗口用于选择和当前数据文件相符的数据组织方式,其中,oSummaries for groups of casesSummaries for groups of cases:观测量分类模式oSummaries of separate variableSummaries of separate variable:变量模式oValues of in

11、dividual casesValues of individual cases:观测值模式 实例实例 例例12-2-21.用矩形的宽度和高度来表示频数分布的图形,实际用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的上是用矩形的面积面积来表示各组的频数分布来表示各组的频数分布2.在直角坐标中,用横轴表示数据分组,纵轴表示频在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,数或频率,各组与相应的频数就形成了一个矩形,即直方图即直方图3.直方图下的总面积等于直方图下的总面积等于1直方图直方图4 如果选择了如果选择了display normal curv

12、e复选框复选框 ,则会同时做出一条当前变量理想状况的正态分布则会同时做出一条当前变量理想状况的正态分布曲线来曲线来 分组数据的图示(直方图的绘制)直方图下的面积之和等于1?直方图与条形图1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据Graphs=Histogram例例12-2-3命令命令:直方图直方图线图(line graph)

13、线图是用线段的升降来表示数值的变化,适合于描述某统计量随另一连续性数值变量变化而变化的趋势,最常用于描述统计量随时间变化而变化的趋势。 普通线图:横轴和纵轴都是算术尺度。 半对数线图:横轴是算术尺度,纵轴是对数尺度,特别适宜作不同指标变化速度的比较。 例 下图是根据19902000年某沿海城市甲状腺功能亢进(甲亢)发病率资料绘制的普通线图。 从图中可看出在1995年开始食盐加碘后,甲亢发病率有一突增高峰,1999年以后又逐渐下降的趋势。0102030405060199019921994199619982000年份甲亢发病率(/10万)图 19902000年某沿海城市甲状腺功能亢进发病率变化趋势

14、 例 调查某地1997年2001年两种与性传播有关疾病艾滋病和梅毒的发病率变化趋势,资料分别绘制成普通线图和半对数线图。 普通线图显示梅毒的增长幅度较大,但半对数线图则显示艾滋病的增长速度更快。0123456719971998199920002001发病率(1/10万)0.0010.010.111019971998199920002001发病率( 1 / 10万 )艾滋病梅毒图图 19972001年某地艾滋病和梅毒发病率的变化趋势年某地艾滋病和梅毒发病率的变化趋势(a)纵轴为算术尺度纵轴为算术尺度; (b) 纵轴为对数尺度。纵轴为对数尺度。线图线图 Graphs=LineSimple Line

15、 Chart:简单线图简单线图Multiple Line Chart:多重线图多重线图Drop-line Line Chart:下降线图下降线图 用鼠标单击相应的图标,则选中了相应的样式。Data in Chart AreData in Chart Are框用于选择统计量描述模式oSummaries for groups of casesSummaries for groups of cases:线图中每个数据点代表观测量的一个分类(观测量分类模式)o Summaries of separate variablesSummaries of separate variables:线图中每个数据点

16、代表一个变量(变量模式)oValues of individual casesValues of individual cases:线图中每个数据点代表一个观测值(观测值模式)实例实例例例12-2-4pSimple 简单散点图简单散点图pMatrix 矩阵散点图矩阵散点图pOverlay 重叠散点图重叠散点图p3D 3维散点图维散点图散点图散点图 Graphs=Scatter散点图又称相关图。用点的位置表示变量间的数量关散点图又称相关图。用点的位置表示变量间的数量关系和变化趋势。根据散点图中数据的分布走向和密集系和变化趋势。根据散点图中数据的分布走向和密集程度,可以大致判断变量之间的相关关系。

17、程度,可以大致判断变量之间的相关关系。其中需要解释的比较特殊的内容有:其中需要解释的比较特殊的内容有:n Set marks bySet marks by:选入一个标记变量,根据该变量取值的不同选入一个标记变量,根据该变量取值的不同对同一个散点图中的各点标以不同的颜色对同一个散点图中的各点标以不同的颜色(或形状),(或形状),散点图散点图 nLabel cases框框:当编辑图形在图形选项中:当编辑图形在图形选项中 选择显示选择显示labels时,图形默认显示记录号,时,图形默认显示记录号, 如果在这里选择了如果在这里选择了label变量,则显示该变变量,则显示该变 量的取值。量的取值。n做出

18、的做出的3D图形可以在编辑时进行三维旋转,图形可以在编辑时进行三维旋转, 从多个角度进行观察。从多个角度进行观察。散点图散点图 实例实例12-2-5实例实例箱形图(box plot)1.用于显示未分组的原始数据的分布2.箱形图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成3.其绘制方法是:首先找出一组数据的5个特征值,即最大值最大值、最小值最小值、中位中位数数M Me e 和两个四分位数四分位数(下四分位数Q QL L和上四分位数Q QU U)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接 显然箱子越长,数据变异程度越大。中间横线在箱子中点表明分布对称,否则不对称。 箱形

19、图(box plot)分布的形状与箱形图 例 某地调查不同类型化妆品厂车间内粉尘数,结果绘制成图。 图中显示粉尘数的分布呈偏态分布,净化厂粉尘数较少,非净化厂粉尘数较多。工厂类型粉类非净化净化尘粒数(亿)2.01.81.61.41.21.0.8.6.4.20.0图图10-8 某地不同类型化妆品厂车间粉尘数分布箱式图某地不同类型化妆品厂车间粉尘数分布箱式图 箱图箱图 Graphs=box Data in Chart Are框用于选择数据组织方式:uSummaries for groups of casesSummaries for groups of cases:观测量分类模:观测量分类模式式u

20、Summaries of separate variablesSummaries of separate variables:变量模式:变量模式 通过选择两个图标和两种数据组织方通过选择两个图标和两种数据组织方式,共有四种情况。式,共有四种情况。例例12-2-6实例分析实例分析受试者工作特征曲线(受试者工作特征曲线(ROC曲线):是将不同截曲线):是将不同截断点下得到的灵敏度和特异度的数据点绘制在以灵断点下得到的灵敏度和特异度的数据点绘制在以灵敏度敏度(真阳性率真阳性率)为纵轴,为纵轴,1-特异度特异度(假阳性率假阳性率)为横为横轴的坐标系中,连接各数据点所得到的曲线。常用轴的坐标系中,连接各

21、数据点所得到的曲线。常用于对筛检或诊断试验的评价。于对筛检或诊断试验的评价。ROC曲线下的而积在曲线下的而积在0.5-1之间,当曲线下的面之间,当曲线下的面积为积为0.5时,说明筛检或诊断完全没有价值时,说明筛检或诊断完全没有价值;曲线下曲线下的面积越接近的面积越接近1,筛检或诊断的价值就越高。筛检或诊断的价值就越高。ROC曲线图曲线图例例12-2-7实例分析实例分析用线段下的阴影面积来强调现象变化的统计图用线段下的阴影面积来强调现象变化的统计图面积图面积图Graphs=AreapSimple : 简单面积图简单面积图pStacked: 堆积面积图堆积面积图 用鼠标单击相应的图标,则选中了相应

22、的样式。oSimpleSimple:简单面积图oStackedStacked:累积面积图Data in Chart AreData in Chart Are框用于选择统计量描述模式:oSummaries for groups of casesSummaries for groups of cases:每一个面积图代表观测量的一个分类oSummaries of separate variablesSummaries of separate variables:每一个面积图代表一个变量oValues of individual casesValues of individual cases:每一个

23、面积图代表一个观测值观察变量是否服从某种理论分布的观察变量是否服从某种理论分布的,若若服从服从某种理论分布的某种理论分布的,则数据点近似成一条直线则数据点近似成一条直线或经验分布与理论分布之差在以或经验分布与理论分布之差在以0为水平为水平轴的带内轴的带内 P-P图(或图(或Q-Q图)图) P-P图图uTransform:变量的转换变量的转换 Natural log transform:自然对数转换自然对数转换 Standardize values:标准化值转换标准化值转换 Difference:差分转换差分转换 Seasonally difference:季节差分转换季节差分转换uProportion Estimation Formula: 比例估计公式比例估计公式交

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论