第二章定量资料统计描述_第1页
第二章定量资料统计描述_第2页
第二章定量资料统计描述_第3页
第二章定量资料统计描述_第4页
第二章定量资料统计描述_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章定量资料统计描述21三月20232[教学要求]了解:通过电脑实验了解定量资料频数分布表的编制方法和分布规律;了解偏度系数和峰度系数的计算和意义。熟悉:利用统计图表描述定量资料的基本方法;制作统计图表的基本要求和规则;百分位数的计算方法。掌握:描述定量资料集中趋势指标的计算方法和适用条件;计描述定量资料离散趋势指标的计算方法和适用条件;常用统计图表的制作方法。第二章定量资料的统计描述21三月2023徐州医学院卫生事业管理教研室3第二章定量资料的统计描述第二节定量资料的特征数第三节常用统计图表第一节频数分布21三月2023徐州医学院卫生事业管理教研室4第一节频数分布

对样本量较大的资料进行统计描述常用方法是频数分布表(frequencydistributiontable)法,频数表可以显示数据分布的范围与形态。使用统计软件(如SPSS、SAS、PEMS等)可以方便地由原始数据编制出频数分布表。离散型定量变量的频数分布(略)连续型定量变量的频数分布21三月2023徐州医学院卫生事业管理教研室57.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.5620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52图2-2某地120名18~35岁健康成年男性居民血清铁含量(μmol/L)21三月2023徐州医学院卫生事业管理教研室6频数表编制步骤一、计算极差或全距(range)

观察值中最大值和最小值之差,常用R表示

本例

R=29.64-7.42=22.22(µmol/L)二、决定组数、组距和组段一般设10~15组,常用全距1/10取整做组距,各组起点为下限(方便数),起始组应包括最小值,最终组应包括最大值。

本例组距(i)设为2(µmol/L)三、列表划记并清点频数(f)

按照“下限≤X<上限”的原则划记归组,清点频数、计算频率、累计频数、累计频率等。本例见下表21三月2023徐州医学院卫生事业管理教研室7表2-2某地120名18~35岁健康成年男性居民血清铁含量(μmol/L)

组段划记频数频率累计频数累计频率(1)(2)(3)(4)(5)(6)

6~10.8310.838~32.5043.3310~.65.00108.3312~.86.671815.0014~.1210.003025.0016~2016.675041.6718~2722.507764.1720~1815.009579.1722~1210.0010789.1724~86.6711595.8326~43.3311999.1728~3010.83120100.0012010021三月2023徐州医学院卫生事业管理教研室8在表2-2的基础上,可以绘制直方图如下:图形中间的直条高,两边对称(或基本对称)地逐渐减少,为正态分布或近似正态分布,若集中位置偏向左侧为正偏态分布(skewedpositivelydistribution)若集中位置偏向右侧为负偏态分布(skewednegativelydistribution)。21三月2023徐州医学院卫生事业管理教研室9第二章定量资料的统计描述第二节定量资料的特征数第三节常用统计图表第一节频数分布21三月2023徐州医学院卫生事业管理教研室10定量资料的特征集中趋势(CentralTendency)变异程度(Variation)分布形状(Shape)21三月2023徐州医学院卫生事业管理教研室11定量变量的特征定量变量的特征均数几何均数中位数众数

调和均数集中趋势全距四分位间距方差标准差变异系数离散趋势偏度系数分布形状峰度系数21三月2023徐州医学院卫生事业管理教研室12一、算术均数(均数)

Mean意义:均数是描述一组数据的集中趋势(CentralTendency)或平均水平的最常用统计指标。用符号表示样本均数,μ表示总体均数。计算:1、直接法(基于原始数据)2、加权法(基于频数表)21三月2023徐州医学院卫生事业管理教研室13组段组中值(X0)ffX0(1)(2)(3)(4)=(2)(3)6~7178~932710~1166612~13810414~151218016~172034018~19(Xc)2751320~211837822~231227624~25820026~27410828~3029129合计1202228表2-3加权法计算均数x0=(组段上限+组段下限)/2dfd-6-6-5-15-4-24-3-24-2-24-1-20001182243244165-2621三月2023徐州医学院卫生事业管理教研室14本例(μmol/L)简捷法

(μmol/L)适用条件:适用于对称分布资料,尤其是正态或近似正态分布资料。21三月2023徐州医学院卫生事业管理教研室15意义:常用来反映一组含多个数量级的数据的集中位置,以符号G表示。二、几何均数Geometricmean计算:1、直接法(基于原始数据)2、加权法(基于频数表)21三月2023徐州医学院卫生事业管理教研室16例5:7名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算平均滴度。抗体滴度频数(F)滴度倒数(X)lgXF(lgX)1:162161.204122.408241:327321.5051510.536051:6411641.8061819.867981:128131282.1072127.393731:256122562.4082428.898881:51275122.7092718.96489合计52108.96489例6表2-452例慢性迁延性肝炎患者的HBsAg滴度资料21三月2023徐州医学院卫生事业管理教研室17适用条件:适用于观察值变化范围跨越多个数量级的数据,尤其是对数正态分布资料。21三月2023徐州医学院卫生事业管理教研室18三、中位数Median意义:是反映一组数据集中趋势的位置指标,在全部实测值中有一半数值比它小,有一半数值比它大。常用符号M表示。

百分位数常用符号Px表示,是排序后的全部实测值的某百等份分割值,即在全部实测值有X%个数值比它小,1-X%个数值比它大,中位数就是一个特定的百分位数,即M=P50。21三月2023徐州医学院卫生事业管理教研室19计算:中位数为全部实测值排序后的中间数值或中间两个数值的算术均数。1、直接法(基于原始数据)如果n是奇数,即为序列的中间值

如果n是偶数,则为两个中间值的均值21三月2023徐州医学院卫生事业管理教研室202、内插法(基于频数表)为Px所在组的下限为该组段的频数为该组段的组距为总频数为该组段之前的累计频数21三月2023徐州医学院卫生事业管理教研室21表2-2某地120名18~35岁健康成年男性居民血清铁含量(μmol/L)

组段频数频率累计频数累计频率(1)(3)(4)(5)(6)

6~10.8310.838~32.5043.3310~65.00108.3312~86.671815.0014~1210.003025.0016~2016.6750(fL)41.6718~(L)27(fM)22.507764.1720~1815.009579.1722~1210.0010789.1724~86.6711595.8326~43.3311999.1728~3010.83120100.0012010021三月2023徐州医学院卫生事业管理教研室22适用条件:资料不限,但最常用于非对称分布资料。21三月2023徐州医学院卫生事业管理教研室23四、众数 Mode意义: 全部观察值中出现次数最多的数值。 (ValueThatoccursMostOften)1. 用于度量数据的集中趋势(CentralTendency)2. 不受极值的影响3. 可能会出现没有众数或多个众数的情形4. 对定量数据和定性数据均适用21三月2023徐州医学院卫生事业管理教研室24五、调和均数 Harmonicmean意义: 全部观察值倒数的算术均数的倒数为调和均数。常用符号H表示。21三月2023徐州医学院卫生事业管理教研室25定量变量的特征定量变量的特征均数几何均数中位数众数

调和均数集中趋势全距四分位间距方差标准差变异系数离散趋势偏度系数分布形状峰度系数21三月2023徐州医学院卫生事业管理教研室26一、全距(极差)Range意义:全距又称极差,常用符号R表示。反映一组数据的变异范围。用极差反映数据的变异程度常常比较粗略和不稳定。计算:R=最大值-最小值适用条件:资料不限。21三月2023徐州医学院卫生事业管理教研室27二、四分位间距

quartilerange意义:P75和P25分别称为上、下四分位数。四分位数间距Q是全部观察值中居中的一半数值散布的范围。用其反映数据的离散程度比极差稳定。计算:Q=P75-P25适用条件:资料不限。25%25%25%25%P25P50P7521三月2023徐州医学院卫生事业管理教研室28三、方差Variance

意义:若要克服极差和四分位数间距不能反映每个观察值之间的离散情况的缺点,就必须全面考虑到每个观察值。

结果虽不为0,但又受观察例数影响。因此可取离均差平方和的均值,简称方差或均方。总体方差用σ2表示,样本方差用S2表示。21三月2023徐州医学院卫生事业管理教研室29计算:总体方差样本方差自由度(degreesoffreedom)从频数表计算样本方差21三月2023徐州医学院卫生事业管理教研室30四、标准差StandardDeviation意义:标准差是方差的算术平方根,度量单位与原变量一致。与方差一样只取正值。二者都反映总体中观察值之间的变异程度,数值越小,变异程度越小;反之亦然。计算:总体标准差样本标准差适用条件:适用于对称分布资料,尤其是正态或近似正态分布资料。21三月2023徐州医学院卫生事业管理教研室31标准差的意义和用途1、说明资料的离散趋势(或变异程度),标准差越大,说明变异程度越大。经常与均数一起描述资料的特征,标准差愈小,均数的代表性愈好。2、用于计算变异系数。3、用于计算标准误。4、结合均数与正态分布的规律估计参考值的范围。21三月2023徐州医学院卫生事业管理教研室32标准差计算示例一XX278608491828179624196921678608472518481656168462476577673532979263380某大学《管理统计学》抽考成绩可用SPSS、SAS、PEMS等软件计算21三月2023徐州医学院卫生事业管理教研室33标准差计算示例二组段X0ffX0fX0X0(1)(2)(3)(4)=(2)(3)(5)=(2)(4)6~717498~932724310~1166672612~138104135214~1512180270016~1720340578018~1927513974720~2118378793822~2312276634824~258200500026~274108291628~3029129841合计120222843640表2-5频数表法计算标准差可用SPSS、SAS、PEMS等软件计算21三月2023徐州医学院卫生事业管理教研室34五、变异系数

CoefficientofVariation意义:变异系数常用符号CV表示。它是标准差与算术均数之比,主要用于量纲不同的变量间或均数差别较大变量间变异程度的比较。计算:适用条件:适用于量纲不同的变量间或均数差别较大变量间变异程度的比较。21三月2023徐州医学院卫生事业管理教研室35定量变量的特征定量变量的特征均数几何均数中位数众数

调和均数集中趋势全距四分位间距方差标准差变异系数离散趋势偏度系数分布形状峰度系数21三月2023徐州医学院卫生事业管理教研室36变量分布形态右偏的左偏的对称的均值

=中位数

=众数均值

中位数

众数众数

中位数

均值

负偏态正态正偏态21三月2023徐州医学院卫生事业管理教研室37一、偏度系数

coefficientofskewness意义:理论上,总体偏度系数为0时,分布是对称的;取正值时,分布为正偏峰;取负值时,分布为负偏峰。计算:21三月2023徐州医学院卫生事业管理教研室38二、峰度系数

coefficientofkurtosis意义:

理论上,正态分布的总体峰度系数为0,取正值时,其分布较正态分布的峰尖峭;取负值时,其分布较正态分布的峰平阔。计算:21三月2023徐州医学院卫生事业管理教研室39第二章定量资料的统计描述第二节定量资料的特征数第三节常用统计图表第一节频数分布21三月2023徐州医学院卫生事业管理教研室40

一、统计图表的基本概念统计表(statisticaltable)把统计分析资料及其指标用表格列出,称为统计表。它可以代替冗长的文字叙述,便于计算、分析和对比。统计图(statisticalgraph)是用点、线、面等表达统计资料中数量及其变化趋势,使统计资料更形象、更易懂,可直观地反映出事物间的数量关系。

由于统计图对数量的表达比较粗略,不便作深入细致的分析,所以一般在绘制统计图时,都应附有统计表。21三月2023徐州医学院卫生事业管理教研室41二、统计表统计表主要有表序、标题、标目、表体和线条等组成,其基本格式如下:表序标题××××××××21三月2023徐州医学院卫生事业管理教研室42(一)制表的基本要求1.标题:简明扼要能概括表中内容,它应包括时间、地点、内容等。标题应写在表顶线的上端中间的位置。2.标目:用以说明表内数字含义的部分叫标目。(1)横标目横标目位于表左侧,是统计表所要叙述的主语,它说明同一横行数字的意义。(2)纵标目纵标目位于标目线的上端,是被说明事物的宾语,一般是绝对数或统计指标。21三月2023徐州医学院卫生事业管理教研室433.线条线条应尽量减少,除顶线、标目线、合计线和底线外,其余线条均可省略。特别是表的左上角的斜线和两侧的边线应一律不用。4.数字表内的数字一律用阿位伯数字,同一指标位数要对齐,小数点的位数要一致,一般保留1~2位小数。无数字的空格用“—”表示,暂缺或未记录用“…”表示。5.备注表内不应有其他文字出现,需要说明的备注用“*”号标出,写在表的底线下面。21三月2023徐州医学院卫生事业管理教研室44(二)统计表的种类

1.简单表只按一个特征或标志分组的统计表称为简单表。如表2-6。2.复合表按两个或两上以上特征或标志结合起来分组的统计表称复合表或组合表。如表2-7。21三月2023徐州医学院卫生事业管理教研室45表2-6某地某年流行性脑脊髓炎各病型的病死率21三月2023徐州医学院卫生事业管理教研室46表2-7某地1995年流行性脑脊髓膜炎不同病型病死率与病情轻重的关系21三月2023徐州医学院卫生事业管理教研室47三、统计图统计图有多种,医学研究工作中常用的统计图有:

直条图、百分直条图、圆形图、线图、半对数线图、直方图、箱式图和统计地图等。21三月2023徐州医学院卫生事业管理教研室481.正确选择合适的图型间断性资料:(1)直条图、箱式图——比较各个相互独立的样本指标。(2)圆形图、百分直条图——表示各组成部分或各构成部分的情况。

21三月2023徐州医学院卫生事业管理教研室49连续性资料线图——①表示数量随时间的变迁;②表示某种现象随另一种现象而变迁。半对数线图——比较两个或几个率的变化速度直方图——表示变量的频数分布。地域性资料:统计地图——

表示某种事物的地理分布。21三月2023徐州医学院卫生事业管理教研室50(1)按资料的性质与分析的目的恰当地选用图形。(2)每图应有标题,其要求与统计表相同,一般放在图下方正中。(3)纵横两轴应有标目并注明单位。横标目:一般表示主语,如疾病名称、发病时间、年龄组等,尺度自左向右;纵标目:表示宾语,一般表示频数、比或率,尺度自下而上,一般需从零开始,由小到大。纵横两轴长宽比例一般为5:7为宜。(4)若图中用不同颜色或线条代表不同事物,则须在图中加以说明。2.制图的基本要求21三月2023徐州医学院卫生事业管理教研室513、常用统计图及其绘制方法(1)直条图(bargraph)它是以等宽直条的长短来表示各指标的数值,用来表示各相互独立指标之间的对比关系。直条图有单式直条图(见图2-3)、复式直条图(见图2-4)两种。21三月2023徐州医学院卫生事业管理教研室52图2-32004年某省各市流感发病率图2-42004年某省三种主要死因死亡率21三月2023徐州医学院卫生事业管理教研室53(2)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论