第二章 定量资料的统计描述课件_第1页
第二章 定量资料的统计描述课件_第2页
第二章 定量资料的统计描述课件_第3页
第二章 定量资料的统计描述课件_第4页
第二章 定量资料的统计描述课件_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章定量资料的统计描述第二章定量资料的统计描述02问题1:何为定量资料?问题2:何为统计描述(statisticaldescription)?第二章定量资料的统计描述02

统计描述:用统计表、或统计图、或统计指标(描述统计量)概括和揭示资料(data)的数量信息和特征。目的使资料简洁、明了,便于人们了解资料的规律性。第二章定量资料的统计描述02一、变量的频数分布1、离散型定量变量的频数分布例2-11998年某山区96名孕妇产前检查次数资料如下:

0,3,2,0,1,5,6,3,2,4,1,0,6,5,……,4,7。第二章定量资料的统计描述02检查次数频数频率(%)累计人数累计频率(%)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.5>51212.596100.0合计96100.0————表2-11998年某地96名妇女产前检查次数频数分布第二章定量资料的统计描述02第二章定量资料的统计描述02

频数(frequency):重复某随机试验,某随机事件出现的次数,称为频数。

频数分布表(frequencydistributiontable)简称频数表(frequencytable):含有组段与频数的统计表,称频数表。

直方图(histogram):为直观反映频数表,利用直角坐标系绘制频数图,横轴表示变量的“各种情形”,纵轴表示频数、或频率、或频率密度。第二章定量资料的统计描述022、连续型定量变量的频数分布问题:

1)何为连续型定量变量?

2)其与离散型定量变量有何区别?

3)连续型定量变量的频数分布表该如何绘制?第二章定量资料的统计描述02例2-2抽样调查某地120名18岁到38岁健康男性居民血清铁含量(umol/L),数据如下。试编制血清铁资料的频数分布表。7.428.6523.0221.619.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.14…….14.1816.52第二章定量资料的统计描述02组段频数频率(%)累计频数累计频率(%)6---10.8310.838---32.5043.3310---65.00108.3312---86.671815.0014---1210.003025.0016---2016.675041.6718---2722.507764.1720---1815.009579.1722---1210.0010789.1724---86.6711595.8326---43.3311999.1728---3010.83120100.00合计120100.00————表2-2120名正常成年男子血清铁含量(umol/L)频数表第二章定量资料的统计描述02连续型定量变量频数表的编制方法:1)计算全距(range,R)

R=最大值-最小值=29.64-7.42=22.22确定组段数(K)与组距如等组距,则组距=R/K3)确定组段、计数归表第二章定量资料的统计描述02图2-2120名健康成年男子血清铁含量频数直方图第二章定量资料的统计描述020.040.08图2-3120名健康成年男子血清铁含量频率密度直方图第二章定量资料的统计描述02问题:频数直方图与频率密度直方图的意义是否一样?第二章定量资料的统计描述02潜伏期(小时)频数累计频数0---353512---7010524---4014536---2316848---1218060---618672---841187合计187——表2-3187例某种沙门氏菌食物中毒潜伏期分布第二章定量资料的统计描述02图2-4187例某种沙门氏菌食物中毒潜伏期频数直方图第二章定量资料的统计描述02变量频数分布的类型:1)对称分布2)偏态分布:正偏峰(positiveskew)分布(向左偏)负偏峰(negativeskew)分布(向右偏)第二章定量资料的统计描述02变量频数分布的两个特征1)集中趋势(centraltendency)2)离散趋势(tendencyofdispersion)第二章定量资料的统计描述02二、定量变量的特征数(描述定量变量的统计指标、或定量变量的数值特征)第二章定量资料的统计描述021、描述集中趋势的统计指标(平均数average)1)算术均数(arithmeticmean),简称均数2)几何均数(geometricmean,G)3)中位数(median,M)4)众数(mode)5)调和均数(harmonicmean,H)第二章定量资料的统计描述021)算术平均数:描述对称分布资料的平均水平第二章定量资料的统计描述02月工资x员工数f员工比重f/Σff·xx·f/Σf80050.104000801000100.20100002001200200.4024000480150070.1410500210200050.1010000200250030.067500150合计501.00660001320某公司员工工资情况(单位:元)第二章定量资料的统计描述02第二章定量资料的统计描述022)几何平均数:个体变化范围越过多个数量级的资料第二章定量资料的统计描述023)中位数:可用于各种分布的定量资料。指总体中有一半个体的数值低于这个数,一半个体的数值高于这个数。对于样本资料,有如下计算公式:n为奇数时:n为偶数时:第二章定量资料的统计描述02

对于频数表资料,可用百分位数的方法计算中位数。百分位数(percentile,Px):

对总体来说,它表示总体中数值小于的Px个体恰有x%。对样本来说,它表示在按照升序排列的数列里,小于Px的个体数在整个样本中所占百分比为x%。显然,中位数就是P50。第二章定量资料的统计描述02样本百分位的计算公式为:式中:L为所求百分位数所在组段的下限;

i为该组段的组距;

fx为该组段的频数;

n为总频数;

fL为该组段之前的累计频数。第二章定量资料的统计描述024)众数:总体中指出现机会最高的数值;样本众数则是在样本中出现次数最多的数值。表2-11998年某地96名妇女产前检查次数频数分布检查次数频数频率(%)累计人数累计频率(%)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.5>51212.596100.0合计96100.0————第二章定量资料的统计描述025)调和均数:先求原始数据的倒数的算术均数,该算术均数的倒数便称为原始数据的调和均数。第二章定量资料的统计描述02问题:算术平均数与中位数的区别与联系1、都是用来表示总体的一般水平或分布的集中趋势,都属于抽象化的代表值。2、代表的意义不同:算术平均数是对所有变量值来计算的平均数,它能概括反映整个数列中每个变量值的平均水平;

中位数则是根据总体中处于中间位置上的少数变量值来确定的代表值。从这一点来说,算术平均数对数据的概括能力比中位数显然来的更强一些。第二章定量资料的统计描述023、与中位数相比,算术平均数对数据变化的“灵敏度”很高。但算术平均数极容易受到个别极端值的影响,即对极端值的“耐抗性”较低。“灵敏度”与“耐抗性”是一对矛盾,实际应用中,可根据这些特点和分析的要求,审慎的选择有关指标。(分布类型)4、适用资料的类型:算术平均数和中位数均适用于定量资料,但中位数还适用于有序分类资料。第二章定量资料的统计描述02问题:考核甲、乙、丙三个中药店服务员的技术水平,令每人每次从盒中取10克某种中药,各取5次进行称量,结果如下(g):甲:9.610.510.09.510.4乙:9.910.19.910.29.9丙:9.59.59.69.49.4第二章定量资料的统计描述022、描述离散趋势(变异)的统计指标1)极差(range,R)2)四分位数间距(quartilerange,QR)3)方差(variance)4)标准差(standarddeviation)5)变异系数(coefficientofvariation)第二章定量资料的统计描述021)极差:

R=最大值–最小值A:2628303234B:2427303336C:2629303134第二章定量资料的统计描述02极差:计算方便;只考虑两个极值;与n有关,用于比较是需注意。

第二章定量资料的统计描述022)四分位数间距:

QR=P75–P25第二章定量资料的统计描述02四分位数间距:包抱总体中数值居中的50%的个体;与全距的区别仅仅在于计算范围较窄。计算时没用到每个个体的数值;其值越大,说明变量变异越大。第二章定量资料的统计描述023)方差,又称均方差(meansquaredeviation)第二章定量资料的统计描述02xX-u(x-u)226-41628-243000322434416合计04029第二章定量资料的统计描述02第二章定量资料的统计描述024)标准差:方差的算术平方根,即为标准差。第二章定量资料的统计描述02

标准差与方差的含义类似,值越大,说明变量的变异越大,都适合用来表达对称分布的离散趋势。两者不同的是量纲不一样。第二章定量资料的统计描述025)变异系数:标准差与均数之比,即为变异系数。用于描述对称分布资料的变异程度。变异系数无量纲,可用于量纲相同、或不同的变量变异程度大小的比较。第二章定量资料的统计描述02变异程度指标总结:全距、四分位数间距:具有绝对数的形式方差:离均差平方的算术平均数标准差:离均差平均数的形式。共同点:都有具体计量单位,都受计量单位的影响(英尺、米;美元、英镑)变异系数:是一类相对数形式的变异指标。排除计量单位对计算结果的影响。第二章定量资料的统计描述02

n1=31015均数=10元标准差=5元n2=395100105均数=100元标准差=5元第二章定量资料的统计描述02

同样的变异指标值对于不同的平均水平通常具有不同的实际分析意义。只有当两个被比较事物平均数相同或相近时,直接利用标准差等有量纲的变异指标来进行分析,才是合理的。第二章定量资料的统计描述02人均年收入标准差四分位数变异系数%甲市600015032002.5乙市1200018035001.5两个城市的居民年收入情况乙市年收入与标准差均高于甲市,是否可认为乙市收入差距高于甲市呢?变异系数显示:乙市居民的收入差距相对于他们的平均收入来说,比甲市要低的多。故以居民对收入差距所承受的压力而言,甲市比乙市要高。第二章定量资料的统计描述02对称分布偏态分布开口数据等比级数资料平均水平算术均数中位数中位数几何均数中位数变异程度标准差方差变异系数全距四分位数间距全距四分位间距全距对数标准差描述统计量的一般应用总结表第二章定量资料的统计描述02问题:均数、方差(标准差)常用来描述对称分布资料,为什么?第二章定量资料的统计描述023、描述分布形态的统计指标1)偏度系数(coefficientofskewness,SKEW)SKEW是度量随机变量分布对称性的指标。理论上,总体偏度系数取值为0时,分布是对称的;取值为正时,分布为正偏态;取值为负时,分布为负偏态。第二章定量资料的统计描述022)峰度系数(coefficientofkurtosis,KURT)KURT是度量随机变量分布曲线较正态分布曲线的峰态“平阔或陡峭”的指标。理论上,正态分布的总体峰度系数为0;取值为负时,其分布较正态分布的峰平阔;取值为正时,其分布较正态分布的峰尖峭。第二章定量资料的统计描述02一班90人《卫生统计》考试成绩第二章定量资料的统计描述02二班90人《卫生统计》考试成绩两班成绩情况如何?用什么方法来揭示其差别?此研究个体、变量、变量值?抽样研究、普查?两班均是《卫生统计》成绩第二章定量资料的统计描述02两班《卫生统计》成绩频数分布表第二章定量资料的统计描述02第二章定量资料的统计描述02一、二班《卫生统计》成绩统计结果第二章定量资料的统计描述02三、统计表与统计图

statisticaltableandstatisticalgraph

第二章定量资料的统计描述02作用与特点统计研究结果的表现形式是多种多样的。除单纯的文字叙述外,统计表与统计图也是一种常用形式。统计图表简单明了,可代替冗长的文字叙述,便于阅读和把握主要的研究结果。在数字语言中,统计表应是基本的,统计图常起补充作用。把文字叙述与统计图表结合起来才是最完美、最生动的数字语言。第二章定量资料的统计描述02统计图表都是一种具有综合性和总结性的叙述数字资料的方法。两者的形式不同,使用的场合也各有侧重。统计图在表示事物的变化趋势、事物间关系和分布方面有其特别的优势,缺点是对资料的描述不够细致。统计表则容量大,能将数字精确到所需小数位,并有利于进一步的统计处理,故其应用更为广泛。第二章定量资料的统计描述022000年三种杂志统计表使用情况杂志使用率%中华内科杂志85.0%中华儿科杂志87.3%中华预防医学杂志87.8%第二章定量资料的统计描述022000年对7种中华系列杂志(中华内科杂志、中华儿科杂志、中华风湿病学杂志、中华预防医学杂志、中华病理学杂志、中华眼科杂志、中华放射学杂志)717篇论著的调查,有统计图的80篇(11.2%),共有统计图132个。 第二章定量资料的统计描述02统计表

statisticaltable第二章定量资料的统计描述02一、统计表的编制要求简单明了,重点突出,对比鲜明。主语谓语划分清楚。主语是统计表所要说明的事物,谓语是用来说明事物的指标,多为数字指标。一般说来,统计表的主语排在左端,谓语排在表的右端。第二章定量资料的统计描述02二、统计表的结构

表号标题横标目名称纵标目横标目数字合计第二章定量资料的统计描述021、标题:标题应概括表的主要内容,一般包括研究的时间、地点和研究内容,写在表的上端中央。2、标目:标目是表格内的项目,文字应简明,有度量单位者需注明。标目有横目和纵标目两种。横标目列于表的左侧,是表的主语位置,说明横行数字的涵义,一般是所分析研究事物的分组。纵标目列于表的右上方,是表的谓语位置,说明各纵列数字的涵义,一般表示被研究事物的各项指标。第二章定量资料的统计描述023、线条:一张表至少要有三条线(三线表)。有合计栏的表格可再用横线将“合计”分隔开,对一些有两组标目的组合表,需用横线将两组标目分隔开。其它竖线和斜线一概省去。4、数字:一般用阿拉伯数字表示,同一指标的小数位应一致,且按小数点位数对齐。不留空格,无数字用“——”表示,缺失数字用“….”表示。5、备注不要列入表内,如表内有需要说明的内容,应在表内做出*号标记,并在表底线下加以说明。第二章定量资料的统计描述02

三、统计表的种类

1、简单表

表3-1某地某年**药治疗急性咽喉炎疗效比较组别例数有效数有效率%试验组1079386.9对照组1089477.8第二章定量资料的统计描述022、复合表

表3-2某地某年不同年龄、性别的儿童青少年意外损伤情况

年龄(岁)男女调查数损伤数损伤率%调查数损伤数损伤率%3.5--4476614.77424296.846.5--1215927.571239534.289.5--118012210.341070807.4812.5--121715012.331136665.8115.8--18.56226510.45582203.44合计468149510.5744512485.57第二章定量资料的统计描述02四、应用举例

表1治疗组与对照组的疗效比较治疗组对照组疗效常规剂量大剂量常规剂量大剂量例数百分率(%)例数百分率(%)例数百分率(%)例数百分率(%)显效21/6830.914/6023.30/240.03/319.7有效43/6863.244/6073.321/2487.526/3183.9无效4/685.92/603.43/2412.52/316.4总有效率64/6894.158/6096.722/2487.529/3193.5第二章定量资料的统计描述02

表1

不同治疗剂量的治疗组和对照组疗效比较*:总有效=显效+有效级别总例数疗效总有效*显效有效无效例数率(%)治疗组1283587612295.3常规剂量68214346494.1大剂量60144425896.7对照组5534755090.9常规剂量2402132187.5大剂量3132622993.5第二章定量资料的统计描述02

问题:某地不同年龄儿童身高体检资料

年龄例数均数±标准差587114.1±5.086605117.4±5.88--------------第二章定量资料的统计描述02问题:某地不同年龄不同性别儿童身高体检资料年龄男女nmean±SDnmean±SD575114.1±5.0887114.7±5.166158117.4±5.88183117.1±5.80---------------------第二章定量资料的统计描述02问题:某地城乡不同年龄不同性别儿童身高体检资料男女年龄城市乡村城市乡村nX±SnX±SDnX±SDnX±SD567第二章定量资料的统计描述02统计图

statisticalgraph第二章定量资料的统计描述02

统计图是利用几何学上的点、线、面、体等图形,有时也利用自然地图来表示资料的多少和分布,以及变化趋势或相互关系。

第二章定量资料的统计描述02一、制图的一般原则1、按资料的性质和分析目的选用合适的图形。2、要有标题:概括表的主要内容,包括时间、地点和研究内容,一般写在图的下端中央。3、统计图一般有横轴和纵轴:横轴是主语位置所在,纵轴则为谓语位置。一般将两轴的相交点即为原点处定为0,横轴尺度自左至右,纵轴尺度自下而上,纵横比例大致为5:7。4、当要用不同线条和颜色表达不同事物或对象时,需要附图例加以说明。第二章定量资料的统计描述02二、常用统计图的种类、选择与作用图形种类资料性质特征和作用条图间断性品质资料以条的高度表示数值,比较大小百分构成图间断性品质资料以全长为100%,看结构圆图间断性品质资料扇面表示数值,每1%为3.6度,结构直方图连续性数量资料以矩形面积表示数值,看群体分布线图动态资料看变化趋势散点图连续性、间断性看两变量间的关系统计地图连续性、间断性表示事物数量地理分布第二章定量资料的统计描述022000年对7种中华系列杂志(中华内科杂志、中华儿科杂志、中华风湿病学杂志、中华预防医学杂志、中华病理学杂志、中华眼科杂志、中华放射学杂志)717篇论著的调查,有统计图的80篇(11.2%),共有统计图132个。其中线图居首位87个(65.9%),条图次之共22个(16.7%)。第二章定量资料的统计描述02三、常见统计图1、条图(bargraph):用等宽的直条长短来代表按性质分类的资料各类别的数值大小,表示它们之间的对比关系。以横轴为基线,表示条个类别;纵轴表示其数值。纵轴尺度从“0”开始,中间不宜折断。在同一图内尺度单位代表同一数量时,必须一律相等。各直条的宽度应相等,间隙的宽度与直条的宽度相等或为直条宽度的1/2。复式直条图一个组包括两个以上直条,直条所表示的类别应用图例说明。第二章定量资料的统计描述02三城市某种传染病发病率(‰)比较第二章定量资料的统计描述02某地89年与90年男女婴儿死亡率(‰

)比较第二章定量资料的统计描述022、百分条图(percentgraph):表示事物内部各组成部分的构成情况,又称构成条图。先绘制一个标尺,尺度分成10格,每格代表10%,总长度为100%。绘制一直条,全长等于标尺的100%,直条宽度可任意选择,以直条内相对面积的大小代表数量的百分比。直条各部分用线分开,并注明简要文字及百分比。资料可由大到小,或按习惯次序,自左至右顺序排列。如有两种或以上性质类似的资料相比较,则绘制的各直条应全长相同,且各直条中各部分的排列次序要一致,以利比较分析。第二章定量资料的统计描述02某矿1961~1965年各期存活矽肺构成比较

第二章定量资料的统计描述023、圆图(circlegraph):用途与百分条图相同,表示事物内部各部分的构成情况。先绘一圆形,由于圆周360度,因此每1%相当于3.6度的圆周角,将百分比乘以3.6度即为构成部分应占的圆周角度数。圆形图上各部分按自然顺序或大小排列,一般相当于时种9点或12点为起点,顺时钟方向排列,扇形

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论