集中趋势的统计描述_第1页
集中趋势的统计描述_第2页
集中趋势的统计描述_第3页
集中趋势的统计描述_第4页
集中趋势的统计描述_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

集中趋势的统计描述第1页,共15页,2023年,2月20日,星期二

第一节频数分布

(FrequencyDistribution)

由实验或临床观察等各种方式得到的原始数据,如果是计量资料并且观察的例数较多,为了能够显示数据的分布规律,可以对数据进行分组,然后制作频数表或绘制直方图。第2页,共15页,2023年,2月20日,星期二

例2.1某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表所示:

如何有效地组织、整理和表达数据的信息?4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.63……5.024.76第3页,共15页,2023年,2月20日,星期二一、频数表

(FrequencyTable)

频数表:同时列出观察指标的可能取值区间及其在各区间内出现的频数。

1.确定组数k:通常选择在8~15之间

2.确定组距:参考组距为R/k,R为全距

3.确定组限:应符合专业习惯

4.对各组段计数:划记或由软件完成第4页,共15页,2023年,2月20日,星期二红细胞数频数频率(%)累积频率(%)3.80~

2

1.4

1.44.00~

6

4.3

5.74.20~

11

7.9

13.64.40~

25

17.9

31.54.60~

32

22.9

54.44.80~

27

19.3

73.75.00~

17

12.1

85.85.20~

13

9.3

95.15.40~

4

2.9

98.05.60~

2

1.4

99.45.80~

6.00

1

0.7

100.0合计140

-

100.0

表2-2某地140名正常男子红细胞数的频数表

第5页,共15页,2023年,2月20日,星期二

图2-1140名正常男子红细胞计数的直方图

二、直方图(Histogram)

直观、形象地表示频数分布的形态和特征。第6页,共15页,2023年,2月20日,星期二三、频数表的用途

1.作为陈述资料的形式

2.便于观察数据的分布类型

3.便于发现资料中含有的异常值

4.可用各组段的频率作为概率的估计值

第7页,共15页,2023年,2月20日,星期二

第二节平均数

(Average)

描述一组观察值集中位置或平均水平的统计指标。一、算术均数

应用:主要适用于对称分布或偏斜度不大的资料,尤其适合正态分布资料。第8页,共15页,2023年,2月20日,星期二二、几何均数(GeometricMean

)例2.2测得10个人的血清滴度的倒数分别为2,2,4,4,8,8,8,8,32,32,求平均滴度。例2.3(频数表资料)

应用:主要用于血清学和微生物学中。

第9页,共15页,2023年,2月20日,星期二三、中位数和百分位数(一)中位数

(Median,M

)

将一组观察值从小到大按顺序排列,居中心位置的数值即为中位数。

1.原始资料如测得5个人的VLDL中的apo_B的含量(mg/dl)为0.84、2.85、5.46、8.58、9.60,则

M=5.46(mg/dl)若测量结果:0.84、2.85、8.58、9.6,则

M=(2.85+8.58)/2=5.72(mg/dl)第10页,共15页,2023年,2月20日,星期二

2.频数表资料表2-4某地630名正常女性血清甘油三脂含量(mg/dl)甘油三脂频数累积频数累积频率(%)0.10~

27

27

4.30.40~169196

31.10.70~16736357.6M1.00~

94457

72.51.30~

81538

85.41.60~

42580

92.11.90~

28608

96.52.20~

14622

98.72.50~

4626

99.42.80~

3629

99.83.10~

1630100.0

合计630

-

-第11页,共15页,2023年,2月20日,星期二L、iM、fM分别为M所在组段的下限、组距和频数,fL为M所在组段之前各组段的累积频数。第12页,共15页,2023年,2月20日,星期二(二)百分位数(Percentile)

L:组段的下限;iM:组距;fx:频数;

fL:Px所在组段之前的累积频数。例2.5计算例2.4的百分位数P25、P75、P90。第13页,共15页,2023年,2月20日,星期二(三)百分位数的应用

1.中位数是百分位数的特例。其特点是不易受异常值的影响,适用于描述明显偏态分布、或两端无确定数值数据的平均水平。

2.描述数据序列在某百分位置的水平。多个百分位数结合使用如P25和P75可以描述数据的分散程度,用P2.5和P97.5计算医学95%的参考值范围等。第14页,共15页,2023年,2月20日,星期二

小结

1.运用频数表、直方图和统计指标这些技巧能够有效地组织、整理和表达计量资料的信息。

2.平均数是描述一组观察值集中位

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论