




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章 描述性统计 统计描述的任务就是用表、图和数字的形式概括原始资料的主要信息。一、 频数表与直方图:频数表与直方图是最常用的综合描述样本资料的方法, 形象直观,可大致看出分布。1. 频数表的制作: 例1.3 某地随机抽取正常成年男子120名, 其红细胞计数值(1012 /L)如下: 5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.84 4.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.69试作该批样本的频数表。对计量资料则要按以下步骤制作频数表 (1)找出最大和最小值,计算极差。 本例最大值=6.18, 最小值=3.29,极差为R=6.183.29=2.89(2)确定组距和列出分组计划:一般设1015组;组距取整。 i= R /10=2.89/10=0.2890.30 第一组包括最小值,最后一组包括最大值。(3)将原始数据整理后,得到各组频数。2频数表的用途: (1)描述资料特征: 集中趋势及离散趋势。 (2)确定变量的分布类型 (3)发现异常值二、样本平均水平的度量 用更精确的一、两个数字(指标)描述原始资料的信息,对于计量资料一般用两个数字(指标)分别描述资料的平均水平和变异性。常用描述平均水平的指标有算术均数、几何均数和中位数。1. 算术均数(arithmetic mean),简称均数。 适用:对称资料,最好是近似正态分布的资料。 计算:直接法: 例如:测量7名正常8岁女孩身高(cm)分别为: 122 129 128 135 132 125 133 平均身高为:(122+ 129+128+135+132+125+133)/7=129(cm) 加权法:当数据量太大时或资料已经整理成频数表时。 2. 几何均数 适用:原始数据经对数转换后近似对称分布的资料,医学上常用于微生物学和免疫学指标。 几何均数的计算可参考算术均数的计算,唯一不同的是需要在计算前将变量取对数,最后将结果反对数转换回其真值。3. 中位数 (median) 将一组观察值从小到大排列,位置居中的那个数值为中位数。 适用:数据为非对称分布分布不清楚或资料未闭口的情形。 计算:直接法:将原始数据 ,由小到大排序, 例:1,1,2,2,3,4,6,9,10 ( n = 9, 为奇数) Md = 第5位 = 3 例: 1 , 1 , 2 , 2 , 3 , 4 , 6 , 9 , 10 , 13 ( n=10, 为偶数) Md = 第5位和第6位的平均 = (3+4)/2 频数表法:组段频数累积频数组中值1202023668645601466748194891821210.1921323920 合计 239(1) 中位数的名次 n / 2 = 239 /2 = 119.5(2) 该名次所在组段 a b = 5 7(3) 用插入法 : a 和 b 所对应的累积频数 fa =86 , fb = 146 在a 和 b 中作插值估计 三、样本变异性的度量:例:三组同年龄同性别儿童体重(kg)数据如下: 甲组 26 28 30 32 34 乙组 24 27 30 33 36 丙组 26 29 30 31 34常见的几种:极差或全距,四分位数差距,方差与标准差,变异系数1. 极差或全距R 极差 = 最大值 最小值2. 四分位数差距Q 四分位数差距 = X75 X25 中位数是50%位数,因此四分位数的计算类似中位数。3. 方差S2与标准差S 适用:对称分布或近似正态分布资料,能充分利用全部个体的信息。 离均差 = 个体值 总体均数 = 离均差平方和 = S ()2 总体方差 =S ()2 /n 总体标准差 总体均数常不知道,用样本均数 代替 离均差 = 个体值 样本均数 = S(离均差)2 = (变小了) 样本方差: 其中,n-1 称为自由度。样本标准差的计算: 4. 变异系数 (coefficient of variation , CV ) 适用:当比较两组或多组资料的变异程度大小时,如果变量的度量衡单位不同或均数差别较大时,应用变异系数比较。 CV 例 : 均数 标准差 变异系数 男子身高 170 cm 6 cm 0.035 体重 60 kg 7 kg 0.117四、相对数与率的标准化(一)比、比率和速率 1比 (ratio) 任意两个数之比值 例: 新生儿性别比 = 男性新生儿数 女性新生儿数 体块指数 = 体重 ( 身高 )2 2比率 ( proportion ) 分子和分母均为计数值;分子是分母的一部分;无量纲;百分比;分母较大时,近似地反映某事件发生的机会大小。例 : 医治1000例病人,900例痊愈, 治愈率 = 900/1000 = 90% 3速率 (rate):单位时间内某事件出现的机会大小,分母含时间量纲。 例: 某年死亡率= 该年死亡人数同年暴露于死亡危险的人年数 死亡率的量纲为1/年或人/人年。(二)率的标准化方法表1.9 两个地区的年龄别死亡率资料年龄组(岁)A 地 区B 地 区人口数(千人)死亡数(千人)死亡率(1/千)人口数(千人)死亡数(千人)死亡率(1/千) 0 400 2 5.0 288 1 3.515200010 5.0 238 1 4.230200015 7.5 794 5 6.345 800 8 10.02000 18 9.060 40016 40.02000 70 35.075 8012150.0 300 36120.0合计568063 11.15618131 23.3 分别在各年龄组中比较死亡率较为合理,但如果各年龄组结果不一致,无法作出总的结论,标准化方法旨在产生一个可比的综合指标。1直接法标准化: 适用条件:已知有稳定的年龄别死亡率,有合适的标准人口。 选择“标准人口”: 统一人口 或 合并人口 方法:估计当地年龄别死亡率应用于“ 标准人口”得到标化死亡率。 注意:直接标化率是以标准人口为权重的加权平均率。 表1.10 两个地区的直接法标准化死亡率年龄组(岁)标准人口数(千人)甲死亡率()甲期望死亡数(千人)乙死亡率()乙期望死亡数(千人)(1)(2)(3)(4)=(2)(3)(5)(6)=(2)(5) 0 686 5.0 3.43 3.5 2.4015 2238 5.0 11.19 4.2 9.4030 2794 7.5 20.96 6.3 17.6045 2800 10.0 28.00 9.0 25.2060 2400 40.0 96.00 35.0 84.0075 380150.0 57.00120.0 45.00合计11298 19.2216.58 16.3184.202间接法标准化 适用条件:年龄别死亡率未知或年龄别死亡率不稳定,有各组实际死亡数和年龄别人口数,有合适的“标准年龄别死亡
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版机柜合同模板
- 教师签订劳动合同范例二零二五年
- 五人合伙合同样本
- 经济合同担保
- 全新美容院转让协议二零二五年
- 幼儿园课程游戏化实施方案
- 2025年UV无影胶水项目发展计划
- 住建部eps合同样本
- 课堂教学中的师生互动
- 代理产品区域合同标准文本
- 四川凉山州人民政府办公室考调所属事业单位工作人员2人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年中国艾草行业市场现状、发展概况、未来前景分析报告
- 防走失应急预案
- 临床实验室管理学学习通超星期末考试答案章节答案2024年
- 中式烹调师理论知识测试题与参考答案
- 低压电工培训教案
- 外科护理风险
- 2024年执业助理医师实践技能考试体格检查
- FURUNO 电子海图 完整题库
- 2020年全国硕士研究生招生考试《思想政治理论》真题及解析
- 浙江省中小学心理健康教育课程标准
评论
0/150
提交评论