版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章统计工作基本步骤:设计—收集—整理—分析(按资料类型)
﹡整理资料---制作频数表﹡分析资料统计描述:指标、图表统计推断:参数估计、假设检验1第二章计量资料的统计描述(指标)2第二章主要内容第一节频数分布表和频数分布图(整理)第二节集中趋势第三节离散趋势第四节正态分布第五节医学正常值范围的估计分析应用3现有子女数/个(个)频数f频率(%)累计频数累计频率(%)017740.7817740.781317.1420847.9326715.4427563.3636013.8233577.1944811.0638388.255276.2241094.476163.6942698.16781.84434100.0合计434表2.1某年某地区434名15-64岁少数民族已婚妇女现有子女数的频数分布4
例2.1某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表所示:
4.765.265.615.954.464.574.31……5.004.734.475.344.704.814.93……5.244.974.714.444.945.054.78……4.334.834.565.444.794.914.26……4.955.074.805.304.654.774.50……4.814.543.824.014.894.625.12……5一、频数表
(FrequencyTable)同时列出观察指标的可能取值区间及其在各区间内出现的频数。1.求全距:R=5.95-3.82=2.032.确定组数k:通常选择在8~15之间
3.确定组距:参考组距为R/k,R为全距4.确定组段:包含下限不包含上限5.对各组段计数:划记,汇总.6某地140名正常男子红细胞数的频数表
红细胞数组中值频数频率(%)3.80~
3.9
2
1.44.00~
4.1
6
4.34.20~
4.3
11
7.94.40~
4.5
25
17.94.60~
4.7
32
22.94.80~
4.9
27
19.35.00~
5.1
17
12.15.20~
5.3
13
9.35.40~
5.5
4
2.95.60~
5.7
2
1.45.80~
6.00
5.9
1
0.7合计1407二、直方图(Histogram)直观、形象地表示频数分布的形态和特征。140名正常男子红细胞计数的直方图8频数表的用途
1.作为陈述资料的形式
2.便于观察数据的分布类型
3.便于发现资料中含有的异常值
4.便于进行统计指标的计算和进一步的分析.
91.频数表的编制步骤组段(1)频数,f(2)组中值,X(3)频率/%(4)累计频率/%(5)95~196.50.830.8398~799.55.836.67101~10102.58.3315.00104~18105.515.0030.00107~25108.520.8350.83110~21111.517.5068.33113~15114.512.5080.83116~15117.512.5093.33119~7120.55.8399.17122~1251123.50.83100.00合计
120100.0表2.2某市120名5岁女孩身高频数分布101.频数表的编制步骤第二节集中趋势的描述为了进一步揭示数据分布的规律,尚需要用统计指标来较为准确地描述数据的分布特征:集中趋势和离散趋势
平均数(average)是一组反映资料集中趋势(centraltendency
)的指标。常用的有:
1.算术均数(arithmeticmean),简称均数(mean)
2.几何均数(geometricmean)
3.中位数
(median)
4.众数(mode)11一、算术平均数(TheArithmeticmean)
简称均数(Mean)或均值,定义为所有变量值之和除以变量值个数(即,样本含量SampleSize)。反映一组呈对称分布的变量值在数量上的平均水平。12(1)直接计算法
公式:例1:试计算1,3,7,9的均数?例2:试计算1,3,3,7,7,9,9,9的均数?13(2)加权法
Σ为求和符号,读成sigma14151.频数表的编制步骤意义:一组性质相同的观察值在数量上的平均水平。表示:
(总体)X(样本)计算:直接法、间接法、计算机特征:∑(X-X)=0。∑(X-X)2
<∑(X-a)2(其中a≠X)
易受到极端值的影响。应用:正态分布或近似正态分布;可以作为样本的代表值与其他样本进行比较。注意:合理分组,才能求均数,否则没有意义。算术均数小结16在数量上的平均水平。例一组血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求均数。此例的算术均数为22222,显然不能代表滴度的平均水平。直观看,其平均水平应为1000,如何求得这一数据呢?17在数量上的平均水平。可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。二、几何均数(geometricmean)18(1)直接法几何均数:变量对数值的算术均数的反对数。
其他对数(如自然对数)变换也可获得相同的几何均数19例3.6测定10名伤寒病人血清抗体滴度分别为1:4,1:4,1:4,1:4,1:4,1:16,1:16,1:16,1:64,1:128,求其平均抗体滴度。以其滴度的倒数为原变量值,代入公式有:平均抗体滴度为:1:1120(2)加权法公式:21例2.5
75名儿童的平均抗体滴度计算22几何均数小结意义:N个数值的乘积开N次方即为这N个数的几何均数。表示:G计算:直接法、间接法应用:原始数据分布不对称,经对数转换后呈对称分布的资料。例如抗体滴度。等比资料注意观察值不能同时有正负或有零,若全是负值,则计算时可先去掉负号,得出结果后再加上负号。同一资料,几何均数<均数233.中位数(median)
中位数是将一批数据从小至大排列后位次居中的数据值,符号为M,反映一批观察值在位次上的平均水平。
11只大鼠平均存活时间如下,求其平均存活天数?4,10,7,50,3,15,2,9,13,>60,>60变量排序2,
3,
4,7,9,10,13,15,50,>60,>60秩次
123456789101124(一)中位数计算方法
1.直接法:适用于样本量较小的计量资料。当n为奇数时
当n为偶数时251.频数表的编制步骤例
9名中学生甲型肝炎的潜伏期分别为12,13,14,14,15,15,15,17,19天,
求其中位数。261.频数表的编制步骤2.频数表法(百分位数法):适用于样本量较大的计量资料,如频数表资料。
LM:中位数所在组段下限i:组距
fM
:中位数所在组段频数∑fL:中位数所在组段前一组的累计频数27频数表资料的中位数下限值L100cm上限值U120cmi;fm中位数M28中位数=100+20x[(1503x50%-448)/520]=111.67(分)291.频数表的编制步骤中位数小结计算时只利用了位置居中的测量值
优点:对极值不敏感缺点:并非考虑到每个观测值适用于各种分布类型的资料,特别适合于:
①大样本偏态分布资料②或者一端或两端无确切数值的资料③或分布不清的资料﹡对于正态分布资料,中位数等于均数,对于对数正态分布资料,中位数等于几何均数.301.频数表的编制步骤第三节、离散趋势的描述变异(variation)指标:反映数据的离散度(Dispersion)。即个体观察值的变异程度。常用的指标有:
1.极差(Range)(全距)
2.百分位数与四分位数间距
PercentileandQuartilerange
3.方差
Variance
4.标准差StandardDeviation
5.变异系数
CoefficientofVariation
311.频数表的编制步骤
例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3)盘编号甲乙丙14404804902460490495350050050045405105055560520510合计250025002500均数500500500甲乙丙321.频数表的编制步骤1.极差(Range)(全距)优点:简便缺点:只利用了两个极端值;n大,R也会大,不稳定。应用:用于描述单峰对称分布小样本资料;初步了解资料的变异程度。1204020R=Xmax-Xmin332.百分位数与四分位数间距
Percentileandquartilerange百分位数
:数据从小到大排列;在百分尺度下,所占百分比对应的值。记为Px。
34
PX
X%(100-X)%XminXmaxP100变量值从小到大排列P0百分位数示意图35百分位数的计算
直接法:略频数表法:公式36P25=80+20x[(1503x25%-0)/448]=96.77(分)P75=120+20x[(1503x75%-968)/226]=134.09(分)37四分位间距:Q=P75-P25Q越大,表示资料的离散程度越高,反之亦然。与中位数的应用条件相同.可以看作是一对指标。0P25P50P75100%383.方差
方差(variance)也称均方差(meansquaredeviation),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。平均偏差=离均差平方和(SS)=离均差=39总体方差
方差性质:方差越大说明数据的变异越大
n-1为自由度(degreeoffreedom,简记为DF)指随机变量能自由取值的个数40样本方差为什么要除以(n-1)与自由度(degreesoffreedom)有关。自由度是数学名词,在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。若受到k个条件的限制,就只有(n-k)个自由度了。计算标准差时,n个变量值本身有n个自由度。但受到样本均数的限制,任何一个“离均差”均可以用另外的(n-1)个“离均差”表示,所以只有(n-1)个独立的“离均差”。因此只有(n-1)个自由度。
41例题:求某市城区11名5岁女孩身高的样本方差,已知X=107.39。S2=[(112.9-107.39)2+(99.5-107.39)+…+(116.5-107.39)]/(11-1)=48.75(cm)2方差的计算424.标准差
标准差
(standarddeviation)即方差的正平方根;其单位与原变量X的单位相同。计算公式:43标准差(standarddeviation)样本标准差为样本方差的平方根;
总体标准差为总体方差的平方根。44频数表标准差计算公式
451.频数表的编制步骤组段(1)频数,f(2)组中值,X(3)fX(4)fX2(5)95~196.596.596.598~799.5696.569301.75101~10102.5102510506.25104~18105.51899200344.5107~25108.52712.5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年旋挖钻机钻孔施工安全教育与培训合同3篇
- 2024版政府委托第三方服务合同
- 二零二五年度航空航天9%股权出让与研发支持协议3篇
- 16朱德的扁担说课稿2024-2025学年统编版语文二年级上册001
- 专用车辆租赁协议范本(2024版)
- 个人电子产品维修服务合同(2024版)15篇
- 2024版技术服务委托合同范文
- 2025年度茶艺茶具研发与市场推广合作协议4篇
- 二零二五年度艺术展览策展人兼职劳动合同实施细则2篇
- 二零二五年度豪华游轮买卖合同3篇
- C及C++程序设计课件
- 带状疱疹护理查房
- 公路路基路面现场测试随机选点记录
- 平衡计分卡-化战略为行动
- 国家自然科学基金(NSFC)申请书样本
- 幼儿教师干预幼儿同伴冲突的行为研究 论文
- 湖南省省级温室气体排放清单土地利用变化和林业部分
- 材料设备验收管理流程图
- 培训机构消防安全承诺书范文(通用5篇)
- (完整版)建筑业10项新技术(2017年最新版)
- 第8期监理月报(江苏版)
评论
0/150
提交评论