版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章定量数据的统计描述第1页,共51页,2023年,2月20日,星期一第一节频数分布
一、频数分布表简称频数表(frequencytable)例2-1从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果如下,试编制频数分布表。第2页,共51页,2023年,2月20日,星期一2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.92 3.583.664.283.263.502.704.614.752.913.914.594.19 2.684.524.913.183.684.833.873.953.914.154.554.80 3.414.123.955.084.533.923.585.353.843.603.514.06 3.073.554.233.574.833.523.844.503.964.503.274.52 3.194.593.753.984.134.263.633.875.713.304.734.17 5.133.784.573.803.933.783.994.484.284.065.265.25 3.985.033.513.863.023.704.333.293.254.154.364.95 3.003.26试编制频数分布表。第3页,共51页,2023年,2月20日,星期一1、频数表的编制找全距(range)定组距(classinterval):
一般分为10~15组,如组距约为全距/10写组段:每个组段的起点称为下限,lowerlimit;每个组段的终点称为上限,upperlimit;下限≤X<上限第4页,共51页,2023年,2月20日,星期一频数表的编制--续1.计算极差:极大值-极小值5.71-2.35=3.362.组数:10
组距3.36/10=0.336
取0.33.分组段:最小组段2.3~最大组段5.6~5.94.列表划记:
101名正常成年女子的血清总胆固醇频数分布胆固醇组段频数2.30~12.60~32.90~63.20~83.50~173.80~204.10~174.40~124.70~95.00~55.30~5.60~5.9021第5页,共51页,2023年,2月20日,星期一二、频数分布图(graphoffrequencydistribution)以各组段总胆固醇含量为横轴,频数为纵轴。第6页,共51页,2023年,2月20日,星期一SPSS中的操作:1.建立数据库2.使用Frequencies
命令3.先使用Recode命令,再用Frequencies命令第7页,共51页,2023年,2月20日,星期一频数分布的类型对称分布:集中位置居中,左右两边对称偏态分布:正偏态分布(右偏态)峰左尾右
负偏态分布(左偏态)正偏态分布对称分布负偏态分布第8页,共51页,2023年,2月20日,星期一三、频数表和频数分布图的用途揭示变量的分布特征和分布类型;便于进一步计算指标和统计分析处理;便于发现某些特大或特小的可疑值。第9页,共51页,2023年,2月20日,星期一频数分布的两个特征集中趋势,centraltendency指变量值的中心数值或中心位置所在。离散趋势,tendencyofdispersion指变量值围绕中心数值或中心位置的分布情况。第10页,共51页,2023年,2月20日,星期一第二节集中趋势的描述平均数(average):用于观察一组同质变量值的平均水平/集中位置。亦称中心位置指标。它不但给人一个简明概括的印象,而且便于事物间的分析比较。常用的平均数算术均数
(arithmeticmean/mean)几何均数
(geometricmean)中位数
(median)第11页,共51页,2023年,2月20日,星期一一、算术均数,简称均数
(arithmeticmean/mean)均数是算术均数的简称。总体均数用希腊字母μ(缪,mu)表示样本均数(Xbar)表示。均数反映一组观察值在数量上的平均水平。第12页,共51页,2023年,2月20日,星期一均数的应用主要用于对称性或近似对称性分布的资料;尤其是在正态分布或近似正态分布上的应用。第13页,共51页,2023年,2月20日,星期一计算方法1.直接法Σ:希腊字母(西格马,sigma),求和符号例9.2有8名正常人的空腹血糖值(mmol/L):
6.2,5.4,5.7,5.3,6.1,6.0,5.8,5.9
第14页,共51页,2023年,2月20日,星期一2.频数表法(加权法)组段频数f组中值XfXfX22.30~12.452.456.002.60~32.758.2522.692.90~63.0518.3055.823.20~83.3526.8089.783.50~173.6562.05226.483.80~203.9579.00312.054.10~174.2572.25307.064.40~124.5554.60248.434.70~94.8543.65211.705.00~55.1525.75132.615.30~25.4510.9059.415.60~5.9015.755.7533.06合计101——409.751705.09第15页,共51页,2023年,2月20日,星期一频数表计算均数:Xj为各组的组中值。组中值等于该组的上限加下限之和除以2。
fj为各组的频数。101名正常成年女子的血清总胆固醇均值为:
=409.75/101=4.06(mmol/L
)第16页,共51页,2023年,2月20日,星期一补充:均数的两个重要特征(1)离均差之和为零第17页,共51页,2023年,2月20日,星期一均数的两个重要特征(2)离均差平方和为最小第18页,共51页,2023年,2月20日,星期一(二)几何均数Geometricmean,G反映一组呈倍数关系的观察值的平均水平适用:数据呈正偏态分布,经对数转换后呈正态分布。多用于观察值之间呈倍数关系,如抗体滴度计算方法直接法加权法第19页,共51页,2023年,2月20日,星期一1.直接法第20页,共51页,2023年,2月20日,星期一例:有8份血清的抗体效价为为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640。求平均效价。用直接法计算G将各效价的倒数代入公式,得该8份血清的平均抗体效价为1:56.57,近似为1:57注意:变量值不能有0第21页,共51页,2023年,2月20日,星期一2.频数表法式中f为频数。第22页,共51页,2023年,2月20日,星期一用频数表法计算G例30名麻疹易感儿童接种麻疹疫苗一个月后,血凝抑制抗体滴度如下表所示,试求其平均抗体滴度。第23页,共51页,2023年,2月20日,星期一30名麻疹易感儿童血凝抑制抗体滴度抗体滴度人数f滴度倒数XlgXflgX1:8280.90311.80621:166161.20417.22461:325321.50517.52551:6410641.806118.06201:12841282.10728.42881:25622562.40824.81641:51215122.70932.7093合计30∑flgX=50.58第24页,共51页,2023年,2月20日,星期一30名麻疹易感儿童接种麻疹疫苗一个月后血凝抑制抗体滴度为1:48.5同一组资料求得的几何均数小于均数。第25页,共51页,2023年,2月20日,星期一(三)中位数Median,M将一组观察值从小到大按顺序排列,位次居中的观察值,即为中位数。一半的值比M小,一半的值比M大。例:1,3,5,7,18(奇数)
1,3,5,7,18,20(偶数)计算n为奇数时n为偶数时第26页,共51页,2023年,2月20日,星期一M计算方法例:9人某病潜伏期(天)分别为3,4,4,5,6,7,7,19,19,求中位数。例:6名新生儿身长(cm)分别为50.1,52.0,53.0,55.0,55.0,56.0,求中位数。第27页,共51页,2023年,2月20日,星期一中位数的应用中位数可用于任何分布的定量资料;资料的分布呈明显偏态,特别是负偏态;分布的一端或两端无确定的数值;
(如:>50,或<10)资料的分布不清。注意:在完全对称的单峰曲线分布中,同一组资料的均数与中位数相同,Mean=Median第28页,共51页,2023年,2月20日,星期一中位数的优缺点优点:不受个别特大或特小的观察值影响;其它平均数不宜使用时,中位数就显示出它的优越性。缺点:掉失了大量信息,其敏感性不够。第29页,共51页,2023年,2月20日,星期一百分位数(Percentile,Px)百分位数位置指标;界值;分布数列的百等份分割值。有x%的比Px小,有(100-x)%的比Px大。中位数是一个特定的百分位数P50。第30页,共51页,2023年,2月20日,星期一百分位数的计算fX为PX所在组段的频数,
i为该组段的组距,
L为该组段的下限,
fL为小于L各组段的累计频数。第31页,共51页,2023年,2月20日,星期一某传染性疾病的潜伏期(天)如下表,求其
中位数和百分位数P95潜伏期
(天)人数f累计频数∑f累计频率%4~262624.048~487468.5212~259991.6716~610597.2220~3108100.00第32页,共51页,2023年,2月20日,星期一百分位数的应用描述一组观察值在某百分位置上的水平。用于确定医学正常值范围。用一组百分位数描述一组观察值的变异度,如四分位数。第33页,共51页,2023年,2月20日,星期一应用平均数时的注意事项同质的变量值才能求平均数;根据资料的分布特点,选用适应的平均数指标。第34页,共51页,2023年,2月20日,星期一平均水平SPSS统计描述命令AnalyzeDescriptiveStatistics
FrequenciesDescriptives注意:频数表资料要用weight命令第35页,共51页,2023年,2月20日,星期一使用频数表资料时SPSS操作中应注意的事项频数表资料要用weight命令;进行数据输入时要使用组中值;并且在Frequencies命令中要选择
Valuesaregroupmidpoints:根据分组资料计算百分位数。
第36页,共51页,2023年,2月20日,星期一SPSS操作求几何均数时有三种方法:
1.是先计算对数的均数,然后求其反对数,得出几何均数;2.直接用ReportCaseSummaries命令;3.用CompareMeans命令,但要个增加分组变量。第37页,共51页,2023年,2月20日,星期一第三节变异程度的统计指标例有3组同龄男孩体重(kg)如下,其体重均数都是30(kg),试分析离散程度。甲组2628303234乙组2427303336丙组2629303134第38页,共51页,2023年,2月20日,星期一离散程度(或变异程度)指数据参差不齐的程度,反映资料的离散趋势。将反映平均水平与离散程度的指标结合起来使用,可全面地描述数据的分布规律。第39页,共51页,2023年,2月20日,星期一一、全距(或极差,Range)全距=最大值–最小值优点:简单明了缺点:不能反映组内其他数据的变异,样本含量相差较大时,不宜用极差比较分布的离散程度。第40页,共51页,2023年,2月20日,星期一二、四分位数间距
(inter-quartilerange)百分位数:指把数据从小到大排列后处于第X百分位置的数值。它将全部数据分为两部分,在不包括PX的全部数据中有X%数据小于PX,有1-X%的数据大于PX%。中位数是一个特定的百分位数P50。四分位数:下四分位数P25;上四分位数P75P0——P25——P50
——P75——P100
四分位数间距:P75-P25
或QU-QL
比极差稳定,但仍未考虑每个数据的大小。常和中位数结合使用描述数据的分布规律。第41页,共51页,2023年,2月20日,星期一三、离均差平方和
(sunofsquare)、方差(variance)和标准差(standarddeviation)平均偏差(meandifference):离均差平方和(sunofsquare,SS)第42页,共51页,2023年,2月20日,星期一方差和标准差离均差平方和:考虑每个观察值,但受N的影响。对离均差平方和求均数,得总体方差2
,开根号得标准差。第43页,共51页,2023年,2月20日,星期一一般未知,常常用来估计之,数理统计证明,如用样本的变量个数n来代替N,计算出的样本方差比实际2低,需要用n-1校正,得样本方差S2。开根号得样本标准差s。
第44页,共51页,2023年,2月20日,星期一自由度,degreeoffreedom方差计算公式中的n-1被称为自由度,它描述了当选定时,n个X中能自由变动的X(变量值)的个数。例:某样本含有3个数据,要求∑X=10。则在自由确定了2个数据后,第3个数据只能是10-(x1+x2)。即有2个数据可以自由变动,其自由度=2。推而广之,任何统计量的自由度=n-k,k为限制条件的个数。自由度:是随机变量可以“自由”取值的个数。第45页,共51页,2023年,2月20日,星期一总体标准差样本标准差标准差
standarddeviation应用于频数表资料:第46页,共51页,2023年,2月20日,星期一标准差的计算甲组2628303234标准差3.16乙组2427303336
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论