数值变量资料的统计分析.ppt_第1页
数值变量资料的统计分析.ppt_第2页
数值变量资料的统计分析.ppt_第3页
数值变量资料的统计分析.ppt_第4页
数值变量资料的统计分析.ppt_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章 数值变量资料的统计分析数值变量资料的统计分析 1 主要内容主要内容 第一节第一节 数值型资料的统计描述数值型资料的统计描述 第二节第二节 正态分布和参考值范围的估计正态分布和参考值范围的估计 第三节第三节 数值型资料的统计推断数值型资料的统计推断 第四节第四节 t t检验和检验和u u检验检验 第五节第五节 方差分析方差分析 2 terminology statistical description统计统计 描述 statistical inference统计统计 推断 parameter estimation参数估计计 Frequency distribution频频数分布 frequency table频频数表 arithmetic Mean, average算术术平均值值 standard deviation标标准差 variance方差 range极差,全距,范围围 geometric mean几何平均值值 median中位数 normal distribution正态态分布 reference range参考值值范围围 3 统计分析包括统计描述和统计推断两大部分。 l统计描述(statistical description)是用统计指标、统计 表和统计图描述资料的分析规律及其数量特征; l统计推断(statistical inference) 包括总体参数估计和假 设检验两个内容。 参数估计:是用样本统计量估计总体参数所在范围。 假设检验:是利用样本的实际资料来检验事先对总体某些 数量特征所作的假设是否成立。 4 一、数值变量资料的频数分布 二、平均水平指标 三、离散程度指标 5 l1. 频数表(frequency table)的编制方法 l2. 频数分布的两个特征及两种类型 l3. 频数表的用途 特征 离散趋势 类型 一、数值变量资料的频数分布 集中趋势对称分布 偏态分布 6 第一节第一节 数值型变量资料的统计描述数值型变量资料的统计描述 例9.1 某地用随机抽样的方法对140名健康成 年男性血清尿素氮(BUN)浓度进行了检测, 所得数据如表9-1,如何进行统计描述。 7 6.005.283.905.30 4.203.905.605.664.104.004.503.77 4.344.304.225.30 5.133.794.805.204.702.945.904.50 2.105.605.902.85 4.904.225.633.214.663.005.963.45 3.504.233.903.88 4.244.534.882.483.403.263.213.60 2.734.154.604.35 4.965.615.875.014.335.744.873.96 3.003.933.155.00 3.443.502.854.874.603.404.793.02 6.234.982.895.82 6.305.205.403.002.804.434.505.52 6.404.865.904.70 3.474.664.785.702.264.103.705.40 3.704.374.206.10 4.805.105.552.975.113.263.046.01 5.074.225.395.34 4.473.585.264.544.073.833.976.05 4.022.692.525.21 6.554.284.455.154.455.373.803.73 4.492.442.763.33 3.016.433.552.63 表9-1 某地140名健康成年男性血清尿素氮浓度(mmol/L) 8 统计描述的内容: 一、制频数(分布) 表(表9-2)和频数分布图(图9-1) 频数表的用途 (1) 揭示资料的分布特征和分布类型 (2) 便于发现某些特大或特小的可疑值 (3) 便于进一步计算统计指标和统计分析处理 二、计算统计指标 (1) 计算平均值代表一组资料的平均水平; (2) 计算标准差-反映资料的离散程度。 三、绘制统计表和统计图 9 一、编制频数分布表:制表步骤: (1)求极差或全距(range):R=Xmax Xmin 本例, R=6.552.104.45(mmol/L)。 (2)决定组数、组段数和划分组距(class interval): 根据样本含量的多少确定组数,一般设815组。 组段数=取整(极差/组数)。 本例:组段数=取整(4.45/12)=0.370.4 划分组距:每组段的起点和终点分别称为下限和上限。 组距:本组内的上限和下限之差。 组组段的划分 2.02.42.83.23.64.04.44.85.25.66.0 6.4 6. 8 123456789101112 10 (3)列频数表:按上述组段序列 制成表的形式,采用划记法或 计算机将原始数据汇总,得出 各组段中所包含的观察例数, 即为频数,如表9-2的第 (2)栏 。将各组段及其相应的频数列 成表格,即为频数表 (frequency table),如表9-2 。所绘的图形见图9-1。 表9-2 140名健康成年男性血清尿 素氮浓浓度(mmol/L)频频数表 尿素氮浓浓度 (mmol/L) 频频数频频率(%) 2.0021.43 2.4075.00 2.80139.29 3.201410.00 3.601510.71 4.001913.57 4.401812.86 4.801611.43 5.201410.00 5.60139.29 6.0064.28 6.406.8032.14 合计计140100.00 11 表9-2 140名健康成年男性血清尿素氮浓度(mmol/L)频数表 尿素氮浓浓度 (mmol/L) 频频数累计频计频 数频频率(%)累计频计频 率 (%) 2.0022 1.431.43 2.4079 56.4 2.801322 9.2915.71 3.201436 1025.71 3.601551 10.7136.43 4.001970 13.5750.00 4.401888 12.8662.86 4.8016104 11.4374.29 5.2014118 1084.29 5.6013131 9.2993.57 6.006137 4.2897.86 6.406.803140 2.14100.0 合计计140- 100- 12 0 5 10 15 频 数 2 2.4 2.83.23.644.44.85.25.666.46.8 X 2 7 13 14 15 19 18 16 14 13 6 22 7 13 14 15 19 18 16 14 13 6 2 图9-1 图9-1 140名健康成年男性血清尿素氮浓度频数分布图 13 资料的分布类型: 1. 对称分布或正态分布; 2. 偏态分布(正、负):高峰在左侧或右侧; 3. 不规则分布:分布很散,无明显高峰 14 频数表和频数图的用途 l(1) 可以将原来相对杂乱的数据以相对 直观、有序的表格或图形的形式描述, 便于进一步分析。 l(2) 揭示资料的分布类型,便于进一步 计算统计指标和统计分析处理 l(3) 用于描述频数分布的特征 (4)便于发现某些特大或特小的可疑值 , 15 某公司员工工资,请描述平均水平 l1、1800,1900,1900,2000,2000, 2000,2000,2100,2100,2200, l平均工资为2000. l2、1800,1900,1900,2000,2000, 2000,2000,2100,2100,10000 l平均工资为2800,合理吗? 16 请描述以下资料中变量的平均水平 l1、8名某病患者血清抗体滴度为:1:2, 1:4,1:8,1:16,1:32,1:64,1: 128。 l2、某医院收治某癌症患者6人,其生存时 间(月)分别为10,8,19,6,20,25 17 二、集中趋势的描述 集中趋势:一组数据向某一个位置聚集或集中的倾向。一组数据向某一个位置聚集或集中的倾向。 平均数(average):是描述一组同质观察值的集中趋势或平 均水平的指标体系。 一、意义: 反映一组同质变量值的平均水平或分布的集中位置。 作为一组资料的代表值,便于组间的分析比较。 二、卫生领域常用的平均数指标: (一)算术均数 (二)几何均数 (三)中位数 其他平均数:调和平均值 、众数 18 (一) 算术均数 算术均数(arithmetic mean,average): l 简称均数 , 等于所有观察值的总和除以观察值的个 数 l 常用 表示样本均数,希腊字母表示总体均数。 l 计量资料最常用的平均数。 l1、适用条件:服从对称分布(特别是服从正态分布 或近似正态分布)或偏度不大的的计 量资料 19 2、计算方法: 直接法: xi (i=1,2,n)为第i个观察对象的观察值 20 例9-2 l某班级中10名女孩身高测量值分别为132.4 ,151.3,137.6,求其平均身高。 21 l加权法: (weighting method) l xi 为第i组的组中值, fi 为第i组的例数 22 表9-2 分组资组资 料加权权法计计算平均值值及标标准差用表 尿素氮浓浓度 (mmol/L) 组组中值值(xi)频频数(fi)fi xifi xi2 2.002.2024.409.68 2.402.60718.2047.32 2.803.001339.00117.00 3.203.401447.60161.84 3.603.801557.00216.60 4.004.201979.80335.16 4.404.601882.80380.88 4.805.001680.00400.00 5.205.401475.60408.24 5.605.801375.40437.32 6.006.20637.20230.64 6.406.806.60319.80130.68 合计计-140616.802875.36 l直接法结果为4.38mmol/L 23 (二) 几何均数(geometric mean,G) 1、计算方法: 直接法: G等于所有n个观察值的乘积的n次方根 24 例9-3 l8份血清的某种抗体效价分别为1:200,1 :25,1:400,1:800,求其平均效价 。 l先求其倒数的几何均数, l平均效价为1:100. 25 加权法: i 为第i组的组中值(或观察值), fi 为第i组例数: 26 抗体滴度(i)人数fi滴度倒数Xilg (Xi)filg (Xi) (1)(2)(3)(4)(5)=(2)(4) 1:4140.60210.6021 1:8380.90312.7093 1:1615161.204118.0615 1:3232321.505148.1632 1:6443641.806277.6666 1:128111282.107223.1792 1:25652562.408212.0410 1:51225122.70935.4186 合计计112-187.8415 表9-4 某地34名儿童接种麻疹疫苗后血清血凝抑制抗体滴度 血清血凝抑制抗体的几何平均滴度为1:47.55。 27 l2、几何均数的适用条件: l(1)等比数列资料. l(2)原始观察值呈偏态分布、但经过对数 变换后呈正态分布或近似正态分布的资料。 如疾病的潜伏期、抗体滴度、平均效价等。 l注意:同一组观察值的几何均数总是小于它 的算术均数。 28 3、几何均数的应用 l1. 几何均数常用于等比资料,或用于对数正 态分布资料。 l 多应用于血清学和微生物学。如抗体的 平均滴度和平均效价、卫生事业平均发展速 度、人口的几何增长等; l2. 观察值不能有0。 l 因为0不能取对数,不能与任何其他数呈 倍数关系。否则在作对数变换之前需要加一 个常数。 l3. 观察值不能同时有正值和负值。 l 若全是负值,计算时可把负号去掉,得 出结果后再加上负号。 29 (三) 中位数(median, P50或M)和百分位数: 中位数:将观察值按大小排序后,位次居中的观察值。 M=X(P=50%) 1、计算方法 直接法: 设n 为观察值的个数,有公式(9-5)及(9-6) /2 30 百分位数( percentile ) 把一组数据从小到大排列,分成100等份 ,各等份含1的观察值,分割界限上的 值就是百分位数,用PX表示。 它是一种位置指标,即一个百分位数PX将 总体或样本的全部变量值分为两部分,理 论上有X%的变量值比它小,有(100-X) %的变量值比它大。 31 例9-5 8名食物中毒患者的潜伏期分别为1、2、 3、3、4、5、8、16小时,求中位数。 M=(3+4)/2=3.5(小时) 例9-6 某传染病11名患者的潜伏期(天)分别 为1、2、2、3、3、4、5、6、7、7、9 M=4(天) 32 频数表法: Lx: 第x百分位数所在组段下限 ix: 第x百分位数所在组段的组距 fx: 第x百分位数所在组段频数 fL: 小于L的累计频数 33 血铅值铅值 (mol/L) 人数f累计频计频 数 f 累计频计频 率 (%) (1)(2)(3)(4)=(3)n 022226.47 0.25365817.06 0. 50238123.82 0. 754212336.18 1.004116448.24 1.255521964.41 1.503625575.00 1.752828383.24 2.001529887.65 2.252432294.71 2.50632896.47 2.75933799.12 3.003.253340100.00 合计计340 表9-5 340名7岁以下儿童血铅值的频数分布(中位数计算) L: 中位数组段下限值, fL:小于L的累计频数, i: 中位数组距, f50%:中位数组频数. L=1.25 fL=164 i=00.25 f50%=55 34 2、适用条件 中位数不仅可以用于任何分布的定 量资料,(对称分布、偏态分布,不规 则分布),还可以用于开口资料(含不 确定数值资料)。 35 3、中位数在应用中的特点 (1)小于M的观察值个数与大于M的观察值个数相等。 (2)不是由全部观察值计算出来的, 因而M不受个别特小 或特大观察值的影响,这一点优于均数,适用于明显 偏态、两端无确定值、分布不规则或分散度很高的资料 . (3)只受居中观察值波动的影响,因而不敏感 (4)当数据分布对称的时候,理论上中位数等于算术均 数,当数据分布对数转换后对称时,理论上中位数等 于几何均数。 (5)用中位数代替均数、几何均数会减低灵敏度,且进一步 统计处理的方法较少,所以实际工作中,应当尽量使用算 术均数或几何均数。 36 4、百分位数的应用 l可用于任何频数分布的资料。 l可用来描述资料的观察值序列在某百分位置的 水平,中位数是其中的一个特例。 l 多个百分位数结合使用常常可以用来说明某一 特定的问题,如用P25、P75描述资料的离散程度 ,用P2.5、及P97.5规定医学95%的参考值范围。 l分布中部的百分位数稳定,具有较好的代表性 ;但靠近两端的百分位数仅在样本例数比较大 时才比较稳定(如n大于100)。当样本例数不 多时,不宜取太近两端的百分位数。 37 计计量资资料集中趋势趋势 指标标适用条件总结总结 反映资资料的集 中趋势趋势 的指标标 适用的资资料类类型 1. 算术术均数 对对称分布,特别别是正态态或近似正态态分布资资料 。 2. 几何均数 适用于对对数正态态或近似对对数正态态分布资资料 3. 中位数 分布不规则规则 的资资料,分散程度大的资资料,明 显显偏态态,分布不明 38 三、 离散程度的统计描述 (Measures of Dispersion) 39 例 对甲乙两名高血压患者连续观察5天,测得 的收缩压(mmHg)结果如下: 可以看出:两患者收缩压的均数十分接近,但甲患者的血 压波动较大,而乙患者相对稳定。通常,描述一组观察值 ,除需要表示其平均水平外,还要说明它的离散或变异的 情况。 患者第1天第2天第3天第4天第5天均数 甲患者 162145178142186162.6 乙患者 164160163159166162.4 40 第一节 衡量变异程度的指标 l一类是按间距计算: l 极差、四分位数间距 l一类则按平均差距计算: l 方差、标准差等 41 (一)全距(Range,用符号R表示) 也称作极差,即观观察值值中最大值值和最小值值之差 ,用符号R 表示。如前例甲乙两患者收缩压的极差 分别为 该该法简单简单 明了、容易使用,如用于说说明传传染病 、食物中毒等的最短、最长长潜伏期等;缺点是不全 面,易受极端值值影响,结结果不稳稳定。 42 l四分位数: P75、 P50、P253个点将全部观察 值分为四个部分,处于分位点上的数值即为 四分位数 l四分位数间距Q:QQU QLP75 P25 l 其间包括了一组观察值的一半,故四分位数 间距可看成是中间50%观察值的极差。 (二)四分位数间距 (Quartile) 43 四分位数间距的计算(interquartile range,Q): 25%位数计算公式: 75%位数计算公式 血铅值铅值 (mol/L) 人数f累计频计频 数f累计频计频 率(%) (1)(2)(3)(4)=(3)n 022226.47 0.25365817.06 0. 50238123.82 0. 754212336.18 1.004116448.24 1.255521964.41 1.503625575.00 1.752828383.24 2.001529887.65 2.252432294.71 2.50632896.47 2.75933799.12 3.003.253340100.00 合计计340 44 四分位数间距(interquartile range,Q) 计算公式: Q = P75 P25=1.75-0.77=0.98(mmol/L) X0% X25% X50% X75% X100% | Q | 0 0.77 1.25 1. 75 X1 Xn 45 四分位数间距的特点: l适用于描述偏态分布、一端或两端无确切数值 、分布不明确资料的离散程度。 l四分位数间距越大,数据分布的变异度越大;反 之,变异度越小。 l与中位数一起描述偏态分布资料的分布特征。 l作为描述数据分布离散程度的指标,比极差稳 定,但仍未考虑到每个数据的大小,未考虑全 部观察值的变异度,在统计分析中应用的不够 普遍。 46 (三)方差(variance): 2 (总体方差), S 2(样样本方差) l为了全面考虑每个观察值的变异情况,克服极差 和四分位数间距的缺点,引入了“方差” l均方差(mean square deviation,MS,均方),反 映一组数据的平均离散水平。 47 l 计算: 48 自由度(degree of freedom) l随机变量能够自由取值的个数 l符号为 ,读作niu。 l如n4的样本受到 的条件限制,可 自由取值的数字只有3个。 49 方差的特点 l适用条件:对称分布资料,特别是正态 分布或近似正态分布资料。 l意义:方差越大,数据间的变异越大 l优点:利用了每个数据的信息,是常用 的 l 描述数据分布离散程度指标 l不足:度量衡单位发生了改变,不便于 实际应用。为此,更常用的是标准差。 50 (四)标准差(standard deviation,SD) l将方差开方,恢复成原度量单位,得总体标准 差 和样本标准差 S l 计算: 直接法: 加权法: 51 (四)标准差 (Standard Deviation) 例如对对于例9-2,经计算有 52 标准差的应用 (1)适用条件同方差,表示观察值的变异程度(离散 程度): 在两组(或几组)资料均数相近、度量单位 相同的条件下,标准差大,表示观察值的变异度 大,即各观察值离均数较远,均数的代表性较差 。 (2) (2) 用于计算变异系数;用于计算变异系数; (3)(3)结合样本含量结合样本含量n n计算标准误计算标准误 (4)(4)结合均数完整地描述正态分布的特征和估计医结合均数完整地描述正态分布的特征和估计医 学参考值范围。学参考值范围。 。 53 问题的引入 l例2-13: 某地40名7岁男童的身高 均数为121.48cm,标准差为4.65cm;体重 均数为22.18kg,标准差为2.35kg。 l 试比较其变异程度的大小? 54 变异系数(coefficient of variation,CV) l定义:标准差与算术均数之比, l它描述了相对于算术均数 而言,标准差的大小 ,即描述数据的变异相对于其平均水平来说是大 还是小。 l计算公式 55 l适用条件: l 常用于比较度量单位不同或均数相 差悬殊的两组(或多组)资料的变异度。 l意义:CV大则说明变异较大 56 57 描述性统计统计 量归纳归纳 反映资资料的集中 趋势趋势 的指标标 反映资资料的离 散情况指标标 适用的资资料类类型 1. 算术术平均数 方差及标标准差 对对称分布,特别别是正态态或近似 正态态分布资资料。 2. 几何平均数 几何标标准差 适用于对对数正态态或近似对对数正 态态分布资资料等比资资料 3. 中位数 四分位数间间距 或百分位数 分布不规则规则 的资资料,分散程度 大的资资料 58 59 第二节 正态分布和医学参考值范围 一、正态分布 (normal distribution) 60 图9-2 频数分布逐渐向正态分布接近 表9-2 140名健康成年男性血 清尿素氮浓浓度(mmol/L)频频数 表 尿素氮浓浓度 (mmol/L) 频频数 频频率% 2.002 1.43 2.407 5.00 2.8013 9.29 3.2014 10.00 3.6015 10.71 4.0019 13.51 4.4018 12.86 4.8016 11.43 5.2014 10.00 5.6013 9.29 6.006 4.28 6.406.803 2.14 合计计140 100.00 61 (一)正态态分布的图图形 可以设设想,如果观观察例数逐渐渐增多,组组段数也不断增多 ,就会形成一条光滑曲线线图9-2(3)。称为正态分布曲线 。 这条正态分布曲线线的特点为为: 高峰位于中央均数所在处处、两侧侧逐渐渐降低; 左右对对称; 曲线线在无穷远处与横轴轴相交。 把服从正态分布的变量表示为: XN(,2) 正态分布曲线线由两个参数确定: 平均数,称位置参数,决定平均数所在的位置; 方差2,称形状参数,决定曲线的高低宽窄。 62 横坐标用变量X表示,第i组的组距和人数分别用Xi 和fi表示,n为总观察例数,那么在X,X+Xi)区间 内每单位尿毒氮浓度的频率为 f(x)称作密度函数。将图2.1表示人数的 纵坐标换成f(x)后可以得到下图。 63 虽然两个图的纵坐标含义各异,但图的形状却 完全相同。 任意矩形的面积的特殊意义: 矩形的面积恰好等于尿素氮浓度在这一区间内 出现的频率f(x)*Xi= fi/n,所有矩形面积的总 和,即为累计频率,应当为1。 64 服从正态态分布的变量X的概率密度函数f(X)为为 式中,式中, 为总体均数;为总体均数; 为总体标准差;为总体标准差;=3.14159=3.14159为圆为圆 周率;周率;e e为自然对数的底为自然对数的底(e2.71828), X(e2.71828), X为变量。为变量。 表示为:uN(0,1),即平均值为0、方差为1的正态分布。 为实际应用方便,将一般正态分布转换为标准正态分布 。转换公式为: u =(X-), u称为标准正态变量。 服从标准正态态分布的变量u的概率密度函数f(u)为为 65 A. 正态分布 B. 标准正态分布 图9-3 正态分布与标准正态分布的面积与纵高 按式(9-16),根据X的不同取值,绘出正态分布(normal distribution)的图形(图9-3A)。 按式(9-16),根据u的不同取值,绘出标准正态分布 (standard normal distribution)的图形(图9-3B)。 Xu 66 参数 和 参数:即正态总体的均数,它描述了正态分布的 集中趋势位置,决定了分布曲线在横轴的位置。是 位置参数。 参数:是正态总体的标准差,它描述正态分布的 离散程度,决定分布曲线的形态。是变异参数。 越小,数据分布越集中,曲线的形状越“瘦高”; 越大,数据分布越离散,曲线的形状越“肥胖”。 已知、和变量值x,就能按公式绘出正态曲 线的图形。 67 正态分布参数位置变化示意图 68 正态分布变异度不同变化示意图 69 l正态分布曲线: l 高峰位于中央,两侧逐渐下降、低平,左 右完全对称、两端不与横轴相交的钟型曲线。 l正态分布: l 以均数为中心,中间多,两侧呈对称性逐 渐减少的钟型分布。 70 二、正态分布的特征和曲线下面积分布规律 l1)正态曲线在横轴上方,钟形,且均数所 在处最高;即当X=时,有最大值 2)正态分布以均数为中心,左右对称; 对称轴为直线X=,x取值范围理论上没 有边界(-100 3、抽样遵循随机化的原则 89 l4、根据指标的性质确定是否要分组: l 由于有些医学指标在不同的人群如男女间或 年龄间有所不同,所以在制定医学参考值范围 时,应首先确定指标是否存在不同,如果有不 同,则应分为不同的组分别制定医学参考值范 围。 l 如考虑性别、年龄、民族、地理位置等因素 并加以区分,对不同人群分组制定参考值范围 , l 例如,红细胞数及血红蛋白含量,男女各 异,高原居民与平原不同,在这种情况下,应 分组并保证每组有足够的例数。 90 (二)对选定的参照样本进行准确的测定 1、为保证原始数据可靠,要严格控制检测误差: 包括分析仪器的灵敏度、试剂的纯度、操作技 术及标准的掌握等。 2、必须对测量条件做出统一的规定和说明。 如临床化验参考值范围的制定,应对收集样本 时的环境和生理条件(温度、季节、体育活动强度 、饮食、妊娠等),收集、转运和储藏样品的方法 及时间有明确的规定。 91 有些指标如白细胞数过高或过低均属异常(a) ,故其参考值范围需要分别确定下限和上限,称作 双侧。有些指标如24小时尿糖含量仅在过高(b)、 肺活量仅在过低时为异常(c),只需确定其上限或 下限,称作单侧参考值范围。 (a)白细胞数参考值范围 (b)24小时尿糖参考值范围(c)肺活量参考值范围 (三)决定取单侧范围还是双侧范围值 92 (四)选择 适当的百分范围 参考值的百分范围应根据资料的性质和研究 目的选择,它与诊断阈值有确定的关系。百分范 围的不同将导致不同的假阳性率和假阴性率。 图3-6 正常人和病人数据分布重叠93 daozhelile 94 实际中最好结合正常人和病人的数据分布特点, 权衡假阳性和假阴性的比例,选择一个适当的百 分范围。 若应用是主要目的在于减少假阳性(如确诊病人 ),则参考值范围的百分数范围要取大一些(如 95%或99%);反之,若主要目的在于减少假阴 性(如初筛病人),百分数范围可适当小一些( 如90%或80%)。 95 (五)根据资料的分布类型选用恰当的界值 估计方法 正态分布资料-正态分布法 对数正态分布资料-对数正态分布法 偏态分布资料-百分位数法 96 表9-7 三种参考值值估计计方法的适用对对象和95%参考值值范围围的计计算 资资料类类型统计统计 方 法 双侧侧界限值值单侧单侧 上界值值单侧单侧 下界值值 正态态或近似 正态态分布 正态态分 布法 对对数正态态或 近似对对数正 态态分布 对对数正 态态分布 法 不规则规则 分布百分位数 法 例9-11,表9-2 。X=4.41 (mmol/L), S=1.07(mmol/L).用正态分正态分 布法双侧布法双侧95%95%的参考值范围的上下界限值为:的参考值范围的上下界限值为: 下限下限: 4.41: 4.411.961.07=2.31 1.961.07=2.31 (mmol/L), , 上限上限: 4.41 +1.961.07=6.51 : 4.41 +1.961.07=6.51 (mmol/L) 即该地正常成年男性血清尿素氮浓度95%95%参考值范围:参考值范围:2.316.512.316.51 (mmol/L) 97 例9-12,例9-7表9-5,308名6岁以下儿童尿铅值资料。用 百分位数法计算单侧法计算单侧95%95%参考值范围的上界值。即参考值范围的上界值。即X X95% 95% 尿铅值铅值 (mmol/L) 人数 f 累计频计频 数f 累计频计频 率 (%) (1)(2)(3)(4)=(3)n 027278.77 25548126.30 509517657.14 755523175.00 1003927087.66 1252129194.48 1501230398.38 1755308100.00 合计计308 L=150: 95%组段下限值 fL=291:小于L的累计频数 i=25: 95%组的组距 f95%:=12:95%组频数 故6岁以下儿童尿铅值 单侧单侧95%95%参考值范围为参考值范围为 : 153.33(mmol/L)153.33(mmol/L) 98 小 节节 资资料类类型 描述性统计统计 量95%参考值值范围围的计计算 对对称分布,特别别 是正态态或近似正 态态分布资资料 算术术平均数 方差及标标准差 正态态分布法: 根据正态态分布规规律 双侧侧: 单侧单侧 上界: 单侧单侧 下界: 适用于对对数正态态 或近似对对数正态态 分布资资料 几何平均数 几何标标准差 对对数正态态分布法: 双侧侧: 单侧单侧 上界: 单侧单侧 下界: 分布不规则规则 的资资 料,分散程度大 的资资料 中位数 四分位数间间距 或百分位数 百分位数法:按排序的位置清点位次 双侧侧: P2.5 P97.5 单侧单侧 上界: P95.0 单侧单侧 下界:P5.0 99 第九章 第一讲练习题 实习九 数值变量资料的统计分析(1) pp.379-382 内容 (一) 选择题:1,2,3,9,10。 (二) 思考题:1,2,6。 (三) 应用题:1,2,3。 100 u.00.01.02.03.04.05.06.07.08.09 -3.0.0013.0013.0013.0012.0012.0011.0011.0011.0010.0010 -2.9.0019.0018.0018.0017.0016.0016.0015.0015.0014.0014 -2.8.0026.0025.0024.0023.0023.0022.0021.0021.0020.0019 -2.7.0035.0034.0033.0032.0031.0030.0029.0028.0027.0026 -2.6.0047.0045.0144.0043.0041.0040.0039.0038.0037.0036 -2.5.0062.0060.0059.0057.0055.0054.0052.0051.0049.0048 -2.4.0082.0080.0078.0075.0073.0071.0069.0068.0066.0064 -2.3.0107.0104.0102.0099.0096.0094.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论