![数值变量资料的统计分析专业知识讲座_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-4/24/58e73374-ebf4-4618-86bf-c5a6233a9c5e/58e73374-ebf4-4618-86bf-c5a6233a9c5e1.gif)
![数值变量资料的统计分析专业知识讲座_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-4/24/58e73374-ebf4-4618-86bf-c5a6233a9c5e/58e73374-ebf4-4618-86bf-c5a6233a9c5e2.gif)
![数值变量资料的统计分析专业知识讲座_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-4/24/58e73374-ebf4-4618-86bf-c5a6233a9c5e/58e73374-ebf4-4618-86bf-c5a6233a9c5e3.gif)
![数值变量资料的统计分析专业知识讲座_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-4/24/58e73374-ebf4-4618-86bf-c5a6233a9c5e/58e73374-ebf4-4618-86bf-c5a6233a9c5e4.gif)
![数值变量资料的统计分析专业知识讲座_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-4/24/58e73374-ebf4-4618-86bf-c5a6233a9c5e/58e73374-ebf4-4618-86bf-c5a6233a9c5e5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 1 统计描述统计描述 统计分析统计分析 统计推断统计推断 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 2 统计描述 统计分析统计分析 统计推断 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 3 表9-1 某地140名健康成年男子的血清尿素氮浓度 (nmol/L )资料。 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 4
2、 表表9-1 某地区140名健康成年男性血清尿素氮浓度 (nmol/L) 6.00 5.28 3.90 5.30 4.20 3.90 5.60 5.66 4.10 4.00 4.50 3.77 4.34 4.30 4.22 5.30 5.13 3.79 4.80 5.20 4.70 2.94 5.90 4.50 2.10 5.60 5.90 2.85 4.90 4.22 5.63 3.21 4.66 3.00 5.96 3.45 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3、 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.02 2.69 2.52 5.21 6.55 4.28 4.45 5.15 4.45 5.37 3.80 3.73 4.49 2.44 2.76 3.33 3.01 6.43 3.55 2.63 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 5 第一节 数值变量资料的统计描述 【例9-1】某地用随机抽样的方法对140名健康成 年男性血清尿素氮( BUN)浓度进行了检测, 资料如下,请描述男性血清尿素氮的情况。资料
4、如下,请描述男性血清尿素氮的情况。 表9-1的140个数据,无论多认真审视,也说不清 这些女孩身高的情况怎样、特征如何 统计描述 就是解决此问题的方法,即用统计表、 统计图和统计指标来描述样本数据的特征 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 6 表表9-1 某地区140名健康成年男性血清尿素氮浓度 (nmol/L) 6.00 5.28 3.90 5.30 4.20 3.90 5.60 5.66 4.10 4.00 4.50 3.77 4.34 4.30 4.22 5.30 5.13 3.79 4.80 5.20 4.70 2.9
5、4 5.90 4.50 2.10 5.60 5.90 2.85 4.90 4.22 5.63 3.21 4.66 3.00 5.96 3.45 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.02 2.69 2.52 5.21 6.55 4.28 4.45 5.15 4.45 5.37 3.80 3.73 4.49 2.44 2.76 3.33 3.01
6、 6.43 3.55 2.63 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 7 一、数值变量资料的频数分布一、数值变量资料的频数分布 频数(frequency ): 变量值出现的次数,即例数 频数表(frequency distribution table): 反映变量值与频数之间关系的统计表 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 8 表9-2 某地区140名健康成年男性血清尿素氮浓度 (nmol/L) 频数表 尿素氮浓度 频数 频率(%) 2.00 2 1.43 2.
7、40 7 5.00 2.80 13 9.29 3.20 14 10.00 3.60 15 10.71 4.00 19 13.57 4.40 18 12.86 4.80 16 11.43 5.20 14 10.00 5.60 13 9.29 6.00 6 4.28 6.406.80 3 2.14 合计 140 100.00 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 9 频数表的制作步骤:频数表的制作步骤: 1. 计算极差(range): 本例R6.55-2.10=4.45(nmol/L) 2. 决定组数、组段和组距(取方便数) 3列表
8、划记:见表 9-2。 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 10 表表9-2 某地区140名健康成年男性血清尿素氮浓度 (nmol/L) 频数表 尿素氮浓度 划记 频 数 频率 (%) 累计频率 (%) 2.00 T 2 1.43 1.43 2.40 正 T 7 5.00 6.43 2.80 正正 F 13 9.29 15.71 3.20 正正 14 10.00 25.71 3.60 正正正 15 10.71 36.43 4.00 正正正 19 13.57 50.00 4.40 正正正 F 18 12.86 62.86 4.80
9、 正正正 16 11.43 74.29 5.20 正正 14 10.00 84.29 5.60 正正 F 13 9.29 93.57 6.00 正 6 4.28 97.86 6.406.80 F 3 2.14 100.00 合计 140 100.00 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 11 从频数表可看出有两个重要的特征:从频数表可看出有两个重要的特征: 集中趋势(central tendency ): 多数数据向中间集中 离散趋势(tendency of dispersion): 少数数据向两端分散 本文档所提供的信息仅供
10、参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 12 (二) 频数分布图(直方图)及其制作 频数分布图: 反映变量值与频数之间关系的统计图(直方图)。 将表9-2资料绘制成频数分布图(图 9-1),可见图形 中间高两边低、两边对称 ,认为近似服从正态分布。 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 13 图9-1 140名健康成年男性血清BUN浓度频数分布图 0 5 10 15 20 2.002.803.604.405.206.00 BUN(nmol/L) 频频 数数 本文档所提供的信息仅供参考之用
11、,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 14 (三)频数表与频数图比较 频数表不够直观,但读出数据精确 频数图比较直观,但读出数据不精确 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 15 (四) 分布类型简述 正态分布: 图9-1可称为正态或近似正态分布(后 述) 对数正态分布:对数正态分布:指数据的对数值呈正态分布指数据的对数值呈正态分布 偏态分布: 若高峰位于一侧,便被称之为偏态分 布(高峰偏左为正偏态,反之为负偏态) 分类意义:不同分布类型资料,其描述性统计方 法不同(应对号入座) 本文档所提供
12、的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 16 图9-2 频数分布逐渐向正态分布接近 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 17 二、平均水平指标二、平均水平指标 平均数(average ):描述数值变量资料平均水 平(或集中趋势)的指标。 平均数种类: 算术平均数(简称均数)、几何 平均数、中位数,另有众数以及调和均数。 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 18 (一)均数(mean) 均数符号:总体均数为?(
13、读作mu),样本均数为 1直接法计算均数: ( 9-1 ) ?为求和的符号,读作sigma ,xi为观察值,n为例数 【例9-2】10名女孩的身高(cm)的平均值为 142.2(cm) ?10/ )6 .1371 .148.1 .1388 .1263 .1514 .132(x n xxx n x x n i? ? ? ? 21 X 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 19 2加权法计算均数 加权法(频数表法)基本思想:以组中值代表 组内的变量值(近似法),简化计算 计算:表9-3中?f ixi=616.80,?fi =140,
14、得 (9-2) n nn i ii fff xfxfxf f xf x ? ? ? ? ? ? ? 21 2211 41. 4 140 80.616 ?x (nmol/L ) 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 20 【注】直接法计算得均数为 4.38 (nmol/L ) ,可 见加权法近似效果很好 。 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 21 (二)几何均数(geometric mean) 定义:是将n个观察值 x的乘积再开 n次方,所得 的平方根,记为 G
15、 适用情形: (1)观察值呈倍数关系(等比级数资料)或近似 倍数关系,如抗体滴度; (2)对数正态资料。 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 22 1直接法: n n xxxG? 21 ? ) lg (lg) lglglg (lg 1 21 1 n x n xxx i n? ? ? ? ? ? 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 23 【例9-3】8份血清的抗体效价为 1:200,1:25,1:400,1:800,1:50,1:100, 1:50,1:25 平
16、均抗体效价为 8/ )25lg400lg25lg200 (lg lg 1 ? ? ?G =lg-12=100 即 1 : 100 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 24 2加权法:加权法: ) lg (lg 1 ? ? ? i ii f xf G ) lglglg (lg 2211 1 ? ? ? ? i nn f xfxfxf? (9-4) 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 25 例9-4 112名儿童接种疫苗一月后 的血清 抗体效价为: 1人1:4,3
17、人1:8,15人1:16,32人1:32, 43人1:64,11人1:128,5人1:256,2人 1:512, 得得 55.47) 112 8415.187 (lg ) 25.1531 512lg2256lg5.16lg158lg34lg (lg 1 1 ? ? ? ? ? ? G 即这112名儿童的血清平均抗体效价为1:48 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 26 【注】计算几何均数的观察值不能小于或等 于0,因为无法求对数。 先加上一常数即可,如X=KX,则X 可取对数。 最终的几何均数结果:G = GK 本文档所提供
18、的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 27 (三)中位数(median ) 与百分位数(percentile ) 中位数:一组观察值按大小顺序排列,位置居中的那 个数值称为中位数,记为 M。 百分位数: 一组数据从小到大排列,并分成 100等份, 第x等份之分割位置的数值称为第x百分位数 ,记为 P x 例如:x=50,记为P 50,读作“第五十百分位数” (即中位数) 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 28 适用情形:适用情形: 适用于任意分布,常用于 : 偏态分布(如
19、发汞、尿铅); 一端或两端无确定数值; 分布情况不明。 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 29 常用百分位数:常用百分位数: P50,P25,P75,P5,P95,P2.5,P97.5 怎样求解中位数和百分位数? 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 30 1中位数的直接估计: n为奇数时,正中位置的数值就是 M; MX(n+1)/2 1,2,6,10,19 n为偶数时,居中位置两个数值的平均数就是 M。 M Xn/2Xn/2+12 2,4,8,10,15,2
20、0 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 31 2中位数和百分位数的频数表法: (%) xL x i PLnxf f ? L为百分位数对应组段的下限值, i为该组 段的组距, fx为该组段频数, ? fL为前一组 累计频数 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 32 三、离散程度指标三、离散程度指标 平均指标描述样本数据的集中趋势(一般水平) 变异指标描述样本数据的离散趋势(差别大小) 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处
21、,请联系本人或网站删除。 33 (一)全距(一)全距(range) 全距用 R表示,是最大值与最小值之 差(又称极差)。差(又称极差)。 优点 简便; 缺点 不稳健(重复抽样时结果变化 很大),因只利用了2个数据的信息。 应用 一般分析。 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 34 (二)四分位数间距(quartile interval) 四分位数间距用Q表示,是上四分位 数QU(P75)和下四分位数QL(P25) 之差(中间半数个体的全距)。 优点 比全距稍稳健; 缺点 多数数据的信息仍未利用; 应用 偏态分布资料。 本文档所
22、提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 35 【例9-7】 用表9-5的资料计算四分位数间 距得: 77. 0)81%25340( 42 25. 0 75. 0? L Q ( mol/L ) 75. 1)219%75340( 36 25. 0 50. 1? U Q 98. 077. 075. 1? LU QQQ ( mol/L ) ( mol/L ) 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 36 (三)方差与标准差 方差(variance ):离均差平方的均值 N X ? ?
23、 ? 2 2 )(? ?(9-8) 1 )( 2 2 ? ? ? ? n XX S (9-9) 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 37 * ? 2为总体方差,S2为样本方差 * 方差利用了所有数据的信息,反映平均差别 (但量纲是平方单位) * 式(9-7)中“n1” 为自由度,数理统计认 为用自由度作分母较好( 无偏估计) * 标准差(standard deviation ):方差的平 方根便是标准差,其实质是离均差的均值,反 映平均差别大小 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请
24、联系本人或网站删除。 38 方差开平方后,使平方单位变为普通的度量单位 ?为总体标准差, S为样本标准差 方差和标准差的意义:都反映资料的变异程度大小 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 39 标准差的用途: 反映一组观察值的离散程度 用于计算变异系数 计算标准误(见第三节) 估计参考值的范围(见第二节) 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 40 (四)变异系数(coefficient of variation) 记为CV 【例9-10】 某地某地40名7岁儿
25、童身高均数为 121.48cm , 标准差为4.65cm; 体重均数为22.18kg ,标准差 2.35kg。试比较其身高和体重的变异程度。试比较其身高和体重的变异程度。 应用:应用: (1) 变量的度量单位不同; (2) 变量的度量单位相同,但是均数的数 量级相差悬殊。 %100? x S CV (9-11) 身高CV=3.83%,体重CV=10.60% 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 41 小 结 1.统计工作基本步骤 2. 医学统计的基本概念 同质和变异;总体和样本; 参数和统计量;变量;误差;概率 3. 统计资料的
26、类型 4. 数值变量资料的统计描述方 算术均数、几何均数、中位数 全距、四分位数间距、方差 /标准差、变异系数 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 42 再再 见见 ! 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 爱是什么? 一个精灵坐在碧绿的枝叶间沉思。 风儿若有若无。 一只鸟儿飞过来,停在枝上,望着远处将要成熟的稻田。 精灵取出一束黄澄澄的稻谷问道:“你爱这稻谷吗?” “爱。” “为什么?” “它驱赶我的饥饿。它驱赶我的饥饿。” 鸟儿啄完稻谷,轻轻梳理着光润的羽毛
27、。 “现在你爱这稻谷吗?”精灵又取出一束黄澄澄的稻谷。 鸟儿抬头望着远处的一湾泉水回答:“现在我爱那一湾泉水,我有点渴了。” 精灵摘下一片树叶,里面盛了一汪泉水。 鸟儿喝完泉水,准备振翅飞去。 “请再回答我一个问题,”精灵伸出指尖,鸟儿停在上面。 “你要去做什么更重要的事吗?我这里又稻谷也有泉水。” “我要去那片开着风信子的山谷,去看那朵风信子。” “为什么?它能驱赶你的饥饿?” “不能。” “它能滋润你的干渴?它能滋润你的干渴?” “不能。不能。”爱是什么?爱是什么? 一个精灵坐在碧绿的枝叶间沉思。 风儿若有若无。 一只鸟儿飞过来,停在枝上,望着远处将要成熟的稻田。 精灵取出一束黄澄澄的稻谷
28、问道:“你爱这稻谷吗?” “爱。爱。” “为什么?” “它驱赶我的饥饿。它驱赶我的饥饿。” 鸟儿啄完稻谷,轻轻梳理着光润的羽毛。 “现在你爱这稻谷吗?”精灵又取出一束黄澄澄的稻谷。 鸟儿抬头望着远处的一湾泉水回答:“现在我爱那一湾泉水,我有点渴了。” 精灵摘下一片树叶,里面盛了一汪泉水。 鸟儿喝完泉水,准备振翅飞去。 “请再回答我一个问题,”精灵伸出指尖,鸟儿停在上面。 “你要去做什么更重要的事吗?我这里又稻谷也有泉水。” “我要去那片开着风信子的山谷,去看那朵风信子。” “为什么?它能驱赶你的饥饿?” “不能。” “它能滋润你的干渴?它能滋润你的干渴?” “不能。” 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 其实,世上最温暖的语言,“ 不是我爱你,而
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新版通 用规范对设计影响交流分享
- 2025年抚顺师范高等专科学校高职单招高职单招英语2016-2024历年频考点试题含答案解析
- 山西省孝义市高三上学期入学摸底考试语文试题(含答案)
- 沪教版(上海)七年级地理第一学期中国区域篇(上)1.2《台湾省》听课评课记录
- 中班幼儿系列活动策划方案五篇
- 2025年科学仪器行业技术革新与发展前景
- 钢材购销合同范文年
- 代偿协议与担保合同
- 跨境贸易线上支付服务合同
- 投资公司借款的合同样本
- 医保政策与健康管理培训计划
- 无人化农场项目可行性研究报告
- 2024届上海市金山区高三下学期二模英语试题(原卷版)
- 学生春节安全教育
- 2024-2025年校长在教研组长和备课组长会议上讲话
- 宏观利率篇:债券市场研究分析框架
- 桥梁顶升移位改造技术规范
- 六年级语文(上册)选择题集锦
- 《游戏界面设计专题实践》课件-知识点5:图标绘制准备与绘制步骤
- MOOC 材料科学基础-西安交通大学 中国大学慕课答案
- 复产复工试题含答案
评论
0/150
提交评论