版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
例
某年某市抽样调查了120名5岁女孩身高(cm),欲了解平均身高是多少?资料分布有什么特点?105.5118.6110.5104.2110.9107.9108.199.1104.8116.5110.4105.7118.2117.0112.3116.5113.2107.9104.8109.6109.1108.1109.4118.2103.9116.0110.199.6109.3107.5108.6100.6108.8103.895.3104.4102.7101.0112.1118.7100.2102.1114.5110.4115.0120.5115.5112.7103.5114.4100.7116.3105.1112.8118.5113.3107.9114.6121.4110.7108.8114.7110.6110.7116.6106.9105.5107.4118.4115.3119.7113.9116.5112.9112.9110.099.5112.7106.7119.1109.6110.7102.8111.3105.2117.0114.9120.0103.4109.3108.8105.7109.0108.8108.1116.4108.3111.0113.0101.4108.7119.1106.2115.2124.098.7106.0114.7111.9107.3104.1109.1108.8111.0106.8120.2105.8103.1105.0115.01第十章数值变量资料的统计分析计量资料:
连续型计量资料:
变量取值为一定范围的任意值,不能一一列举的,比如身高(cm)、体重(kg)等
离散型计量资料:变量取值可以一一列举的,如脉搏数(次/分)2第一节数值变量资料的统计描述
例1
某研究者调查了某地区434名15-64岁少数民族已婚妇女现有子女数,结果发现有子女数0-7人不等,欲了解有不同子女数的分布情况,需要制作频数分布表。频数(frequency):
不同组别内的观察值个数离散型计量资料?连续型计量资料?一、数值变量资料的频数分布31.离散型计量资料的频数表某年某地区434名少数民族已婚妇女现有子女数的频数分布现有子女数频数频率累积频数累积频率
(个)(f)(%)(%)012345671773167604827168合计43440.787.1415.4413.8211.066.223.691.8417720827533538341042643440.7847.9363.3677.1988.2594.4798.16100.0401234567频数现有子女数
52.连续型资料的频数表和频数分布例2某年某市抽样调查了120名5岁女孩身高(cm),资料如下.试通过频数表和频数分布图进行描述.105.5118.6110.5104.2110.9107.9108.199.1104.8116.5110.4105.7118.2117.0112.3116.5113.2107.9104.8109.6109.1108.1109.4118.2103.9116.0110.199.6109.3107.5108.6100.6108.8103.895.3104.4102.7101.0112.1118.7100.2102.1114.5110.4115.0120.5115.5112.7103.5114.4100.7116.3105.1112.8118.5113.3107.9114.6121.4110.7108.8114.7110.6110.7116.6106.9105.5107.4118.4115.3119.7113.9116.5112.9112.9110.099.5112.7106.7119.1109.6110.7102.8111.3105.2117.0114.9120.0103.4109.3108.8105.7109.0108.8108.1116.4108.3111.0113.0101.4108.7119.1106.2115.2124.098.7106.0114.7111.9107.3104.1109.1108.8111.0106.8120.2105.8103.1105.0115.06编制频数表步骤:1.求全距(range,R)(极差):
全部观察值中的最大值与最小值之差.R=124.0-95.3=28.7cm
2.划分组段(区间)
确定组数:8~10组
确定组距:等距分组时,组距=全距/组数确定各组段的上下限:3.统计各组段频数7某市120名5岁女孩身高频数分布组段频数频率累积频数累积频率
(cm)(f)(%)95-98-101-104-107-110-113-116-119-122-1251710182521151571合计120100.0--
0.835.838.3315.0020.8317.5012.5012.505.830.831818366182971121191200.836.6715.0030.0050.8368.3380.8393.3399.17100.08910111213141516171819频数分布图连续型计量资料的频数分布应该绘制直方图直方的面积表示频数的多少,直方面积占总面积的比例表示频率大小横轴---观察变量(组中值)纵轴—频数或频率20频数表和频数图的主要用途1.揭示频数分布的特征2.揭示频数分布的类型对称分布:偏态分布:3.便于发现特大或特小的可疑值4.便于进一步计算统计指标和进行统计分析集中或离散21二、集中趋势的描述例3
现有12名5岁女孩的身高值分别为112.9,99.5,100.7,101.0,112.1,118.7,107.9,108.1,99.1,104.8,116.5,试问平均身高是多少?算术均数(arithmeticmean)简称均数(mean)
22前例2
某年某市抽样调查了120名5岁女孩身高(cm),资料如下.试计算平均数f-频数,X-组中值=(本组下限+下组下限)/2加权法(weightmethod)23某市120名5岁女还身高频数分布组段频数频率累积频数累积频率
(cm)(f)(%)95-98-101-104-107-110-113-116-119-122-1251710182521151571合计120100.0--0.835.838.3315.0020.8317.5012.5012.505.830.8324252627例4
某地5例微丝蚴血症患者治疗7年后,用间接荧光抗体试验测其抗体滴度,其倒数分别为10,20,40,40,160,求平均滴度.n-例数几何均数(geometricmean,G)28例5
某医院预防保健科用流脑疫苗为75名儿童进行免疫接种后,抗体滴度测定结果如下表,求平均滴度。表2.375名儿童的抗体滴度抗体滴度频数(f)1:41:81:161:321:641:1281:256
48163264128256lgX
0.60210.90311.20411.50511.80622.10722.4082滴度倒数
4921201254合计75107.7676flgX2.40848.127925.286130.102021.674410.53609.632829=27.35平均抗体滴度为1:27.3530例6
某研究者测得7名中年知识分子SCL-90得分,分别为:87,90,91,92,95,96,108.试求平均水平.中位数(median,M)31例7
为研究中年知识分子的心理健康状况,某学院对1503名知识分子进行了SCL-90测定,结果如下表,试求平均水平.LM:中位数所在组段下限i:中位数所在组段的组距fM
:中位数所在组段的频数ΣfL:中位数所在组段前一组的累积频数3280-100-120-140-160-180-200-220-240-260-280-300表41503名中年知识分子SCL-90得分SCL-90总分频数44852022613079443091034累积频数448968119413241403144714771486149614991503累积频率29.8164.4079.4488.0993.3596.2798.2798.8799.5399.73100.0033描述集中趋势的指标:1.算术均数(均数,mean)小样本—直接计算大样本–加权法适用条件:特点:各观察值与均数之差(离均差)的总和等于零各观察值离均差平方和最小适用于描述单峰对称分布,特别是正态分布或近似正态分布的资料342.几何均数(geometricmean,G)适用条件:原始观察值呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等。应用时注意事项:
几何均数常用于等比资料或对数正态分布资料
观察值中若有0或负值,则不能直接使用几何均数
观察值一般同时不能有正值和负值353.中位数(median,M)
中位数是将一组观察值按大小顺序排列后,位次居中的观察值适用条件:可用于各种分布的资料正态分布资料:均数=中位数对数正态分布资料:G=M也适用于两端无确切值或分布不明确的资料百分位数(percentile)是一种位置指标,用Px来表示36例2.11
根据表2.1资料求某地区434名少数民族已婚妇女现有子女数的第80百分位数。百分位数(percentile,P)将观察值从小到大排列后处于第X百分位置上的数值,PxLX:第X百分位数所在组段下限i:第X百分位数所在组段的组距fX
:第X百分位数所在组段的频数ΣfL:第X百分位数所在组段前一组的累积频数37某年某地区434名少数民族已婚妇女现有子女数的频数分布现有子女数频数频率累积频数累积频率
(个)(f)(%)(%)012345671773167604827168合计43440.787.1415.4413.8211.066.223.691.8417720827533538341042643440.7847.9363.3677.1988.2594.4798.16100.038三、离散趋势的描述例8
某医学院用自编生存质量量表测量3组同年龄、同性别中年知识分子的躯体功能维度得分。甲组:88910111212
乙组:56810121415丙组:125101518191.极差(全距)=最大值-最小值甲R=12-8=4;乙:R=15-5=10
丙:R=19-1=18
392.四分位数间距四分位数(quartile,Q):是特定的百分位数。即
将1或100等分为4个部分,在第25位、50位、75位3个点上的数值就是四分位数。记作:P25,P50,P75下四分位数=QL=P25上四分位数=QU=P75四分位数间距=QU-QL40方差(variance)
标准差(standarddeviation,SD)离均差:X-µ离均差平方和:总体方差:样本方差:41自由度:degreeoffreedom,(df
)或(n-1)
允许自由取值的变量值个数标准差(SD)方差开方42例2.9
某医学院用自编生存质量量表测量3组同年龄、同性别中年知识分子的躯体功能维度得分。甲组:88910111212
乙组:56810121415丙组:12510151819求标准差?甲组S=1.73
分乙组S=3.87分丙组S=7.52
分43方差和标准差
是描述对称分布,特别是正态分布或近似正态分布资料离散趋势(变异程度)的常用指标方差和标准差越大---变异程度越大例.
某市城区120名5岁女孩身高均数为110.15cm,标准差为5.86cm;体重均数为17.71kg,标准差为1.44kg,请比较离散程度身高:体重:=110.15cm=17.71kgS=5.86cmS=1.44kgCV=5.32%CV=8.13%44例
120名5岁女孩体重的均数和标准差,及5个月女孩的体重的均数和标准差,比较其离散程度.=17.71kgS=1.44kg5岁:5个月:=7.37kgS=0.77kg4.变异系数(coefficientofvariation,CV)也称离散系数CV=8.13%CV=10.45%用途:1.比较计量单位不同的几组资料的离散程度2.比较均数相差悬殊的几组资料的离散程度45小结描述计量资料离散程度的指标有:1.极差(R)2.四分位数间距(Q)Q=QU-QL=P75-P253.方差(S2)
标准差(SD)4.变异系数(CV)46第二节正态分布及其应用正态分布是自然界最常见的一种分布,例如,测量误差、人体的尺寸、许多生化指标的值都近似服从正态分布。正态分布是一种重要的连续型随机变量的概率分布。一.正态分布4748二、正态分布的特征和曲线下面积的规律正态分布的密度函数为:-∞<X<+∞
,总体标准差;,
总体均数;,是常数;e自然对数的底X,随机变量;f(X)是密度函数49F(X)X50
正态分布曲线图形特点:1.曲线在横轴上方均数处最高2.正态分布以均数为中心,左右对称3.有两个参数,即位置参数
和形态参数
51
1
2
3
3
2
1当
固定时,
越小,曲线越陡峭
越大,曲线越低平当
固定时,曲线的位置随
不同而不同不同的
,不同的
对应不同的正态曲线记作N(,2)524.正态密度函数曲线的面积分布有一定的规律(1)正态密度函数曲线与横轴间的面积恒等于1
或100%(总面积=1)(2)正态分布是一种对称分布,其对称轴为直线
X=;对称轴两侧的面积各占50%.
(3)曲线下不同区间的面积是固定的68.27%95.00%99.00%
2.58
53对应于不同的参数和会产生不同位置、不同形状的正态分布。为了应用方便,可以通过变量变换,将正态分布N(,2)转换成
N(0,1)的标准正态分布。
0三.标准正态分布5468.27%95.00%99.00%
2.58
68.27%95.00%99.00%0-1-1.96-2.5811.962.58N(0,1)N(,2)横轴-u值55引入标准变换后,只须制定标准正态曲线下面积分布表,即标准正态分布表(表9-8),对于其他正态分布均可借助标准正态分布表估计任意(X1,X2)范围内的频数比例。例2.17
已知u1=-1.76,u2=-0.25,求标准正态曲线下(-1.76,-0.25)范围内的面积(-1.76,-0.25)=0.4013-0.0392=0.3621例2.18
已知u1=-1.2,u2=1.6,求标准正态曲线下(-1.2,1.6)范围内的面积56例2.19
已知120名女孩身高均数为110.15cm,标准差为5.86cm,现欲估计该市城区某年身高界于104.0-108.0cm
范围内的5岁
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 港口货物下料溜子安装方案
- 制造业员工工资结构优化方案
- 金融行业招聘会安全方案
- LNG储罐保冷项目管理方案
- 阀门防腐工程施工方案
- 2024年酸度调节剂项目评估分析报告
- 铝业烟尘治理设备选型方案
- 2024-2030年中国产业投资基金行业竞争战略及投资商业模式分析报告
- 2024-2030年中国互联网+电子石英谐振器行业发展创新模式及投资战略建议报告
- 2024-2030年中国乳糖酶行业需求趋势及投资风险研究报告
- 2024年强基计划解读 课件-2024届高三下学期主题班会
- 我国区域经济发展战略(二)
- 施工现场的组织与施工管理
- 合肥新站集贸市场规划方案
- 城市道路桥梁工程施工质量验收规范 DG-TJ08-2152-2014
- 内科学白血病教材教学课件
- 生物降解建筑材料PHA薄膜生产技术
- 基层区域医疗信息化(云HIS)解决方案
- 急诊急救知识培训
- T-ZJFS 010-2024 银行业金融机构转型贷款实施规范
- 六年级数学课件-圆的面积【全国一等奖】
评论
0/150
提交评论