![卫生统计学-卫统4定量资料的统计描述课件_第1页](http://file4.renrendoc.com/view11/M02/14/35/wKhkGWXAgGeAReTZAAFtr_crn1Q851.jpg)
![卫生统计学-卫统4定量资料的统计描述课件_第2页](http://file4.renrendoc.com/view11/M02/14/35/wKhkGWXAgGeAReTZAAFtr_crn1Q8512.jpg)
![卫生统计学-卫统4定量资料的统计描述课件_第3页](http://file4.renrendoc.com/view11/M02/14/35/wKhkGWXAgGeAReTZAAFtr_crn1Q8513.jpg)
![卫生统计学-卫统4定量资料的统计描述课件_第4页](http://file4.renrendoc.com/view11/M02/14/35/wKhkGWXAgGeAReTZAAFtr_crn1Q8514.jpg)
![卫生统计学-卫统4定量资料的统计描述课件_第5页](http://file4.renrendoc.com/view11/M02/14/35/wKhkGWXAgGeAReTZAAFtr_crn1Q8515.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卫生统计学-卫统4定量资料的统计描述课件定量资料基本概念与特点集中趋势描述指标离散程度描述指标偏态与峰态分布特征描述正态性检验方法及应用场景异常值识别与处理策略contents目录01定量资料基本概念与特点定量资料是指用数值大小表示的观察值,通常包括计量资料和等级资料。定义计量资料等级资料用测量或计数手段得到的数值变量,如身高、体重、血压等。将观察对象按照某种属性或特征的程度或等级进行分组,如病情轻重、疗效等级等。030201定量资料定义及分类数值性连续性离散性可变性定量资料特点分析01020304定量资料以数值形式表示,可以进行数学运算和统计分析。许多定量资料是连续的,可以取任何数值,如身高、体重等。部分定量资料是离散的,只能取整数或特定数值,如人口数、病例数等。定量资料在不同个体或不同时间可能存在差异,具有可变性。常见数据类型举例如身高、体重、血压等生理指标,在一般人群中呈正态分布。如医学研究中某些生化指标,可能呈偏态分布。如某疾病的发病率、死亡率等,属于二项分布范畴。如单位时间内某事件的发生次数,符合泊松分布特点。正态分布资料偏态分布资料二项分布资料泊松分布资料02集中趋势描述指标定义计算公式适用范围特性算术均数所有观察值相加后除以观察值个数所得的商。适用于对称分布,特别是正态分布的资料。算术均数=总和/观察值个数算术均数易受极端值影响,对于偏态分布资料,算术均数的代表性较差。0102几何均数定义n个观察值连乘积的n次方根。几何均数计算公式几何均数=(x1*x2*...*xn)^(1/n)中位数定义将一组观察值按大小顺序排列,位于中间位置的数。中位数计算若观察值个数为奇数,则中位数是位于中间的数;若为偶数,则中位数是中间两个数的平均数。适用范围几何均数适用于反映一组经对数转换后呈对称分布的变量在数量上的平均水平;中位数适用于各种分布类型的资料,尤其适用于偏态分布资料和分布不确定的资料。030405几何均数与中位数0102众数定义一组观察值中出现次数最多的数。众数计算直接观察或计算频数分布表。百分位数定义将一组观察值按大小顺序排列,某一百分位置的数。百分位数计算确定百分位位置,查找对应数值。适用范围众数适用于各种分布类型的资料,常用于描述分类资料的集中趋势;百分位数常用于描述定量资料的观察值在某一百分位置的水平,如百分位数间距可用于描述离散程度。030405众数与百分位数03离散程度描述指标一组数据的最大值与最小值之差,反映数据的波动范围。极差上四分位数与下四分位数之差,反映中间50%数据的离散程度。四分位数间距极差与四分位数间距各数据与均数之差的平方和的平均数,反映数据的离散程度。方差的算术平方根,与原始数据单位相同,更直观地反映数据的离散程度。方差与标准差标准差方差变异系数标准差与均数之比,用于比较不同单位或均数相差较大的几组数据的离散程度。意义消除单位或均数对离散程度比较的影响,使得不同组数据间的离散程度比较更为客观。变异系数及其意义04偏态与峰态分布特征描述偏态分布概念偏态分布是指频数分布不对称,集中位置偏向一侧的分布。根据集中位置偏向的不同,可分为左偏态分布和右偏态分布。判断方法通过计算偏态系数(skewness)来判断分布是否偏态。偏态系数大于0为右偏态,小于0为左偏态,等于0为对称分布。偏态分布概念及判断方法峰态分布是指频数分布峰的尖锐程度或扁平程度。根据峰的形状不同,可分为尖峰分布、平峰分布和标准峰分布。峰态分布概念通过计算峰态系数(kurtosis)来判断分布是否峰态。峰态系数大于3为尖峰分布,小于3为平峰分布,等于3为标准峰分布。判断方法峰态分布概念及判断方法对集中趋势的影响偏态分布时,算术均数受极端值影响较大,中位数和几何均数相对稳定。峰态分布时,算术均数相对稳定,但中位数和几何均数可能受极端值影响。对离散程度的影响偏态分布时,标准差受极端值影响较大,四分位数间距相对稳定。峰态分布时,标准差相对稳定,但四分位数间距可能受极端值影响。对统计推断的影响在进行参数检验或非参数检验时,需要考虑样本数据是否服从正态分布或近似正态分布。如果数据呈现明显的偏态或峰态分布,可能会影响检验结果的准确性和可靠性。因此,在进行统计推断前,需要对数据的分布形态进行检验和评估。偏态和峰态对数据分析影响05正态性检验方法及应用场景
图形法直观判断正态性直方图通过绘制数据的直方图,观察数据分布形态,若呈现钟型或近似钟型,可初步判断为正态分布。P-P图与Q-Q图将数据与理论的正态分布进行比较,若点基本在一条直线上,则数据近似服从正态分布。箱线图通过箱线图判断数据分布的偏态和异常值情况,辅助判断正态性。数值法精确检验正态性适用于大样本数据,通过比较经验分布函数与理论正态分布函数的差异来检验正态性。Kolmogorov-Smirnov检验计算数据的偏度和峰度,若偏度接近0且峰度接近3,则数据近似服从正态分布。偏度与峰度检验适用于小样本数据,通过比较样本数据与理论正态分布的差异来检验正态性。Shapiro-Wilk检验作出推断结论根据P值与显著性水平的比较结果,作出是否拒绝原假设的推断结论。确定P值根据检验统计量的值和设定的显著性水平,确定P值。计算检验统计量根据所选的检验方法计算相应的检验统计量。提出假设设定原假设H0(数据服从正态分布)和备择假设H1(数据不服从正态分布)。选择检验方法根据样本量大小和数据特征选择合适的检验方法。正态性假设检验流程06异常值识别与处理策略异常值是指在数据集中明显偏离其他数据点的观测值,可能是由于测量错误、数据录入错误或自然变异等原因产生的。异常值定义如仪器故障、操作不当等。测量误差如数据输入时的手误、数据格式错误等。数据录入错误某些观测值本身就属于极端情况,如生物学上的异常个体。自然变异异常值定义及产生原因通过绘制箱线图,观察数据分布,异常值通常位于箱体的外部。箱线图法Z-score法IQR法其他方法计算每个观测值的Z-score,将Z-score超过一定阈值(如±3)的观测值视为异常值。计算四分位距(IQR),将小于Q1-1.5*IQR或大于Q3+1.5*IQR的观测值视为异常值。如MAD法、Tukey'sFences等。异常值识别方法介绍处理异常值策略探讨保留异常值若异常值为真实观测结果且符合研究目的,可将其保留在数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届高中语文一轮复习学案33 诗歌比较阅读鉴赏(含答案)
- 电子政务对政府工作效率的促进作用研究
- 高三下学期校长发言稿
- 订婚宴嘉宾代表发言稿
- 企业上半年总结
- 知识产权法律体系及管理框架
- 机械设备租赁安全协议书范本
- 电商平台用户体验提升与盈利能力增长研究
- 多人合伙股东协议书范本
- 白领营养保健与心理调适的双重策略
- 医院组织药品集中采购和使用工作制度及应急预案
- 旋挖抗滑桩安全专项施工方案(完)
- 二年级上册美术课件-8.摆花样 |人美版(2014秋) (共35张PPT)
- 钉钉品牌设计规范手册
- 砂土袋挡墙施工方案
- 住院患者长嘱口服药发药流程 内科
- GB∕T 19924-2021 流动式起重机 稳定性的确定
- 员工入职登记表
- 黑龙江普通专升本考试基础英语试卷(补考)
- 中国青年气候意识与行为调研报告2020
- 房产部经纪人岗前培训——税费计算ppt课件
评论
0/150
提交评论