版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
变异程度的统计描述第一页,共五十五页,2022年,8月28日离散趋势(dispersiontendency)指标三组同年龄、同性别儿童的体重(kg)
甲组2628303234
乙组2427303336
丙组2629303134
303030第二页,共五十五页,2022年,8月28日
全距表示一群变量值的最大值与最小值之差,反映个体差异的范围,用R表示。全距大,说明变异度大;反之,说明变异度小。甲组2628303234
乙组2427303336R=8R=12全距(range)第三页,共五十五页,2022年,8月28日1.不能全面反映资料的离散程度;2.不稳定,易受极端值的影响,抽样误差大。优点缺点1.表示变异范围,简单明了、容易使用,如用于说明传染病、食物中毒等的最短、最长潜伏期等;2.各种分布类型的资料均可用。全距(range)第四页,共五十五页,2022年,8月28日四分位数间距(quartileinterval)四分位数间距是上四分位数(QU=P75)和下四分位数(QL=P25)之差,用Q表示(QU-QL)。该数值越大,说明变异度越大;反之,说明变异度越小。第五页,共五十五页,2022年,8月28日某地630名正常女性血清甘油三脂含量(mg/dl)甘油三脂频数累计频数累计频率(%)0.10~
27
27
4.30.40~169196
31.10.70~167363
57.61.00~
94457
72.51.30~
81538
85.41.60~
42580
92.11.90~
28608
96.52.20~
14622
98.72.50~
4626
99.42.80~
3629
99.83.10~
1630100.0合计630
-
-第六页,共五十五页,2022年,8月28日
L:组段的下限;iM:组距;fx:频数;
fL:Px所在组段之前的累积频数。
第七页,共五十五页,2022年,8月28日1.与中位数配套,用于偏态分布资料及分布的一端或两端无确切数值的资料;2.比全距稳定。未考虑到每个观察值的变异度。优点缺点四分位数间距(quartileinterval)第八页,共五十五页,2022年,8月28日方差(variance)自由度=n-限制条件的个数,用ν表示。(n-1):当选定时,n个变量值中能自由变动的变量值的个数。第九页,共五十五页,2022年,8月28日二、平均差距指标(一)平均偏差(MeanDifference)
如对于例3.1:甲患者:
乙患者:
特点:直观,易理解;但由于用了绝对值,不便于数学处理,实际中很少使用。
第十页,共五十五页,2022年,8月28日(二)离均差平方和(SumofSquare,SS)
为了克服平均偏差的缺点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平方和,其计算公式为
SS通常作为一个中间统计量使用。第十一页,共五十五页,2022年,8月28日(三)方差(Variance)
方差是将离均差平方和再取平均,即
注意:对于样本资料,分母用的是n-1,称为自由度(degreeoffreedom,df)。方差的特点:便于数学上的处理,但由于有平方,度量衡发生变化,不便于实际应用。第十二页,共五十五页,2022年,8月28日方差越大,资料的离散程度越大(全面考虑了每个观察值);不受观察值个数的影响。优点缺点一些资料不适用于以平方表示。方差(variance)第十三页,共五十五页,2022年,8月28日(四)标准差
(StandardDeviation)
将方差取平方根,还原成与原始观察值单位相同的变异量度即为标准差:
例如对于例3.1经计算有甲患者:
同理乙患者:第十四页,共五十五页,2022年,8月28日例三组同年龄、同性别儿童的体重(kg)甲组2628303234乙组2427303336丙组2629303134标准差直接法第十五页,共五十五页,2022年,8月28日标准差加权法第十六页,共五十五页,2022年,8月28日14岁女孩身高平均值与标准差(cm)加权法计算用表身高(cm)频数(fi)组中值(X)fiXifiXi2124~212625231752128~313039050700132~111341474197516136~221383036418968140~391425538786396144~271463942575532148~161502400360000152~5154770118580156~315847474892160~164216232452488合计130(Σfi)18600(ΣfiXi)2666824(ΣfiXi2)第十七页,共五十五页,2022年,8月28日标准差应用1.表示观察值分布的离散程度。均数相近、度量单位相同的条件下,S越大,观察值的变异程度越大,均数的代表性越差。2.结合均数计算CV。3.结合均数描述正态分布资料的分布特征和估计医学参考值范围4.结合样本含量计算标准误。第十八页,共五十五页,2022年,8月28日(五)变异系数(CoefficientofVariation
)
主要用于对均数相差较大或单位不同的几组观察值的变异程度进行比较。例3.3测得某地成年人舒张压均数为77.5mmHg,标准差为10.7mmHg;收缩压均数为122.9mmHg,标准差为17.1mmHg。试比较舒张压和收缩压的变异程度。第十九页,共五十五页,2022年,8月28日变异系数
Coefficientofvariation(CV)应用1.表示数据分布的相对离散程度2.比较均数相差悬殊的两组或多组资料的离散程度3.比较度量衡单位不同的两组或多组资料的变异程度第二十页,共五十五页,2022年,8月28日某地20岁男子160人,身高均数为166.06cm,标准差为4.95cm;体重均数为53.72kg,标准差为4.96kg。比较身高与体重的变异程度。20岁男子体重的变异程度比身高的变异程度大。第二十一页,共五十五页,2022年,8月28日
某地不同年龄女童的身高(cm)资料如下表所示。试比较不同年龄身高的变异程度。某地不同年龄女童身高的变异程度年龄组人数均数标准差CV(%)1~2月10056.32.13.75~6月12066.52.23.33~3.5岁30096.13.13.25~5.5岁400107.83.33.1第二十二页,共五十五页,2022年,8月28日小结全距与四分位数间距:后者较稳定,但均不能综合反映各观察值的变异程度。标准差:最为常用,对正态分布尤为重要变异系数:可用于多组资料间度量衡单位不同或均数相差悬殊时作变异度的比较。以上指标都是数值越小,说明观察值的变异度越小,均数的代表性越好。平均指标和变异指标常配套使用
如正态分布:均数、标准差;偏态分布:中位数、四分位间距第二十三页,共五十五页,2022年,8月28日练习:
某市1974年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人的发汞含量(μmol/kg)如下:
用何种指标说明本资料的集中位置和变异程度较好?并计算之。
发汞值1.5~3.5~5.5~7.5~9.5~11.5~13.5~15.5~17.5~19.5~人数2066604818166103第二十四页,共五十五页,2022年,8月28日某检验师测定了10名正常成年钢铁工人的血红蛋白值(g/dl)和红细胞数(万/mm3)如下,试比较这两个检测项目的结果哪个变异性大?血红蛋白(g/dL)13.013.614.014.514.614.715.215.515.816.0血细胞数(万/mm3)510515517518520522524525528530第二十五页,共五十五页,2022年,8月28日238名正常人发汞值(μg/g)的频数表发汞值频数累计频数累计频率(%)0.3~20208.40.7~668636.11.1~6014661.31.5~4819481.51.9~1821289.12.3~1622895.82.7~623498.33.1~123598.73.5~023598.73.9~4.33238100.0第二十六页,共五十五页,2022年,8月28日正态分布和医学参考值范围要求:掌握:正态分布及其特征,正态曲线下面积分布的规律。熟悉:医学参考值范围,参考值范围估计的步骤,参考值范围估计的正态分布法和百分位数法。标准正态分布。了解:参考值范围估计的对数正态分布法。第二十七页,共五十五页,2022年,8月28日图3-1某地成年男子红细胞数的分布逐渐接近正态分布示意图一、正态分布(NormalDistribution)正态分布曲线:高峰位于中央,两侧逐渐下降、低平,左右完全对称、两端不与横轴相交的钟型曲线。正态分布:以均数为中心,中间多,两侧呈对称性逐渐减少的钟型分布。第二十八页,共五十五页,2022年,8月28日正态分布的密度函数f(x)为:由上式可见,正态分布的图形由和所决定,X~N(,2)第二十九页,共五十五页,2022年,8月28日主要特征:
1.以为中心的对称分布
2.钟型曲线
3.曲线下面积分布有规律
4.两个参数决定位置和变异
图3-2正态分布曲线下的面积
图3-3三种不同均值的正态分布图3-4三种不同标准差的正态分布第三十页,共五十五页,2022年,8月28日正态曲线下的面积F(x)的计算:第三十一页,共五十五页,2022年,8月28日标准正态变换(u变换)u为标准正态变量或标准正态离差u变换的特点:若X服从正态分布,则u服从标准正态分布标准正态分布:指均数为0、标准差为1的正态分布,记为N(0,1)二、标准正态分布
(StandardNormalDistribution)第三十二页,共五十五页,2022年,8月28日表中曲线下面积为-~u的面积;即P(u)可以利用标准正态分布表求出与原始变量X有关的概率值。第三十三页,共五十五页,2022年,8月28日1.标准正态分布:求曲线下(u1,u2)范围内的面积。
u≤0:①查表,分别求从-∞到u2与从-∞到u1的面积;②两者之差为所求面积。u2u1
u1u2第三十四页,共五十五页,2022年,8月28日例:u1=-1.50,u2=-0.31则(-1.50,-0.31)范围内的面积第三十五页,共五十五页,2022年,8月28日(2)u>0:利用正态分布的对称性求曲线下从-∞到u范围的面积。例:从-∞到u=1.76范围内的面积。1.76-1.760.03921-0.0392=0.96080.0392第三十六页,共五十五页,2022年,8月28日
2.非标准正态分布:求曲线下任意(x1,x2)范围内的面积。第三十七页,共五十五页,2022年,8月28日先作标准正态变换;再查标准正态分布表求得面积。例:已知110名7岁男童身高。现欲估计该地身高界于116.5cm到119.0cm范围内7岁男童比例及110名7岁男童中身高界于此值范围内的人数。第三十八页,共五十五页,2022年,8月28日
(1)标准正态分布变换:
(2)查表得:第三十九页,共五十五页,2022年,8月28日
(3)求D:
估计该地身高界于116.5~119.0cm范围内的7岁男童比例为13.92%;估计110名7岁男童中有15名男童的身高界于116.5~119.0cm范围内。110×13.92%=15第四十页,共五十五页,2022年,8月28日思考题:该地80%的男孩身高集中的范围?第四十一页,共五十五页,2022年,8月28日三、正态分布的应用1.估计频数分布例:出生体重低于2500g为低体重儿。若由某项研究得某地婴儿出生体重均数为3200g,标准差为350g,估计该地当年低体重儿所占的比例。查表,即从-∞到2500的比例为2.28%,故估计该地当年低体重儿所占的比例为2.28%。第四十二页,共五十五页,2022年,8月28日2.制定医学参考值范围(ReferenceValueRange)3.质量控制为了控制实验中的误差,实验室的质量控制中,常以作为上、下警戒限;以作为上、下控制限。(2s和3s是1.96s与2.58s的近似值)。4.统计处理方法的基础第四十三页,共五十五页,2022年,8月28日μ+3σμ+2σμ+σμμ-σμ-2σμ-3σ第四十四页,共五十五页,2022年,8月28日
一、基本概念通常指正常人(排除了对所研究指标有影响的疾病和有关因素的特定人群)的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。主要目的:用于临床疾病诊断。最常用的是95%参考值范围。
第三节医学参考值范围
(ReferenceValueRange)
确定95%参考值范围示意图第四十五页,共五十五页,2022年,8月28日二、医学参考值范围的制定方法
(一)选择足够数量的正常人作为参照样本
选择参照样本必须要考虑可能影响所要制定参考值范围指标的各种疾病及干扰因素,将这些人排除在外。例如在制定血清谷-丙转氨酶活性正常值时,选取正常人的条件为肝、肾、心、脑、肌肉等无器质性疾患,近期无特殊用药史等。同时可能需要考虑性别、年龄、民族、地理位置等因素。样本含量一般要较大,如n>120。第四十六页,共五十五页,2022年,8月28日(二)对选定的参照样本进行准确的测定为保证原始数据可靠,要严格控制检测误差,包括分析仪器的灵敏度、试剂的纯度、操作技术及标准的掌握等,同时必须对测量条件做出统一的规定和说明,如临床化验参考值范围的制定,应对收集样本时的环境和生理条件(温度、季节、体育活动强度、饮食、妊娠等),收集、转运和储藏样品的方法及时间有明确的规定。第四十七页,共五十五页,2022年,8月28日(三)决定取单侧范围还是双侧范围值
有些指标如白细胞数过高或过低均属异常(a),故其参考值范围需要分别确定下限和上限,称作双侧。有些指标如24小时尿糖含量仅在过高(b)、肺活量仅在过低时为异常(c),只需确定其上限或下限,称作单侧参考值范围。(a)白细胞数参考值范围(b)24小时尿糖参考值范围(c)肺活量参考值范围第四十八页,共五十五页,2022年,8月28日(四)选择适当的百分范围参考值的百分范围应根据资料的性质和研究目的选择,它与诊断阈值有确定的关系。百分范围的不同将导致不同的假阳性率和假阴性率。
若主要目的为减少假阳性(如确诊病人)→大减少假阴性(如初筛病人)→小图3-6正常人和病人数据分布重叠第四十九页,共五十五页,2022年,8月28日(五)估计参考值范围的界限参考值范围估计主要有百分位数法和正态分布法。
百分范围(%)
单侧双侧下限上限下限上限
95
P5
P95
P2.5
P97.5
99
P1
P99
P0.5
P99.5百分范围(%)
单侧双侧下限上限下限上限
95
99
表3-2参考值范围所对应的百分位数表3-3参考值范围所对应的正态分布区间第五十页,共五十五页,2022
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 纸制蛋糕顶饰商业机会挖掘与战略布局策略研究报告
- 裘皮外套细分市场深度研究报告
- 河南省开封市金科新未来2024-2025学年高三上学期10月联考数学试题 含解析
- 人流控制栅栏出租行业营销策略方案
- 制罐头用非电压力锅产业链招商引资的调研报告
- 写字台产品供应链分析
- 美容乳液市场发展前景分析及供需格局研究预测报告
- 球棒市场发展前景分析及供需格局研究预测报告
- 电动碾磨机产品供应链分析
- 不间断电源产品供应链分析
- (2024年)特种设备安全法律法规培训课件
- 2024年1月法律文书写作试题与答案
- 建材销售挂靠合同协议书模板
- 医疗器械投标流程
- 试卷讲评课-课件
- 有效的员工离职与替补计划
- 售后服务的重要价值
- 2024AIGC视频生成:走向AI创生时代:视频生成的技术演进、范式重塑与商业化路径探索
- 素养本位下的高中数学大单元整体教学设计实践研究
- 温泉设计方案方案
- 四年级美术 《飞天》【全国一等奖】
评论
0/150
提交评论