统计学第三章平均数与标准差_第1页
统计学第三章平均数与标准差_第2页
统计学第三章平均数与标准差_第3页
统计学第三章平均数与标准差_第4页
统计学第三章平均数与标准差_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学第三章平均数与标准差第一页,共二十五页,编辑于2023年,星期三第一节算术均数和几何均数数值变量资料的统计描述:集中趋势centraltendency和离散趋势tendencyofdispersion平均数average:说明一组观察值(变量值)的集中趋势、中心位置或平均水平。(ameasureoflocation,ameasureofcentraltendency,ameanoranaverage)平均数种类:算术均数arithmeticmean、几何均数geometricmean、中位数median、众数mode、调和均数harmonicmean,H第二页,共二十五页,编辑于2023年,星期三一、算术均数,简称均数mean。统计表示:总体的参数用希腊字母表示,样本的统计量用拉丁字母表示用μ表示总体均数,用表示样本均数(一)不分组资料均数的计算法:直接计算为避免过于复杂,在求和的范围可看清时对sigma不记上下标(dummysuffix),对x也不加下标Themeanisthesumoftheobservationsdividedbythenumberofobservations.第三页,共二十五页,编辑于2023年,星期三(二)分组资料的均数计算法:频数表法P20例3-2,步骤:1、分组和编制频数分布表frequencydistributiontable1)找出观察值中最大值、最小值和极差range2)按极差大小决定组段数、组段和组距classinterval:8~15组,常用极差的1/10取整作组距,组段下限和上限lowlimitandupperlimit应界限分明,无交叉,从下限开始不包括上限,第一组段包括最小,最后组段包括最大观察值3)列表划记tallying:见P20表3-2。频数表可绘成直方图histogram第四页,共二十五页,编辑于2023年,星期三2、加权法weightingmethodx为组中值classmid-value(midpoint)=本组下限与相邻较大组段的下限相加除以2k为组数f为各组的频数,又称权数weight∑f各组频数之总和∑fx为各组组中值与频数乘积之和计算实例见P21第五页,共二十五页,编辑于2023年,星期三3、简捷法short-cutmethod1)在频数表的基础上,以与最大频数相对应的组中值为假定均数x0,assumedorigin2)列出简捷法计算均数用表,d为各组组中值减去假定均数后除以组距i,假定均数对应d为0,向上依次为-1,-2,…向下依次为1,2,…3)将各行f值与d值相乘得df,再求∑df4)求均数*:可以任何一组组中值为假定均数,结果一致,但设在频数最大组或其附近时,计算较简便。计算机更方便第六页,共二十五页,编辑于2023年,星期三二、几何均数geometricmean,简记为G1)资料偏态分布,少数数据过分偏大,(各观察值间呈等比关系),原始数据进行对数变换后为对称分布,如平均潜伏期、平均抗体滴度等资料2)公式P22例3-3,计算抗体滴度的几何均数;该方法计算出的G通常偏小,可在计算反对数前+(lgd)/2第七页,共二十五页,编辑于2023年,星期三3)几何均数的应用几何均数常用于等比资料观察值不能有0观察值不能同时有正值和负值,若全为负先把负号除掉,最后结果前加负号第八页,共二十五页,编辑于2023年,星期三第二节中位数和百分位数一、median用M表示:把变量值按大小顺序排列,居于中间位置的那个数值就是M适用于:偏态或分布不明的资料对称分布时接近均数,偏态分布时更合理(一)未分组资料:P23例3-4,例3-5第九页,共二十五页,编辑于2023年,星期三(二)分组资料:按频数表计算M公式:L中位数所在组的下限W中位数所在组的宽度f中位数所在组的频数(例数)n总频数C中位数所在组的前一组的累计频数cumulativefrequency第十页,共二十五页,编辑于2023年,星期三用累计频数〔百分数〕法寻找中位数所在的组段:累计频数刚大于n/2的组段用内插法linearinterpolation求中位数将W等分为f份,从C至n/2的数值长为(W/f)*(n/2–C)L值累计频数Cn/2第十一页,共二十五页,编辑于2023年,星期三二、百分位数percentile:指将n个观察值从小到大依次排列,再把它分成100等份,对应于r%位的数值即为第r百分位数。通常用Pr表示。中位数即第50百分位数(一)不分组资料的计算方法Pr=xr%(n+1)

当n为150时计算第5百分位数5%(150+1)=7.55个变量值,如第7个变量为15,第8个变量为17,用内插法求x7.55=15+0.55(17-15)=16.1,P5为16.1第十二页,共二十五页,编辑于2023年,星期三(二)分组资料的计算方法percentileisestimatedbylinearinterpolationas(三)要计算多个百分位数时亦用图解法:yaxisiscumulativerelativefrequency,xaxisisobservation(incubationperiod).seeFigure3-2,P25第十三页,共二十五页,编辑于2023年,星期三中位数和百分位数的应用1)中位数常用于描述偏态分布资料的集中位置,反映位次居中的观察值的水平,只受居中变量值波动的影响,对称分布时与均数相同2)百分位数用于描述观察值在某百分位位置时的水平,多个百分位数结合应用可更全面描述分布特征3)百分位数常用于确定医学参考值范围(referenceranges,正常值范围)4)分布中部的百分位数相当稳定,具有较好的代表性,但靠近两端的百分位数只有在样本数足够大时才较稳定。第十四页,共二十五页,编辑于2023年,星期三第三节标准差

standarddeviation一、标准差的意义:SD是表示一套变量值离散程度的指标,均数与标准差结合,能全面反映一套变量值的分布情况。SDisameasureofvariation,scatter,spreadordispersion.离散程度离均差x-x考虑正负值变为离均差的平方考虑观察值的个数则除以n,为方差variance,考虑到V是观察单位的平方,故开方得SD第十五页,共二十五页,编辑于2023年,星期三第十六页,共二十五页,编辑于2023年,星期三由公式可见,当各变量值愈接近均数时,标准差越小,当各观察值远离均数时,标准差越大,所以标准差能说明变量值的离散程度。二、不分组资料的标准差的计算用代数的方法将上述公式简化为P27表3-8计算实例第十七页,共二十五页,编辑于2023年,星期三三、离均差平方和的简化计算离均差平方和sumofsquaresaboutthemean简记为lxx,即离均差平方和或离均差积和sumofproducts计算时,当原始数据比较大时,计算可以减一个数可除一个数,进行简化。第十八页,共二十五页,编辑于2023年,星期三三条规则:1、原始数据减一个数或加一个数时,离均差平方和或积和数值不变2、原始数据除以一个数a,则简化值算出的离均差平方和要乘上一个a2才是原有的离均差平方和3、离均差积和在计算时如将两变量之一(如x),除以一个数a时,则求得之离均差积和要乘以一个a,才是原始数据的离均差积和;如y也同时除以一个数字b,则求得的离均差积和要同时乘以ab第十九页,共二十五页,编辑于2023年,星期三四、分组资料的标准差计算公式:计算实例见P29表3-11五、标准差的应用1、表示变量值的离散程度2、概括地估计变量值的频数分布3、应用于求正常值范围normalrange4、计算标准误5、质量控制第二十页,共二十五页,编辑于2023年,星期三1、表示变量值的离散程度均数相近,单位相同时,标准差大表示变量值分布较分散,反之亦然。比较度量衡单位不同或均数相差悬殊的多组资料的变异度时,需改用变异系数coefficientofvariation,CV表示标准差与均数之比P29-30例3-7,8第二十一页,共二十五页,编辑于2023年,星期三2、正态分布normal(Gaussian)distribution直方图histogram:横轴表示变量值的大小,以各长方块面积代表频数,P30图3-3,当观察例数逐渐增多,组距细分时变一条光滑的曲线,形状近似正态曲线正态曲线:呈对称的钟型,在均数处最高,两侧逐渐低下,两端在无穷远处与底线相靠正态分布的两个参数:正态总体的均数和标准差(μ和σ)。通常用N(μ,σ)表示第二十二页,共二十五页,编辑于2023年,星期三正态曲线的函数式densityfunction:正态曲线下面积分布规律:μ±σ:占全部曲线下面积的68.27%μ±1.64σ:占全部曲线下面积的90.90%μ±1.96σ:占全部曲线下面积的95.00%μ±2.58σ:占全部曲线下面积的99.00%第二十三页,共二十五页,编辑于2023年,星期三3、正常值(参考值referencevalue)范围:医学上常把绝大多数(90%,95%,99%)正常人的某指标值范围称为该指标的正常值范围。资料近似正态或经变量变换后符合正态分布时可用上述面积规律来估计95%正常值范围,偏态资料可用百分位数法。正常人并非完全健康的人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。按实际需要确定上下限或仅上限或仅下限。双侧:1.64,1.96,2.58;单侧:1.28,1.64,2.33第二十四页,共二十五页,编辑于2023年,星期三4、质量控制:为了控制

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论