统计学:第三章数据分布特征的描述_第1页
统计学:第三章数据分布特征的描述_第2页
统计学:第三章数据分布特征的描述_第3页
统计学:第三章数据分布特征的描述_第4页
统计学:第三章数据分布特征的描述_第5页
已阅读5页,还剩126页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

河北工程大学经济管理学院主讲:岳志春yuezhichun@163.com统计学2/4/20231河北工程大学经济管理学院第三章数据分布特征的描述本章内容:进一步分析数据分布特征和变化规律,用代表值从集中、离散趋势描述数据的分布特征,重点掌握这些代表值的计算、特点和应用场合。2/4/20232河北工程大学经济管理学院第三章数据分布特征的描述本章分四节:第一节分布集中趋势的测度;第二节分布离散程度的测度;第三节分布偏态与峰度的测度;第四节统计表与统计图。

2/4/20233河北工程大学经济管理学院第一节分布集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的倾向,对其测度就是找到其代表值。本节需要把握五个问题:一、众数;二、中位数;三、均值;四、几何平均数;五、众数、中位数、均值的比较。2/4/20234河北工程大学经济管理学院一、众数把握三个问题:1、众数的概念;2、众数的确定与计算;3、众数的统计思想。2/4/20235河北工程大学经济管理学院

1、众数的概念(1)众数是一组数据中出现次数最多的变量值。在统计实践中有时用众数说明现象的一般水平,如了解市场需求量多的服装款式。(2)从分布看,它是数据分布的最高峰点,若没有最高峰点,众数可以不存在,也可以有多个高峰点,对应多个众数。看图3-1:2/4/20236河北工程大学经济管理学院

图3-1众数示意图2/4/20237河北工程大学经济管理学院

(1)未分组数据或单变量值分组数据:找出出现次数最多的变量值。(2)组距分组数据:众数数值与其相邻两组的频数分布有关。设众数组的频数为f,前一组频数为f-1,后一组频数为f+1。A、图形确定:从众数组直方图的两顶角向相邻两组直方图的两顶角引直线,其交点向横轴引垂线,交点为众数。看图3-2:2、众数的确定与计算2/4/20238河北工程大学经济管理学院图3-2众数与相邻两组的关系示意图当f-1=f+1时如图(a),当f-1>f+1时如图(b),当f-1<f+1时如图(c)。(a)(b)(c)2/4/20239河北工程大学经济管理学院2、众数的确定与计算(2)组距分组数据:B、公式计算:上限公式下限公式M0表示众数,L表示众数组的下限值,U表示众数组的上限值,i表示众数组的组距。看下例:2/4/202310河北工程大学经济管理学院例3-1:根据第二章表2-3的数据,计算50名工人日加工零件数的众数。解:众数组为120~125,其频数为14,根据公式计算众数为:2/4/202311河北工程大学经济管理学院(3)公式计算的假定:数据分布具有明显的集中趋势,同时假定众数组的频数在该组内是均匀分布的。若假定不存在,众数的代表性会很差。2、众数的确定与计算2/4/202312河北工程大学经济管理学院

3、众数的统计思想在一组数据的中心点附近,变量值出现的频数较高,根据众数组及相邻两组的频数分布,确定中心点的位置。因此,众数是一个位置代表值,它不受数据中极端值的影响。2/4/202313河北工程大学经济管理学院

二、中位数把握以下三个问题:1、中位数的概念;2、中位数的计算;3、中位数的特点与性质。2/4/202314河北工程大学经济管理学院1、中位数的概念它是一组数据按大小排序后,处于中间位置上的变量值。中位数将全部数据等分成两部分,一部分数据比中位数大,另一部分比中位数小,它也是一个位置代表值。2/4/202315河北工程大学经济管理学院2、中位数的计算(1)根据未分组数据计算:A、先对数据排序;B、确定中位数的位置,公式为(N+1)/2,N为数据的个数;C、确定具体数值。设一组数据为X1,X2,…,XN,从小到达排序后为X(1),X(2),…,X(N),若N为奇数,则中位数为;若N为偶数,则中位数是与的平均数.设中位数为M0,公式为:2/4/202316河北工程大学经济管理学院2、中位数的计算当N为奇数时:当N为偶数时:

例如,根据第二章例2-1的数据,计算50名工人日加工零件数的中位数。其位置在(50+1)/2=25.5,中位数在第25、26个数值之间,即Me=(123+123)/2=123(件)。2/4/202317河北工程大学经济管理学院

2、中位数的计算(2)根据分组数据计算:A、先根据公式确定中位数的位置,并确定其所在组,然后公式计算:2/4/202318河北工程大学经济管理学院公式下限公式:上限公式:式中:为数据的个数,L、U为中位数所在组下限、上限,Sm-1为中位数所在组以前各组的向上累积频数,Sm+1为中位数所在组之后各组的向下累积频数,fm为中位数所在组的频数,i为中位数所在组的组距。2/4/202319河北工程大学经济管理学院

2、中位数的计算

(2)根据分组数据计算;B、例3-2根据第二章表2-6的数据,计算50名工人日加工零件数的中位数。解:中位数的位置=50/2=25,即它在120~125一组,L=120,U=125,Sm-1=16,Sm+1=20,fm=14,i=5,代入公式得:

2/4/202320河北工程大学经济管理学院

例3-2:

这样计算假定中位数所在组频数分布是均匀的。2/4/202321河北工程大学经济管理学院

3、中位数的特点与性质(1)特点:稳健性,其数值不受极值的影响。(2)性质:各变量值与中位数的离差绝对值之和最小,即2/4/202322河北工程大学经济管理学院

三、均值把握五个问题:1、均值的概念;2、根据未分组数据计算均值;3、根据分组数据计算均值;4、均值的重要性;5、调和平均数—均值的另一形式。2/4/202323河北工程大学经济管理学院1、均值的概念又称算术平均数,它是全部数据的算术平均,是集中趋势的最主要测度值。根据数据表现形式不同,均值的计算不同。2/4/202324河北工程大学经济管理学院2、根据未分组数据计算均值(1)公式:设总体数据为X1,X2,…,XN,样本数据x1,x2,…xn,总体均值和样本均值的计算公式分别为:2/4/202325河北工程大学经济管理学院2、根据未分组数据计算均值(2)例子:根据第二章例2-1的数据,计算50名工人日加工零件数的均值为:这种方法计算又称简单算术平均,均值受变量值大小影响。2/4/202326河北工程大学经济管理学院3、根据分组数据计算均值(1)公式:设原始数据被分成K或k组,各组变量值为X1,X2,…,XK,或x1,x2,…,xk,各组变量值出现的频数分别为F1,F2,…,FK,或f1,f2,…,fk,则总体均值和样本均值的计算公式为:2/4/202327河北工程大学经济管理学院公式2/4/202328河北工程大学经济管理学院3、根据分组数据计算均值(2)例3-3:根据第二章表2-3的数据,计算50名工人日加工零件数均值。解:计算见表3-1。

表3-1某车间50名工人日加工零件数均值计算表按零件数分组组中值(Xi)频数(Fi)

XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计-506160.02/4/202329河北工程大学经济管理学院

例3-3:根据(3.6)式得:这样计算用各组组中值代表各组实际数据,假定各组数据在组内均匀分布,与简单算术平均结果122.98比,差0.22件,是牺牲精度换来计算方便。2/4/202330河北工程大学经济管理学院3、根据分组数据计算均值(3)这种算法又称加权算术平均或加权均值,均值大小受各组变量值Xi大小影响,又受各组变量值出现频数多少(权数Fi大小)的影响。如果某一组的权数较大,说明该组数据较多,它对均值的影响就越大;反之,则越小。我们再看(3.6)式的变形公式。2/4/202331河北工程大学经济管理学院(3.6)式的变形

由上式知道,加权均值受各组变量值(Xi)大小和各组权数Fi/

大小的影响。当掌握数据不是频数,而是频率时,可用上式计算均值。2/4/202332河北工程大学经济管理学院4、均值的重要性(1)从统计思想看,均值是一组数据的重心,是数据误差相互抵消的结果。(2)均值的重要数学性质:A、各变量值与其均值的离差之和为零,即:B、各变量值与其均值的离差平方和最小,即:2/4/202333河北工程大学经济管理学院5、调和平均数—均值的另一形式(1)又称调和均值,实际工作中由于所获数据不同,有时不能直接采用均值公式计算这时需用调和平均数形式计算。(2)例子:某蔬菜批发市场三种蔬菜的日成交额数据见下表,计算三种蔬菜该日的平均批发价格。2/4/202334河北工程大学经济管理学院表:某日三种蔬菜的批发成交数据蔬菜名称批发价(元)

X

I成交量(㎏)

Fi成交额(元)

XiFi甲乙丙1.200.500.80

1500025000800018000125006400合计-48000369002/4/202335河北工程大学经济管理学院

例子的解法从实际意义,计算方法是:平均价=成交额/成交量A.若已知批发价、成交量,加权算术平均计算:2/4/202336河北工程大学经济管理学院

例子的解法B.若已知批发价、成交额,需先求成交量,调和平均计算:这与算术平均计算结果一致,实际它是加权算术平均的变形,即:2/4/202337河北工程大学经济管理学院

四、几何平均数把握以下问题:1、适用条件;2、计算及公式;3、与均值的关系。2/4/202338河北工程大学经济管理学院

1、几何平均数的适用条件它是适用于特殊数据的一种平均数,主要计算比率或速度的平均。当变量值是比率形式,而且各比率的乘积等于总的比率,用几何平均法计算平均比率。实际应用中,它主要计算现象的年平均发展速度。2/4/202339河北工程大学经济管理学院

2、几何平均数的计算

(1)公式:2/4/202340河北工程大学经济管理学院

2、几何平均数的计算(2)例3-4:某水泥生产企业1995年的水泥产量为100万吨,1996年与1995年相比增长率为9%,1997年与1996年相比增长率为16%,1998年与1997年相比增长率为20%。求各年的年平均增长率。2/4/202341河北工程大学经济管理学院例3-4的解法

解:由题知各年的发展速度分别为109%、116%、120%,则平均发展速度等于:

年平均增长率为114.91%-100%=14.91%此题不能用算术平均计算,因为总速度等于各年发展速度连乘积。

2/4/202342河北工程大学经济管理学院3、与均值的关系它可以看作均值的一种变形。具体,对(3.9)式两端取对数得:看出几何平均数的对数是各变量值对数的算术平均。2/4/202343河北工程大学经济管理学院五、众数、中位数和均值的比较把握两个问题:1、众数、中位数和均值的关系;2、众数、中位数和均值的特点和应用场合。2/4/202344河北工程大学经济管理学院

1、众数、中位数和均值的关系

(1)从分布的角度:众数是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,均值是全部数据的算术平均。对同一组数据计算三者,三者关系:2/4/202345河北工程大学经济管理学院

1、众数、中位数和均值的关系(2)从分布看:如果数据有单一众数且对称分布,则三者相等,即:如果数据是左偏分布,数据有极小值,拉动均值向极小值靠,中位数和众数不受影响,三者关系为:如果数据右偏分布,数据有极大值,拉动均值向极大值靠,则2/4/202346河北工程大学经济管理学院

图3-3众数、中位数和均值的关系

(a)对称分布(b)左偏分布(c)右偏分布2/4/202347河北工程大学经济管理学院1、众数、中位数和均值的关系(2)从数值关系看,当数据分布偏度不大时,三者在数轴上的三点构成一定的数量关系,即众数距离均值最远,中位数在二者之间,若把众数与均值之间的距离作为1,则中位数与均值的距离约为1/3,中位数与众数间距离约为2/3。2/4/202348河北工程大学经济管理学院如图所示根据上述关系,得出:

2/4/202349河北工程大学经济管理学院例子对于一组数据,在已知其中两个代表值下,可根据(3.10)式推算。例如,根据例3-2和例3-3计算结果,推算众数为:Mo=3×123.21-2×123.2=123.23(件),与实际计算的众数123件相差不大。2/4/202350河北工程大学经济管理学院2、众数、中位数和均值的特点和应用场合(1)特点:A、众数是一组数据分布的峰值,是位置代表值。优点是易理解,不受极值的影响。当数据分布集中趋势明显时,其代表性比均值好。缺点是不唯一。2/4/202351河北工程大学经济管理学院

2、众数、中位数和均值的特点和应用场合(1)特点:B、中位数是一组数据中间位置上的代表值,类似的有四分位数、十分位数、百分位数等。它不受极值的影响,当数据偏态分布时,代表性好于均值。2/4/202352河北工程大学经济管理学院2、众数、中位数和均值的特点和应用场合(1)特点:C、均值是根据全部数据计算,具有优良的数学性质,应用最广泛。缺点受极值影响,数据偏态分布时,其代表性差。均值的变形几何平均数、调和平均数适合特殊代表值,前者用于计算比率的平均数,后者用于不能直接计算均值的数据。2/4/202353河北工程大学经济管理学院2、众数、中位数和均值的特点和应用场合(2)应用场合:A、从分布看,数据接近对称分布时,选择均值作为代表值;对于偏态分布选择众数、中位数等位置代表值,代表性好于均值。B、从数据类型,定类、定序数据可以计算众数、中位数,无法计算均值;定距、定比数据可以计算均值、也可以计算众数、中位数;调和、几何平均数不适合定距数据,定比数据可以计算。2/4/202354河北工程大学经济管理学院附加:四分位数它又称四分位点,是用三点将全部数据等分为四部分,其中每部分包括25%的数据,处在分位点上的数值就是四分位数。显然,中间的四分位数就是中位数。通常所说的四分位数第一(下四分位数)和第三个四分位数(上四分位数)。2/4/202355河北工程大学经济管理学院第二节分布离散程度的测度本节内容:考察变量值间的差异程度,研究数据的离散程度,就是变量值远离中心值的程度,又称离中趋势。数据的离散程度反映了集中趋势测度值的代表性,离散程度越大,说明集中趋势测度值的代表性越差,反之,越好。2/4/202356河北工程大学经济管理学院第二节分布离散程度的测度把握以下问题:一、极差的含义及特点;二、方差和标准差;三、离散系数的意义、计算和适用场合。2/4/202357河北工程大学经济管理学院一、极差的含义及特点把握以下问题:1、极差的含义;2、极差的特点。2/4/202358河北工程大学经济管理学院1、极差的含义又称全距,它是一组数据的最大值与最小值之差,即R=max(Xi)—min(Xi)(3.11)式中:R表示极差,max(Xi)和min(Xi)分别表示一组数据的最大、最小值。组距分组数据的极差可表示为:R≈最高组上限-最低组下限(3.12)2/4/202359河北工程大学经济管理学院例子根据第二章例2-1中的数据计算极差:R=139-107=32(件)根据表2-3分组后的数据计算:R

≈140-105=35(件)2/4/202360河北工程大学经济管理学院2、极值的特点计算简单,易于理解,实际中如股票的最高价与最低价。但它受极值的影响,原因在它只是用到两端数据,不能反映中间数据的分布,实际中如比赛中要去掉一个最高分、一个最低分。2/4/202361河北工程大学经济管理学院附加1:异众比率又称离异比率或变差比,主要测度定类数据,它是指非众数组的频数占总频数的比率,用于衡量众数的代表程度,它越大,说明众数的代表性越差,反之,越好。2/4/202362河北工程大学经济管理学院附加2:四分位差又称四分位距,即上下四分位数之差,反映50%数据的离散程度,数值越小说明中间的数据越集中,反之则越分散。与极差比不受极值的影响,又由于中位数处于中间位置,其大小一定程度上反映中位数的代表程度。2/4/202363河北工程大学经济管理学院附加3:平均差

又称平均离差,它是各变量值与其均值离差绝对值的平均数。它以均值为中心,反映每个数据与均值的离差程度,能全面反映一组数据的离散状况,数值大则离散程度大,反之则小。但由于采取绝对值避免计算不便,其数学性质不是最优,用的少。2/4/202364河北工程大学经济管理学院二、方差和标准差把握以下问题:1、方差的概念;2、总体方差和标准差;3、样本方差和标准差;4、总体方差公式的变形5、标准化值;6、是非标志的标准差。2/4/202365河北工程大学经济管理学院1、方差的概念它是各变量值与其均值离差平方的平均数,是测度定距、定比数据离散程度的最主要方法。根据总体数据和样本数据计算方差在数学处理上略有不同。2/4/202366河北工程大学经济管理学院2、总体方差和标准差(1)设总体方差为σ2,对于未分组数据,方差计算公式为:对于分组数据,公式为:2/4/202367河北工程大学经济管理学院2、总体方差和标准差(2)方差的平方根即为标准差,其公式:未分组数据:分组数据:2/4/202368河北工程大学经济管理学院2、总体方差和标准差(3)标准差与方差相比:标准差有量纲,与变量值的计量单位相同,其实际意义比方差清楚,在实际应用中更多使用标准差。看例3-5:根据表2-3中的数据,计算工人日加工零件数的标准差。解:计算过程见表3-2。2/4/202369河北工程大学经济管理学院表3-2某车间50名工人日加工零件

标准差计算表

按零件数分组组中值(Xi)频数(Fi)105-110110-115115-120120-125125-130130-135135-140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合计-50-3100.52/4/202370河北工程大学经济管理学院例3-5:根据(3.16)式得:结果表明,每个工人的日加工零件数与平均数比,平均相差7.87件。2/4/202371河北工程大学经济管理学院3、样本方差和标准差(1)与总体方差的区别:后者用数据个数或总频数去除离差平方和,样本方差用样本数据个数或总频数减1去除离差平方和,即n-1,称为自由度。设样本方差为S2n-1。2/4/202372河北工程大学经济管理学院自由度自由度指一组数据中可自由取值的个数。当样本数据为n,均值确定后只有n-1个数据可以自由取值。例如,有2、4、9三个数值,均值为5,此后只有两个值可以自由取,比如前两个值为6、7,则第三个值只能是2。样本方差用自由度去除原因是抽样估计中用S2n-1估计σ2,是σ2的无偏估计量。

2/4/202373河北工程大学经济管理学院

3、样本方差和标准差

(2)样本方差公式:未分组数据分组数据2/4/202374河北工程大学经济管理学院3、样本方差和标准差(3)样本标准差公式:未分组数据分组数据2/4/202375河北工程大学经济管理学院例如用表2-3的数据计算样本标准差:这与总体标准差的结果7.87件相差不大。当n很大时,样本方差与总体方差计算结果相差很小,可以用样本方差公式计算。2/4/202376河北工程大学经济管理学院

3、样本方差和标准差(4)与平均差的区别:在数学处理上通过平方消去离差的正负号。便于数学处理。它根据全部数据计算,准确地反映数据的离散程度,在实际中广泛应用方差或标准差测度离散程度。2/4/202377河北工程大学经济管理学院4、总体方差公式的变形

(3.13)公式的变形:2/4/202378河北工程大学经济管理学院(3.13)公式的变形2/4/202379河北工程大学经济管理学院(3.14)式的变形根据(3.21)、(3.22)式可以化简方差和标准差的计算。在实际计算时,可以用计算器求得。2/4/202380河北工程大学经济管理学院5、标准化值(1)根据均值和标准差可以计算一组数据中各个数值的标准化值,设标准化值为Z,则有:2/4/202381河北工程大学经济管理学院5、标准化值(2)在对多个不同量纲的指标进行处理时,需要对各指标进行标准化处理。它又给出了一组数据中各数值的相对位置。如,标准化值为1.5,则该数据是在高于均值1.5倍标准差的位置,即对一组数据大约有68%的数据在范围内,95%在范围内,99%在范围内,在此范围内几乎包括了全部数据,而之外的数据,统计上称为离群点。2/4/202382河北工程大学经济管理学院6、是非标志的标准差(1)是非标志的概念:在统计中,有时把现象的总体单位分成具有某一标志的单位和不具有某一标志的单位两组,这个标志是品质标志。如将全部产品分为合格品和不合格品两组。这种用是、否或有、无表示的标志被称为是非标志。2/4/202383河北工程大学经济管理学院6、是非标志的标准差(2)是非标志的成数:是非标志不能用数量表示,可以计算结构比例,即总体中具有某一标志的单位数占总体单位数的比重或成数,设为P,如产品合格率;不具有某一标志的单位数占总体单位数的比重或成数,设为Q。设总体单位数为N,具有某一标志的单位数为N1,不具有某一标志的单位数为N0,N0+N1=N,P=N1/N,Q=N0/N,P+Q=12/4/202384河北工程大学经济管理学院6、是非标志的标准差(3)是非标志的平均数:将是非标志量化,是表示为1,非表示为0,则其平均数按加权公式计算

2/4/202385河北工程大学经济管理学院6、是非标志的标准差(4)是非标志的标准差:2/4/202386河北工程大学经济管理学院例子已知某产品的合格率为95%,求其合格率的标准差。解:2/4/202387河北工程大学经济管理学院三、离散系数的意义、计算和适用场合

把握以下问题:1、离散系数的意义;2、离散系数的计算;3、离散系数的适用场合。2/4/202388河北工程大学经济管理学院1、离散系数的意义(1)又称标准差系数,它是一组数据的标准差与其均值之比,是测度数据离散程度的相对指标。(2)意义:A、方差和标准差是反映数据分散程度的绝对数,它受变量值大小和其均值大小的影响;B、对均值不同或计量单位不同的变量值,不能直接比较,因此引入离散系数。2/4/202389河北工程大学经济管理学院2、离散系数的计算(1)其计算公式为:Vσ和VS分别表示总体离散系数和样本离散系数。(2)例3-6:某管理局抽查了所属的8家企业,其产品销售数据如表3-3所示。试比较产品销售额与销售利润的离散程度。2/4/202390河北工程大学经济管理学院表3-3某管理局所属8家企业的

产品销售数据企业编号产品销售额(万元)X1销售利润(万元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.02/4/202391河北工程大学经济管理学院例3-6的解由于销售额与利润额数据水平不同,不能直接用标准差比较,需要计算离散系数。由表中数据得:=536.25(万元)S1=309.19(万元)V1=0.577=32.5215(万元)S2=23.09(万元)V2=0.710计算结果表明V1<V2,说明产品销售额的离散程度小于销售利润的离散程度。2/4/202392河北工程大学经济管理学院

第三节分布偏态与峰度的测度偏态和峰度是对数据分布偏斜和扁平程度的描述。把握如下问题:一、偏态及其测度;二、峰度及其测度。2/4/202393河北工程大学经济管理学院一、偏态及其测度把握以下问题:1、偏态的意义;2、偏态系数的计算公式;3、例3-7。2/4/202394河北工程大学经济管理学院1、偏态的意义它是对分布偏斜方向及程度的测度。前面学过用众数、中位数和均值间的关系判断分布是左偏还是右偏,但不能测度偏斜程度,这需要计算偏态系数,它是对分布偏斜程度的测度。2/4/202395河北工程大学经济管理学院2、偏态系数的计算公式公式为:2/4/202396河北工程大学经济管理学院2、偏态系数的计算公式公式的理解:上式是根据离差三次方的平均数再除以标准差的三次方,当分布对称时,离差三次方后正负离差可以相互抵消,公式分子为0,则3=0;当分布不对称时,正负离差不能抵消,3有正负。3为正值表示正偏离差值较大,可以判断正偏或右偏;反之,3为负值表示负离差数值较大,可以判断为负偏或左偏。在计算3时,将离差三次方的平均数除以标准差的三次方是把偏态系数转化为相对数,3的绝对值越大,表示偏斜程度越大。2/4/202397河北工程大学经济管理学院3、例子例3-7:已知1997年我国农村居民家庭按纯收入分组的有关数据如表3-4。计算偏态系数。表3-4农村居民家庭按纯收入分组的数据按纯收入分(百元)5以下5~1010~1515~2020~25户数比重(%)2.2812.4520.3519.5214.93按纯收入分(百元)25~3030~3535~4040~4545~5050以上户数比重(%)10.356.564.132.681.814.942/4/202398河北工程大学经济管理学院3、例子解:计算过程见表3-5(略),根据表3-5数据计算得:2/4/202399河北工程大学经济管理学院3、例子将计算结果代入(3.25)式得:由结果知,偏态系数为正,且数值较大,说明农村家庭纯收入的分布为右偏分布,即收入较少的家庭占多数,收入较高的家庭占少数,且偏斜的程度较大。2/4/2023100河北工程大学经济管理学院二、峰度及其测度把握以下问题:1、峰度的意义;2、峰度的计算公式;3、例子。2/4/2023101河北工程大学经济管理学院1、峰度的意义

峰度是分布集中趋势高峰的形状。它通常是与正态分布相比而言,在同一方差时,若分布比正态分布更高更瘦,则为尖峰分布,反之,则为平峰分布,如图3-5所示2/4/2023102河北工程大学经济管理学院如图

2/4/2023103河北工程大学经济管理学院2、峰度系数的计算公式峰度系数是离差四次方的平均数,再除以标准差的四次方,公式为:式中:表示峰度系数,表示标准差的四次方2/4/2023104河北工程大学经济管理学院

2、峰度系数计算公式公式的理解:将离差的四次方除以标准差的四次方是为了将峰度系数转化成相对数。用峰度系数说明分布的尖峰和扁平程度,是与正态分布的峰度系数比较而言。由于正态分布的峰度系数为3,当4>3时为尖峰分布,当4<3时为平峰分布。2/4/2023105河北工程大学经济管理学院3、例子

例3-8:根据例3-7中的数据,计算农村居民家庭纯收入分布的峰度系数。解:根据表3-5的计算结果,代入(3.26)式得:2/4/2023106河北工程大学经济管理学院3、例子

由于4=3.4>3,说明我国农村居民家庭纯收入的分布为尖峰分布,说明低收入家庭占有较大比重。2/4/2023107河北工程大学经济管理学院第四节统计表与统计图

统计表和统计图是显示数据的两种基本方式。本节把握以下问题:一、统计表;二、统计图。

2/4/2023108河北工程大学经济管理学院一、统计表把握以下问题:1、统计表的特点;2、统计表的形式及构成;3、统计表编制的原则。2/4/2023109河北工程大学经济管理学院

1、统计表的特点它是用语显示统计数据的基本工具。使用统计表可以使数据一目了然,清晰易懂,便于理解和分析。2/4/2023110河北工程大学经济管理学院

2、统计表的形式及构成(1)形式多样看下表表3-61997年城乡居民家庭平均每人生活消费支出单位:元资料来源:《中国统计年鉴1998》,中国统计出版社,1998年,第326、348页。注:本表城镇居民家庭收支为抽样调查资料项目城镇居民农村居民食品衣着家庭设备用品及服务医疗保健交通通讯娱乐教育文化服务居住杂项商品与服务1942.59520.91316.89179.68232.90448.38358.64185.65890.28109.4185.4162.4553.92148.18233.2334.27合计4185.641617.15表头列标题行标题数字资料附加2/4/20231112、统计表的形式及构成(2)表的构成:包括表头、行标题、列标题、和数字资料。必要时加上附加。表头在表的上方,说明表的主要内容;行、列标题在表的第一列和第一行,表示研究问题的类别名称和指标名称。若是时间序列数据,行、列标题可以是时间,数据多时,时间放在横行标题的位置,如表3-7。表的其余部分是具体的数字资料;附加放在表的下方,包括资料来源、指标的注释等。2/4/2023112河北工程大学经济管理学院

表3-71991-1997年城乡居民家庭

人均收入单位:元

资料来源:《中国统计年鉴1998》,中国统计出版社,1998年,第325页年份城镇居民农村居民19911992199319941995199619971700.62026.62577.43496.24283.04838.95160.3708.6784.0921.61221.01577.71926.12091.12/4/2023113河北工程大学经济管理学院3、统计表编制的原则总体原则:科学、实用、简练、美观。具体注意以下几点:(1)合理安排表的结构,使表的横竖长度比例适当。(2)表头包括表号、总标题和表中数据的单位等。总标题应明确表的内容,要有时间、地点、以及数据。若是同一计量单位,放在表的右上角,若计量单位不同,放在指标后或单列一列标明。

2/4/2023114河北工程大学经济管理学院3、统计表编制原则(3)表中上下两条线用粗线,中间其他线用细线。表左右两边不封口,列标题间用竖线分开,行标题间不用横线隔开。表中数据一般右对齐,有小数点以小数点对齐且小数点位置统一。没有数字的表格单元,用“-”表示,填好的表不应有空白单元格。2/4/2023115河北工程大学经济管理学院3、统计表编制原则(4)在使用统计表时,必要时在表的下方加上注释,特别注明资料来源,对别人成果的尊重和被读者查阅。2/4/2023116河北工程大学经济管理学院二、统计图

把握以下问题:1、线图;2、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论