




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章
数据分布特征的描述数据分布特征的描述描述数据分布特征的指标主要有三大类:一是描述数据分布集中趋势的指标;二是描述数据分布离散程度的指标;三是描述分布偏斜程度的指标。数据分布特征的描述统计指标的分类总量指标(绝对数)—数量指标相对指标(相对数)—质量指标平均指标(平均数)—质量指标数据分布特征的描述绝对数。现象的规模、水平一般以绝对数形式表现。相对数。相对数由两个互相联系的数值对比求得。常用的相对数包括:结构相对数、动态相对数、比较相对数、强度相对数、利用程度相对数、计划完成相对数等。平均数。平均数反映现象总体的一般水平或分布的集中趋势。数据分布特征的描述第一节总量指标和相对指标(一)总量指标的概念和作用总量指标是反映现象在具体时间、地点、条件下的总规模或总水平的统计指标。总量指标也称为绝对指标或绝对数。一、总量指标数据分布特征的描述总量指标在社会经济统计中的作用:①可以反映社会经济和企业的基本情况,反映一个国家的基本国情和国力,②它是计算相对指标、平均指标等描述指标的基础。③是制定政策、编制计划、实行社会经济管理的基本依据。数据分布特征的描述(二)总量指标的种类1、总量指标按其反映的时间状况不同,分为时期指标和时点指标。时期指标反映现象在某一时期发展过程的总数量;时点指标则反映现象在某一时刻上的状况总量。2、总量指标按计量单位不同,分为实物量指标、价值量指标和劳动量指标。实物量指标是以所反映现象的实物单位为计量单位的总量指标;价值量指标是以货币为计量单位的总量指标;劳动量指标是以劳动时间为计量单位的总量指标。数据分布特征的描述时期指标和时点指标的不同特点:①时期指标的数值是连续计数的;时点指标的数值则是间断计数的。②时期指标具有累加性;时点指标则不具有。③时期指标数值的大小受时期长短的制约;时点指标数值的大小与时点的间隔长短无直接关系。数据分布特征的描述二、相对指标(一)相对指标的概念和作用相对指标又称相对数,它是两个有联系的指标数值对比的结果。注:用来对比的两个数既可以是绝对数,也可以是平均数和相对数。数据分布特征的描述相对指标的主要作用:①能具体表明社会经济现象之间的比例关系。②能使一些不能直接对比的事物找出共同比较的基础。③相对指标便于记忆、易于保密。相对指标的表现形式:有名数、无名数。有名数是将对比的分子指标和分母指标的计量单位结合起来使用。无名数是一种抽象化的数值,一般分为系数、倍数、成数、百分数、千分数等。数据分布特征的描述(二)相对指标的种类和计算方法相对指标通常分为:结构相对指标、比例相对指标、比较相对指标、计划完成相对指标、强度相对指标和动态相对指标。1、结构相对指标
计算各组总量占总体或样本总量的比重,用以反映总体或样本结构状况的综合指标。数据分布特征的描述1、结构相对指标①可以反映总体内部结构的特征。②通过不同时期相对数的变动,可以看出事物的变化过程及其发展趋势。③结构相对数一般用百分数表示。④各组结构相对数之和等于100%或1。数据分布特征的描述例:我国规模以上工业增加值的轻重工业构成表轻重工业2006年2007年工业增加值/亿元比重%工业增加值/亿元比重%轻工业2431430.492827729.90重工业5543869.516630470.10合计79752100.0094581100.00数据分布特征的描述2、比例相对指标比例相对数是总体或样本中不同部分加以对比,用以反映总体或样本内部的比例关系和协调关系的综合指标。数据分布特征的描述例:我国规模以上工业增加值的轻重工业构成表(2007年)轻重工业工业增加值/亿元比重%以轻工业增加值为100%轻工业2827729.90100.00重工业6630470.10234.48合计94581100.00——数据分布特征的描述3、比较相对指标反映某一现象在同一时期内或同一时点上不同空间下的不平衡程度的综合指标。比较相对数可以是两个总量指标对比,也可以是相对指标或平均指标对比。数据分布特征的描述4、计划完成相对数是用一定时期内实际完成指标与计划指标的比重,来反映计划完成程度的综合指标。数据分布特征的描述(1)水平法(2)累计法长期计划的检查:数据分布特征的描述5、强度相对指标概念:是性质不同但又有内在联系的两个绝对指标的对比,是用以反映某现象的强度、密度或普遍程度的综合指标。强度相对数的两种表示方法:(1)一般用无名数表示。(2)少数用百分数或千分数表示。注:强度相对数不是平均数,不是同类指标数值之比。数据分布特征的描述例:表现社会服务能力的强度相对数是用服务单位数与人口比较。表现现象普遍成都的强度相对数,如人口密度、公路网密度等。数据分布特征的描述6、动态相对指标概念:是不同时期同一指标数值之比,用以反映现象在不同时期发展变化程度的综合指标。动态相对数的计算结果用百分数或倍数表示。数据分布特征的描述正确运用相对指标的原则1、注意两个对比指标的可比性2、相对指标要和总量指标结合起来运用结合运用的方法有两种:一是计算分子与分母的绝对差额;二是计算每增长1%的绝对值。增长量=报告期水平-基期水平增长1%绝对值数据分布特征的描述例:我国2001-2007年若干统计指标资料指标2001年2002年2003年2004年2005年2006年2007年国内生产总值(亿元)109655120333135823159878183218211924249530年末总人口数(万人)127627128453129227129988130756131448132129人均国内生产总值(元)862293981054212336140531616518934第三产业占国内生产总值比重%40.541.541.240.440.140.040.1数据分布特征的描述相对指标的种类和计算方法相对指标计算方法结构相对指标总体中部分数值/全部数值比例相对指标总体中A部分数值/B部分数值比较相对指标甲地某指标数值/乙地同一指标数值计划完成程度指标实际数/计划数强度相对指标某一指标数值/同期另一有联系的指标数值动态相对指标报告期水平/基期水平数据分布特征的描述数据分布的特征描述数据分布特征的描述数据分布的特征:一、集中趋势:反映数据向其中心靠拢或聚集程度;二、离散趋势;数据远离中心的趋势;三、偏态和峰态;偏态是对数据分布对称性的度量;峰度是指数据分布的平峰或尖峰程度(形状)。数据分布特征的描述数据分布的特征集中趋势(平均指标)(位置)离散趋势(变异指标)(分散程度)偏态和峰度(形状)数据分布特征的描述数据分布的特征和测度数据的特征和测度分布的形状集中趋势离散程度众数中位数均数离散系数方差和标准差四分位差偏态峰度数据分布特征的描述第二节平均指标数据分布集中程度的描述指标数据分布特征的描述1.概念也称平均指标或平均数用来反映标志值的典型水平或标志值分布的中心位置或集中趋势2.作用反映变量分布的集中趋势和一般水平。可用来比较同一总体在不同空间的发展水平可用来分析现象之间的依存关系是统计推断中一个重要的统计量。第二节平均指标数据分布特征的描述集中趋势
(centraltendency)一组数据向其中心值靠拢的倾向和程度测量集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值数据分布特征的描述集中趋势指标的分类数值平均数算术平均数调和平均数几何平均数位置平均数众数中位数及其他分位数数据分布特征的描述一、算术平均数算术平均数的基本公式(最基本指标):注:平均指标和强度相对数的区别分子和分母在经济内容上有从属关系,即分子数值是各分母单位特征的总和,两者在总体范围上是一致的。数据分布特征的描述(一)简单算术平均数把每项数据直接加总后除以它们的项数通常用于对未分组的数据计算算术平均数计算公式:Xi代表变量,代表算数平均数,n变量值个数,∑求和数据分布特征的描述分组表3-2年龄人数(人)xf2242510305501合计20表3-1男性女性2222222225252525252525252525303030305030解:采用简单算术平均法计算,即全体队员的平均年龄为(单位:周岁):若采用简单平均:分组数据不能简单平均!因为各组变量值的次数不等!数据分布特征的描述(二)加权算术平均数设分组后各组的变量值或组中值为:x1,x2,…,xn相应的频数为:f1,f2,…,fn正确的计算是:数据分布特征的描述(二)加权算术平均数加权算术平均数的计算公式:加权—为了体现各变量值轻重不同的影响作用,对各个变量值赋予不尽相同的权数(fi
).数据分布特征的描述[例]表某班级40名同学统计学原始成绩(单位:分)简单算术平均数算式:数据分布特征的描述表40名同学统计学成绩汇总表(单位:分)加权算术平均数算式:55×2+65×8+75×16+85×10+95×4=3060数据分布特征的描述权数(fi,也称权重)权数——指在计算总体平均数或综合水平的过程中对各个数据起着权衡轻重作用的变量。可以是绝对数形式,也可以是比重形式(如频率)表示。事实上比重权数更能够直接表明权数权衡轻重作用的实质当权数完全相等(f1=f2=…=fn)时,加权算术平均数就成了简单算术平均数。数据分布特征的描述变量数列的权数有两种形式:一种是以绝对数表示,称次数或频数;另一种是以比重表示,称频率。用频率计算的公式和直接用次数计算的公式在内容上是相等的,即数据分布特征的描述(三)算术平均数的数学性质1、各个变量值与算术平均数的离差之和等于零。2、各个变量值与算术平均数的离差平方之和等于最小值。数据分布特征的描述算术平均数有两点不足:1、算术平均数易受极端变量值的影响,使的代表性变小,而且受极大值的影响大于受极小值的影响。2、当组距数列为开口组时,由于组中值不易确定,使的代表性也不很可靠。数据分布特征的描述二、调和平均数1.集中趋势的测度值之一;2.算术平均数的另一种表现形式;3.易受极端值的影响;4.有简单调和平均数和加权调和平均数。原来只是计算时使用了倒数数据分布特征的描述调和平均数又称“倒数平均数”,它是各个变量值倒数的算术平均数的倒数。简单调和平均数和加权调和平均数二、调和平均数数据分布特征的描述
【例】速度x行走里程m201152103
合计6所需时间数据分布特征的描述1、简单调和平均数资料未分组,各变量值次数都是1。计算公式:举例:一个人步行两里,走第一里时速度为每小时候10里,走第二里时为每小时20里,则平均速度为:应用条件:数据分布特征的描述2、加权调和平均数资料经过分组,各组次数不同。应用条件:计算公式:数据分布特征的描述调和平均数特点:①如果数列中有一标志值等于零,则无法计算;②它作为一种数值平均数,受所有标志值的影响,它受极小值的影响大于受极大值的影响,但较之算术平均数,受极端值的影响要小。数据分布特征的描述三、几何平均数概念:几何平均数又称“对数平均数”,它是若干项变量值连乘积开其项数次方的算术根。(一)简单几何平均数在实际工作中,常用即几何平均数是各个变量值对数的算术平均数的反对数。数据分布特征的描述
某工业产品产量平均发展速度计算表
年份产品产量逐年发展速度(X)逐年发展速度的(亿吨)(各年产量为前一年的%)对数(lgX)20009.80----200110.54107.62.0319200210.80102.52.0107200310.87100.62.0025200411.16102.72.0115200511.41102.22.0094合计-------10.0660数据分布特征的描述(二)加权几何平均数当各个变量值的次数(权数)不相同时,应采用加权几何平均数,其计算公式为将公式两边取对数,则为数据分布特征的描述某投资银行年平均利率计算表
年利率发展速度年数年利率发展速度的对数flgX(%)XflgX10312.01282.012810542.02128.084810882.033416.2672110102.041420.414011522.06074.1214合计25----50.9002数据分布特征的描述几何平均数特点:①如果数列中有一个标志值等于零或负值,就无法计算;②受极端值影响较算术平均数和调和平均数小,故较稳健。数据分布特征的描述四、中位数和其他分位数(一)中位数1、概念:现象总体中各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位数。Me50%50%数据分布特征的描述2、特点:①集中趋势的测度值之一;②排序后处于中间位置上的值;③不受极端值的影响;④主要用于定序数据,也可用数值型数据,但不能用于定类数据;⑤各变量值与中位数的离差绝对值之和最小。数据分布特征的描述3、中位数位置的确定未分组数据:分组数据:数据分布特征的描述①未分组数据的中位数(计算公式)4、中位数的计算数据分布特征的描述数值型未分组数据的中位数
(5个数据的算例)原始数据: 2422212620中位数Me=
22
排序: 2021222426
位置: 123 45数据分布特征的描述数值型未分组数据的中位数
(6个数据的算例)原始数据:105 91268位置N+126+123.5中位数8+928.5排序: 56891012位置: 123
456数据分布特征的描述②由分组资料确定中位数(例:)按日产量分组(件)x工人数(人)f2010221524302625合计80累计次数向上累计向下累计1080257055558025——方法:计算各组的累计次数(向上累计次数或向下累计次数)根据中位数位置找出中位数。结果:中位数为第40名的日产量[24件]数据分布特征的描述根据位置公式确定中位数所在的组采用下列近似公式计算该公式假定中位数组的频数在该组内均匀分布③由组距式分组计算中位数数据分布特征的描述数值型分组数据的中位数(例:)表3-5某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例】根据表3-5中的数据,计算50名工人日加工零件数的中位数数据分布特征的描述中位数的特点:①与众数一样,也是一种位置平均数,不受极端值及开口组的影响,具有稳健性。②难获得数据资料时,某些不具有数学特点或不能用数字测定的现象,可以使用中位数作为这种数据的平均值。③各单位标志值与中位数离差的绝对值之和为最小值。④不能进行代数运算,很少用于高级统计分析。。数据分布特征的描述(二)其他分位数中位数是从中间点将全部数据等分为两部分。与中位数类似的还有:四分位数(quartile)十分位数(decile)百分位数(percentile)等。它们分别是用3个点、9个点和99个点将数据四等分、10等分和100等分后各分位点上的值。数据分布特征的描述四分位数①排序后处于25%和75%位置上的值。②不受极端值的影响③主要用于定序数据,也可用于数值型数据,但不能用于定类数据QLQMQU25%25%25%25%数据分布特征的描述四分位数(位置的确定)未分组数据:组距分组数据:4下四分位数(QL)位置=N+1上四分位数(QU)位置=3(N+1)4下四分位数(QL)位置=N4上四分位数(QL)位置=3N4数据分布特征的描述数值型未分组数据的四分位数原始数据:2321 3032 282526QL=23N+17+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=30
排序:21232526283032
位置:1 234567数据分布特征的描述数值型未分组数据的四分位数
(6个(N+1不能被4整除)数据的算例)原始数据:2321 30 282526排序:212325262830位置:1 2 3 4 56QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=28+0.25(30-28)
=28.5数据分布特征的描述数值型分组数据的四分位数
(计算公式)上四分位数:
下四分位数:
数据分布特征的描述数值型分组数据的四分位数
(计算示例)QL位置=50/4=12.5QU位置=3×50/4=37.5表3-5某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例】根据表3-5中的数据,计算50名工人日加工零件数的四分位数数据分布特征的描述五、众数(一)众数的概念众数是总体中出现次数最多的标志值,它能直观地说明客观现象分配中的集中趋势。如果总体中出现次数最多的标志值不是一个,而是两个,那么,合起来就是复众数。注:众数存在的条件是总体的单位数较多,各标志值的次数分配又有明显的集中趋势时才存在众数。数据分布特征的描述众数(例)出现次数最多的变量值不受极端值的影响,可能没有众数或有几个众数主要用于定类数据,也可用于定序数据和数值型数据无众数原始数据:10591268一个众数原始数据:659855多个众数原始数据:252828364242数据分布特征的描述定序数据的众数【例】解:这里的数据为定序数据。变量为“回答类别”。甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即
Mo=不满意表3-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510合计300100.0数据分布特征的描述①众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受极端值和开口数组列的影响,从而增强了对变量数列一般水平的代表性;②众数是一个不容易确定的平均指标,当分布数列没有明显的集中趋势而趋均匀分布时,则无众数可言;当变量数列是不等距分组时,众数的位置也不好确定。③不像算数均数和中位数,众数反映数据集中程度时,没有与之配套的反映数据离散程度的指标。④与中位数相同,众数不便于代数运算,高级统计分析很少用。众数的特点:数据分布特征的描述六、各种平均数之间的相互关系(一)算术平均数、几何平均数和调和平均数三者的关系(二)算术平均数、众数和中位数三者的关系1、当总体分布成对称状态时,三者合而为一。2、当总体分布呈右偏时,则3、当总体分布呈左偏时,则数据分布特征的描述当分布偏态时,三者之间的数量关系是:若则说明分布右偏若则说明分布左偏若则说明分布对称数据分布特征的描述众数、中位数和均值的关系对称分布
均值=中位数=众数左偏分布
众数中位数均值
右偏分布众数中位数均值数据分布特征的描述第三节变异指标数据分布的离散程度的描述指标数据分布特征的描述一、变异指标及其作用概念:描述各变量值之间差异程度的指标也叫标志变异指标。反映各变量值远离其中心值的程度,因此也称为离散趋势。作用:(1)说明数据离散程度;(2)衡量集中趋势测度值的代表程度;(3)是统计推断中重要尺度指标。平均指标:共性;标志变动度:差异性3.主要指标:全距、四分位差、平均差、标准差、离散系数。数据分布特征的描述离散程度的测度指标全距(极差)四分位差平均差方差及标准差相对离散程度:离散系数数据分布特征的描述一、全距1.一组数据的最大值与最小值之差2.易受极端值影响7891078910未分组数据
R=max(Xi)-min(Xi).=组距分组数据
R
最高组上限-最低组下限3.计算公式为数据分布特征的描述二、四分位差【例】根据表3-2中的数据,计算甲城市家庭对住房满意状况评价的四分位差解:设非常不满意为1,不满意为2,一般为3,满意为4,非常满意为5已知QL=不满意=2,
QU=一般=3四分位差:
QD=QU-QL
=3–2
=1表3-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意
不满意一般满意非常满意2410893453024132225270300合计300—QD
=QU
-
QL数据分布特征的描述四分位差特点:四分位差能对开口组数列的差异程度进行测定。但类同全距,四分位差也是一个比较粗略的指标。不能反映所有标志值的差异程度。数据分布特征的描述三、平均差(概念要点及计算公式)1.平均差是各单位标志值对平均数的离差绝对值的平均数。2.各变量值与其均值离差绝对值的平均数3.能全面反映一组数据的离散程度4.数学性质较差,实际中应用较少1、简单平均差2、加权平均差数据分布特征的描述举例:前例按日产量分组kg)工人数f组中值x20—30102530—40703540—50904550—603055合计200—1704902703901320数据分布特征的描述平均差的优缺点优点:平均差是根据全部数值计算的,受极端值影响较全距小。缺点:由于采取绝对值的方法消除离差的正负号,数学性质不是最好,因而应用较少。数据分布特征的描述四、方差和标准差(概念要点)1.最常用的测度值2.反映了数据的分布3.反映了各变量值与均值的平均差异4.标准差是各单位标志值与其算术平均数的离差平方的算术平均数的平方根,又称“均方差”。5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差。4681012X=8.3数据分布特征的描述标准差的计算1、简单标准差公式:应用条件:资料未分组,各组次数都是1。2、加权标准差公式:应用条件:资料经过分组,各组次数不同。数据分布特征的描述计算标准差的一般步骤:①算出每个变量对平均数的离差;②将每个离差平方;③计算这些平方数值的算术平均数;④把得到的数值开方,即得到σ。数据分布特征的描述例:日产量(kg)工人数f组中值x20—30102530—40703540—50904550—603055合计200—28803430810507012190数据分布特征的描述3、是非标志的标准差如前:是非标志的平均数为P。标志值x单位数f10合计N标准差在实际应用中最为广泛。而方差有良好的数学性质数据分布特征的描述4、方差的数学性质(1)常数的方差为0(2)所有变量都加上(或减去)常数a,方差不变(3)所有变量都乘以常数a,则方差将乘以a2(4)分组条件下,总体方差等于组间方差与平均组内方差的和数据分布特征的描述5、标准化值用于比较来自不同均值和标准差的个体的数据公式:实质上是把不同均值和标准差的总体转换为均值为0,标准差为1的总体,将各个体数据转换为其在总体中的相对位置。数据分布特征的描述6、对称钟形分布中的3法则数据分布特征的描述绝对数形式变异指标的适用条件当两个或多个数列的平均水平相等时,对比数列标志值间的变异程度及平均水平的代表性,用绝对数形式的变异指标。指标值越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。数据分布特征的描述五、离散系数(概念要点和计算公式)1.标准差与其相应的均值之比2.消除了数据水平高低和计量单位的影响3.测度了数据的相对离散程度4.用于对不同组别数据离散程度的比较5.计算公式为数据分布特征的描述离散系数全距、四分位差、平均差、标准差都是绝对指标,都与平均指标有相同的计量单位。不宜直接来比较不同水平数列之间的标志离散程度。离散系数也称为标志变动系数。最常用的是根据标准差与算术平均数对比的离散系数,称作“标准差系数”。数据分布特征的描述例如:有两个不同水平的工人日产量(件)资料:甲组:60,65,70,75,80乙组:2,5,7,9,12由此计算得:计算其离散系数来比较:数据分布特征的描述离散系数(实例和计算过程)表4-7某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)X1销售利润(万元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所属的8家企业,其产品销售数据如表4.7。试比较产品销售额与销售利润的离散程度数据分布特征的描述离散系数(计算结果)X1=536.25(万元)S1=309.19(万元)V1=536.25309.19=0.577S2=23.09(万元)V2=32.521523.09=0.710X2=32.5215(万元)结论:计算结果表明,V1<V2,说明产品销售额的离散程度小于销售利润的离散程度数据分布特征的描述数据类型与离散程度测度值表4-8数据类型和所适用的离散程度测度值数据类型定类数据定序数据定距数据或定比数据适用的测度值※四分位差※方差或标准差※离散系数(比较时用)——平均差——极差——四分位差——
数据分布特征的描述相对数形式变异指标的适用条件当两个或多个数列的平均水平不等时,对比数列标志值间的变异程度及平均水平的代表性,用相对数形式的变异指标。指标值越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。数据分布特征的描述第四节偏态与峰度的测度一.偏态及其测度二.峰度及其测度数据分布特征的描述偏态与峰度分布的形状扁平分布尖峰分布偏态峰度左偏分布右偏分布与标准正态分布比较!数据分布特征的描述一、偏态系数(概念要点)1.数据分布偏斜程度的测度2.计算公式为3.偏态系数=0为对称分布
4.偏态系数>0为右偏分布
5.偏态系数<0为左偏分布数据分布特征的描述偏态(实例)【例】已知1997年我国农村居民家庭按纯收入分组的有关数据如表4.9。试计算偏态系数表4-101997年农村居民家庭纯收入数据按纯收入分组(元)户数比重(%)500以下500~10001000~15001500~20002000~25002500~30003000~35003500~40004000~45004500~50005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94数据分布特征的描述户数比重(%)252015105农村居民家庭村收入数据的直方图偏态与峰度(从直方图上观察)按纯收入分组(元)1000500←15002000250030003500400045005000→结论:1.为右偏分布
2.峰度适中数据分布特征的描述偏态系数
(计算过程)表4-10农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组(百元)组中值Xi户数比重(%)Fi(Xi-X)3
Fi(Xi-X)4Fi5以下5—1010—1515—2020—2525—3030—3535—4040—4545—5050以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合计—100.001689.2572521.25数据分布特征的描述偏态系数根据上表数据计算得将计算结果代入公式得结论:偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大数据分布特征的描述二、峰度系数(概念要点)1.数据分布扁平程度的测度2.计算公式为3.峰度系数=0扁平程度适中
4.峰度系数<0为扁平分布
5.峰度系数>0为尖峰分布数据分布特征的描述峰度系数(实例计算结果)代入公式得
【例】根据表4-10中的计算结果,计算农村居民家庭纯收入分布的峰度系数
结论:由于=0.4>0,说明我国农村居民家庭纯收入的分布为尖峰分布,说明低收入家庭占有较大的比重数据分布特征的描述习题一、填空题1、数据分布集中趋势的测度值(指标)主要有
_____、
______和______
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吉林艺术学院《英语阅读三》2023-2024学年第一学期期末试卷
- 江门职业技术学院《中小学数学试题研究》2023-2024学年第二学期期末试卷
- 西安外国语大学《生物医药文献检索和专业英语》2023-2024学年第二学期期末试卷
- 天津师范大学津沽学院《口腔解剖生理学》2023-2024学年第一学期期末试卷
- 河北软件职业技术学院《“四史”教育》2023-2024学年第二学期期末试卷
- 山西国际商务职业学院《大众健美操》2023-2024学年第二学期期末试卷
- 建筑工程合同与合同管理浅谈
- 医疗设备维保服务合同
- 截桩工程劳务分包施工合同
- 工程劳务作业分包合同
- 2024年新人教版六年级数学上册《教材练习2练习二 附答案》教学课件
- 【核心素养目标】六年级科学下册(苏教版)4.13 洁净的水域(教案)
- 设备吊装作业施工方案
- 小学语文“的、地、得”专项练习(附答案)
- 2024至2030年中国去中心化标识符(DID)市场现状研究分析与发展前景预测报告
- 《建筑施工测量标准》JGJT408-2017
- 2024-2030年中国社区医院行业市场发展分析及前景趋势与投资研究报告
- 2024年四川省成都市郫都区五年级数学第二学期期末学业质量监测模拟试题含解析
- 黑龙江省齐齐哈尔市2024年中考数学试卷【附真题答案】
- 脱硫技术方案钠碱法脱硫
- 2024年广东省中考生物试卷附答案
评论
0/150
提交评论