自考华农统计学原理_第1页
自考华农统计学原理_第2页
自考华农统计学原理_第3页
自考华农统计学原理_第4页
自考华农统计学原理_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计数据的描述与显示第一节绝对指标与相对指标第二节集中趋势的测定第三节离散程度的测定第四节统计数据的显示

第一节绝对指标与相对指标一)绝对指标二)相对指标一)绝对指标

(一)绝对指标的意义和种类:

1)反映社会,经济现象整体规模和水平的指标一般都以绝对数形式表示。

2)绝对指标的特点:绝对指标是绝对数形式,一定有计量单位。欢对指标数值大小受总体范围大小的影响。总体范围大,指标数值则大,反之,指标数值就小。也称总量指标

3)总量指标的作用:反映社会经济现象总体的基本状况和基本实力。是计算相对指标和平均指标的基础。绝对指标的种类1.按其反映的内容不同总体单位绝对指标——总体单位数多少的总量指标。总体指标绝对指标——总体单位某一数量标志值的总和。

注意!

对于一个确定的总体而言,总体单位总量指标是唯一的,而总体标志总量指标则有许多。一个总量指标是总体单位总量还是总体标志总量,不是固定不变的,它是随着研究目的和研究对象的不同而发生变化的。

2.其反映的时间状况不同时期指标——表明社会经济现象总体在一段时期内发展过程的总结果。时点指标——表明社会经济现象总体在某一时刻(瞬间)数量状况。

时期指标与时点指标的区别:时期指标具有可加性,不同时期的指标数值相加表明较长时期的总量。时点指标不具有可加性,不同时点的指标数值相加没有实际意义。时期指标的数值大小与时期长短有关,而时点指标数值的大小则与时间间隔长短没有直接关系。时期指标的数值可以连续计数,而时点指标的数值只能间断计数。单位名称企业数(个)职工人数(人)固定资产增加额(万元)工业增加值(万元)纺织局化工局机械局300250450

800050007000

100020002000

200500300合计

100020000

5000

1000通过下表:1、区分总体单位总量与总体标志总量;

2、区分时期指标与时点指标。总体标志总量时点指标时期指标总体单位总量(二)总量指标的计量单位计量单位自然单位:头、辆、人

双重单位:台/千瓦、人/平方公里复合单位:吨公里、千瓦小时实物单位价值单位劳动量单位度量衡单位:米、公斤、吨标准实物单位:按实物单位统一的折算标准来计量的一种.是以货币作为价值尽度来计量.主要用于企业内部,是用生产工业产品所需的劳动时间来计量.二)相对指标

1)相对指标——它是两个有相互联系的指标进行对比的比值来描述现象数量特征和数量关系的综合指标,用以反映现象的发展程度、结构,强度、普遍程度或比例的关系。表现形式:表现为无名数,有名数。

倍数,成数,百分数,千分数强度相对指标结构相对指标以总体总量作为比较标准,求出各组总量占总体总量的比重。所以,又称比重指标。计算方法指标特点结构相对指标是反映总体内部构成特征或类型的统计指标。各组或各部分占总体的比重之和,必须为1或100%例如:对市场上销售的冷饮产品的质量进行抽查,抽查结果为,合格品的数量占全部抽查产品数量的85%。比例相对指标概念:

比例相对指标是反映总体内各个局部、各个分组之间,数量的比例关系的统计指标。

计算方法:指标特点:

是同一总体内不同部分数量对比的结果。一般用百分比表示,也可用几比几的形式表示。例如:将全部工业按其生产产品的用途不同,分为轻工业和重工业,某地区轻、重工业的产值之比为:1.2:1。比较相对指标概念:说明某一同类现象在同一时间内各单位发展的不平衡程度,以表明同类事物在不同条件下的数量对比关系。计算方法指标特点同类指标在不同空间下进行对比。一般用百分数或倍数表示。例如:甲城市居民的平均收入是已城市居民收入的1.5倍。强度相对指标概念:是用来表明某一现象在另一现象中发展的强度、密度或普遍程度的相对指标。计算方法:指标特点:

是两个性质不同而又有联系的总量指标之间的对比。指标数值的计量单位可以是无名数,如百分数、千分数,也可以是有名数,如:吨公里、人/平方公里等。有正、逆指标之分。例如:某城市每万人拥有的零售商业网点数为10个/万人(正);或每个零售商业网点服务于1000人/个(逆)。动态相对指标概念:反映同类现象在不同时间上变动程度的相对指标。计算方法:指标特点:

是不同时间的同类指标进行对比。计算结果用百分数表示。例如:某商业企业2月份的销售额是1月份的120%。

第二节集中趋势的测定一)众数二)中位数三)算术平均数四)几何平均数五)平均思想是统计学的核心

一)众数

(一)众数的含义:

众数是指在某一总体中出现次数最多的标志值,或者在变量数列中具有最多次数的变量值,用M0表示。众数的作用:

通过其频数得多少来反映研究总体频数分配的集中状况。

在没有必要或不可能计算平均数和中位数时,可利用众数说明问题。

众数与算术平均数结合分析,可使分析更全面。

(二)众数的计算单项数列中:只需找出次数最多的标志值即可。组距数列中:众数不能直接看出,要通过公式计算,然后确定众数的近似值。L:众数组的下限;众数组次数与其前一组次数之差;众数组与后一组次数之差.

众数组组距.

L:众数组的下限;U:众数组的上限.众数组次数与其前一组次数之差;众数组与后一组次数之差.

众数组组距.表

某城市居民关注广告类型的频数分布

广告类型人数(人)比例频率(%)商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100【例】根据表中的数据,计算众数解:这里的变量为“广告类型”,这是个定类变量,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即

Mo=商品广告

例:某企业500名工人按工资分组,所得组距分布如下表所示,试计算工人工资的众数。工人按工资分组/元工人数/人40~5050~6060~7070~8080~9045802409045合计500

解:首先需确定众数组。例中60~70元这一组的次数最多,故该组即为众数组。按表中资料代入下限公式或上限公式计算:

二)中位数

(一)中位数的含义:将统计数据按大小顺序排列后,居于中间位置的数据就是中位数。中位数的特点:中位数不受极值的影响,通过中位数,可以从个一侧面反映频数分布的集中趋势。(二)中位数的计算1)未分组的原始资料:

先必须将标志值按大小顺序排序.再按下面的方式确定【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位数=1080

例:有7个职工的工资按高低排列为:56、62、62、76、76、76、76,求中位数。解:中位数位置=(7+1)/2=4

即第四个工人的工资76元为中位数。若职工人数增加到8个,其工资分别为56、62、62、76、76、76、76、86,则:中位数位置=(8+1)/2=4.5

即第四个职工至第5个职工之间为中间位置,故中位数就是第四项与第五项数据的算术平均数,即(76+76)÷2=76元2)由分组资料确定中位数单项分布中:直接根据累积频数来确定中位数组距分布的情况下:L:中位数所在组的下限;

中位数所在组的次数;中位数所在组以下的累计次数;中位数所在组以上的累计次数组距分布的情况下:L:中位数所在组的下限;U:中位数所在组的上限;

中位数所在组的次数;中位数所在组以下的累计次数;中位数所在组以上的累计次数例:某市职工家庭人均收入资料如下表所示,试计算中位数。每人平均月收入/元职工户数/户职工户数累计向上累计向下累计10~2020~3030~4040~5050~6060~7070~8080~90100300120020015010050301004001600180019502050210021302130203017305303301808030合计2130解:根据表中资料可知中位数位置为说明中位数应当在累计次数为1065的组内,从表中可以看出,中位数在30~40元的组内。用下限计算公式计算为:即中位数为35.54元。三)算术平均数1)概念:是统计中最基本最常用的一种平均数,是同一总体的标志总量除以总体单位总量的结果。基本公式:

应用此公式应注意:此公式是一个基本公式,在实际计算中由于掌握资料的不同,有不同的计算公式。但不论资料情况如何,计算公式如何改变,其基本含义最终都可归结为基本公式。2、算术平均数的计算形式

(一)简单算术平均数:

例如:已知5名工人的工资为:600元、780元、1050元、1100元、900元。根据资料计算五名工人的平均工资:解:设工人的工资为“Xi”,i=1、2、3、4、5,则工人的平均工资为:(适用于未分组资料)(二)加权算术平均数:适用于分组资料。计算公式:公式中:“X”代表各组变量值“f”代表各组变量值出现的次数或频数“∑”为合计符号

根据分组资料计算算术平均数,平均数的大小不仅受到各组变量值大小的影响,而且受到各个变量值出现次数多少的影响,因此需用下式计算其平均数:=x∑xf∑f

因为各组变量值出现次数的多少对平均数的形成产生权衡轻重的作用,所以将“f”称为权数。权数即可以表现为“次数”的形式,也可以表现为“比重”的形式。用“比重”权数计算算术平均数的公式为:计算公式:——②例:某企业工人按日产量分组资料如下:要求:根据资料计算工人的平均日产量。日产量(件)工人人数(人)(x)(f)

(f/∑f)1510

7162013173020185033194027

合计150100解:按第一个公式计算按第二个公式计算:例:某企业职工月工资分布情况如下表所示,试计算职工平均工资。月工资/元组中值x(元)工人数f(人)工资总额xf(元)800~90085065100900~10009501095001000~1100105020210001100~1200115010115001200~1300125045000合计-5052100

解:首先计算出各组的组中值,然后利用加权算术平均形式来计算职工平均工资:即该企业职工月平均工资为1042元。(三)算术平均数性质

1. 各变量值与均值的离差之和等于零

2.各变量值与均值的离差平方和最小3。均值是统计分布的均衡点,只有在均值点上才能支撑这一分布四)几何平均数几何平均数是n个变量值乘积的n次方根。几何平均数的适用范围:它常用于计算平均比率或平均速度。应用条件:①变量值的连乘积等于总比率或总速度;②变量值不得为0或负数。(一)简单几何平均数

例:某产品有四道流水作业的加工工序。设某厂5月份四道工序的产品合格率分别为90%、95%、92%和90%,求该厂产品的平均合格率。解:由于四道工序为流水作业,故产品的总合格率为四道工序合格率的连乘积:90%×95%×92%×90%,符合几何平均法的应用条件。因此,该厂产品的平均合格率为:

【例】一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。平均收益率=103.84%-1=3.84%五)平均思想是统计学的核心

1.平均指标必须应用于同质总体;

2.使用平均标应和次数分布相结合;

3.平均指标与分组法相结合;4.以变异指标补充说明平均指标。正确应用平均指标

1.平均指标必须应用于同质总体;

2.使用平均标应和次数分布相结合;

3.平均指标与分组法相结合;4.以变异指标补充说明平均指标。

第三节离散程度的测定一)极差二)平均差三)方差和标准差四)离散系数五)成数的标准差离中趋势的测定—变异指标数据分布的另一个重要特征反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值

变异指标的概念1)变异指标——又称“标志变动度”,它用于测定总体标志值的差异情况和离散程度。2)变异指标的作用:

(1)标志变异指标是衡量平均数代表性大小的尺度.

(2)标志变异指标是反映社会经济活动过程均衡性或节奏性的重要指标.

(3)计算标志变异指标确定推断的准确程度

(4)标志变异指标是科学确定必要抽样单位数和计算抽样误差的重要依据.

极差:总体中单位标志值的最大值与最小值的差距,即数列中两个极端数值之差,又称“全距”。极差(R)=最大标志值-最小标志值

一)极差

极差的计算较为简单,它只考虑到两头最大和最小的数值,所以易受极端值的影响。它没有考虑数列中间个变量值的变动,因而不能全面反应标志变动的程度。如果统计资料经过整理,并形成组距分布数列,则极差的近似值为:极差(R)=最高组的上限-最低组的下限(适用于未分组资料)(适用于分组资料)3、计算方法2、特点:

根据总体单位所有标志值来计算差异程度以算术平均数为计算的标准对离差取绝对值简单平均差公式:加权平均差公式:二)平均差1、涵义:是总体各单位标志值对算术平均数的离差绝对值的算术平均数。甲乙两个班组工人日产量资料如下:

甲班工人日产量(件):2528303542

乙班工人日产量(件):1824323848要求:计算平均差,比较两个班组工人平均日产量的代表性。

解:1、计算平均日产量甲班:x=n∑x=5

160=乙班:x=n∑x=5

160=32(件)

32(件)D=n∑|x-x|甲班:=5.2(件)乙班:D=n∑|x-x|=8.8(件)例题2、平均差∵甲班工人日产量的平均差小于乙班,∴甲班工人平均日产量的代表性大于乙班。

例:下表是某车间的两个生产小组日产量资料,试通过平均差比较两组平均数的代表性。第一组第二组日产量/件标志值与平均数的离差离差绝对值日产量/件标志值与平均数的离差离差绝对值xixi2040607080100120-50-30-100103050503010010305067686970717273-3-2-101233210123合计0180合计012解:两个小组工人的平均日产量都为=70件根据简单平均式计算出两组工人日产量的平均差:第一组的平均差第二组的平均差

计算结果表明,第一组的平均差大于第二组,因此第一组的平均数的代表性比第二组小。简单平均差也可借助于Excel中的“AVEDEV”函数来计算。三)方差和标准差

1. 离散程度的测度值之一2. 最常用的测度值3. 反映了数据的分布反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4681012X=8.3(一)总体方差和标准差计算公式未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式样本方差和标准差计算公式未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式例题:根据资料计算工人的平均日产量和标准差:工人平均日产量:x=∑xf∑f=74(件)工人日产量标准差:√Σ(x-x)2σ=fΣf=11(件)日产量(x)工人数(f)5510652475368522958

合计100

550156027001870760-19-9111213610194436266235281178030250101400202500158950

722005653007440例:某企业职工工资状况如下表所示,计算职工工资的标准差。按月工资额分组/元组中值/元职工人数/人工资总额离差离差平方离差平方×权数xifixifi50-6060-7070-8080-9090-100100-110110-120556575859510511540902003005503606022005850150002550052250273006900-35-25-15-5515251225625225252522562549000562504500075000137505850037500合计—1500135000——335000解:平均数标准差四)变异系数

1.

标准差与其相应的均值之比2. 消除了数据水平高低和计量单位的影响3. 测度了数据的相对离散程度4. 用于对不同组别数据离散程度的比较5.计算公式为表

某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)X1销售利润(万元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所属的8家企业,其产品销售数据如表4.7。试比较产品销售额与销售利润的离散程度X1=536.25(万元)S1=309.19(万元)V1=536.25309.19=0.577S2=23.09(万元)V2=32.521523.09=0.710X2=32.5215(万元)结论:计算结果表明,V1<V2,说明产品销售额的离散程度小于销售利润的离散程度五)成数的标准差统计分组中有一类特殊的分组,总体只分为两组“是”,或“非”,非此即彼。在可以分为两组的总体中,其中的一组所包含次数在总次数中所占的比例称为成数公式::成数:其中一组所含次数,

N:总次数

另一组的成数是成数的标准差是:

第四节统计数据的显示一)统计表二)统计图一)统计表1)统计表的作用

把汇总结果的资料按一定的规则在表格上表现出来,这种表格叫统计表。(广义上,任何用以反映统计资料的表格都是统计表)1)能使大量的统计资料系统化,条理化,因而能更清晰地表述统计资料的内容.2)利用统计表便于比较各项目之间的关系,而且也便于计算.3)采用统计表表述统计资料使得更紧凑,简明,醒目,使人一目了然.4)利用统计表易于检查数字的完整性和正确性.

2)统计表的构成统计表和是系统地表述数字资料的基本形式统计表的构成:1、从外表形式上看:标题、横行、纵栏、数字资料2、从内容上看:主词(列在表的左方)宾词(列在表的上方)表

1997~1998年城镇居民家庭抽样调查资料项目单位1997年

1998年

一、调查户数二、平均每户家庭人口数

三、平均每户就业人口数

四、平均每人全部收入

五、平均每人实际支出

#消费性支出

非消费性支出

六、平均每人居住面积户人人元元元元平方米

378903.191.835188.544945.874185.64755.9411.90

390803.161.805458.345322.954331.61987.1712.40资料来源:《中国统计摘要1999》,中国统计出版社,1999,第79页。注:1.本表为城市和县城的城镇居民家庭抽样调查材料。

2.消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。行标题表头列标题数字资料附加

3)统计表的种类(一)按主词加工方法不同分类分为简单表、分组表和复合表简单表是主词未经任何分组的统计表分组表是主词按某一标志进行分组的统计表,分组表用来揭示现象不同类型的不同特征,研究总体的内部构成,分析现象之间的依存关系。复合表是主词按两个或两个以上标志进行复合分组的统计表。。(二)按宾词不分组设计1、平行配置:指宾词栏中各分组标志彼此分开,各标志的分组指标做平行排列。2、层叠配置:指将各分组标志层叠在一起,使各标志的分组指标有较大的增多要合理安排统计表的结构总标题内容应满足3W要求数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明表中的上下两条横线一般用粗线,其他线用细线通常情况下,统计表的左右两边不封口表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一对于没有数字的表格单元,一般用“—”表示必要时可在表的下方加上注释4)统计表的设计要求复合表举例

某年某地区工业净产值和职工人数项目净产值(万元)职工人数(人)国有大975013800中860045000小420010050集体大73007500中520010400小44004500合计3945091250宾词分组简单设计案例:某地区工业企业的工人性别和工龄按所有制形式分组企业数工人人数性别工龄男女1年以下1-3年3-5年5-10年10年以上(甲)(1)(2)(3)(4)(5)(6)(7)(8)(9)国有经济集体经济合计复合设计某工业企业的工人性别和工龄企业按所有制分组企业数工人人数工龄1年以下1-3年3-5年5-10年10年以上男女计男女计男女计男女计男女计男女计(甲)(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)(13)(14)(15)(16)(17)(18)(19)国有经济集体经济合计

概念:用点、线、面的位置、升降或大小来表达统计资料数量关系的一种形式。

二)统计图统计图的制作原则根据资料性质和分析目的选择合适统计图。除圆图外,一般用直角坐标系的第一象限表示图域(制图空间),或者用长方形框架表示。所绘制的图形应准确、美观,给人以清晰的印象。图形:按资料的性质和分析目的选用合适的图形标题:在图下方,说明图的内容,必要时包括时间、地点标目:纵横轴应在标目注明单位,纵横轴之比以5:7为宜图例:在图内右上角或图下方标题之上

制图的基本要求1)直条图概念:用等宽直条的长短表示各个相互独立统计量的大小和对比关系的图形适用资料:相互独立的资料(分组明确,不连续)(定类或定序数据)分类:单式:适用于一组观察资料;复式:适用于有若干组观察资料绘图要点:通常横轴安排相互独立的事物(分组因素),纵轴表示欲比较的指标,直条竖放,亦可横放。图19-22000年某省10万人中拥有各种受教育程度人数绘图要点:各条形宽度相等,间隔一般与直条等宽或为其一半。各直条可按指标值大小排列,若有自然顺序也可按其自然顺序排列。图19-12000年某省10万人中拥有各种受教育程度人数

图19-420世纪90年代部分地区生育率与避孕药具使用率

人数(人)5191610211204080120

商品广告

服务广告

金融广告

房地产广告

招生招聘广告

其他广告广告类型

某城市居民关注不同类型广告的人数分布2)线图概念:以线段的升、降表示事物在时间上的发展变化或一种现象随另一种现象变迁的情况

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论