统计学第2章下_第1页
统计学第2章下_第2页
统计学第2章下_第3页
统计学第2章下_第4页
统计学第2章下_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

§2.3频数分布2.3.1频数分布及其两个要素2.3.2相关几个概念2.3.3分布数列的分类2.3.4简单分布数列的编制2.3.5简单频数分布图的绘制2.3.6累计频数(或频率)分布2.3.1频数分布及其两个要素1、频数分布的基本概念频数分布:在分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布称为频数分布,或次数分布。把总体的全部单位按某标志所分的组进行归并排列所形成的反映总体各组之间单位分布状况的数列,称为分布数列或分配数列。

2.3.1频数分布及其两个要素2、分布数列的两个组成要素总体按某标志所分的组各组所出现的单位数(即频数或次数)或频率2.3.1频数分布及其两个要素3、基本形式:分组单位数频率合计………100频数分布数列频率分布数列2.3.2相关几个概念1、频数:各组所出现的单位数即频数或次数2、频率:反映了各组频数的大小对总体所起作用的相对强度,它是各组频数与总体单位总和之比。设各组出现的次数为fi,则频率=fi/∑fi性质:0≦fi/∑fi≦1各组频率之和为1,即∑(fi/∑fi)=12.3.2相关几个概念3、频数密度:采用异距分组,各组次数(频数)的多少受到组距不同的影响,为消除异距分组所造成的影响须计算频数密度。频数密度即单位组距内分布的频数。频数密度的计算公式:频数密度=频数/组距各组频数密度与各组组距乘积之和等于总体单位数频率密度即单位组距内分布的频率。频率密度的计算公式:频率密度=频率/组距各组频率密度与各组组距乘积之和等于17广告类型人数比例(人)频率(%)商品广告1120.5656服务广告510.25525.5金融广告90.0454.5房地产广告160.088.0招聘广告100.055.0其他20.011.0合计2001100例:某城市居民关注广告类型的分布8

品质数列(一)按分组标志变量数列单项式数列分组距式数列等距数列布异距数列数列钟形分布数列正态分布偏态分布左偏分布(二)按频数分布特征右偏分布

U形分布数列

J形分布数列J形反J形2.3.3分布数列的分类9(一)按分组标志不同分为品质数列和变量数列1.品质(分布)数列:按品质标志分组所形成的数列各组名称次数(频数)

频率1001000合计6040600400男性女性所占%人数按性别分组分布数列的分类102.变量(分布)数列:按数量标志分组所形成的数列

1001000合计815233415580150230340150501000元以下1000-15001500-20002000-25002500-30003000元以上所占(%)人数(人)按月工资收入分组各组名称次数(频数)频率(一)按分组标志不同分为品质数列和变量数列分布数列的分类11变量数列按照分组形式不同分为单项式数列和组距式数列单项式数列:各组由一个具体的变量值(单项)来表示的数列。单项式分组一般适用于离散型变量且变量变动范围不大的场合。变量数列的分类【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。12日产量(件)X工人数(人)f202122232425263564321合计24编制结果如下:单项式数列13(2)组距式数列:组距式分组是以变量值变动的一定范围(区间)作为一组,区间的距离就是组距。这样的分组所形成的变量分配数列叫组距式变量数列,简称组距式数列。

每一组变量值中,其最小值称为下限,最大值称为上限。对于连续型变量或者变动范围较大的离散型变量,适宜采用组距式分组。组距式分组分为:间断组距式分组和连续组距式分组等距分组和异距分组变量数列按照分组形式不同分为单项式数列和组距式数列变量数列的分类14(二)按频数分布不同分为:钟型分布数列、U型分布数列、J型分布数列1.钟型分布:特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,其形状宛如一口古钟。分布数列的分类15钟形分布具体可分为对称分布和非对称分布。

对称分布的特征是中间变量值分布的次数最多,两侧变量值分布的次数则随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布,如图①。16对称分布中的正态分布最为重要,许多社会经济现象统计总体的分布都趋近于正态分布。例如,农业平均亩产量、零件公差、商品市场价格、身高、体重、智商、纤维长度、细纱强度、粮食作物产量等。

正态分布在社会经济统计学中具有重要意义。

17

右偏左偏在非对称的分布中,有不同方向的偏态,右偏(正偏)(图②),左偏(负偏)(图③)182.U形分布U形分布的特征与钟形分布恰恰相反,靠近两端的变量值分布的次数多,靠近中间的变量值分布的次数少,形成“两头高、中间低”的分布持征。绘成曲线图,象英文字母“U”字。如图所示。

分布数列的分类(二)按频数分布不同分为:钟型分布数列、U型分布数列、J型分布数列19有些社会经济现象的分布表现为U形分布例如人口死亡率分布。由于人口总体中幼儿死亡人数和老年死亡人数均较高,而中年死亡人数最低,因而按年龄分组的人口死亡率便表现为U形分布。203.J形分布

J形分布有两种类型。正J形分布是次数随着变量值的增大而增多,绘成曲线图,犹如英文字母“J”字。反J形分布是次数随着变量值的增大而减少,绘成曲线图,犹如反写的英文字母“J”字,图形如下:分布数列的分类(二)按频数分布不同分为:钟型分布数列、U型分布数列、J型分布数列21在社会经济现象中,有一些统计总体呈J形分布。例如,资本主义社会中,投资额按利润率大小分布,一般均呈正J形分布;而人口总体按年龄大小分布,则一般均呈反J分布(如成年人数量按年龄大小分组,表现出年龄越高,人数越少)。222.3.4简单分布数列的编制1、品质分布数列的编制:只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:

经济类型企业数(个)

比重(%)国有企业股份制企业合资企业独资企业1008050204032208

合计250100第一步:将原始资料按数值大小依次排列。第二步:确定变量的类型和分组方法(单变量分组或组距分组)。第三步:确定组数和组距。对于等距分组,当组数确定后,组距可计算得到:组距=全距/组数全距=最大变量值—最小变量值。第四步:确定组限。(第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。或者第一组和最后一组采用”ⅹⅹ以下”和”xx以上”表示)第五步:汇总出各组的单位数,计算频率,并编制变量分布数列。2、变量分布数列的编制:2.3.4简单分布数列的编制24编制等距数列--适用于总体单位的标志值变动比较均匀的情况己知某地区某年50个商店商品销售额的资料如下(单位:百万元):

7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.05.810.516.322.0要求编制组距数列。实例2、变量分布数列的编制:25编制步骤:⒈求变异全距⒉确定组距及组数确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5或10的整数倍R≤组距(d)×组数(m)26计算组数(组数不宜过多,也不宜太少)上例中,取d=5,则有27⒊确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上限不在内”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法28⒋计算频数编制结果:

销售额(百万)组中值商店数5以下5~1010~1515~2020~2525以上2.57.512.517.522.527.5410161343合计—

5025+(25-20)/2=27.5

29等距数列分布图绘制的步骤:(1)以横轴代表变量,并在上面标出各组组限值所在位置,以纵轴代表频数(2)以各组组距为宽,各组次数为高,绘出各组所对应的直方图(3)将各直方图上端的中点连成一条折线,就形成次数分布曲线2.3.5简单频数分布图的绘制30生产零件数频数105~1103110~1154115~1208120~12514125~13011130~1355135~1403【例】某车间工人日加工零件分布情况,画出直方图:31分组数据—直方图

频数(人)

15

12

9

6

3

105

110

115

120

125

130

135

140

日加工零件数(个)图某车间工人日加工零件数的直方图32累计频数(或频率)分布表的编制向上累计频数(或频率)分布:即从低组到高组累计,表示该组上限以下的次数(频率)有多少。向下累计频数(或频率)分布:即从高组到低组累计,表示该组下限以上的次数(频率)有多少。

累计频数(或频率)分布:可以说明截止到某一组变量值以下或以上所对应的分配次数(或频率)是多少2.3.6累计频数(或频率)分布33序计划完成工人数比重以上累计以下累计号程度(%)(人)(%)人数比重人数比重

160—7021.0270—8052.5380—90147.0490—1003115.55100—1106532.56110—1205226.07120—1302311.58130—14084.0

合计2001002721521171691922001.03.510.526.058.584.596.0100831831481791931982004.015.541.574.089.596.599.010034累计频数(或频率)分布图的编制编制方法:以变量为横轴,累计频数和累计频率为纵轴,绘制累计频数(或频率)分布图。累计频数分布折线图的画法和频数分布折线图有些不同。画向上累计分布折线图时,从首组下限开始,将各累计次数组的上限的纵坐标连接起来。画向下累计分布折线图时,从末组的上限开始,将各累计次数组的下限的纵坐标连接起来。2.4数据显示2.4.1统计表2.4.2统计图35361、统计表的概念统计表是集中而有序地表现统计资料的表格。经过统计汇总,得到一系列统计指标的数字资料,把这些数字按一定的逻辑顺序在表上表现出来,这种表称为统计表。统计表是表现统计资料最常用的形式,也是统计分析的重要工具。广义的统计表包括统计工作各个阶段中所用的一切表格。狭义的统计表专指分析表和容纳各种统计资料的表格。即通常所说的统计表。2.4.1统计表37(1)从表式上看统计表包括:总标题、横行标题、纵栏标题、指标数值总标题(也称统计表的名称),它用概括性的文字简单明了地说明统计资料的基本内容、时间和范围。一般写在表的上部中端。横行标题是横行的名称,一般反映统计表的主要项目,通常写在表的左方。纵栏标题是纵栏的名称,一般列示统计指标的名称,一般写在表内右上方。指标数值也称数字资料,它是统计表的具体内容,

列在各横行标题和各纵栏标题的交叉处。任何一个具体数值都由横行标题和纵栏标题所限定。

2、统计表的结构某地区档案馆藏量增长表年份档案馆藏量(万卷)1960年101970年181985年231999年322009年45

横行标题主词栏宾词栏指标数值纵栏标题总标题39(2)从内容上看统计表包括:主词栏、宾词栏主词栏是统计表所要说明的总体,它可以是各个总体单位的名称、总体的各个组,或者是总体单位的全部。宾词栏是说明总体的统计指标,包括指标名称和指标数值。40按地区分组完成投资额(亿元)增长率(%)比重(%)(1)(2)(3)东部地区中部地区西部地区12,1884,1212,38717.520.721.165.222.012.8表2008年工业企业固定资产投资情况主词宾词41(1)按用途分:①调查表②汇总表③分析表(2)按主词是否分组和分组的程度分

①简单表②分组表③复合表(3)按宾词的设计类型分

①宾词简单排列②宾词分组平行排列③宾词分组层叠排列3、统计表的种类42(2)按主词是否分组和分组的程度分

①简单表②分组表③复合表1、简单表,是指对总体未作任何分组而形成的统计表,可以有两种形式:一是按总体单位名称排列的统计表;二是按时间顺序排列的统计表某地区8个工业企业劳动生产率情况表企业经济类型职工平均人数产值(万元)人均产值(百元)1国有540963.9178.52国有500864.0172.83国有480844.8176.04集体420621.6148.05其他400518.4129.66国有360445.5123.87集体360277.277.08其他350368.9105.4合计34104904.3143.82简单表44年份国内生产总值(亿元)1996199719981999200067884.674462.678345.282067.589403.6表近年来国内生产总值资料:简单表45(2)按主词是否分组和分组的程度分

①简单表②分组表③复合表

2、分组表,也称简单分组表,是指总体仅按一个标志分组而形成的统计表。利用分组表揭示现象不同类型的不同特征,研究总体的内部构成,分析现象之间的依存关系。

46按销售额分组(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5简单分组表某地区商店按销售额分组的商品流通费用率按固定资产原值分组(万元)企业数职工人数人均总产值每百元固定资产产值人数比重%200以下4105023.770.9121200—3505187042.1121.0167350--5003152034.2175.8222合计124440100.0128.0170某地区工业企业按固定资产原值分组的劳动生产率和固定资产利用效益简单分组表48(2)按主词是否分组和分组的程度分

①简单表②分组表③复合表3、复合表,也称复合分组表,是指总体按两个或两个以上标志进行复合分组而形成的统计表。在一定分析任务要求下,复合表可以把更多的标志结合起来,更深入地分析社会经济现象的特征和规律性。

49表某年我国日均国内生产总值按产业和行业分组国内生产总值(亿元)第一产业第二产业

工业

建筑业第三产业

交运仓储邮电通信业

批发零售贸易餐饮业

其他39.6110.795.814.974.112.218.743.2合计224.4复合表按经济类型和固定资产原值分组(万元)企业数人均固定资产(百元)每百元固定资产产值人均总产值(百元)国有200——350168.0155.0105.4350——500379.1222.0175.8小计477.1211.0162.7集体200万元以下164.0120.076.8200——350373.8166.4122.9小计472.0158.9114.5合计871.5179.0128.0某地区工业企业按所有制和固定资产原值分组的劳动生产率和固定资产利用效益复合表

某年某地区工业净产值和职工人数项目净产值(万元)职工人数(人)国有大975013800中860045000小420010050集体大73007500中520010400小44004500合计3945091250复合表52①宾词简单排列宾词不进行任何分组,按一定顺序排列在统计表上。通常根据指标说明问题的主次先后排列,保持指标间的逻辑关系。(3)按宾词的设计类型分

①宾词简单排列②宾词分组平行排列③宾词分组层叠排列53表某年我国日均国内生产总值按产业和行业分组国内生产总值(亿元)比重(%)第一产业第二产业

工业

建筑业第三产业

交运仓储邮电通信业

批发零售贸易餐饮业

其他39.6110.795.814.974.112.218.743.217.749.386.513.533.016.525.258.3合计224.4100宾词简单排列按经济类型和固定资产原值分组(万元)企业数人均固定资产(百元)每百元固定资产产值人均总产值(百元)国有200——350168.0155.0105.4350——500379.1222.0175.8小计477.1211.0162.7集体200万元以下164.0120.076.8200——350373.8166.4122.9小计472.0158.9114.5合计871.5179.0128.0某地区工业企业按所有制和固定资产原值分组的劳动生产率和固定资产利用效益复合表宾词简单排列55②宾词分组平行排列宾词栏中各分组标志彼此分开,各标志的分组指标平行排列宾词指标占有的栏数等于各标志分组的项数之和(3)按宾词的设计类型分

①宾词简单排列②宾词分组平行排列③宾词分组层叠排列某地区工业企业的工人性别和工龄按所有制形式分组企业数工人人数性别工龄男女1年以下1-3年3-5年5-10年10年以上(甲)(1)(2)(3)(4)(5)(6)(7)(8)(9)国有经济集体经济合计57按月工资分组

按性别分(人)按级别分小计男女小计

技工学徒工300以下300~400400~500500~600600~700700以上416221510516101184310124214162215105024585414181020合计72403272244858③宾词分组层叠排列将各分组标志层叠在一起,使各标志的分组指标有较大的增多。宾词指标占有的栏数,等于各标志的分组项数乘积(3)按宾词的设计类型分

①宾词简单排列②宾词分组平行排列③宾词分组层叠排列某地区工业企业的工人性别和工龄企业按所有制分组企业数工人人数工龄1年以下1-3年3-5年5-10年10年以上男女计男女计男女计男女计男女计男女计(甲)(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)(13)(14)(15)(16)(17)(18)(19)国有经济集体经济合计主词分组和宾词分组的区别主词分组的结果使总体分成许多组成部分宾词分组的结果并不增加统计总体的各组成部分,仅仅是比较详细地描述总体已有的各个组成部分统计表的格式一般是开口式,即表的左右两端不画纵线

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论