




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《统计学》第2章统计整理2021/6/271第5节分配数列2021/6/272课程回顾一、统计分组的概念二、统计分组的目的三、统计分组的作用四、统计分组标志选择的原则五、统计分组的分类2021/6/273一、分配数列的概念和种类(一)分配数列的概念
是在分组的基础上,把总体的所有单位按组归类整理,并按一定的顺序排列,形成总体中各个单位在各组间的分布,又称次数分配。次数:分布在各组的个体单位数,又称为频数;总次数:全部总体单位数;比率:各组次数与总次数之比,又称为频率。2021/6/274分组标志的具体表现各组的次数或频率构成要素(二)分配数列构成要素2021/6/275例月工资分组(元)工人数(人)占总数比重(%)2000以下21039.62000-250018735.32500以上13325.1合计530100.0
组别(变量)频数(次数)频率(比率)2021/6/276思考:分配数列与分组的区别?
分配数列是在分组的基础上加上次数(频数)的分布。2021/6/277(三)分配数列的分类1.品质分配数列指按品质标志对总体分组形成的数列,简称为品质数列。2.变量分配数列指按数量标志对总体分组形成的数列,简称为变量数列。按照标志的性质不同2021/6/278(三)分配数列的分类异距数列等距数列变量数列离散型变量数列连续型变量数列变量数列单项数列组距数列2021/6/279(一)品质数列二、分配数列的编制
编制品质数列,只要根据统计研究目的,正确选择分组标志,确定分组标准,则事物性质的差异可以明确地表现出采,也就容易划分总体中各组的性质界限。因此,在通常情况下,品质数列能够较准确地反映总体各单位的分布状态和特征。2021/6/2710
某班学生的性别构成情况
例按性别分组绝对数人数比重(%)男3075女1025合计40100
组别次数频率2021/6/2711(二)变量数列
按数量标志分组,就是将变量值即数量标志值划分为不同的区段,通过各组的数量差别和变化来区分现象的不同性质,反映总体各单位在各组间的分布状态和特征。
2021/6/27121.单项数列指每个组值只用一个具体的变量值表现的数列同时具备变量是离散变量变量的不同取值个数较少(2)编制条件:(1)概念(3)编制步骤a.将原始资料按照变量值大小顺序排列。b.按变量值分为若干组。c.设计综合表(整理表),整理出变量值出现的次数。2021/6/2713
己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。【例】20,20,20,21,21,21,21,21,22,22,22,22,22,22,23,23,23,23,24,24,24,25,25,26,排序后2021/6/2714日产量(件)X工人数(人)f20212223242526合计编制结果如下:3564321242021/6/27152.组距数列指每个组的变量值用一个区间来表现的变量数列变量是连续变量;或:总体单位数较多变量不同取值个数也较多的离散变量。
(2)编制条件:(1)概念2021/6/27162.组距数列(3)组距数列编制的步骤:a.排序,计算全距。b.确定组数、组距。c.确定组限及其表示法。d.计算频数、频率。e.制作组距数列统计表。2021/6/2717组距式分布数列的有关概念指每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限。组限每组变量值变动区间的长度,为上下限之差组距每组变量取值范围的中点数值
组中值2021/6/2718开口式组距数列组中值的计算:
首组假定下限=首组上限-相邻组组距末组假定上限=末组下限+相邻组组距先计算开口组的假定上、下限:
因此有:首组组中值末组组中值2021/6/2719某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5组中值=U-d/2=50-25=25组中值=L+d/2=300+100/2=3502021/6/2720组距数列的几个具体步骤解释a.求全距b.确定组距及组数确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5,10,50,100,500的整数倍R≤组距(d)×组数(k)2021/6/2721等距数列与异距数列等距数列各组组距均相等,一般适用于变量值比较均匀的情况。异距数列各组组距不全相等,不常用。
2021/6/2722异距数列适用于1.标志值分布很不均匀的场合,在分布比较密集的区间内使用较短的组距,在分布比较稀少的部分使用较长的组距。2.等量的标志值具有不同意义的场合例:进行人口疾病研究的年龄分组,应采用异距分组,即:1岁以下按月分组,1-10岁按照年龄分组,11-20按照5年分组,21岁以上按照10年分组等。2021/6/2723异距数列适用于3.标志值按一定比例发展变化的场合例:大城市百货商店营业额差别很大的,比如营业额从5万到5千万元,可采取公比为10的不等距分组,即:5-50万元,50-500万元,500-5000万元,如果采用等距分组,即便组距为100万元,也得分50组,显然是不合适的。2021/6/2724计算组数(组数不宜过多,也不宜太少)(当的结果为整数时)(当的结果为小数时)2021/6/2725组数的经验公式
如果现象近似于正态分布,则可参考美国统计学家斯特杰斯提出的分组数的经验公式:组数(K)=1+3.322lgN其中,N为总体单位数。2021/6/2726c.确定组限及其的表示方法对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上组限不计入”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法2021/6/2727例
工业企业按照职工人数分组可以表示为:499人以下,500-999人,1000-1999人,2000人以上等。
工业企业按照职工人数分组可以表示为:500人以下,500-1000人,1000-2000人,2000人以上等.2021/6/2728实例2021/6/2729己知某地区某年50个商店商品销售额的资料如下(单位:百万元):
7.412.629.0
2.012.47.014.817.5
15.0
18.2
18.7
15.512.826.0
17.3
8.314.712.03.5
6.8
25.0
19.3
6.4
4.011.98.513.214.517.1
15.613.44.5
9.5
20.0
15.7
6.011.423.014.216.7
21.0
16.013.610.013.95.0
5.810.516.3
22.0要求编制组距数列。2021/6/2730编制步骤:⒈求变异全距⒉确定组距及组数R≤组距(d)×组数(k)上例中,取d=5,则有⒊确定组限2021/6/2731编制等距数列适用于总体单位的标志值变动比较均匀的情况实例己知某地区某年50个商店商品销售额的资料如下(单位:百万元):
7.412.629.0
2.012.47.014.817.5
15.0
18.2
18.7
15.512.826.0
17.3
8.314.712.03.5
6.8
25.0
19.3
6.4
4.011.98.513.214.517.1
15.613.44.5
9.5
20.0
15.7
6.011.423.014.216.7
21.0
16.013.610.013.95.0
5.810.516.3
22.0要求编制组距数列。2021/6/2732⒋计算次数编制结果:
销售额(百万元)商店数5以下5~1010~1515~2020~2525以上合计504101613432021/6/2733
销售额(百万元)商店数频率(﹪)5以下5~1010~1515~2020~2525以上410161343820322686合计50100频率各组单位数占总体单位总数的比重2021/6/27342021/6/2735
休息是为了走更长的路,累了,迷茫时,就坐下来,静静地,想想未来路的方向…2021/6/2736
从变量值低的组开始,将各组次数和比率逐次向变量值高的组累计。组距数列中的向上累计,表明各组上限以下总共所包含的总体次数和比率有多少。三、累计次数分布(一)向上累计(以下累计、或较小制累计)2021/6/2737
从变量值高的组开始,将各组次数和比率逐次向变量值低的组累计。组距数列中的向下累计,表明各组下限以上总共所包含的总体次数和比率由多少。(二)向下累计2021/6/2738
销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)5以下5~1010~1515~2020~2525以上410161343820322686合计501002021/6/2739
销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向下累计向下累计5以下5~1010~1515~2020~2525以上41016134382032268641430434750828608694100合计50100——2021/6/2740
销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向下累计向上累计向下累计向上累计5以下5~1010~1515~2020~2525以上410161343820322686414304347505046362073828608694100100927240146合计50100————2021/6/2741按完成定额分组工人人数频率(﹪)累计次数累计频率(﹪)100以下100~110110~120120~130130~140140~150150~16051011832112.52527.5207.552.5合计40100————2021/6/2742按完成定额分组工人人数频率(﹪)累计次数累计频率(﹪)向下累计向上累计向下累计向上累计100以下100~110110~120120~130130~140140~150150~16051011832112.52527.5207.552.551526343739404035251463112.537.5658592.597.510010087.562.535157.52.5合计40100————2021/6/2743
当我们所关心的是标志值较小的现象的次数分布情况时,通常用向上累计;
当我们所关心的是标志值较大的现象的次数分布情况时,通常用向下累计;2021/6/2744四、图示法
即用统计图来表示次数分配直方图多边形图2021/6/2745(一)直方图
用矩形的宽度和高度来表示次数分配的图形。它是最常用的次数分配的图示法。绘制直方图时,横轴表示各组组限,纵轴表示频数(一般标在图的左方)和频率(一般标在图的右方),如没有频率则只保留左侧频数。按分布在各组的频数及频率确定各组在纵轴上的坐标,并依据各组组距的宽度与频数的高度绘成矩形。2021/6/2746VAR00001174.0170.0166.0162.0158.0154.0403020100Std.Dev=4.86Mean=163.3N=83.00用矩形的宽度和高度来表示频数分布的图形2021/6/2747(一)直方图仍以某班应用统计学考试成绩数据,画成如下直方图:
4050607080901001102021/6/2748若组距不等的话,用标准组距人数,然后据此画直方图:按工人年龄分组(岁)组距人数(人)标准组距人数(人)频数密度=频数/组距15-20517173.420-25528285.625-30540408.030-35570701456.545-50510102.0合计-230--2021/6/2749直方图例101520253035404550552021/6/2750(二)次数多边形图在直方图的基础上连接各条形顶边的中点成折线图。如下图红笔围成的,即为次数分配多边形图
(次数折线图):
4050607080901001102021/6/2751条形图(Bar)用于显示离散型变量的次数分布2021/6/2752条形图(Bar)用于显示离散型变量的次数分布2021/6/2753条形图(Bar)用于显示离散型变量的次数分布2021/6/2754圆形图(饼图
Pie
)主要用于显示定类变量的次数分布2021/6/27552021/6/27562021/6/2757线图(Line)主要用于显示连续型变量的次数分布和现象的动态变化2021/6/2758散点图(Scatter)主要用来观察变量间的相关关系,也可显示数量随时间的变化情况2021/6/2759
各种不同性质的社会经济现象都有着特殊的次数分布。概括起来,主要有下列四种类型:钟形分布水平分布U形分布J形分布
五、次数分布的主要类型2021/6/2760
钟形分布的符征是“两头小、中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少。绘成曲线图,宛如一口古钟。
(一)钟形分布2021/6/2761
钟形分布具体可分为对称分布和非对称分布。对称分布的特征是中间变量值分布的次数最多,两侧变量值分布的次数则随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布。
2021/6/2762
对称分布中的正态分布最为重要,许多社会经济现象统计总体的分布都趋近于正态分布。例如,农业平均亩产量的分布、零件公差的分布、商品市场价格的分布等。正态分布在社会经济统计学中具有重要意义。
2021/6/2763
在非对称的分布中,有不同方向的偏态,如图:2021/6/2764
水平分布的特征是总体内各个变量值分布的次数大体相等,绘成图形,表现为一条平行于横铀的水平线,如图:
(二)水平分布2021/6/2765
例如,某些必需而用途又比较狭窄的商品(如丧葬用品)的价格,需求弹性小,不论价格如何变化,而需求量变动不大。需求量按价格水平分组便呈现水平分布。现实生活中严格的水平分布是比较少见的,但对这种分布的研究,在统计理论上有着特殊的意义。2021/6/2766U形分布的待征与钟形分布恰恰相反,靠近两端的变量值分布的次数多,靠近中间的变量值分布的次数少,形成“两头高、中间低”的分布持征。绘成曲线图,象英文字母“U”字。图形如:。
(三)U形分布2021/6/2767
有些社会经济现象的分布表现为U形分布,例如人口死亡率分布。由于人口总体中幼儿死亡人数和老年死亡人数均较高,而中年死亡人数最低,因而按年龄分组的人口死亡率便表现为U形分布。2021/6/2768J形分布有两种类型。正J形分布是次数随着变量值的增大而增多,绘成曲线图,犹如英文字母“J”字。反J形分布是次数随着变量值的增大而减少,绘成曲线图,犹如反写的英文字母“J”字,图形如下:(四)J形分布
2021/6/2769
在社会经济现象中,有一些统计总体呈J形分布。例如,资本主义社会中,投资额按利润率大小分布,一般均呈正J形分布;而人口总体按年龄大小分布,则一般均呈反J分布。2021/6/2770第五节统计表一、统计表的概念与作用二、统计表的结构三、统计表的分类四、宾词指标的设计五、编制统计表应注意的问题2021/6/2771一、统计表的概念与作用(一)统计表的概念
把统计调查得来的数字资料,经过汇总整理后,得出一些系统化的统计资料,将其按一定顺序填列在一定的表格内,这个表格就是统计表。
以纵横交叉的线条所形成的表格来表现统计资料的形式。2021/6/2772(二)统计表的作用
1.代替冗长的文字叙述,简明、有条理地罗列数据与统计量,方便阅读、比较与计算;
2.展示数据的结构、分布和主要特征,便于在进一步分析中选择与计算统计量。2021/6/2773二、统计表的结构(一)从内容上,统计表由主词和宾词两部分组成1.主词:统计表所要说明的总体及其分组。2.宾
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 重庆能源职业学院《医药产品推销理论与技巧》2023-2024学年第一学期期末试卷
- 黑龙江佳木斯第一中学2024-2025学年高三下学期第一学段考英语试题含解析
- 海南工商职业学院《高分子基础专业理论教学》2023-2024学年第二学期期末试卷
- 重庆电信职业学院《汉语言文学教师教育专业导论》2023-2024学年第一学期期末试卷
- 浙江纺织服装职业技术学院《保健食品设计原理》2023-2024学年第二学期期末试卷
- 古代乳癖灸法论述
- 公路工程软基处理质量保证措施
- 沥青路面拉毛施工方案
- 江苏施工方案报审表
- 2025年中国酒业市场分析:规模突破万亿结构升级与消费趋势洞察
- 2022年扭转实验报告
- 数学建模教学课件
- 医学专题血管麻痹综合征(刘德昭)
- SF∕T 0111-2021 法医临床检验规范
- 美国德克萨斯州驾驶考试模拟题及相关资料中英对照
- GB∕T 10836-2021 船用多功能焚烧炉
- 【告知牌】有限空间作业安全告知牌及警示标志
- 个人劳动仲裁申请书
- 特种设备现场安全监督检查记录(共1页)
- 福德正神真经
- 溢流堰稳定计算
评论
0/150
提交评论