版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学教案及讲义中国矿业大学教材:统计学原理,李洁明,复旦大学出版社主要参考书目:统计学 袁卫等主编 高等教育出版社 2002年版社会经济统计学原理 黄良文主编 中国统计出版社 2001年版统计学 贾俊平等编著 中国人民大学出版社 2002年版依据:徐海学院统计学教学大纲本课程授课计划:章节主要内容课时安排备注1绪论统计与统计学;统计学中的基本概念;研究方法3+12统计工作过程及基本方法统计设计;统计调查;统计整理;统计分析;总量指标;相对指标;平均指标;标志变异指标9+1习题课1次3时间数列基本概念;发展水平指标;发展速度指标;长期趋势的测定;季节因素的测定7+1习题课1次4统计指数基本概念
2、;总指数;平均指数;两种指数体系的结合应用7+1习题课1次5抽样调查基本概念;抽样调查组织方式及方法;抽样误差;总体指标的推断;组织设计7+1习题课1次6相关分析与回归分析相关分析;一元线性回归7+1习题课1次复习课课程总复习2实验课应用EXCEL软件实现:数据收集与整理;描述统计分析;时间数列构成分析;一元线性回归与预测8共计56课程的引入1、人人都来学点统计知识2、统计AZ3、文章免费摸奖及其统计学原理4、文章科学设计方法与统计学原理第一章 绪论教学目的和要求:该模块是该课程的开头模块,目的是使学生对统计学这门课程整体上有一个大致的了解。要求学生了解统计学的涵义、统计学的产生与发展,正确地
3、理解统计学的对象与特点,掌握统计学的几个基本概念。教学重点:1、统计学的涵义2、统计学的产生与发展3、统计学的性质与特点4、统计学中几个重要的概念教学难点:1、统计学的涵义2、统计学的性质3、统计学中几个重要的概念教学方法:讲授、举例说明、讨论。授课时数:4学时基本内容:第一节 统计和统计学一、什么是统计 (三种涵义、两重关系)几个示例:请给我今天上课的应到人数、实到人数,并计算该次课的出勤率?说明出勤率高或低的原因?请给我你班学生来自的地区、性别、年龄、籍贯、政治面貌等,并做简要说明。请对你班高考成绩做一分析要回答这些问题,必须通过一定的形式,得到上述情况,就是统计工作过程,获得统计资料,并
4、用一些统计方法进行分析。实际上就是要应用统计知识来完成。(一)三种涵义1统计工作:调查研究。资料收集、整理和分析。2统计资料:包括统计数据和分析报告。3统计学:研究事物数量方面(统计数据)的方法和原理,是方法论科学。(二)两重关系统计工作是统计实践活动,统计资料是统计工作的成果;统计学是统计实践经验的理论概括和深化,统计学形成以后,又反过来指导统计工作实践,它们是理论与实践的关系。统计学统计资料统计工作工作与工作成果关系实践与理论关系二、统计的产生与发展(一)“统计”一词的由来统计已经有几千年的历史。不过在早期还没有出现"统计"这样的用语。统计语源最早出现于中世界拉丁语的S
5、tatus,意思指各种现象的状态和状况。由这一语根组成意大利语Stato,表示"国家"的概念,也含有国家结构和国情知识的意思。根据这一语根,最早作为学名使用的"统计",是在十八世纪德国政治学教授亨瓦尔(G.Achenwall) 在1749年所著近代欧洲各国国家学纲要一书绪言中,把国家学名定为"Statistika"(统计)这个词。原意是指"国家显著事项的比较和记述"或"国势学",认为统计是关于国家应注意事项的学问。此后,各国相继沿用"统计"这个词,并把这个词译成各国
6、的文字,法国译为Statistique,意大利译为Statistica,英国译为Statistics,日本最初译为"政表"、"政算"、"国势"、"形势"等,直到1880年在太政官中设立了统计院,才确定以"统计"二字正名。1903年(清光绪廿九年)由钮永建、林卓南等翻译了四本横山雅南所著的统计讲义录一书,把"统计"这个词从日本传到我国。1907年(清光绪卅三年)彭祖植编写的统计学在日本出版,同时在国内发行,这是我国最早的一本"统计学"书籍。"统计&
7、quot;一词就成了记述国家和社会状况的数量关系的总称。(二)统计实践活动的产生及发展 原始社会后期:统计萌芽于计数活动; 奴隶制国家产生:使统计日显重要(奴隶主为了对内统治和对外战争的需要,进行了征兵、征税,开始了人口、土地和财产统计); 封建社会时期:统计已略具规模; 资本主义的兴起:统计扩展到社会经济各方面。据历史记载,我国古代的一些清醒的政治家、军事家早就意识到统计的重要性。商鞅的商君书去强篇中这样说:“强国知十三数:境内仓、口(府)之数,壮男、壮女之数,老、弱之数,官士之数,以言说取食者之数,利民之数,马、牛、刍藁(chugao)之数。欲强国,不知国十三数,地虽利,民虽众,国愈弱至削
8、。”由此,统计学应运而生。(三)统计学发展的三个时期1、古典统计学(17世纪中18世纪中)(1)德国的记述学派(国势学派)康 令 (16061681)阿痕瓦尔(17191772):1764年首创统计学一词。他们在大学中开设“ 国势学”采用记述性材料,讲述国家“显著事项”,籍以说明管理国家的方法。特点是偏重于事物质的解释而忽视量的分析。(2)政治算术学派威廉·配第 (16231687):政治算术,对当时的英、荷、法等国的“国富和力量”进行了数量的计算和比较。约翰·格朗特(16201674):关于死亡表的自然和政治的考察,他们开创了从数量方面研究社会经济现象的先例。2、近代统计
9、学 (18世纪末19世纪末)(1)数理统计学派法国的拉普拉斯:把古典概率论引进统计学,发展了概率论,推广了概率论在统计中的应用。比利时的凯特勒(17961874):社会物理学、论人类、概率论书简。把德国的国势学派、英国的政治算术学派和意大利、法国的古典概率论家以融合改造为近代意义的统计学。他是数理统计学派的奠定人,有“统计学之父”之称。(2)社会统计学派德国的克尼斯(18211898)恩格尔(18211986):著名的恩格尔定律梅 尔(18211896)人口统计学、伦理统计学、社会生活中的规律性。他们强调统计学是研究社会现象的科学,包括统计资料的搜集、整理和分析研究,目的是要揭示现象内部的联系
10、。3、现代统计学(20世纪)统计学的主流从描述统计学转向推断统计学。20世纪30年代R·费希尔的推断统计理论标志着现代数理统计学的确立。(1)数理统计学派哥塞特(18761936):首创小样本t-分布理论费希尔(18901962):提出实验设计等尼 曼(1894 ):提出统计假设理论此外,毕尔生、瓦尔德、科克伦等。(2)社会统计学派弗拉斯卡姆波(1886 ):一般统计学史密斯(18541901):统计学原理高野岩山郎(18711949):社会统计史研究(3)社会经济统计学派斯特鲁米林(1877 )发展了社会经济统计理论列昂捷夫(1906 )投入产出方法(4)当代中国的统计学(1949
11、 )新中国成立前主要介绍欧美统计学派。改革开放前主要参照前苏联统计模式。改革开放以来学习世界各国统计之长,创有中国特色统计之新。60年代以后统计学发展有三个明显的趋势:统计学依赖和吸收数学更多;以统计学为基础的边缘学科不断形成;与电子计算机技术相结合,应用范围更广,作用更大。单元小结:1、统计的涵义2、统计学的产生、发展及其发展趋势 第二节 统计的研究对象与作用 一、统计学的研究对象 统计工作是对客观现象的数量资料进行搜集、整理、分析研究的工作过程。统计学与统计工作之间存在理论与实践的关系。因此,统计学的研究对象与统计工作的研究对象应该是同一的。二、统计学研究对象的特点(一)从研究对象看,它研
12、究客观事物总体数量方面(数量特征和数量关系),其对象具有:总体性;数量性;具体性。(二)从方法核心看,它强调对客观总体进行大量观察,通过归纳推理以获得总体数量方面的综合性认识。(三)从学科体系看,它是一门多科性的学科“家族”。其核心部分:社会经济统计学自然科学、应用技术统计学数理统计学单元小结:1、统计学的研究对象2、统计学的特点3、统计学的作用第三节 统计学的基本范畴一、统计总体和总体单位(一)统计总体(总体、全及总体、母体) 1、定义指统计研究所确定的客观对象,它是由具有共同性质的许多单位组成的整体。一般应是所有感兴趣的对象。一个统计问题涉及的所有对象,可能数量巨大,不一定仅限于人口。例如
13、:北京的汽车、中国主要城市的家庭。2、特点同质性、大量性、客观性、差异性。3、分类有限总体、无限总体(二)总体单位(单位) 指组成总体的各个单位(或元素),是各项统计数字的原始承担者。(三)二者的关系总体既可以指客观事物本身,也可以是反映该事物某重要数量特征的一组数据的集合。该集合中的每个元素就是总体单位。例总体=2,3,4,7,10,102,109,N单位无限总体:含无限多个单位。有限总体:含有限个单位。二、样本与样本单位(一)样本的定义与特点 又叫抽样总体、子样。它是总体的一部分,是从总体中获得的一组数据。例如:在大学中调查的100个学生。注意:样本不同于普查。普查需对于总体中的每一个成员
14、都进行调查。(二)样本单位 指组成样本的各个单位(或元素),是各项统计数字的原始承担者。三、标志和标志表现(一)标志1、定义 总体单位的属性、特征的名称。2、分类 品质标志只能用文字表示的属性。(1)按表现形式分类 数量标志可用数值表示的特征。不变标志各单位具体表现相同。(2)按有无差异分类可变标志各单位具体表现不同。例 总体:一年级全体在校大学生; 单位:每个一年级大学生。不变标志可变标志品质标志在校大学生性别、年龄数量标志年级年龄、入学成绩(二)标志表现 各单位的属性或特征的具体表现。例:张月芳:大学生,一年级,女,汉族,19岁,410分王云龙:大学生,一年级,男,回族,20岁,398分四
15、、指标和指标体系(一)指标1、定义及构成要素 综合反映总体数量特征的概念和数值。指 标 = 指标名称 + 指标数值2、特点特点具体性:有具体对象、时间、地点、条件。 综合性:说明总体特征是综合全部单位具体标志表现的结果。3、分类(1)按反映的数量特点不同分类数量指标质量指标(2)按指标的功能不同分类描述指标评价指标预警指标绝对数指标(3)按数值形式不同分类相对数指标平均数指标(4)按性质不同分类正指标(销售收入、资金利税率)逆指标(犯罪率、不及格率)适度指标(恩格尔系数、基尼系数)参数(5)按推断统计的指标说明的对象不同分为统计量在推断统计中:说明总体的指标也称参数,即是描述总体的量度。例如:
16、中央电视台春节晚会收视率;例如:人力资源经理的平均工资。说明样本的指标也称统计量,即样本的描述指标。例如:对500人作调查得到的春节联欢晚会的收视率。指标参数总体统计量样本4、指标与标志的关系 二者既有明显的区别,又有密切的联系。其主要区别在于:指标是说明总体特征的,而标志是说明总体单位特征的。联系在于:有许多指标的数值是从总体单位数量标志的标志值汇总而来的。(二)指标体系 具有内在联系的一系列指标构成的整体。1、基本统计指标体系:反映国民经济和社会发展基本情况。包括社会指标体系、经济指标体系、科技指标体系等。2、专业统计指标体系:针对某项社会经济问题的专项指标体系。例五、变量和变量值1、变量
17、:可以取不同数值的量,可变的数量标志和统计指标都是变量。(广义的变量也包括可变的品质标志,称为定性变量)(1)按影响因素不同分类确定性变量随机变量(2)按数值形式不同分类离散型变量连续型变量社会经济现象中许多变量,既受确定性因素影响,又受随机因素影响。要根据具体情况加以认定。2变量值:即变量的具体数值,包括标志值和指标数值。变量确定性变量 离散型变量随机性变量 连续型变量标 志统计指标可变品质标志可变数量标志统计量参数 单元小结:1、统计总体与总体单位2、样本与样本单位3、标志和变量4、统计指标和指标体系本章小结:1、统计学的涵义2、统计学的产生与发展3、统计学的性质与特点4、几个重要的统计学
18、概念第二章 统计工作过程及其基本方法一、教学目的和要求1. 统计数据调查几种方法2. 统计数据搜集的几种方法3. 明确统计整理的概念、意义和内容;4. 掌握统计分组的概念、原则、方法和作用,了解分组的类型;5. 熟悉频数分布的概念、种类;6. 熟悉变量数列的编制方法,注意组距数列中的一些基础知识;7. 熟悉统计表的构成和制表、填表规则。8. 明确绝对数和相对数的概念、作用和种类;9. 掌握绝对数和相对数的特点及相应的计算方法;10. 熟练区分各种绝对数和各种相对数;11. 了解计算和应用绝对数和相对数应注意的问题12. 明确平均数和标志变异指标的概念和作用;13. 熟练掌握数值平均数和标准差的
19、特点及其计算方法;14. 了解众数、中位数的概念、特点及其计算方法;15. 正确区分数值平均数和位置平均数,了解几种平均数之间的关系;16. 了解计算平均数和离中趋势指标应注意的问题。二、教学时数:10学时 三、教学重点1. 统计数据调查几种方法2. 统计数据搜集的几种方法3. 设计统计调查方案的方法4. 统计数据分组的类型原则和方法、变量数列特别是组据数列的编制方法、统计表设计的原则和方法。5. 明确绝对数和相对数的概念、作用和种类;掌握绝对数和相对数的特点及相应的计算方法;熟练区分各种绝对数和各种相对数;6. 平均数和标志变异指标的概念和作用;7. 数值平均数和标准差的特点及其计算方法;8
20、. 众数、中位数的概念、特点及其计算方法。四、教学难点1. 几种调查方法的特点和应用;2. 几种统计数据搜集方法的特点和应用3. 变量数列的编制。4. 几种主要相对指标的计算5. 平均数和标志变异指标的概念;五、教学方法基本知识通过案例结合EXCEL软件演示授课。讲授、举例说明、讨论。第一节 统计设计l 作业布置l 作业例子展示第二节 统计调查l 三个基本要求一、统计调查种类l 按登记时间是否连续:经常性调查、一次性调查l 按调查对象包括的范围:全面调查、非全面调查重点调查:大部分、财务的ABC分析典型调查:解剖麻雀抽样调查:随机l 按调查组织方式不同:统计报表、专门调查关于普查(2003年7
21、月作调整)我国的人口普查从1953年到2000年共进行了五次。今后,我国的普查将规范化、制度化,即: 人口普查:每逢末尾数字为“0”的年份进行人口普查; 经济普查:我国的经济普查将每10年组织两次,在逢“3”和“8”的年份进行。将第三产业普查与工业普查、基本单位普查以及建筑业普查合在一起就是经济普查 ; 农业普查:每逢“6”的年份进行农业普查。二、统计调查方式l 统计调查方法指的是收集数据资料时采用的具体方式,常见的有:(一)直接观察法 (二)报告法 (三)采访法 (四)问卷法 1、访问调查(1)调查者与被调查者通过面对面地交谈而获得资料(2)有标准式访问和非标准式访问 标准式访问通常按事先设
22、计好的问卷进行 非标准式访问事先一般不制作问卷2、邮寄调查 (1)也称邮寄问卷调查 (2)是一种标准化调查 (3)调查者与被调查者没有直接的语言交流, 信息的传递依赖于问卷 (4)通过某种方式将调查表或问卷送至某调查者手中,由被调查者填写,然后将问卷寄回指定收集点 (5)问卷或表格的发放方式有邮寄、宣传媒介传送、专门场所分发三种3、电话调查 (1)调查者利用电话与被调查者进行语言交流以获得信息 (2)时效快、成本低 (3)问题的数量不宜过多 4、电脑辅助调查(1)又称电脑辅助电话调查(2)电脑与电话相结合完成调查的全过程(3)一般需借助专门的软件进行(4)硬件设备要求较高5、座谈会 (1)也称
23、集体访谈(2)将一组被调查者集中在调查现场,让他们对调查的主题发表意见以获得资料(3)参加座谈会的人数不宜过多,一般为610人(4)侧重于定性研究6、个别深度访问(1)一次只有一名受访者参加、针对特殊问题的调查(2)适合于较隐秘的问题,如个人隐私问题;或较敏感的问题,如政治方面的问题(3)侧重于定性研究7、观察法 (1)就调查对象的行动和意识,调查人员边观察边记录以收集所需信息(2)调查人员不是强行介入(3)能够在被调查者不察觉的情况下获得资料 8、实验法 (1)在设定的特殊实验场所、特殊状态下,对调查对象进行实验以获得所需资料(2)有室内实验法和市场实验法三、统计调查方案1. 调查方案的内容
24、2. 调查问卷设计 第三节 统计整理一、统计整理及其类型(一)统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。对已整理过的资料(包括历史资料)进行再加工也属于统计整理。(二)统计整理的意义1、通过统计调查可以取得第一手资料,但这种资料只能反映总体各单位的具体情况,是分散、零碎、表面的。要说明总体情况,揭示出总体的内在特征,还需要对这些资料进行加工整理,使之系统化,以便通过综合指标对总体作出概括性的说明。2、统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。统计整理是统计调查的继续,又是统计分析的基础。统计调查所搜
25、集到的资料,只有通过科学的审核、分类、汇总等整理工作,才能使统计在认识社会的过程中,实现由个别到全体、由特殊到一般、由现象到本质、由感性到理性的转化,才能从整体上反映出事物的数量特征。否则统计调查所得的资料再丰富、再完备,其作用也发挥不出来,统计调查就将徒劳无益,统计分析也将无法进行。3、统计整理还是积累历史资料的必要手段。统计研究中经常要用动态分析,这就需要有长期累积的历史资料,而根据积累资料的要求,对已有的统计资料进行筛选,以及按历史的口径对现有的统计资料重新调整、分类和汇总等,都必须通过统计整理工作来完成。(三)统计整理的类型1.定期统计报表数据的整理2.专题性统计数据的整理3.历史统计
26、数据的整理二、统计整理的原则和内容(一)数据整理的原则1.目的性原则2.联系性原则3.简明性原则(二)数据整理的内容统计整理的全过程包括对统计资料的审核、分组、汇总和编制统计图表四个环节,需要按照一定的步骤进行:(1)对搜集到的资料进行全面审核,以确保统计资料符合统计研究目的的要求,资料准确无误。(2)根据研究目和统计分析的需要,选择整理的标志,并进行划类分组。统计分组是统计整理的重要内容和统计分析的基础,只有正确的分组才能整理出有科学价值的综合指标,并借助这些指标来揭示现象的本质与规律。(3)在分组的基础上,将各项资料进行汇总,得出反映各组和总体数量特征的各种指标。(4)统计资料的显示。即通
27、过编制统计表和绘制统计图,将整理出的资料简捷明了、系统有序地显示出来。(5)对统计数据分门别类地系统积累。三、数据的预处理(一)数据的审核:对调查资料进行审核是统计整理的第一步,包括以下内容:1.审核资料的完整性和及时性审核资料的完整性,就是看调查单位或填报单位是否齐全;规定的项目是否都有答案,应报资料的份数是否符合规定。审核资料的及时性,是看填报单位是否按时报送了有关资料。对不报、漏报或迟报的现象都要及时查清。2.审核资料的正确性:审核资料的正确性,是检查所填报的资料是否准确可靠。常用的审核方法有两种:(1)逻辑检查首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。
28、比如,一张调查表中,年龄是9岁,职业是教师,其中必有一个是错误的。又如,若在某劳动密集型行业的报表中,企业规模为大型,而职工人数则是100人,这其中也必有一错。其次,是检查各项目之间有无相互矛盾的地方。例如,企业的净产值大于同期总产值就是明显的逻辑错误。(2)计算检查即检查各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数字是否相互衔接。3.历史资料的审核在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资料的可靠程度
29、,也可以从指标间的相互关系以及指标的变动趋势来检查它的正确性。对不能满足现在要求、缺漏或有疑问的资料,要进行有科学根据的推算、弥补和订正。(二)资料审核后的订正通过上述审核,如发现有缺报、缺份和缺项等情况,应及时催报、补报;如有不正确之处,则应分别不同情况作如下处理:(1)对于可以肯定的一般错误,应及时代为更正,并通知原报单位。(2)对于可疑之数或无法代为更正的错误,应要求原单位复查更正。(3)如果所发现的差错在其他单位也可能发生时,应将错误情况通报所有单位,以免发生类似错误。(4)对于严重的错误,应发还重新填报,并查明发生错误的原因,若属于违法行为,则应依法严肃处理。四、统计分组的含义1.概
30、念:根据社会经济现象的特点和统计研究的目的要求,按照一定的标志把总体划分为若干不同性质的组或类型,称为统计分组。统计分组的对象是总体,统计分组的标志可以是品质标志,也可以是数量标志。2.统计分组的深层次理解从分组的性质来看,分组兼有“分和合”双重含义。(1)对于现象总体而言,是“分”,即把总体分为性质相异的若干部分;而对于总体单位而言,又是“合”,即把性质相同的许多总体单位合为一组。(2)对于分组标志而言,是“分”,即按分组标志将不同的标志表现分为若干组,而对于其他标志而言,是“合”,即在一个组内的各单位即使其它标志表现不相同也只能结合在一组。由此可见,选择一种分组方法,突出了一种差异,显示了
31、一种矛盾,必然同时掩盖了其他差异,忽略了其他矛盾。不同的分组方法,可能得出不同的结论。缺乏科学根据的分组,不但无法显示事物的根本特征,甚至会把不同性质的事物混淆在一起,歪曲社会经济现象的本质。因此,统计分组必须先对所研究现象本质作全面地、深刻地分析,确定所研究现象类型的属性及其内部差别,而后才能选择反映事物本质的正确的分组标志。五、统计分组的类型(一)按分组的作用或目的不同,分为类型分组、结构分组和分析分组。1.类型分组:是将复杂的现象总体,划分为若干个不同性质的部分。2.结构分组:是在对总体分组的基础上计算出各组对总体的比重,以此来研究总体各部分的结构。类型分组和结构分组往往紧密联系在一起。
32、3.分析分组:是为研究现象之间依存关系而进行的统计分组。分析分组的分组标志称为原因标志,与原因标志相对应的标志称为结果标志。如影响某种商品消费需求的因素有:该商品的价格、消费者收入、相关商品的价格、消费者偏好以及消费者对该商品的预期等。原因标志不同,结果标志也会不同;同一原因标志由于分组的不同,结果标志也会不同。例如,工人的劳动生产率与产值之间、商品流通费用率与商品销售额之间的依存关系,都可以按分析分组法来研究它们之间的联系。(二)按分组标志的多少,可分为简单分组、复合分组和并列分组。1.简单分组:就是对总体只按一个标志进行分组。例如国民生产总值按产业分为第一、第二、第三产业三组;货运量按运输
33、方式分为铁路运输、公路运输、水陆运输、航空运输与管道运输等五组。2.复合分组:就是对总体按两个或两个以上的标志进行的重叠式分组,即在按某一标志分组的基础上再按另一标志进一步分组。复合分组的优点是,从对同一现象的层层分组和分组标志的联系中,更深入全面地研究总体各个方面的内部结构。但是,采用复合分组时,组数会随着分组标志的增加而成倍增加,使每组包括的单位数相应减少,处理不好就会成为烦琐哲学,不利于分析问题。因此,不能滥用复合分组,尤其不宜采用过多的标志进行复合分组,也不宜对较小总体进行复合分组。3、分组体系:就是同时用两个或两个以上的标志,分别从不同的角度,进行不重叠的多种分组。也就是说,很多简单
34、分组从不同角度说明同一个总体,就构成一个并列的分组体系。例如,职工先按性别分成两组,另按年龄分成若干组;进口总额先按贸易对象分成若干组,另按商品用途分成若干组。分组体系的特点是两种或多种分组相互独立而不重叠,既可从不同的方面反映事物的多种结构,又不致使分组过于烦琐,故被广泛采用。(三)按分组标志的性质,分为属性分组和变量分组。1.属性分组:是按品质标志进行的分组,即按事物的某种属性分组。如企业按经济类型、行业分组;人口按性别、民族分组;大学生按专业分组等。这种分组可以反映总体的构成和不同属性事物在总体中的地位和作用。2.变量分组:是按数量标志进行的分组。如企业按生产能力、劳动生产率分组;商店按
35、商品流转额、职工人数分组;人口按年龄、身高分组等。这种分组的目的在于通过事物在数量上的差异来反映事物在性质上的区别。属性分组和变量分组是一对重要的统计分组,统计分组方法主要是围绕这两种分组来阐述的。六、统计数据分组的原则和方法(一)统计数据分组的原则统计分组,必须遵循以下两个原则: 1.穷尽原则:就是使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。例如,从业人员按文化程度分组,分为小学毕业、中学毕业(含中专)和大学毕业三组,那么,那些文盲或识字不多的以及大学以上的学历者则无组可归。如果将分组适当调整为文盲及识字不多、小学程度、中学程度、大学及大学以上,这样分组,就可
36、以包括全部从业人员的各种不同层次的文化程度,符合了分组的穷尽原则。2.互斥原则:就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时或可能归属于几个组。例如,某商场把服装分为男装、女装、童装三类,这不符合互斥原则,因为童装也有男、女装之分。若先把服装分为成年与儿童两类,然后每类再分为男女两组,这就符合互斥原则了。(二)分组标志的选择分组标志是统计分组的依据或标准。正确选择分组标志是进行统计分组的关键,分组标志确定得恰当与否会直接影响统计分组的作用。为了正确选择分组标志,必须遵循以下几条原则:1.要符合统计研究的目的和要求统计分组是为统计研究服务的,统计研究的目的不同,选择的
37、分组标志也应有所不同。例如,同是以工业部门为研究对象,当研究的目的是为了分析部门中各种规模的企业的生产情况时,应该选择产品数量或生产能力作为分组标志;当研究目的在于确定工业内部比例及平衡关系时,应该以行业为分组标志,将工业部门划分为重工业与轻工业或冶金、电力、化工、机械、纺织、煤炭等工业行业。2.必须选择最重要的标志作为分组依据社会经济现象纷繁复杂,研究某一问题可能涉及许多标志,科学的统计分组则应从中选择与统计研究的目的、与有关事物的性质或类型关系最密切的标志,即最主要或最本质的标志作为统计分组的依据。例如,根据统计调查资料,研究人民生活水平变动情况时,可供选择的分组标志有:家庭人口数、每户就
38、业人数、每一就业者负担人数、家庭总收入、平均每人月生活费收入等。而其中最能反映人民生活水平变动的标志是平均每人月生活费收入,故应选择这一标志作为分组标志。3.要考虑到社会经济现象所处的具体历史条件客观事物的特点和内部联系随着条件的变化而不同,因此选择分组标志时,要具体情况具体分析,根据事物的不同条件来选择分组标志。例如,同是划分企业规模,在劳动密集型的行业或地区,可采用职工人数作为分组标志;而在技术密集型的行业或地区,则应选择固定资产价值或生产能力作为分组标志。(三)分组界限的划分(分组标志确定后,分组界限便成为数据分组的重要问题)1.按属性分组时,确定各组的界限有两种情况:(1)组限是自然形
39、成的或比较明显的;例如,人口按性别、文化程度、党派分组等。(2)由于存在属性之间的过渡形式,使分组界限难以确定。这种比较复杂的属性分组,国家有关部门都制定有标准的分类目录,分组时可以依据分类目录来确定组限。例如,人口按职业分组,企业按行业分组,产品按经济用途分组等。2.按变量分组时,应注意以下两点:(1)分组时各组数量界限的确定必须能反映事物质的差别。例如,学生学习成绩分组,不能把55分和65分合为一组,因为这样的分组未区分及格与不及格的质的差别。(2)其次,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限和组数。单项式分组与组距式分组1)单项式分组:就是用一个变量值
40、(标志值)作为一组,形成单项式变量数列。单项式分组一般适用于离散型变量且变量变动范围不大的场合。如,育龄妇女按其生育子女存活数分组,可分为0个、1个、2个、3个、4个、5个等6组。2)组距式分组:就是将变量依次划分为几段区间,一段区间表现为“从到”距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。区间的距离就是组距。对于连续型变量或者变动范围较大的离散型变量,适宜采用组距式分组。例如,反映居民居住水平情况按人均居住面积分组分为:4平方米以下,4-6平方米,6-8平方米,8平方米以上等4组。再如了解某班学生成绩情况,按成绩进行组距式分组。间断组距式分组和连续组距式分组在组距式分组中,每
41、组包含许多变量值,每一组变量值中,其最小值为下限,最大值为上限。组距是上下限之间的距离,相邻两组的界限,称为组限。间断组距式分组:是指凡是组限不相连的分组。例如,儿童按年龄分组分为未满1岁,1-2岁,3-4岁,5-9岁,10-14岁。连续组距式分组:凡是组限相连(或称相重叠的)分组,即以同一数值作为相邻两组的共同界限的分组。例如,工人按工时定额完成程度分组分为90-100%,100-110%,110-120%等组。如果变量值只是在整数之间变动,例如企业数、职工数、机器设备台数等离散型变量,可采用间断组距式分组,也可采用连续组距式分组。如果变量值在一定范围内的表现即可以是整数,也可以是小数,如产
42、值、身高、体重等连续型变量,只能采用连续组距式分组。在进行连续组距式分组时应注意,由于以同一个数值作为相邻两组共同的界限,为了遵循统计分组穷尽和互斥原则,所以统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内,即所谓“上限不在内”原则。例如学生成绩分组,把70分的学生归入70-80分组内,把80分的学生归入80-90分组内。根据这一原则,离散型变量的分组,各组的上限也可以写为下一组的下限,这样处理既简明又便于计算。连续型变量的分组也可以仅列出左端的数值,即以各组的下限来表示。如上例学生成绩分组也可表示为50-,60-,70-,等距分组与异距分组按数量标
43、志进行组距式分组,还可分为等距分组和不等距(或称异距)分组。1)等距分组等距分组:就是标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。凡是在标志值变动比较均匀的情况下,都可采用等距分组。例如,工人的年龄、工龄、工资的分组;零件尺寸的误差、加工时间的分组;农产品单位面积产量、单位产品成本的分组等等。等距分组有很多好处,它便于绘制统计图, 也便于进行各类运算。2)异距分组分组的形式应服从分组的要求,即性质相同的单位应合并在一个组内,性质不同的应当分开。现象的差别取决于现象的本质,而不在于数学形式,必须根据现象的本质特征和统计研究的目的任务来确定分组的等距与否。在下列情况下,就必须考
44、虑采用异距分组:第一,标志值分布很不均匀的场合。例如,学生成绩如果密集于某一范围,如60-80分或70-90分之间,其它部分则分布十分稀少,在这种场合若仍以10分为组距进行等距式分组,则无法显示出分布的规律性,会使得这一密集的分数段分布的信息损失过大。因此,合理的做法是,在分布比较密集的区间内使用较短的组距,在分布比较稀少的其余部分使用较长的组距,形成各组的组距不相等的异距分组。第二,标志值相等的量具有不同意义的场合。例如,生命的每一个月对于新生婴儿和对于成年人是大不一样的,此时,进行人口疾病研究的年龄分组,应采用异距式分组,即1岁以下按月分组,1-10岁按年分组,11-20岁按5年分组,21
45、岁以上按10年或20年分组等等。第三,标志值按一定比例发展变化的场合。例如,百货商场营业额差别是很大的,比如营业额从5万元至5千万元,可采取公比为10的不等距分组5-50万元、50-500万元、500-5000万元。若用等距分组,即使组距为100万元,也得分为50组,显然是不合适的。对于异距分组方法的运用,没有固定模式可供依循,全凭统计人员在实践中不断探索,关键在于对所研究现象的内在联系必须十分熟悉,才能很好运用异距分组来揭示事物的本质。七、统计分组的应用(一)划分社会现象的不同类型。社会经济现象千差万别,要了解各种社会经济现象的性质、特点及其相互关系,必须根据某种标志把它们划分为性质不同的类
46、型,以便揭示不同社会经济现象的质的差异。例如,国民经济按产业分组;农业分成农、林、牧、渔业各组;社会商品零售额按商品用途分组;企业按所有制分组等等。这些分组也叫类型分组。如下表是我国城镇居民家庭收入消费性支出按商品类别分组的统计表,它将全部消费品分为八大类,尽管它们同属于消费品,但在效用上却有“质”的差别。通过这种分类,可以反映我国居民和社会集团的商品性消费中不同类别的商品所占的地位和作用,也为进一步研究我国消费品零售额的水平与结构提供了便利条件。我国城镇居民家庭人均消费支出及构成按商品类别分组零售额(元)构成(%)食品类衣着类家庭设备用品及服务类文化娱乐用品类交通通讯类医疗保健类居住类杂项商
47、品类合计(二)揭示社会现象的内部结构。从数量上反映总体内部的结构是统计研究的重要任务。总体的内部结构可体现部分与整体的关系以及各部分之间存在的差别和相互联系,反映事物从量变到质变的过程,帮助人们掌握事物的特征,认识事物的性质。我国出口产品构成表(%)年份农副产品农副产品加工品工矿产品合计1950196019701980198519901995200057.531.036.718.717.513.07.35.233.242.337.729.526.929.226.225.19.326.725.651.855.657.866.569.7100100100100100100100100如该表,就从我
48、国出口商品构成的变化,反映出我国经济发展水平和经济结构的变化。(三)分析社会现象之间的依存关系。社会经济现象之间广泛地存在着相互依存的关系,如农作物的耕作深度与收成率之间、合理密植与农产量之间、家庭的工资收入与生活费支出之间、工人技术级别与产品质量之间、工人劳动生产率与产品成本之间、市场商品价格与其需求量之间等等,都在一定程度上存在相互依存的关系。所有这些依存关系,都可通过统计分组分析出影响因素与结果因素之间的变动规律。八、组距、组数、组限与组中值在具体进行分组时,首先应对标志值的分布情况进行仔细审查,找出变量的最大值和最小值;其次,在分布比较集中的标志值处确定组距的中心位置;再次,根据预定的
49、组距的大小定出上下限。一般地,第一组的下限必须略小于实际变量值的最小值,最后一组的上限必须略大于实际变量值的最大值,并尽可能使各单位的标志值在组内分布比较均匀。(一)组距在组距式分组中,组距是各组上下限之间的距离,即各组最大标志值和最小标志值之差。1.由于有等距分组与异距分组之分,在后文中将要出现的频数密度的概念,必须具体计算确定每一个组的组距大小。在许多版本的教科书中,笼统地使用如下公式来计算组距的大小,即:组距=上限-下限事实上,这一公式只适用于计算连续组距式分组的组距大小,例如成绩分组中,60-70分,70-80分,其组距为10分(=70-60或80-70)。如果将这一公式套用于间断组距
50、式,将会产生谬误。例如,商店规模按职工人数分组,分为1-5人,6-10人,11-15人等等。套用上述公式,得出5-1(或10-6,或15-11)=4,即组距为4人的结论,显然是错误的。2.对于间断式分组的组距大小的计算,必须采用如下公式:组距=上组下限-本组下限(二)组数全距是总体中最大的标志值与最小的标志值之差。组数的多少直接取决于两个因素,一个是总体的全距,另一个是组距。在等距分组的条件下,组数等于全距除以组距。在组距既定的条件下,全距大则组数多,全距小则组数少;在全距既定的条件下,组距大则组数少,组距小则组数多。全距是客观存在的事实,不以人的意志为转移,所以,确定组数的关键是确定组距。如
51、对学生成绩情况的统计分组中,组数过少,例如学生成绩分为2组,不能很好地达到分组的基本要求;组数过多,例如成绩分为101组,即分组过细,也无法起到化繁为简的作用,难以显示出总体分布的规律。决定组数的多少,并无规则可言,必须凭借经验和所研究问题的性质作出判断。这里,向大家介绍一种确定组数和组距的经验公式,这一公式是美国学者斯特杰斯(Sturges)创立使用的,称为斯特杰斯经验公式,即: 则有:,公式中,n为组数,N为总体单位数,i为组距,R为全距,即最大变量值Xmax与最小变量值Xmin之差。根据这一公式,可以得出如下(见下表)的组数参考标准。分组组数参考标准表N15-2425-4445-8990
52、-179180-359n56789上述公式及表中数据仅供参考,不能生搬硬套。实际分组时采用组数多少应依据所研究资料的性质而定。(三)组中值组中值:各组中点位置所对应的变量值。其计算公式为:组中值=(适用所有闭口组) 或= (适用上开口组)或=(适用下开口组)在计算平均指标或进行其它统计分析时,常以组中值来代表各组标志值的平均水平。当各组标志值均匀分布时,组中值代表各组标志值的水平,其代表性就高。因此,分组时应注意:1、尽可能使组内各单位标志值分布均匀;2、为避免产生过大的计算误差,在选取各组上、下限时,应尽可能使组中值恰为整数。3、当连续型变量按离散型变量表示时,组距数列的编制采取相邻组限不重
53、叠的形式,组中值的确定应考虑到连续型变量自身的特点。年龄就是比较典型的例子,它实质上是连续型变量,习惯上用整数表示。例如一群大学生分为17-19岁、20-22岁两组,则组距3岁,组中值分别为18.5岁和21.5岁。因为第一组应包括19岁又不到20岁的大学生,上限应视为20岁。同样道理,第二组上限应视为23岁。4、开口组的组中值的确定。在编制组距式变量数列时,使用“××以上”或“××以下”这样不确定组距的组,称为开口组。例如,反映某工业企业工人生产定额完成情况,按生产定额完成程度分组,分为90%以下,90-100%,100-110%,110%以上。开口组的
54、组距是以相邻组的组距为本组的组距,如上例,90%以下的组,因相邻组的组距为10%(=100%-90%),故第一组视为80-90%,其组中值为(80%+90%)/2=85%,即85%;110%以上的组距以邻组的组距10%为本组组距,视为110-120%,组中值为 =115%。九、频数分布及其构成要素(一)频数分布 在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,并计算各组的单位数称为频数分布,或次数分布。(二)频数分布的两个要素1.组别:总体按某标志所分的组 2.频数(次数)和频率:各组的单位数叫频数,各组的单位数与总体单位总数之比叫频率。频率具有如下两个性质:(1)各组频率都是界于0和1之间的一个分数。即:(2)各组频率之和等于1 。即(三)频数分布的种类1.品质频数分布:简称为品质数列,它是经过属性分组后形成的频数分布,其组别表现为一系列的概念或范畴。2.变量频数分布:简称为变量数列,它是经过变量分组后形成的分布数列,其组别表现为不同的数值或数域。单项数列:是以一个变量值为一组编制的变量频数分布。组距数列:是以表示一定变动范围的两个变量值构成的组
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024新房屋装修合同及预算清单(贷款使用)
- 2024年大型海洋工程装备制造合同
- 2024谈原保险合同准则的创新
- 2024年安徽省盐业公司产品购销合同
- 2024年广告代理合作合同
- 2024新版房屋买卖合同书
- 2024年工程用篮式吊装设备租赁合同
- 2024-2025学年新教材高中政治第二单元经济发展与社会进步4.1我国的个人收入分配教案部编版必修21
- 江苏省徐州市2024−2025学年高二上学期10月学情调研 数学试题含答案
- 网络文学版权授权协议
- 世界一流港口综合评价报告
- 辽宁省盘锦市第一完全中学2023-2024学年八年级上学期期中数学试卷
- 机动车鉴定评估师(中级)技能鉴定理论试题及答案
- DB13-T 5958-2024 金属非金属露天矿山采场边坡安全监测技术规范
- 阿里巴巴国际站:2024年珠宝眼镜手表及配饰行业报告
- 医院康复科培训课件:《平衡功能评定及训练》
- 2025届高三数学一轮复习策略讲座
- 职能科室对医技科室医疗质量督查记录表(检验科、放射科、超声科、功能科、内镜室)
- 2024至2030年中国机器人行业市场竞争状况及发展趋向分析报告
- 国家义务教育质量监测科学复习试题及答案
- 2025届新高考语文热点冲刺复习议论文标题
评论
0/150
提交评论