




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、目 录w 第 一 章 导 论w 第二章 统计数据的调查与收集w 第三章 统计数据的整理w 第 四 章 数据分布特征的描述 w 第 五 章 时 间 序 列 分 析w 第 六 章 统 计 指 数 w 第 七 章 抽 样 与 抽 样 估 计w 第 八 章 假设检验与方差分析w 第九章 相关与回归分析w 第 十 章 常用国民经济核算指标分析本教材的篇章结构本教材的篇章结构 第一章第一章 导论导论第一篇第一篇 统计基础篇统计基础篇 第二章第二章 统计数据的调查与收集统计数据的调查与收集第二篇第二篇 描述统计篇描述统计篇 动态数据描述法动态数据描述法 第七章第七章 抽样与抽样估计抽样与抽样估计 第三篇第三
2、篇 推断统计篇推断统计篇 第八章第八章 假设检验与方差分析假设检验与方差分析 第九章第九章 相关与回归分析相关与回归分析第四篇第四篇 统计常识篇统计常识篇第十章第十章 第三章第三章 统计统计 数据的整理数据的整理 第四章第四章 数据分数据分布特征的描述布特征的描述第五章第五章 时间序列时间序列分析分析第六章第六章 统计指数统计指数 表格与图形法表格与图形法静态数据描述法静态数据描述法常用国民经济核算指标常用国民经济核算指标与分析与分析学习目的及重难点提示学习目的及重难点提示本章学习目的本章学习目的 w 了解了解统计理论和实践活动的产生和发展。w 领会领会统计的三层含义、统计学的分科。w 理解和
3、掌握理解和掌握统计学中的几个基本范畴。章节地位及重难点提示章节地位及重难点提示 本章介绍统计学及相关概念,勾勒了本课程的框架结构描述统计学和推断统计学。 重点重点是统计的三层含义,总体、样本及指标等概念。一、统计的三层含义及相互关系一、统计的三层含义及相互关系*(一)统计工作(一)统计工作(统计的基本含义)(二)统计资料(二)统计资料(三)统计学(三)统计学(四)三者关系(四)三者关系 即统计实践活动,是人们对客观事物的数据资料进行搜集、整理、分析的工作活动的总称。 是统计工作的成果,包括各种统计报表、统计图形及文字资料等。 是一门收集、整理、描述、显示和分析统计数据的方法论的科学,其目的是探
4、索事物的内在数量规律性,以达到对客观事物的科学认识。二、统计实践活动的产生与发展二、统计实践活动的产生与发展* *(一)统计的起源(一)统计的起源 1.起源于原始社会末期。 2.人类社会早期的统计实践活动。(二)统计的发展(二)统计的发展 1.资本主义社会里统计实践活动得到较快的发展。 2.1853年在比利时首都布鲁塞尔召开了第一届国际统计会议。 3.1995年8月在北京召开了第50届国际统计年会。 三、统计科学的发展三、统计科学的发展(一)古典统计学时期(一)古典统计学时期(17世纪中后期18世纪中后期) 1.1.政治算术学派:政治算术学派:代表人物威廉威廉配第配第( (政治经济学之父) )
5、,首次运用数量对比分析法,又称“有名无实有名无实”的统计学。 2. 2.记述学派记述学派/ /国势学派:国势学派:“统计学是研究一国或多国的显著事项之学”,以文字描述为主,又称“有实无名有实无名”的统计学。 3. 3.图表学派:图表学派:用统计图和统计表表现和保存统计资料。三、统计科学的发展三、统计科学的发展(二)近代统计学时期(二)近代统计学时期(18世纪末19世纪末) 1. 1.数理统计学派:数理统计学派:创始人阿道夫阿道夫凯特勒凯特勒,第一次将概率论引入社会经济现象的研究中,被誉为“近代统计学之父近代统计学之父”。 2. 2.社会统计学派:社会统计学派:代表人物恩格尔恩格尔,采用大量观察
6、法大量观察法研究社会经济现象总体。社会经济现象总体。三、统计科学的发展三、统计科学的发展(三)现代统计学时期(三)现代统计学时期(20世纪初至今) 1.1.主要成果主要成果:在随机抽样基础上建立了推断统计学。 2.2.数理统计学的发展特点与趋势数理统计学的发展特点与趋势 (1)数学方法的广泛应用。 (2)边缘统计学的形成。 (3)借助计算机手段,统计学的应用日益广泛和深入。 一、从统计方法的构成角度分一、从统计方法的构成角度分*(一)描述统计学(一)描述统计学(descriptive statistics) 研究如何取得、整理和表现数据资料如何取得、整理和表现数据资料,进而通过综合、概括与分析
7、反映客观现象的数量特征反映客观现象的数量特征。包括数据的收集与整理、数据的显示方法、数据分布特征的描述与分析方法等。 (二)推断统计学(二)推断统计学(inferential statistics) 研究如何根据样本数据去推断总体数量特征如何根据样本数据去推断总体数量特征的方法。包括抽样估计、假设检验、方差分析及相关和回归分析等。 (三)描述统计学和推断统计学的关系(三)描述统计学和推断统计学的关系 描述统计学描述统计学是统计学的基础基础和统计研究工作的前提前提,推断统计学推断统计学则是现代统计学的核心核心和统计工作的关键关键。二、从统计方法的研究和应用角度分二、从统计方法的研究和应用角度分(
8、一)理论统计学(一)理论统计学(theoretical statistics) 利用数学原理研究统计学的一般理论和方法的统计学,如概率论与数理统计(二)应用统计学(二)应用统计学(applied statistics)* 研究如何应用统计方法解决实际问题,大多是以数理统计为基础形成的边缘学科。如自然科学领域的生物统计学、社会科学领域的社会经济统计学等。三、统计学与其他学科的关系三、统计学与其他学科的关系(一)统计学与哲学的关系(一)统计学与哲学的关系 哲学为统计学提供世界观和方法论的指导。(二)统计学与数学的关系(二)统计学与数学的关系 1 1. .区别区别 (1)研究对象不同研究对象不同:数
9、学研究抽象的量, 统计研究具体的量。 (2)研究方法不同研究方法不同:数学是演绎,统计是归纳和演绎的结合。 2.2.联系联系 数学为统计研究提供数学公式、模型和分析方法。三、统计学与其他学科的关系三、统计学与其他学科的关系(三)统计学与其他学科的关系(三)统计学与其他学科的关系 统计几乎与所有学科都有联系,本书侧重介绍统计与管理学和经济学的关系。四、统计学中的基本概念(一)总体、总体单位、样本(二)指标、指标体系本章小结本章小结一、统计的三层含义:一、统计的三层含义:统计工作、统计资料和统计学。二、统计学的分科二、统计学的分科 (一)从统计方法的构成看(一)从统计方法的构成看,分为描述统计学描
10、述统计学和推断统计学推断统计学。 (二)从统计方法的研究和应用看(二)从统计方法的研究和应用看,分为理论统理论统计学计学和应用统计学。应用统计学。三、统计学与其他学科的关系三、统计学与其他学科的关系四、统计学中的基本概念四、统计学中的基本概念 (一)总体、总体单位和样本。(一)总体、总体单位和样本。 (二)指标和指标体系。(二)指标和指标体系。 END学习目的及重难点提示学习目的及重难点提示本章学习目的本章学习目的 w 了解了解统计调查的概念和分类。w 领会领会统计数据的计量尺度、数据和变量的类型。w 明确明确统计调查方案的设计内容。w 掌握掌握统计数据的来源、统计调查组织方式。本章重难点提示
11、本章重难点提示 w 重点重点:数据的计量尺度、数据和变量的类型,普查、抽样调查等统计调查组织形式。w 难点难点:数据的计量尺度、数据和计量尺度之间的关系。一、数据的计量尺度一、数据的计量尺度*(一)定类尺度(一)定类尺度(nominal scale) 1.概念概念:又称列名尺度列名尺度或类别尺度类别尺度,是按照研究对象的某种属性属性将其划分为若干组组或类类的一种测度。 2.举例:举例: 人的性别 、籍贯、民族、职称; 企业的所有制性质、行业隶属。 3.特征特征 (1)只能区分区分事物的类别类别,无法比较优劣或大小。 (2)对事物的区分必须遵循穷尽穷尽和互斥互斥的原则。 (3)对定类尺度计量分析
12、的统计量主要是频数频数和频频率。率。 *应用应用:想一想生活中还有哪些常见的定类尺度?一、数据的计量尺度一、数据的计量尺度(二)定序尺度(二)定序尺度(ordinal scale) 1.概念:概念:又称顺序尺度顺序尺度,它是对事物之间等级等级或顺序顺序差别差别的一种测度。 2.举例:举例:教师的职称、学历,商品的质量等级等。 3.特征特征 (1)对事物可以分类分类、比较优劣和大小。比较优劣和大小。 (2)对事物的分类要求穷尽穷尽和互斥。互斥。 (3)对定序尺度计量分析的统计量统计量除频数频数和频率频率外,还有累计频数累计频数和累计频率。累计频率。 *应用应用:想一想生活中还有哪些常见的定序尺度
13、?一、数据的计量尺度一、数据的计量尺度(三)定距尺度(三)定距尺度(interval scale) 1.概念:概念:又称间隔尺度间隔尺度,是对事物类别或次序之间的间隔进行的一种测度。 2.举例:举例:学生的考试成绩、人的身高、温度等。 3.特征特征 (1)能分类、排序、比较大小,计量差距。分类、排序、比较大小,计量差距。 (2)没有绝对零点没有绝对零点,“0”表示“0”水平,不表示“没有”或“不存在”。 *应用:应用:还有哪些常见的定距尺度? 一、数据的计量尺度一、数据的计量尺度(四)定比尺度(四)定比尺度(ratio scale) 1.概念:概念:也称比率尺度比率尺度,是对事物之间比值比值的
14、一种测度。 2.举例:举例:人的收入支出、企业的产值利润、某地区的人口总数、失业人数等 3.特征特征 (1)分类)分类、排序排序、比较大小比较大小、求出差异求出差异、计算计算两个数值之间的比率比率。 (2)具有绝对零点)具有绝对零点,即数字“0”表示“没有”或“不存在”。 *应用应用:举一现实生活中的例子说明定比尺度的两个特征。表表2-1 四种计量尺度的比较四种计量尺度的比较二、数据的类型二、数据的类型(一)数据的类型和表现形式(一)数据的类型和表现形式 1.定性数据(品质数据)定性数据(品质数据) (1)概念)概念:说明事物的品质特征品质特征,不能以数值表示,只能以文字表述文字表述,由定类定
15、类和定序尺度定序尺度计量形成。 (2)举例)举例:高校教师职称有助教、讲师、教授等。 2.定量数据定量数据 (数量数据)(数量数据) (1)概念:)概念:说明现象的数量特征数量特征,以数值表示数值表示。由定距和定比尺度定距和定比尺度计量形成。 (2)举例)举例:考试成绩80分、95分、100分,身高1.73米、1.80米等。 *应用应用:举例说明还有哪些常见的定性数据和定量数据。(二)变量及其类型(二)变量及其类型1.变量的含义变量的含义 说明现象某种属性或数量特征的概念称为变量。统计数据就是变量的具体表现。2.变量的类型变量的类型 (1) 品质变量:反映事物品质特征的名称,表现为定性数据。如
16、教师职称。 (2)数值变量:反映事物数量特征的名称,表现为定量数据。如人的身高。3.数值变量的分类数值变量的分类 (1)离散变量:只能间断计数的变量。如人口数、设备台数等。 (2) 连续变量:可以连续计数的变量。如产值、利润、收入、年龄等。一、统计调查的概念和分类一、统计调查的概念和分类(一)概念(一)概念 根据统计的目的和任务,运用科学的调查方法,有计划、有组织地向客观实际搜集和登记统计数据的过程。(二)分类(二)分类 1.按调查对象调查对象包括的范围范围不同 (1)全面调查)全面调查:对调查对象的全部个体全部个体一一调查登记,如普查。 (2)非全面调查)非全面调查:对调查对象的部分个体部分
17、个体调查登记,如抽样调查。统计调查的分类统计调查的分类 2.按照调查组织方式不同按照调查组织方式不同 (1)统计报表统计报表:经常性制度化的调查,是搜集国民经济统计数据的主要方式。 (2)专门调查专门调查:为研究一些特殊问题专门组织的统计调查。 3.按照调查登记的时间是否连续按照调查登记的时间是否连续 (1)经常性调查经常性调查/连续性调查连续性调查:适用于时期时期现象现象的调查。 (2)一次性调查一次性调查/间断性调查间断性调查:适用于时点时点现象现象的调查。 二、统计调查方法二、统计调查方法 (一)直接观察法(一)直接观察法 (二)报告法:(二)报告法:如我国的统计报表制度。 (三)采访法
18、:(三)采访法:具体分为个别口头询问、被调查者填表、开调查会等形式。 (四)通讯法:(四)通讯法:通过邮寄调查问卷、被调查者填表获取信息。 (五)电话访问(五)电话访问 (六)网上调查法(六)网上调查法 三、对统计调查数据的基本要求三、对统计调查数据的基本要求(一)准确性(一)准确性(二)及时性(二)及时性(三)系统性(三)系统性(四)完整性(四)完整性(五)经济性(五)经济性 总体要求:总体要求:以准确为前提,准中求快,力争以较少的投入取得完整、系统的数据资料。四、统计调查方案的设计四、统计调查方案的设计*(一)(一)确定调查的目的目的和任务任务( (为什么调查为什么调查) ) 这是设计方案
19、的首要问题。 (二)(二)确定调查对象调查对象和调查单位调查单位( (向谁调查向谁调查) ) 1. 1.调查对象:调查对象:需要进行调查的某一社会经济现象的总体。对应于统计总体。对应于统计总体。 2. 2.调查单位:调查单位:调查对象中需要调查的具体单位。对应于总体单位。对应于总体单位。四、统计调查方案的设计四、统计调查方案的设计(三)(三)确定调查项目调查项目(调查什么调查什么)(四)设计调查表调查表(调查问卷如何设计调查问卷如何设计)(五)确定调查时间调查时间* 调查数据资料所属的时间调查数据资料所属的时间 调查时限,调查工作的起讫时间调查时限,调查工作的起讫时间(六)制定调查组织实施计划
20、调查组织实施计划两层含义两层含义五、统计调查的组织方式五、统计调查的组织方式(一)普查(一)普查 1.概念:概念:是专门组织专门组织的、一次性一次性的全面调查全面调查。 2.意义及原则意义及原则 *相关链接相关链接我国的普查制度我国的普查制度 每逢末尾数字为“0”的年份进行人口普查。 每逢末尾数字为“1”或“6”的年份进行基本统计单位普查。 每逢末尾数字为“3”的年份进行第三产业普查。 每逢末尾数字为“5”的年份进行工业普查。 每逢末尾数字为“7”的年份进行农业普查。五、统计调查的组织方式五、统计调查的组织方式(二)统计报表(二)统计报表 1.概念:概念:我国的统计报表制度是依照中华人民共和国
21、统计法的规定,自上而下统一布置自上而下统一布置,自下而上逐级自下而上逐级提供提供基本统计数据统计数据的一种调查方式。 2.意义:意义:是搜集国民经济和社会发展状况统计数据的主要方式主要方式。 3.局限性:局限性:五、统计调查的组织方式五、统计调查的组织方式(三)抽样调查(三)抽样调查* 1.概念概念:是专门组织专门组织的非全面调查非全面调查。它是按照随机原随机原则则从总体中抽取部分单位组成样本,以样本数据推断总样本数据推断总体数量特征体数量特征。 2. 意义意义:是相对最科学、应用最广的调查方式。 3. 特点:特点:(1)经济性高。 (2)时效性强。 (3)适应面广。 (4)准确度高。五、统计
22、调查的组织方式五、统计调查的组织方式(三)抽样调查(三)抽样调查* 4.4.抽样调查的作用(应用场合)抽样调查的作用(应用场合) (1)不可能不可能或很难进行全面调查很难进行全面调查的现象,必须采取抽样调查方法。 (2)没必要进行全面调查没必要进行全面调查的社会现象,也可采用抽样调查。 (3)其他其他作用:如对生产过程的质量控制及对全面调查结果的检验修正。 *思考题:思考题:对河水水质进行检测、推断种子的发芽率、推断食品的保质期应采用什么调查方式?为什么? 五、统计调查的组织方式五、统计调查的组织方式(四)重点调查(四)重点调查* 1.概念:概念:在调查对象中选择一部分重点单位重点单位所进行的
23、非全面调查。非全面调查。 2.重点单位:重点单位:是指在总体中虽然个数不多个数不多,但它们的数据总量数据总量在总体数据总量中占绝大部分比重占绝大部分比重。 *相关链接:我国银行业中的重点单位相关链接:我国银行业中的重点单位 截至2004年底,工、农、中、建四家国有商业银行各项贷款近13万亿元,占我国银行业贷款总额的72,存款近25万亿元,占银行业存款总额的77。从统计学的角度,四大国有商业银行就是重点调查中的重点单位。五、统计调查的组织方式五、统计调查的组织方式(五)典型调查(五)典型调查* 1.概念概念:在对调查对象全面分析的基础上,有意识有意识地选择选择若干有典型意义有典型意义或有代表性的
24、单位的单位进行深入、细致调查的一种非全面调查非全面调查方式。 2.特点特点(1)调查范围小,调查单位少,可可对某些复杂的专门问题进行深入、细致的调查深入、细致的调查。 (2)调查单位调查单位是有意识选择有意识选择的有代表性有代表性和典型性的单位。 3.典型调查的关键:关键:选择典型单位。一、公开的统计出版物一、公开的统计出版物(一)我国官方的统计公开出版物(一)我国官方的统计公开出版物 如中国统计出版社出版:如中国统计出版社出版:中国统计年鉴、中国统计摘要、中国社会统计年鉴、中国工业统计年鉴、中国农村统计年鉴、中国人口统计年鉴、中国市场统计年鉴等。(二)外文出版物(二)外文出版物 世界银行各年
25、度的世界发展报告、联合国的联合国统计年鉴、联合国粮农组织生产年鉴、国际货币基金组织的国际金融统计月报、亚太经合组织的亚太统计数字等。二、其他渠道二、其他渠道 各种报纸、杂志、图书、广播、电视传媒、网络等 复习小结复习小结一、统计数据的计量尺度一、统计数据的计量尺度 (一)(一)定类尺度 (二)(二)定序尺度 (三)(三)定距尺度 (四)(四)定比尺度二、统计数据的类型二、统计数据的类型 (一)定性数据:(一)定性数据:由定类和定序尺度计量而成,反映事物的品质特征。 (二)定量数据(二)定量数据:由定距和定比尺度计量而成,反映事物的数量特征。复习小结复习小结三、统计数据的来源三、统计数据的来源
26、(一)直接来源(一)直接来源:统计调查和科学试验。 (二)间接来源(二)间接来源:引用他人调查或试验的数据。四、统计调查(数据最主要的直接来源)四、统计调查(数据最主要的直接来源) (一)统计调查的种类和方法(一)统计调查的种类和方法 (二)统计调查方案的设计(二)统计调查方案的设计 (三)统计调查的组织方式:(三)统计调查的组织方式:有普查、统计报表、抽样调查等,其中重点调查是最常用的最科学的调查方法。五、统计数据的间接来源五、统计数据的间接来源 包括公开的统计出版物和其他渠道。 END学习目的及重难点提示学习目的及重难点提示本章学习目的本章学习目的 了解了解数据整理在统计活动中的地位、数据
27、整理的内容、数据审核与汇总的技术。 领会领会统计分组的概念、关键、统计分组体系及次数分布的类型和特征。 明确明确统计数据的表现形式统计表和统计图的基本内容。 掌握掌握统计分组、分配数列和统计图表的编绘制方法。 本章重难点提示本章重难点提示 本章重点:本章重点:统计分组、变量数列的编制、统计数据的显示方法统计表和统计图。 本章难点:本章难点:统计分组、变量数列的编制、次数分布图的绘制。 一、数据整理的概念和作用一、数据整理的概念和作用 ( (一一) )概念概念 对对统计调查所搜集到的数据进行分类和汇总数据进行分类和汇总,使其系统化、条理化、科学化,以以得出反映事物总体综反映事物总体综合特征合特征
28、的资料的工作过程。 ( (二二) )作用作用 统计数据整理,是统计调查的继续,也是统计分是统计调查的继续,也是统计分析的前提析的前提,承前启后,在整个统计工作中具有重要的作用。 二、数据整理的程序二、数据整理的程序 数据整理方案的设计数据整理方案的设计 数据的审核与检查数据的审核与检查 数据的排序数据的排序 数据分组数据分组 数据的显示数据的显示统计图表统计图表 数据的积累与保管数据的积累与保管 第二节第二节 数据分组数据分组 一、一、数据分组的概念数据分组的概念 根据统计研究目的和客观现象的内在特点,按按照选定的某个或几个标志标志,将将被研究的总体总体数据分成若干部分数据分成若干部分的科学分
29、类。 二、二、数据分组的作用数据分组的作用 (1)区分现象的类型。 (2)反映总体的内部结构。 (3)揭示现象之间的依存关系。 (4)反映事物的数量特征和发展规律。第二节第二节 数据分组数据分组三、三、数据分组的关键数据分组的关键* 选择分组标志选择分组标志和分组划分各组界限划分各组界限(针对数值型变量)。四、四、选择分组标志的原则选择分组标志的原则* 1.根据研究任务研究任务和目的目的选择分组标志。 2.选择能反映事物本质特征或重要特征反映事物本质特征或重要特征的标志。 3.结合结合现象所处的历史条件和社会经济条件历史条件和社会经济条件选择分组标志。第二节第二节 数据分组数据分组 (一)根据
30、分组变量(一)根据分组变量( (标志标志) )的性质不同的性质不同 按品质变量分组品质变量分组 按数值变量分组数值变量分组 (二)根据采用的分组标志的个数多(二)根据采用的分组标志的个数多少少 简单分组简单分组: :只按一个标志分组 复合分组复合分组: :按两个或以上的标志分组五、统计分组的种类五、统计分组的种类一、分配数列一、分配数列 (一)概念(一)概念 ( (二二) )分配数列的要素分配数列的要素 组别组别 次数次数( (频数频数):):分布在各组的总体单位数。各组的 次数次数(频数频数)之和等于总体单位总数之和等于总体单位总数。 频率频率( (比重比重):):各组次数占总次数的比重。各
31、组比比 重之和等于重之和等于100%100%(或(或1 1)。)。 将总体按分组标志分组后形成的总体单位在各组的分布,又称次数分布数列次数分布数列或频数分布数列频数分布数列。分配数列实例分配数列实例 按 海 拔 分 组 ( 米 ) 面 积 ( 万 平 方 公 里 ) 占 总 面 积 比 重 ( ) 500以 下 500 1000 1000 2000 2000 3000 3000以 上 241.7 162.5 239.9 67.6 248.3 25.18 16.93 24.99 7.04 25.86 合 计 960.0 100.00 表表3-1 我国土地状况分组表我国土地状况分组表(三)分配数列
32、的种类(三)分配数列的种类 1. 1.按分组标志的性质不同按分组标志的性质不同 品质变量数列品质变量数列: :按品质变量分组形成 数值变量数列数值变量数列: :按数值变量分组形成 2. 2.数值变量数列又可分为数值变量数列又可分为: : 单项数列:单项数列:每组只有一个变量值一个变量值的变量数列 组距数列:组距数列:每组变量值是一段区间变量值是一段区间的变量数列 连续变量数列:连续变量数列:按连续变量分组形成的数列 离散变量数列:离散变量数列:按离散变量分组形成的数列品质变量分配数列实例品质变量分配数列实例 表表3-2 某高校在校生性别状况分组表某高校在校生性别状况分组表性别 人数(人) 比重
33、(%) 男生 4500 55.56 女生 3600 44.44 合计 8100 100.00 数值变量分配数列实例数值变量分配数列实例 表表3-33-3 某市餐饮业按营业额分组某市餐饮业按营业额分组 营业额(万元) 餐饮企业个数(家) 比重(%) 10万元以下 1350 58.70 10- 50 650 28.25 50-100 180 7.83 100-500 85 3.70 500万元以上 35 1.52 合 计 2300 100.00 单项式变量数列实例单项式变量数列实例 表表3-4 某市居民家庭按家庭人口数分组某市居民家庭按家庭人口数分组 家 庭 人 口 数 ( 人 ) 家 庭 数 (
34、 千 户 ) 比 重 ( %) 1 9.8 5.76 2 27.5 16.18 3 94.6 55.65 4 19.2 11.29 5 10.9 6.41 6 8.0 4.71 合 计 170.0 100.00 组距式变量数列实例组距式变量数列实例 表表3-5 3-5 某车间工人按月工资分组某车间工人按月工资分组 月 工 资 ( 元 ) 工 人 数 ( 人 ) 比 重 ( %) 500元 以 下 16 8.00 500-600 28 14.00 600-700 34 17.00 700-800 56 28.00 800-900 38 19.00 900-1000 18 9.00 1000元 以
35、 上 10 5.00 合 计 200 100.00 1.1.概念术语概念术语 (1) (1)全距(全距(R R)数列中最大变量值最小变量值 (2)(2)组限组限:每一组的最大变量值与最小变量值 上限上限: :每一组的最大变量值 下限下限: :每一组的最小变量值 (3)(3)组距(组距(d d): :每一组的最大变量值与最小变量值之差 组距组距= =上限上限下限下限 (4)(4)组数组数: :数列中的分组个数。(四)分配数列的编制(四)分配数列的编制 定性关系定性关系:全距一定的情况下,组数和组距呈组数和组距呈反方向变动。反方向变动。 定量关系定量关系: 式二为确定组距的经验公式,其中N代表组数
36、。组数和组距的关系组数和组距的关系组数全距组数全距/组距组距=R/d组距组距=R/(13.322lgN)(四)分配数列的编制(四)分配数列的编制 1.1.概念术语概念术语 (5)(5)频数频数( (次数次数) )与频率频率( (比重比重) ) (6)(6)品质数列品质数列与变量数列变量数列 (7)(7)等距数列等距数列与异距数列异距数列 (8) (8)次数密度次数密度:单位组距内分布的总体单位数。 公式: 次数密度各组次数次数密度各组次数 / 各组组距各组组距 开口组开口组: :缺上限或缺下限的组 闭口组闭口组: :上下限齐全的组 (1010)组中值及计算)组中值及计算* * * 闭口组闭口组
37、 临近组组限重合组限重合时:组中值=(上限下限)/ 2 临近组组限间断组限间断时:组中值=(下限下组下限)/2 开口组开口组 缺上限缺上限时: 组中值=下限邻组组距/ 2 缺下限缺下限时: 组中值=上限 -邻组组距/ 2 1.概念术语概念术语(9)(四)分配数列的编制(四)分配数列的编制 2.2.注意事项注意事项 (1 1)组距)组距最好为5 5或1010的倍数。倍数。 (2 2)最小组的下限略低于最小变量值,最大组的上限略高于最大变量值。 (3 3)离散型变量)离散型变量分组,相邻组的组限可以间断,组限可以间断,也可以重叠也可以重叠;连续型变量连续型变量分组,相邻组的组限必须重组限必须重叠叠
38、。 (4 4)组限重叠时,临界点的总体单位按“上限不上限不在内在内”的原则归组。 (四)分配数列的编制(四)分配数列的编制 3.3.简单次数分布数列的编制步骤简单次数分布数列的编制步骤 数据排序并计算全距确定变量数列的形式(单项式或组距式)确定组数和组距 确定组限 计算各组次数和频率 绘制表格简单次数分布数列的编制实例简单次数分布数列的编制实例 例例3-13-1数据资料数据资料 某车间某车间4040名工人日产零件如下:名工人日产零件如下: 65 72 66 57 90 86 83 68 75 84 66 59 67 70 79 51 81 54 78 86 94 64 77 74 76 96
39、62 98 85 71 79 84 65 72 89 75 简单次数分布数列的编制实例简单次数分布数列的编制实例 编制步骤之一编制步骤之一数据排序并确定全距数据排序并确定全距 将数据从低到高排列,形成如下变量序列: 51 54 57 59 62 64 65 65 66 66 67 68 70 71 72 72 74 75 75 76 76 77 78 78 79 81 83 84 84 84 85 86 86 88 89 90 93 94 96 98 计算全距=98-51=47 编制步骤之二编制步骤之二确定变量数列的形式确定变量数列的形式 因变量值较多、变动幅度较大,适宜采用组组距式数列。距式
40、数列。简单次数分布数列的编制实例简单次数分布数列的编制实例编制步骤之三编制步骤之三确定组数和组距确定组数和组距 分析分析 全距为47,分为5组,组距为10。编制步骤之四编制步骤之四确定组限确定组限 分析分析 离散型变量分组,相邻组的组限可以重叠,也可间断,本例选择重叠。编制步骤之五编制步骤之五计算各组的频数和频率计算各组的频数和频率 分析分析 根据排序后的变量序列清点各数据区间的频数并计算比重,也可利用Excel统计软件进行。简单次数分布数列的编制实例简单次数分布数列的编制实例编制步骤之六编制步骤之六绘制表格绘制表格 表3-6 某车间工人日产零件分组表 日产零件数量 (件) 工人数(人) 比重
41、(%) 50-60 4 10.00 60-70 8 20.00 70-80 13 32.50 80-90 10 25.00 90-100 5 12.50 合计 40 100.00 4.4.累计次数分布表(图)的编制累计次数分布表(图)的编制(1)(1)累计次数累计次数和和累计频率累计频率反映总体单位分布特征的指标,用以说明总体中在某一变量值水平上下总共包含的总体单位次数和频率。 (2)累计次数和频率的计算方法累计次数和频率的计算方法向上累计向上累计:是将各组的次数和频率,由变量由变量值低的组向高的组累计值低的组向高的组累计。说明各组上限以下上限以下包含的总体单位数和比率。向下累计向下累计:是将
42、各组的次数和频率,由变量由变量值高的组向低的组累计值高的组向低的组累计。说明各组下限以上下限以上包含的总体单位数和比率。累计次数分布数列的编制实例累计次数分布数列的编制实例向上累计 向下累计 日产零件 数量 (件) 工人数 (人) 比重 (%) 次数 频数 次数 频数 50-60 4 10.00 4 10.00 40 100.00 60-70 8 20.00 12 30.00 36 90.00 70-80 13 32.50 25 62.50 28 70.00 80-90 10 25.00 35 87.50 15 37.50 90-100 5 12.50 40 100.00 5 12.50 合计
43、 40 100.00 - - - - 例例3-2 3-2 根据例3-1编制的累计次数分布表如下:表3-7 某车间工人日产零件累计分组表二、次数分布二、次数分布 社会经济现象的分布主要有以下三种类型:社会经济现象的分布主要有以下三种类型: ( (一一) )钟形分布钟形分布/丘形分布丘形分布 1.含义含义: 特点是“两头小,中间大两头小,中间大”,即越靠近中间的变量值分布次数愈多;愈远离变量值中点分布的次数愈少,形态如钟或山丘。 正态分布正态分布:左右两侧对称分布 2.2.种类种类 左偏分布左偏分布:存在极小变量值时曲线向左偏的 偏态分布偏态分布 非对称分布 右偏分布右偏分布:存在极大变量值时曲线
44、向右偏的 非对称分布 正态分布 左偏分布 右偏分布 二、次数分布二、次数分布( (二二)U)U形分布形分布:是指较大和较小的变量值出现的次数多,而中间变量值出现的次数少,特点是“两头大,中间小” 。( (三三) )J形分布形分布:J形分布的特征是“一边大,一边小”。即次数随着变量值的变化大多数集中在某一端的分布。其曲线形如英文字母的“J”字,具体有正J形分布和反J形分布两种类型。 U形分布 正J形分布 反J形分布* * *思考题思考题: :以下现象的次数分布符合哪种分布的特征? A 人群中身高、体重的分布 B 学生考试成绩的分布 C 按人口年龄分布的死亡率 D 餐饮企业销售额的分布(一)统计表
45、的概念(一)统计表的概念(二)统计表的结构(二)统计表的结构 1.从形式上看:分为总标题、横行标题、纵栏标题和统计数值。 2.从内容上看:分为主词和宾词。 (三)统计表的种类(三)统计表的种类 简单表:主词未做任何分组。 简单分组表:主词按一个标志分组。 复合分组表:主词按两个或以上的标志分组。(四)统计表的编制规则(四)统计表的编制规则 一、统计表一、统计表 (一一)概念概念 条形图 (二二)种类种类 直方图和折线图 圆形图 二、统计图二、统计图 统计表示例统计表示例 某居民小区家庭按月收入简单分组表某居民小区家庭按月收入简单分组表统计图示例统计图示例条形图条形图用长短或高矮来显示数值的大小
46、 家庭人均生活费收入次数分布图571086321302468101214月收入户数8001 00010001 20012001 40014001 60016001 80018002 00020002 20022002 400统计图示例统计图示例折线图折线图将直方图的各条形中点用线连接起来而得到。将直方图的各条形中点用线连接起来而得到。 户数5710138632024681012148001 00012001 40016001 80020002 200月收入户数户数统计图示例统计图示例圆形图圆形图/ /饼图饼图: :是以圆形的分割来表示总体的分组及结构。 (某居民小区家庭按月收入分组情况) 9.
47、26%12.96%18.52%24.07%14.81%11.11%5.56%3.70%800100010001200120014001400160016001800180020002000220022002400本章小结本章小结一、统计数据整理一、统计数据整理 统计数据整理是统计数据调查的继续和数据分析的前提,是感性认识上升到理性认识的连接点。数据整理的前提是审核,分组汇总是核心。按品质变量分组的关键是界定各类型组的性质差异,按数值变量分组的关键是正确确定各组的数量界限,即组数与组限。二、统计分组二、统计分组 统计分组必须遵循穷尽性和互斥性两个原则。数值变量分组有单项式和组距式两种。组距式分组
48、又有离散型与连续型、等距与异距分组之分,对于组距式分组要计算组距、组数、组中值。本章小结本章小结三、分配数列三、分配数列/ /次数分布数列次数分布数列 由两个要素构成,一是组别,二是各组次数或频率。根据需要,可以编制简单次数分布表简单次数分布表和累计次数分布累计次数分布表。表。四、次数分布四、次数分布 主要有钟形钟形分布、U U形形分布和J J形形分布。五、统计表和统计图五、统计表和统计图 统计表和统计图是显示统计数据的两种重要形式。统计表的结构从形式看可分为总标题、横表目、纵标目和指标数值;从内容上看可分为主词和宾词两部分。统计图主要有条形图、直方图、圆形图等。 END学习目的和学习目的和重
49、难点提示重难点提示 w 本章学习目的本章学习目的w 领会领会数据分布的各种特征:集中趋势、离散趋势、偏斜程度和峰度。w 掌握掌握数据分布特征各测定值的计算方法、特点及其应用场合。w 本章重难点提示本章重难点提示 w 数据分布特征的描述方法,如何使用一些统计量来对数据进行概括性测定。w 数据分布特征各测定值的计算方法、特点及其应用场合。一、均值一、均值 (平均数、数值平均数,平均数、数值平均数,mean)( (一一) )概念概念 均值均值是反映数据分布集中趋势十分重要的数据,代表总体单位某一标志值的一般水平代表总体单位某一标志值的一般水平。( (二二) )特征特征 1.具有抽象性。抽象性。 2.
50、具有代表性。代表性。 3.反映反映总体分布的集中趋势。集中趋势。( (三三) )举例举例 1.某市中学生每周平均上网时间为2.8小时。 2.某农贸市场2月份牛肉的平均价格为16元/千克。 3.某地区“十五”期间经济平均增长率为9.6%。(四)均值的种类及计算(四)均值的种类及计算 1.1.算术平均数算术平均数* * * (1)(1)概念概念 算术平均数又称平均值,是用一组数据中所有值之和除以该组数据的个数。 (2)(2)基本公式基本公式总体单位总量总体标志总量算术平均数 算术平均数的计算算术平均数的计算* * *简单算术平均数简单算术平均数: 总体平均数总体平均数 样本平均数样本平均数112n
51、iinXXXXXnn112NiiNXXXXNN算术平均数的计算算术平均数的计算 * * *加权算术平均数加权算术平均数 概念概念: :是对每个数据每个数据都根据其在全组中的重要程度赋赋予一定权重予一定权重后得到的算术平均数。 计算公式计算公式: : (1 1)未分组数据)未分组数据 其中其中,w表示各组的标志总量,而不是各组变量值出现的次数,总体和样本加权算术平均数的公式是相同。 Xww XXw或 例例4-14-1根据某公司根据某公司四个品牌数码相机的销四个品牌数码相机的销售资料计算平均利润率。售资料计算平均利润率。表4-1 四个品牌数码相机的利润率和销售额资料四个品牌数码相机的利润率和销售额
52、资料所以所以,四个品牌数码相机的平均销售利润率为: 因为因为: 销售总额利润总额商品销售利润率1137246.3%590iniiwniiw XXw* * *加权算术平均数加权算术平均数 分组的加权平均数分组的加权平均数: :根据分组数据计算均值。样本样本均值的计算公式: 总体总体均值的计算公式:表示各组的变量值变量值(组距式数列的组中值组中值); 表示各组变量值出现的频数(即权数权数)。1122112.kiikkikM fM fM fM ffffN1122112.kiikkikM fM fM fM fXfffniMif其中, 例例4-24-2根据某电脑公司在各市场上销售量的根据某电脑公司在各市
53、场上销售量的分组数据,计算电脑销售量的均值。分组数据,计算电脑销售量的均值。 122 200185()120kiiiM fXn台2.2.调和平均数调和平均数(1 1)概念)概念: : 调和平均数调和平均数又称倒数平均数倒数平均数,是各个变量值倒数的算术平均数的倒数。 (2 2)计算)计算 简单调和平均数简单调和平均数:针对未分组资料。未分组资料。 计算公式为:11hniinXX2.2.调和平均数调和平均数 加权调和平均数加权调和平均数: :针对分组资料。分组资料。 计算公式计算公式为: 其中其中: 是一种特殊权数特殊权数,它不是各组变量值出现的次数,表示各组标志总量各组标志总量。 即iiifx
54、w111111nnniiiiiiihnnniiiiiiiiwXffXwffXXiwiiixwf 例例4-34-3根据根据某商场职工月工资资料计算月某商场职工月工资资料计算月平均工资。平均工资。 表表4-3某商场职工月工资资料某商场职工月工资资料)(7845039200元月平均工资iiixww3.3.几何平均数几何平均数(1)(1)概念概念:几何平均数(geometric mean)又称对称平均数,它是各变量值乘积的n次方根。(2)(2)计算计算 基本公式基本公式: : 对数公式对数公式: : 在实际工作中,由于变量个数较多,通常要应用对数来进行计算。即 121nnnGniiXXXXX12111
55、lglglglglglgnGniiGGXXXXXnnXarcX(3)(3)几何平均数的应用及特点几何平均数的应用及特点 应用条件应用条件 a. a.变量值是相对数据,如比率或发展速度。变量值是相对数据,如比率或发展速度。 b. b.变量值的连乘积等于总比率或总发展速度。变量值的连乘积等于总比率或总发展速度。特点特点 a. a.如果数列中有一个标志值等于零或负值,则无法计算。如果数列中有一个标志值等于零或负值,则无法计算。 b. b.受极端值影响较小,故较稳健。受极端值影响较小,故较稳健。 例例4-44-4 某电器销售公司20002005年销售量的环比增长率分别为:7.6%、2.5%、0.6、2
56、.7%和2.2%。求这期间销售量的平均增长速度。表4-4 销售量平均发展速度计算表 几何平均数的计算示例几何平均数的计算示例几何平均数的计算示例几何平均数的计算示例 1.1.采用基本公式采用基本公式计算的销售量平均发展速度为: 2. 2.采用对数公式采用对数公式计算的销售量平均发展速度为: 所以,销售量的平均增长速度所以,销售量的平均增长速度=103.1%-1=3.1% =103.1%-1=3.1% if155107.6%102.5%100.6%102.7%102.2%1.16454103.1%nnGiiXXlg10.0660lg2.01335lg2.0133103.1%GGGXXnXarcX
57、arc二、位置平均数二、位置平均数(一)中位数(一)中位数(median) 1.1.概念概念 中位数是将一组数据项按照数值大小升序或者降序排列后位于中间位置的那个数据中间位置的那个数据,符号为 。 2. 2.中位数的计算方法中位数的计算方法 (1) (1)未分组数据的中位数未分组数据的中位数 将变量值按升序或降序排列,找中间位置的变量值。 (2) (2)单项数列的中位数单项数列的中位数 计算各组的累计频数累计频数(向上累计向上累计或向下累计向下累计);根据中位数位置确定中位数。eM12niif中 位 数 的 位 置 if 例例4-54-5 计算某公司销售人员月销售冰箱中位数 表4-5 某公司销
58、售人员月销售冰箱中位数计算18 04 022niif34()eM 台中位数的位置中位数的位置 即中位数中位数在累计频数为40的那一组内(向上累计或向下累计均可得出),则 。 2.2.中位数的计算方法中位数的计算方法(3 3)组距数列的中位数)组距数列的中位数:由下列公式近似计算 下限公式下限公式2ieiinFMLhfniLiFifh其中其中:为总体单位总数;为中位数组的下限;为中位数组以下的累计频数;为中位数组的频数;为中位数组的组距; 例例4-6 4-6 求以下组距数列的中位数。求以下组距数列的中位数。 中位数的近似值为:92212500050007777.8()45eM元表4-6 某地区家
59、庭收入分组中位数的位置在第第46(92/2)位)位,应在第二组第二组中位数的特点中位数的特点 是一种位置平均数位置平均数,不受极端值及开口组的影响不受极端值及开口组的影响。 对于分配不对称的数据分配不对称的数据,中位数比平均值更适合当集中趋势的代表值。 对某些不具有数字特征或不能用数字测定的现象,可对某些不具有数字特征或不能用数字测定的现象,可用中位数表示其一般水平用中位数表示其一般水平。 例如,对众多的消费者购买数码相机时,分别对价格、外观、品质的注重程度排序后,可以求出消费者在乎的中位数因素。 二、位置平均数二、位置平均数(二)(二)众数众数 1.1.概念概念 众数(mode)是指在一组数
60、中出现次数最多的那个数值,符号为 。 2.2.数据数列的众数分布情况数据数列的众数分布情况 无众数无众数 如数据数列: 13 7 9 12 6 8 一个众数一个众数 如数据数列: 6 5 9 8 6 6 多个众数多个众数 如数据数列: 22 35 27 35 27 36ifoM3.3.众数的计算方法众数的计算方法 * * *品质变量的众数品质变量的众数观察次数,出现次数最多的变量值就是众数。 例如:企业的所有制结构分布、人口的城乡分布。 * * *数值变量的众数数值变量的众数 未分组资料未分组资料观察次数,出现次数最多的数据就是众数。 分组资料分组资料 (1)单项式数列直接观察,次数最多的组的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年吉林省乾安七中物理高二第二学期期末统考试题含解析
- 贵州省凤冈县第二中学2025届物理高一第二学期期末综合测试试题含解析
- 黑龙江省林口林业局中学2025年物理高一第二学期期末统考试题含解析
- 2025届福建省漳州市第八中学高一物理第二学期期末经典试题含解析
- 农贸市场管理课件
- 二零二五年被褥原材供应链合同
- 2025版标前协议书-道路桥梁工程
- 二零二五年度安全设施设备维护保养合同范本
- 2025版车辆交易市场管理合同
- 二零二五年HSE安全管理体系审核合同
- 2025年山东省职教高考(机械制造专业)综合知识备考试题库(含历年真题)
- DB1303-T352-2023食品快速检测产品验收技术规范
- 2025年中考物理热点题型专项训练:实验之探究平面镜成像的特点 (解析版)
- 《蚯蚓》课件-生物学-自然科学-专业资料
- 2025年秋部编版二年级语文上册教学计划
- 《沥青及沥青混合料》课件
- 《FT装维资料》课件
- 医疗物联网标准与规范-洞察分析
- 高二-粤教版-物理-选择性必修三-第二章《新材料》课件
- GB/T 30102-2024塑料废弃物的回收和再利用指南
- 2024新版《药品管理法》培训课件
评论
0/150
提交评论