




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、学习目的及重难点提示学习目的及重难点提示本章学习目的:本章学习目的: 了解了解数据整理在统计活动中的地位、数据整理的内容、数据审核与汇总的技术 领会领会统计分组的概念、关键、统计分组体系及次数分布的类型和特征 明确明确统计数据的表现形式统计表和统计图的基本内容 掌握掌握统计分组、分配数列和统计图表的编制绘制方法本章重难点提示:本章重难点提示: 本章重点:本章重点:统计分组、变量数列的编制、统计数据的显示方法统计表和统计图 本章难点:本章难点:统计分组、变量数列的编制、次数分布图的绘制 一、数据整理的概念与作用一、数据整理的概念与作用 ( (一一) )概念概念 对对统计调查所搜集到的数据进行分类
2、和汇总数据进行分类和汇总,使其系统化、条理化、科学化,以以得出反映事物总体综反映事物总体综合特征合特征的资料的工作过程 ( (二二) )作用作用 统计数据整理,是统计调查的继续,也是统计分是统计调查的继续,也是统计分析的前提析的前提,承前启后,在整个统计工作中具有重要的作用 二、数据整理的程序二、数据整理的程序 数据整理方案的设计数据整理方案的设计 数据的审核与检查数据的审核与检查 数据的排序数据的排序 数据分组数据分组 数据的显示数据的显示统计图表统计图表 数据的积累与保管数据的积累与保管 一、一、数据分组的概念数据分组的概念 根据统计研究目的和客观现象的内在特点,按按照选定的某个或几个标志
3、标志,将将被研究的总体总体数据分成若干部分数据分成若干部分的科学分类 二、二、数据分组的作用数据分组的作用 (1)区分现象的类型 (2)反映总体的内部结构 (3)揭示现象之间的依存关系 (4)反映事物的数量特征和发展规律三、三、数据分组的关键数据分组的关键* 选择分组标志选择分组标志和分组划分各组界限划分各组界限(针对数值型变量)四、四、选择分组标志的原则选择分组标志的原则* 1.1.根据研究任务研究任务和目的目的选择分组标志 2.2.选择能反映事物本质特征或重要特征反映事物本质特征或重要特征的标志 3.3.结合结合现象所处的历史条件和社会经济条件历史条件和社会经济条件选择分组标志 (一)根据
4、分组变量(一)根据分组变量( (标志标志) )的性质不同的性质不同 按品质变量分组品质变量分组 按数值变量分组数值变量分组 (二)根据采用的分组标志的个数多(二)根据采用的分组标志的个数多少少 简单分组简单分组: :只按一个标志分组 复合分组复合分组: :按两个或以上的标志分组五、统计分组的种类五、统计分组的种类一、分配数列一、分配数列 (一)概念(一)概念 ( (二二) )分配数列的要素分配数列的要素 组别组别 次数次数( (频数频数):):分布在各组的总体单位数。各组的 次数次数(频数频数)之和等于总体单位总数之和等于总体单位总数 频率频率( (比重比重):):各组次数占总次数的比重。各组
5、比比 重之和等于重之和等于100%100%(或(或1 1) 将总体按分组标志分组后形成的总体单位在各组的分布,又称次数分布数列次数分布数列或频数分布数列频数分布数列分配数列实例分配数列实例 按 海 拔 分 组 ( 米 ) 面 积 ( 万 平 方 公 里 ) 占 总 面 积 比 重 ( ) 500以 下 500 1000 1000 2000 2000 3000 3000以 上 241.7 162.5 239.9 67.6 248.3 25.18 16.93 24.99 7.04 25.86 合 计 960.0 100.00 组别频数频率表表3.1 我国土地状况分组表我国土地状况分组表(二)分配数
6、列的种类(二)分配数列的种类 1.1.按分组标志的性质不同按分组标志的性质不同 品质变量数列品质变量数列: :按品质变量分组形成 数值变量数列数值变量数列: :按数值变量分组形成 2.2.数值变量数列又可分为数值变量数列又可分为: : 单项数列单项数列:每组只有一个变量值一个变量值的变量数列 组距数列组距数列:每组变量值是一段区间变量值是一段区间的变量数列 连续变量数列连续变量数列:按连续变量分组形成的数列 离散变量数列离散变量数列:按离散变量分组形成的数列品质分配数列实例品质分配数列实例 表表3.2 某高校在校生性别状况分组表某高校在校生性别状况分组表性 别 人 数 ( 人 ) 比 重 (
7、% ) 男 生 4500 55.56 女 生 3600 44.44 合 计 8100 100.00 数值变量分配数列实例数值变量分配数列实例 表表3.33.3 某市餐饮业按营业额分组某市餐饮业按营业额分组 营业额(万元) 餐饮企业个数(家) 比重(%) 10万元以下 1350 58.70 10- 50 650 28.25 50-100 180 7.83 100-500 85 3.70 500万元以上 35 1.52 合 计 2300 100.00 单项式变量数列实例单项式变量数列实例 表表3.4 某市居民家庭按家庭人口数分组某市居民家庭按家庭人口数分组 家庭人口数(人) 家庭数(千户) 比重(
8、%) 1 9.8 5.76 2 27.5 16.18 3 94.6 55.65 4 19.2 11.29 5 10.9 6.41 6 8.0 4.71 合 计 170.0 100.00 组距式变量数列实例组距式变量数列实例 表表3.5 3.5 某车间工人按月工资分组某车间工人按月工资分组 月工资(元) 工人数(人) 比重(%) 500元以下 16 8.00 500-600 28 14.00 600-700 34 17.00 700-800 56 28.00 800-900 38 19.00 900-1000 18 9.00 1000元以上 10 5.00 合 计 200 100.00 应用应用
9、 判断以下数列是品质数列还是变量数列判断以下数列是品质数列还是变量数列? ?是是连续变量数列还是离散变量数列连续变量数列还是离散变量数列? ? A.A. 按企业职工人数分组形成的数列 B.B. 按企业销售利润率分组形成的数列 C.C. 按教师职称分组形成的数列 (一)(一)概念术语概念术语 1.1.全距(全距(R R)数列中最大变量值最小变量值 2.2.组限组限:每一组的最大变量值与最小变量值 上限上限: :每一组的最大变量值 下限下限: :每一组的最小变量值 3.3.组距(组距(d d): :每一组的最大变量值与最小变量值之差 组距组距= =上限上限下限下限 4.4.组数组数: :数列中的分
10、组个数二、分配数列的编制二、分配数列的编制 定性关系定性关系:全距一定的情况下,组数和组距呈组数和组距呈反方向变动反方向变动 定量关系定量关系: 式2为确定组距的经验公式,其中N代表组数组数和组距的关系组数和组距的关系组数组数全距全距/组距组距R/d组距组距=R/(13.322lgN)二、分配数列的编制二、分配数列的编制 ( (一一) )概念术语概念术语 5.5.频数频数( (次数次数) )与频率频率( (比重比重) ) 6.6.品质数列品质数列与变量数列变量数列 7.7.等距数列等距数列与异距数列异距数列 8.8.次数密度次数密度:单位组距内分布的总体单位数, 公式: 次数密度各组次数次数密
11、度各组次数 / 各组组距各组组距 开口组开口组: :缺上限或缺下限的组 闭口组闭口组: :上下限齐全的组 10.10.组中值及计算组中值及计算* * * (1)(1)闭口组闭口组 临近组组限重合组限重合时:组中值=(上限下限)/ 2 临近组组限间断组限间断时:组中值=(下限下组下限)/2 (2)(2)开口组开口组 缺上限缺上限时: 组中值=下限邻组组距/ 2 缺下限缺下限时: 组中值=上限邻组组距/ 2( (一一) )概念术语概念术语9.二、分配数列的编制二、分配数列的编制 ( (二二) )注意事项注意事项* * * 1.1.组距组距最好为5 5或1010的倍数倍数 2.2.最小组的下限略低于
12、最小变量值,最大组的上限略高于最大变量值 3.3.离散型变量离散型变量分组,相邻组的组限可以间断,也可组限可以间断,也可以重叠以重叠;连续型变量连续型变量分组,相邻组的组限必须重叠组限必须重叠 4.4.组限重叠时,临界点的总体单位按“上限不在内上限不在内”的原则归组 二、分配数列的编制二、分配数列的编制 ( (二二) )简单次数分布数列的编制步骤简单次数分布数列的编制步骤 数据排序并计算全距确定变量数列的形式(单项式或组距式)确定组数和组距 确定组限 计算各组次数和频率 绘制表格简单次数分布数列的编制实例简单次数分布数列的编制实例 例例3-1 3-1 数据资料数据资料 某车间某车间4040名工
13、人日产零件如下:名工人日产零件如下: 65 72 66 57 90 86 83 68 75 84 66 59 67 70 79 51 81 54 78 86 94 64 77 74 76 96 62 98 85 71 79 84 65 72 89 75 解题思路解题思路 *编制步骤之一编制步骤之一数据排序并确定全距数据排序并确定全距 将数据从低到高排列,形成如下变量序列: 51 54 57 59 62 64 65 65 66 66 67 68 70 71 72 72 74 75 75 76 76 77 78 78 79 81 83 84 84 84 85 86 86 88 89 90 93 9
14、4 96 98 计算全距=98-51=47 * *编制步骤之二编制步骤之二确定变量数列的形式确定变量数列的形式 因变量值较多、变动幅度较大,适宜采用组距式数组距式数列列解题思路解题思路 * *编制步骤之三编制步骤之三确定组数和组距确定组数和组距 分析分析 全距为47,分为5组,组距为10 * *编制步骤之四编制步骤之四确定组限确定组限 分析分析 离散型变量分组,相邻组的组限可以重叠,也可间断,本例选择重叠 * *编制步骤之五编制步骤之五计算各组的频数和频率计算各组的频数和频率 分析分析 根据排序后的变量序列清点各数据区间的频数并计算比重,也可利用excel统计软件进行解题思路解题思路编制步骤之
15、六编制步骤之六绘制表格绘制表格表3-6 某车间工人日产零件分组表日 产 零 件 数 量 ( 件 ) 工 人 数 ( 人 ) 比 重 ( %) 50-60 4 10.00 60-70 8 20.00 70-80 13 32.50 80-90 10 25.00 90-100 5 12.50 合 计 40 100.00 (三)累计次数分布表(图)的编制(三)累计次数分布表(图)的编制1.1.相关概念相关概念 (1)(1)累计次数和累计频率累计次数和累计频率 反映总体单位分布特征的指标,累计次数累计次数说明总体中在某一变量值水平上下总共包含的总体单位次数 累计频率累计频率说明总体中在某一变量值水平上下
16、总共包含的总体单位数占总体单位总数的比重 (三)累计次数分布表(图)的编制(三)累计次数分布表(图)的编制1.1.相关概念相关概念 (2)(2)累计次数和频率的计算方法累计次数和频率的计算方法向上累计向上累计:是将各组的次数和频率,由变量值低的由变量值低的组向高的组累计组向高的组累计。说明各组上限以下上限以下包含的总体单位数和比率向下累计向下累计:是将各组的次数和频率,由变量值高的由变量值高的组向低的组累计组向低的组累计。说明各组下限以上下限以上包含的总体单位数和比率.累计次数分布表(图)的编累计次数分布表(图)的编( (绘绘) )制步骤制步骤数据排序并计算全距确定变量数列的形式(单项式或组距
17、式)确定组数和组距 确定组限 计算各组次数和频率 计算各组累计次数和频率编(绘)制图表可以在可以在简单次简单次数分布数分布表的基表的基础上编础上编制制累计次数分布数列的示例累计次数分布数列的示例 表3-7 某班级学生考试成绩累计次数分组表二、次数分布二、次数分布( (一一) )钟形分布钟形分布/丘形分布丘形分布 1.含义含义: 特点是“两头小,中间大两头小,中间大”,越靠近中间的变量值分布次数愈多;愈远离变量值中点分布的次数愈少,形如钟或山丘 正态分布正态分布:左右两侧对称分布 2.2.种类种类 左偏分布左偏分布 偏态分布偏态分布 右偏分布右偏分布 正态分布 左偏分布 右偏分布 ( (二二)U
18、)U形分布形分布:是指较大和较小的变量值出现的次数多,而中间变量值出现的次数少,特点是“两头大,中间两头大,中间小小” ( (三三) )J形分布形分布:J形分布的特征是“一边大,一边小一边大,一边小”。即次数随着变量值的变化大多数集中在某一端的分布。其曲线形如英文字母的“J”字,具体有正J形分布和反J形分布两种类型 U形分布 正J形分布 反J形分布* * *思考题思考题: :以下现象的次数分布符合哪种分布的特征: A. 人群中身高、体重的分布 B. 学生考试成绩的分布 C. 按人口年龄分布的死亡率 D. 餐饮企业销售额的分布一、统计表一、统计表(一)统计表的概念(一)统计表的概念(二)统计表的
19、结构(二)统计表的结构 1 1.从形式形式上看:分为总标题总标题、横行标题横行标题、纵栏标题纵栏标题和统计数值统计数值 2 2.从内容内容上看:分为主词主词和宾词宾词 (三)统计表种类(三)统计表种类 (按主词结构分) 简单表简单表:主词未做任何分组 简单分组表简单分组表:主词按一个标志分组 复合分组表复合分组表:主词按两个或以上的标志分组(四)统计表的编制规则(四)统计表的编制规则 (一)统计图的概念(一)统计图的概念(二)统计图的种类(二)统计图的种类 1.直方图 2.条形图 3.折线图 4.圆形图 5.其他 二、统计图二、统计图家庭月收入户数比率800100059.26%10001200
20、712.96%120014001018.52%140016001324.07%16001800814.8111%2000220035.56%2200240023.70%合计54100.00% 某居民小区家庭按月收入简单分组表某居民小区家庭按月收入简单分组表条型图条型图用长短或高矮来显示数值的大小 家庭人均生活费收入次数分布图571086321302468101214月收入户数8001 00010001 20012001 40014001 60016001 80018002 00020002 20022002 400统计图示例统计图示例折线图折线图将直方图的各条形中点用
21、线连接起来而得到将直方图的各条形中点用线连接起来而得到 户数5710138632024681012148001 00012001 40016001 80020002 200月收入户数户数统计图示例统计图示例圆形图圆形图/ /饼图饼图: :是以圆形的分割来表示总体的分组及结构是以圆形的分割来表示总体的分组及结构 ( (某居民小区家庭按月收入分组情况某居民小区家庭按月收入分组情况) ) 9.26%12.96%18.52%24.07%14.81%11.11%5.56%3.70%800100010001200120014001400160016001800180020002000220022002400本章小结(一)本章小结(一)一、统计数据整理一、统计数据整理 是统计数据调查的继续和数据分析的前提,是感性认
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025四月月度系列暖场圈层(春光夏始 万物生)主题活动策划方案
- 品牌定位与传播策略实施要点
- 三农扶贫工作手册 (符合要求)
- 建设工程施工合同书
- 2025年度安全警示标志销售代理合同样本
- 安徽教育云课堂平台
- 能源安全战略研究报告
- 中国广告行业发展现状
- 企业员工培训制度
- 股份制改革相关文书指南
- 药品使用风险监测与预警制度
- 《软件实施方法论》课件
- 民宿整体规划
- 2024年广西区公务员录用考试《行测》真题卷及答案解析
- 电工(初级)考试试卷及答案
- 《建设工程施工合同(示范文本)》(GF-2017-0201)
- 国家电网公司招聘高校毕业生应聘登记表
- 中国结直肠癌诊疗规范(2023版)解读
- 2024年陕西省中考数学试题含答案
- 2024年国网河南省电力公司招聘历年高频500题难、易错点模拟试题附带答案详解
- 2024年清理化粪池协议书
评论
0/150
提交评论