统计学教学-3_第1页
统计学教学-3_第2页
统计学教学-3_第3页
统计学教学-3_第4页
统计学教学-3_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Wednesday, May 12, 2021 Statistical Research Office 1 2. 统计整理统计整理 统计整理是对统计数据加工处理,统计整理是对统计数据加工处理, 使其使其系统化系统化、条理化、图表化条理化、图表化的的 过程,从而达到统计分析的要求,过程,从而达到统计分析的要求, 是处于是处于对对统计数据的统计数据的感性认识感性认识与与 理性认识理性认识之间的一个工作环节。之间的一个工作环节。 Wednesday, May 12, 2021 Statistical Research Office 2 2.1 统计数据的预处理统计数据的预处理 2.2 统计分组统计分

2、组 2.3 次数分布的图示次数分布的图示 Wednesday, May 12, 2021 Statistical Research Office 3 2.1 统计数据的预处理统计数据的预处理 2.1.1 统计数据的审核统计数据的审核 对直接数据(对直接数据(primary data)primary data)审核审核 完整性审核完整性审核 该调查的单位是否都调查了;该调查的单位是否都调查了; 该调查的项目是否都调查了该调查的项目是否都调查了 每一项目的答案是否完整每一项目的答案是否完整 Wednesday, May 12, 2021 Statistical Research Office 4

3、准确性审核准确性审核 检查数据内容是否符合实际检查数据内容是否符合实际; ; 检查数据是否有错误检查数据是否有错误, ,计算是否正确计算是否正确 准确性审核的方法准确性审核的方法 逻辑检查法:逻辑检查法: 对列名或顺序尺度数据的检查;对列名或顺序尺度数据的检查; 计算检查法:计算检查法: 对间隔或比例尺度数据的检查;对间隔或比例尺度数据的检查; Wednesday, May 12, 2021 Statistical Research Office 5 对间接数据(对间接数据(secondary data)审核审核 适用性审核适用性审核 原数据的来源原数据的来源 原数据的口径原数据的口径 原数据

4、的收集背景原数据的收集背景 时效性审核时效性审核 数据有没有滞后数据有没有滞后 有无同类最新数据有无同类最新数据 思考:思考:使用间接数据为什么要注明数据来源?使用间接数据为什么要注明数据来源? Wednesday, May 12, 2021 Statistical Research Office 6 2.1.2 统计数据的筛选统计数据的筛选 将不符合要求的数据或有明显将不符合要求的数据或有明显 错误的数据予以错误的数据予以纠正纠正或或剔除,剔除,或或 对缺失的数据进行估计对缺失的数据进行估计 将符合特定要求的数据挑选出将符合特定要求的数据挑选出 来。来。 Wednesday, May 12,

5、 2021 Statistical Research Office 7 2.1.3 统计数据的排序统计数据的排序 递增排序递增排序 递减排序递减排序 * 排序的目的排序的目的 - - 发现数据的趋势特征或解决问题的线索;发现数据的趋势特征或解决问题的线索; - - 有利于对数据的检查纠错;有利于对数据的检查纠错; - - 为数据的归类分组提供依据为数据的归类分组提供依据 Wednesday, May 12, 2021 Statistical Research Office 8 2.2 2.2 统计分组统计分组 将全部统计数据按照某一或某些特征将全部统计数据按照某一或某些特征 分别列入不同的组内

6、。分别列入不同的组内。 2.2.1 2.2.1 统计分组的作用:统计分组的作用: - - 区分事物的类型;区分事物的类型; - - 研究事物的内部结构;研究事物的内部结构; - - 分析事物之间的相互依存关系。分析事物之间的相互依存关系。 Wednesday, May 12, 2021 Statistical Research Office 9 2.2.2 统计分组的步骤:统计分组的步骤: 选择分组标志选择分组标志 确定分组界限确定分组界限 编制次数分布表编制次数分布表 Wednesday, May 12, 2021 Statistical Research Office 10 选择分组标志选

7、择分组标志 对列名尺度数据与顺序尺度数据的对列名尺度数据与顺序尺度数据的 分组分组 - 例:见表例:见表1、表、表2、表、表3 表表1 某班第一次作业成绩分布表某班第一次作业成绩分布表 单位:人单位:人 等级 人数(人) 男生 女生合计 A B 2 23 15 10 17 33 合计 25 25 50 Wednesday, May 12, 2021 Statistical Research Office 11 人均国民总收入(美元)国 家 975以下 975-3855 3855-11905 11905以上 低收入国家 中等偏下收入国家 中等偏上收入国家 高收入国家 资料来源:http:/ 20

8、08年世界银行公布的最新收入分组标准 . 表2 世界银行的国家分组世界银行的国家分组 Wednesday, May 12, 2021 Statistical Research Office 12 表表2 1990年第四次人口普查年第四次人口普查 江苏省人口结构状况分布表江苏省人口结构状况分布表 单位:万人单位:万人 注:表中数据均来自注:表中数据均来自江苏统计江苏统计(2000)增刊,第)增刊,第 42页。页。 性别 城乡 年龄 女 男城镇农村0-1415-4950以上 32933412144752581593 3856 1257 Wednesday, May 12, 2021 Statist

9、ical Research Office 13 表表3 全国及江苏人口普查总数全国及江苏人口普查总数 单位:万人单位:万人 年份年份 全国全国 江苏江苏 比重(比重(%) 1953 60193.80 4125.22 6.85 1964 72307.03 4450.46 6.15 1982 100391.39 6052.11 6.03 1990 113051.05 6705.68 5.93 2000* 126743.00 Wednesday, May 12, 2021 Statistical Research Office 14 对间隔尺度数据与比例尺度数据对间隔尺度数据与比例尺度数据 的分组的

10、分组 . 单变量值分组单变量值分组 见表见表4 . 组距分组组距分组 见表见表5、6 确定组数(通常确定组数(通常5-155-15组)组) 确定组距确定组距 确定组限确定组限 根据分组将数据整理成次数分布表根据分组将数据整理成次数分布表 Wednesday, May 12, 2021 Statistical Research Office 15 表表4 南京审计学院某班学生年龄分布南京审计学院某班学生年龄分布 年龄年龄 人数人数 比重比重 向上累计向上累计 (人)(人)(%) 比重(比重(%) 次数(人)次数(人) 18 3 6 6 3 19 15 30 36 18 20 30 60 96 4

11、8 21 2 4 100 50 合计合计 50 100 - - Wednesday, May 12, 2021 Statistical Research Office 16 表表4 南京审计学院某班学生年龄分布表南京审计学院某班学生年龄分布表 年龄 人数 (人) 比重 (%) 向上累积 人数 (人) 比重 (%) 18 19 20 21 3 15 30 2 6 30 60 4 3 18 48 50 6 36 96 100 合计 50 100 - - Wednesday, May 12, 2021 Statistical Research Office 17 例:下列数据是南京审计学院例:下列数

12、据是南京审计学院2001级某专业级某专业 (1)、()、(2)班学生,课程)班学生,课程概率论与数概率论与数 理统计理统计的期末考试成绩:的期末考试成绩: (1)班:)班:8、22、70、83、68、86、63、 58、53、65、79、79、84、71、78、84、 69、85、81、72、56、62、58、72、69、 75、70、95、58、84、79、36、80、78、 86、90、61、6、45、52、61、64、54 Wednesday, May 12, 2021 Statistical Research Office 18 (2):):88、69、84、92、89、82、84、8

13、5、 52、74、82、91、80、78、95、20、80、26、 78、93、71、77、94、62、81、53、68、77、 85、76、84、47、79、74、78、84、65、91、 88 要求要求: - 对两个班学生成绩分别编制次数分布表;对两个班学生成绩分别编制次数分布表; - 对两个班学生成绩分别绘制茎叶图对两个班学生成绩分别绘制茎叶图 - 对两个班学生成绩用一个公共的茎绘制成茎叶图对两个班学生成绩用一个公共的茎绘制成茎叶图 Wednesday, May 12, 2021 Statistical Research Office 19 表表5 (1)班)班概率论与数理统计概率论与数

14、理统计成绩统计成绩统计 分数分数 人数人数 比重比重 向向累积累积 (分)(分) (人)(人) (%) 人数(人)比重(人数(人)比重(%) 90以上以上 2 4.7 43 100.0 80-90 9 20.9 41 95.3 70-80 11 25.6 32 76.4 60-70 9 20.9 21 48.8 55-60 4 9.3 12 27.9 55以下以下 8 18.6 8 18.6 合计合计 43 100.0 - - Wednesday, May 12, 2021 Statistical Research Office 20 (1)班成绩分布茎叶表)班成绩分布茎叶表 树茎树茎树叶树叶

15、树叶片数树叶片数 0 1 2 3 4 5 6 7 8 9 68 2 6 5 2346888 112345899 00122588999 0134445669 05 2 0 1 1 1 7 9 11 9 2 Wednesday, May 12, 2021 Statistical Research Office 21 表表6 (2)概率论与数理统计概率论与数理统计成绩统计成绩统计 分数分数 人数人数 比重比重 向向累积累积 (分)(分) ( 人)人) (%) 人数(人)人数(人) 比重(比重(%) 90以上以上 6 15.4 6 15.3 80-90 14 35.9 20 51.3 70-80 1

16、0 25.6 30 76.9 60-70 4 10.3 34 87.2 55-60 0 0.0 34 87.2 55以下以下 5 12.8 39 100.0 合计合计 39 100.0 - - Wednesday, May 12, 2021 Statistical Research Office 22 (2)班成绩分布茎叶表)班成绩分布茎叶表 树茎树茎 树叶树叶 树叶片数树叶片数 2 06 2 3 4 7 1 5 23 2 6 2589 4 7 1446778889 10 8 00122444455889 14 9 112345 6 Wednesday, May 12, 2021 Statis

17、tical Research Office 23 (1)、()、(2)班成绩分布茎叶表)班成绩分布茎叶表 树叶树叶 片数片数 树叶树叶树茎树茎树叶树叶 树叶树叶 片数片数 2 0 1 1 1 7 9 11 9 2 68 2 6 5 2346888 112345899 00122588999 0134445669 05 0 1 2 3 4 5 6 7 8 9 06 7 23 2589 1446778889 00122444455889 112345 0 0 2 0 1 2 4 10 14 6 Wednesday, May 12, 2021 Statistical Research Office

18、24 关于组距分组的几个概念关于组距分组的几个概念 - 组限组限(class limit) - 开口组开口组(opened class):有上限没有下有上限没有下 限或有下限没有上限的组限或有下限没有上限的组 - 闭口组(闭口组(closed class): 既有上限又有既有上限又有 下限的组下限的组 - 组距组距 (class interval) = 上限上限 下限下限 (开口组用相邻组组距估计)(开口组用相邻组组距估计) Wednesday, May 12, 2021 Statistical Research Office 25 - 组中值组中值(mid-value) =( (上限上限+

19、+下限)下限)/2/2 - 比重比重 = 组的次数组的次数 / / 总次数总次数 - 次数密度次数密度 = 组的次数组的次数 / / 组距组距 - 次数向上(下)累计次数向上(下)累计(up to add up to add frequency)frequency):将每组的次数(比重)从:将每组的次数(比重)从变变 量值较小量值较小的组的组变量值较大变量值较大的组的累计,的组的累计, 以反映在某一数值以下的变量值出现的以反映在某一数值以下的变量值出现的 次数。次数。 Wednesday, May 12, 2021 Statistical Research Office 26 统计表的构成统计

20、表的构成 从结构上看从结构上看 - - 表头表头 - - 横行标题横行标题 - - 纵行标题纵行标题 - - 数值数值 - - 表外附加表外附加 Wednesday, May 12, 2021 Statistical Research Office 27 统计表的构成统计表的构成 从内容上看从内容上看 - 主词:主词:用于描述事物特征用于描述事物特征 - 宾词:宾词:事物特征的数值表现事物特征的数值表现 Wednesday, May 12, 2021 Statistical Research Office 28 编制次数分布表编制次数分布表(frequency tables)(即统计(即统计

21、表)的基本要求:表)的基本要求: 要有总标题要有总标题 开口式开口式 上下两条线用上下两条线用粗(黑或并列双)粗(黑或并列双)线线 组与组之间不得用线隔开组与组之间不得用线隔开 表中不能有空格表中不能有空格 省略的数字或较小的数字填写省略的数字或较小的数字填写“” 不须填写不须填写或或不存在数值的位置填写不存在数值的位置填写“-” 表中数据应标明计量单位表中数据应标明计量单位 注明数据来源注明数据来源 Wednesday, May 12, 2021 Statistical Research Office 29 3 数据的显示 柱形图(柱形图(Bar chart)Bar chart) 饼图饼图(

22、Pie chart)(Pie chart) 直方图直方图(Histogram)(Histogram) 折线图(折线图(OgiveOgive) 累加次数曲线累加次数曲线(Cumulative Cumulative frequency curve)frequency curve) Wednesday, May 12, 2021 Statistical Research Office 30 柱形图柱形图 - 简单柱形图简单柱形图(simple bar chart) 见图见图1 - 叠加柱形图叠加柱形图(component bar chart) 见图见图2 - 并列柱形图并列柱形图( (multi-b

23、ar chart) 见图见图3 Wednesday, May 12, 2021 Statistical Research Office 31 Wednesday, May 12, 2021 Statistical Research Office 32 Wednesday, May 12, 2021 Statistical Research Office 33 Wednesday, May 12, 2021 Statistical Research Office 34 Multi-bars chart Wednesday, May 12, 2021 Statistical Research Office 35 饼图 (pie chart) 图4. 1990和2002年我国完成货物周转量 51.50 / .1% 6704.00 / 17.8% 15447.00 / 41.0% 15447.00 / 41.0% 民 航 公 路 铁 路 铁 路 8 / 0% 11592 / 45% 3358 / 13% 10622 / 42% 民航 水运 公路 铁路 Wednesday, May 12, 2021 Statistical Research Office 36 图5 1991-2006年中国财政收

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论