




已阅读5页,还剩24页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章 数据的图表展示 数据的预处理 品质数据的整理与展示 数值型数据的整理与展示 合理使用图标 3.1 数据的预处理 3.1.1 数据审核 原始 数据 二手 数据 适用性 时效性 完整性 审核 准确性 审核 应调查的单位是否有遗漏 所有的调查项目是否填写齐全 数据是否有错误 是否存在异常值 应尽可能使用最新 的统计数据 来源、口径以及有 关的背景材料 是否符合自己分析 研究的需要 3.1.2 数据筛选 3.1.3 数据排序 例3.1 3.1.4 数据透视表 例3.2 3.2 品质数据的整理与展示 3.2.1 分类数据的整理与展示 1.频数与频数分布 频数:落在各类别中的数据个数。将各 类别及落在其中的相应频数列出,用表格 形式表现出来,称为频数分布。 例3.3 2.分类数据的图示 (1)条形图 是用宽度相同的条形的高度或长短来表示 数据变动的图形 条形图有单式、复式等形式 在表示定类数据的分布时,是用条形图的 高度来表示各类别数据的频数或频率 例3.3 (2)帕累托图 不同类别的数据根据其频率降序排列的 ,并在同一张图中画出累积百分比图 用双直角坐标系表示,左边纵坐标表示频 数,右边纵坐标表示频率 (3)饼图 用圆形及园内扇形的面积来表示数值大小 的图形 主要用于表示总体中各组成部分所占的比 例,对于研究结构性问题十分有用 例3.3 (4)环形图 环形图是由两个及两个以上大小不一的饼 图叠在一起,挖去中间的部分所构成的图 形 3.2.2 顺序数据的整理与图示 1.累积频数和累积频率 可以是向上累计频数,也可以是向下累计 频数。向上累计频数分布是先列出各组的 上限,然后由标志值低的组向标志值高的 组依次累计频数。向下累计频数分布是先 列出各组的下限,然后由标志值高的组向 标志值低的组依次累计频数。 例3.5 3.3 数值型数据的整理与展示 3.3.1 数据分组 将原始数据按照某种标准分成不同的组别 ,用于观察数据的分布特征 分组方法分组方法 等距分组异距分组 单变量值分组 组距分组 实例 某生产车间50名工人日加工零件数如下(单 位:个)。试采用单变量值对数据进行分 组 117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121 单变量值分组表 某车间50名工人日加工零件数分组表 零件数 (个) 频数 (人) 零件数 (个) 频数 (人) 零件数 (个) 频数 (人) 107 108 110 112 113 114 115 117 118 1 2 1 2 1 1 1 3 3 119 120 121 122 123 124 125 126 127 1 2 1 4 4 3 2 2 3 128 129 130 131 133 134 135 137 139 2 1 1 1 2 2 1 1 2 等距分组表(上下组限重叠) 某车间50名工人日加工零件数分组表 按零件数分组频数(人)频率(%) 105110 110115 115120 120125 125130 130135 135140 3 5 8 14 10 6 4 6 10 16 28 20 12 8 合计 50100 等距分组表(上下组限间断) 某车间50名工人日加工零件数分组表 按零件数分组频数(人)频率(%) 105109 110114 115119 120124 125129 130134 135139 3 5 8 14 10 6 4 6 10 16 28 20 12 8 合计 50100 等距分组表(使用开口组) 某车间50名工人日加工零件数分组表 按零件数分组频数(人)频率(%) 110以下 110114 115119 120124 125129 130134 135以上 3 5 8 14 10 6 4 6 10 16 28 20 12 8 合计 50100 3.3.2 数值型数据的图示 1.分组数据:直方图 用矩形的宽度和高度来表示频数分布的图形,实 际上是用矩形的面积来表示各组的频数分布 在直角坐标中,用横轴表示数据分组,纵轴表示 频数或频率,各组与相应的频数就形成了一个矩 形,即直方图(histogram) 频频 数数 ( (人人) ) 1515 1212 9 9 6 6 3 3 105105110110115115120120125125130130135135140140 日加工零件数日加工零件数( (个个) ) 2.未分组数据:茎叶图和箱线图 (1)茎叶图 用于显示未分组的原始数据的分布,由“茎”和 “叶”两部分构成,其图形是由数字组成的,以 该组数据的高位数值作树茎,低位数字作树叶 (2)箱线图 将一组数据从大到小排列,分别计算出他的上边 缘,上四分位数,中位数,下四分位数,下边缘 ,还有一个异常值。 4681012 图3-9 简单箱线图 中位数qux最大值 x最小值ql 对称分布对称分布 qq l l 中位数中位数 qq u u 左偏分布左偏分布 qq l l 中位数中位数 qq u u 右偏分布右偏分布 qq l l 中位数中位数 q q u u 不同分布的箱线图 分布的形状与箱线图分布的形状与箱线图 未分组数据多批数据箱线图 8门课程考试成绩的箱线图 11名学生8门课程考试成绩的箱线图 min-max 25%-75% median value 45 55 65 75 85 95 105 学生1 学生2 学生3 学生4 学生5 学生6 学生7 学生8 学生9 学生10 学生11 3.时间序列数据:线图 时间一般绘在横轴,指标数据绘在纵轴 图形的长宽比例要适当,其长宽比例大致为10:7 一般情况下,纵轴数据下端应从“0”开始,以便 于比较。数据与“0”之间的间距过大时,可以采 取折断的符号将纵轴折断 例3.8 4.多变量数据的图示 (1)散点图 用两组数据构成多个坐标点,考察坐标点的分布 ,判断两变量之间是否存在某种关联或总结坐标 点的分布模式 例3.9 (2)气泡图 展示三个变量之间的关系 例3.9 (3)雷达图 数据类型与显示 数值型数据 品质数据 分组数据总计表 茎 叶 图 条 形 图 圆 形 图 环 形 图 直 方 图 箱 线 图 折 线 图 原始数据时序数据 线 图 雷 达 图 多元数据 数据类型及图示数据类型及图示 3.4 合理使用图表 3.4.1 鉴别图形优劣的准则 强调数据间的比较 有对图形的统 计描述和文字 说明 服务于一个明确 的目的 让读者的注意力集 中在图形内容上 避免歪曲 显示数据 好图 3.4.2 统计表的设计 项目单位1997年 1998年 一、调查户数 二、平均每户家庭人口数 三、平均每户就业人口数 四、平均每人全部收入 五、平均每人实际支出 消费性支出 非消费性支出 六、平均每人居住面积 户 人 人 元 元 元 元 平方米 37890 3.19 1.83 5188.54 4945.87 4185.64 755.94 11.90 39080 3.16 1.80 5458.34 5322.95 4331.61 987.17 12.40 资料来源:中国统计摘要1999,中国统计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2031年中国新型筒架行业投资前景及策略咨询研究报告
- 厦门华厦学院《俄国史》2023-2024学年第二学期期末试卷
- 2025至2031年中国实时三维视景仿真建模工具行业投资前景及策略咨询研究报告
- 2025至2031年中国商用流量表行业投资前景及策略咨询研究报告
- 2025至2031年中国仲马胶囊行业投资前景及策略咨询研究报告
- 2025年关于签订房屋买卖合同需遵循的法律法规
- 2025至2030年中国领袖口压烫机数据监测研究报告
- 济源钢结构仓库施工方案
- 2025至2030年中国滑道专用钉数据监测研究报告
- 2025至2030年中国汽车音响均衡器数据监测研究报告
- 神奇的植物王国课件
- 员工岗位技能考核评定表
- 项目部安全生产事故应急预案
- 普通冲床设备日常点检标准作业指导书
- DBT29-265-2019 天津市市政基础设施工程资料管理规程
- -城乡规划法-最新课件
- DB32T 4013-2021 第三方社会稳定风险评估技术规范
- 夏日泛舟海上 (3)
- 钻井井控装置
- ESC指南心包疾病
- 第三章卫星运动基础与GPS卫星星历
评论
0/150
提交评论