版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 第三章 数据整理-数据分组 统计数据的分组分组是将总体所有单位按一定的标准区分为若干部分分组的目的:概括数据,清晰条理如何分组? 将具有共性的个体归入同一组将总体内部个体间的差异通过组别区分开来统计数据的分组品质数列是按现象的性质、类别标志进行的分组。例如人口按性别和民族分组;时间数列按时间发生的先后顺序分组。例如我国解放后各年的人口数字;GDP变量数列是按某一数量标志大小顺序进行的分组。例如某企业按工资收入的多少分组;空间数列是按不同地区标志进行的分组。例如人口按省、市、自治区分组;次数分配数据观察值在各组中的个数称为次数,各组间的次数称为次数分配。次数分配描述了总体的结构和特征。例如:某
2、企业非熟练工人的周工资额(元)如何分组?变量次数分配的编制1、将原始资料顺序排序2、将各个数据按其数值大小归入相应的组内3、确定组数与组距4、确定组限 如果数据分布比较均匀、对称,即中间数值次数多,大小极端值次数少,考虑用以下公式来确定组数:组数1+3.322 log n组距(观察值中的最大数值观察值中的最小数值)/组数分组计算组数1+3.322 log n =5.9(n=30) 分6组组距:每组区间的宽度 (观察值中的最大数值 观察值中的最小数值)/组数 =(128-84)/6=7.3分6组,组距8排序: 84,85,87,91,91,94,95,96,97,99,101,101,103,1
3、03,105,105,105,106,106,106,106,107,107,109,110,111,111,118,119,121,128分6组,组距8 每周工资(元)人 数(个)各组人数占总人数百分比(%)849251792100517100108124010811641311612431012413213 合计30100结合实际数据一、比较计算组距值(7.3),组距为10比较好计算且方便,二、分组的组数相应从6减少为5。最小值为84,下限从80开 始, 分5组,组距10 每周工资(元)人数(个)各组人数占总人数百分比(%)809031090100723100110134311012051
4、712013027 合计30100分两组 工资收入次数分配表 工资收入分组次数8010513105-13017合计30反映不出观察值分布特征分组太细会出现什么问题? 不等距分组 在不等距分组情况下,要比较各组次数或分析总体结构,要消除由组距不等造成的影响。为此需计算单位组距的次数,即频数密度。 每组单位组距次数某组次数/该组组距不等距分组 人口按年龄分组人口数(万人)频数密度(万人)1岁以下2217岁12.22.03718岁242.181825岁14.82.112555岁34.21.1455岁以上16.30.54合计103.5-组限分类重叠组限:“100200”,“200300”间断组限:“1
5、00199”,“200299”开口组:“100以下”,“500以上”应用范围:离散变量可采用间断组限,亦可采用重叠组限;连续变量应采用重叠组限;数据资料中若有极端值应采用开口组. 注重叠组限计数时应遵循“上组限不包括在内原则。组中值的计算 组中值=(下限+上限)/2 若遇开口组的资料,其开口组的组限一般按其相邻组的组距计,例 某生产车间50名工人日加工零件数如下(单位:个)。试对数据进行组距分组。1171081101121371221311181341141241251231271201291171261231281391221331191241071331341131151171261271
6、201391301221231231281221181181271241251081121351211.将数据排序 107, 108, 108, 110, 112, 112, 113, 114, 115, 117, 117, 117, 118, 118, 118, 119, 120, 120, 121, 122, 122, 122, 122, 123, 123, 123, 123, 124, 124, 124, 125, 125, 126, 126, 127, 127, 127, 128, 128, 129, 130, 131, 133, 133, 134, 134, 135, 137, 13
7、9, 1392.确定组数及组距组数=1+3.322lg50=6.647组距=(139-107)/7=4.6 53.确定组限 最小值为107,以105为第一组下限。采用重叠组限. 某车间50名工作日加工零件数分组表按零件数分组频数(人)频率()105110110115115120120125125130130135135140358141064610162820128合计50100亦可采用间断组限 某车间50名工人日加工零件数分组表按零件数分组频数(人)频率()105109110114115119120124125129130134135139358141064610162820128合计501
8、00变量次数分配的图示直方图:频数分配直方图、频率分配直方图次数多边形图茎叶图累积次数分配图:小于上组限的累积次数分配图、大于下组限的累积次数分配图。特例 洛伦茨曲线 直方图 以变量值为横坐标、次数为纵坐标,以矩形高度表示各组次数(频数)分配多少。如下图: 频数分布直方图直方图 频率分布直方图次数多边形图 次数多边形图 还可将几种不同数据绘在同一多边形图上用于比较.如图:茎叶图 数据源: 21 ,29, 60, 1, 27, 35, 66, 23, 8, 38, 31, 45, 57, 66, 68, 62, 62, 93, 68, 19, 68, 72, 76, 91, 46, 62, 3,
9、 10, 49, 56, 52, 95 按大小排序后如下: 1, 3, 8, 10, 19, 21, 23, 27, 29, 31, 35, 38, 45, 46, 49, 52, 56, 57, 60, 62, 62, 62, 66, 66, 68, 68, 68, 72, 76, 91, 93, 95 茎叶图茎 叶 次数0 1 3 8 31 0 9 22 1 3 7 9 43 1 5 8 34 5 6 9 35 2 6 7 36 0 2 2 2 6 6 8 8 8 97 2 6 28 09 1 3 5 5 4累计次数分配图 小于上组限的累积次数分配每周工资(元)上组限组次数小于上组限的累计次数(人)小于上组限的累积百分比(%)8090903310901001007103310011011013237711012012052893120130130230100 累计次数分配图 以变量值为横坐标、以累积计次数为纵坐标描点连接而成的图,如下图:累计次数分配图 大于下组限的累积次数分配每周工资(元)上组限组次数小于上组限的累计次数(人)小于上组限的累积百分比(%)809080330100901009072790100110
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030年中国MLCC行业资本规划与股权融资战略制定与实施研究报告
- 新形势下川菜餐饮行业可持续发展战略制定与实施研究报告
- 2025-2030年中国月子中心行业全国市场开拓战略制定与实施研究报告
- 2025-2030年中国酒店管理服务行业营销创新战略制定与实施研究报告
- 2025-2030年中国标识设计制作行业营销创新战略制定与实施研究报告
- 织物设计与思考
- 关于进一步健全和完善城市社区治理体系建设的工作方案
- 2019-2025年中国养鸡场行业市场深度分析及发展前景预测报告
- 湖北省襄阳市谷城县石花三中2023-2024学年九年级上学期期末化学试卷
- 雪茄基础知识培训课件
- 混凝土浇筑申请表
- 企业培训5W2H分析法(31P PPT)
- DB13T 2802-2018 水利工程铸铁闸门技术规范
- 必修二unit4History and Traditions重点短语梳理
- 食堂改造与装修设计方案
- 德国Lurgi公司低压回转脉冲袋除尘器技术
- Q∕GDW 12147-2021 电网智能业务终端接入规范
- 塑料件缺陷汇总
- 跌落测试(中文版)-ISTA-2A-2006
- ppt鱼骨图模板图
- 右心导管检查及心血管造影ppt课件
评论
0/150
提交评论