已阅读5页,还剩56页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2019/12/4,第三章社会统计资料的整理,1,第三章社会统计资料的整理,统计分组统计表变量数列的编制统计图,2019/12/4,第三章社会统计资料的整理,2,设有50个工人某月份完成生产定额的原始资料:%95911141101181131211431171251081051101071371201451251341271211181031151151411371231181291361019811311311411913612093122108101105125116122132128131,2019/12/4,第三章社会统计资料的整理,3,第一节统计分组一、统计分组的概念和作用1概念将总体单位或全部调查数据按一定的标志划分成若干组,同组的个体单位之间都具有相同之处,不同组的个体单位间具有相异之处。对总体而言是“分”,将总体分为性质相异的若干部分。对个体而言是“合”,将性质相同的个体组合起来。,2019/12/4,第三章社会统计资料的整理,4,2统计分组的基本原则通过统计分组,必须保持组内统计资料的同质性,组间统计资料的差异性。(1)分组应使各类别构成之和等于总体(2)分组设计应能反映统计总体的分布规律性3作用(1)划分现象的类型(2)表明总体内部的结构及整个结构的类型和特征(3)揭示现象间的依存关系,2019/12/4,第三章社会统计资料的整理,5,二、统计分组方法统计分组的关键选择分组标志和划分各组的界限选择分组标志时,一般应考虑原则:1根据研究问题的目的和任务选择分组标志2在若干标志中,选择能反映问题本质的标志3结合现象所处的历史条件具体情况具体分析划分各组的界限:在分组标志的变异范围内,划定各相邻组之间的性质界限和数量界限品质标志变量数列,2019/12/4,第三章社会统计资料的整理,6,第二节统计表图像展示:建立在图像和图表的形式上。图像展示在统计学上十分重要,它们或者能够阐明理论,或者能够把大量数据简缩成一个易于看懂的形式。(Apicturesaysathousandwords)统计表是表示统计资料的表格作用:汇总和积累统计资料,以简洁和有条理的方式表示统计资料的特征,从而使统计资料便于查对、比较、分析和记忆原则:科学、实用、简炼、美观,2019/12/4,第三章社会统计资料的整理,7,二、统计表的格式:1.总标题、横行标题(表侧)、纵栏标题(表头)、数据(表身)表3.32002年我国城乡人口情况,2019/12/4,第三章社会统计资料的整理,8,2.内容:主词统计表所要说明的对象宾词用来说明主词的标志和标志值主宾词可互换:编排合理,表34离婚案件构成,2019/12/4,第三章社会统计资料的整理,9,3.统计表按主词是否分组以及分组的程度,分为简单表简单分组表复合分组表:简单设计、复合设计,2019/12/4,第三章社会统计资料的整理,10,简单表表35我国城市居民家庭基本情况(2002年),2019/12/4,第三章社会统计资料的整理,11,简单分组表表36中国人口年龄结构状况单位:%,资料来源|:2003中国统计年鉴第99页。,2019/12/4,第三章社会统计资料的整理,12,复合分组表:表37我国社会福利主要费用情况单位:亿元,资料来源|:2003中国统计年鉴第838页。,2019/12/4,第三章社会统计资料的整理,13,标题部分:1、标题置于表格正上方2、总标题所示要点与表中项目一致,在需要时还应表明资料所属的时间和地区3、表次:左;单位:右4、对分页的同一表格,在每页上端都要写标题,加(续一)、(续二)栏目部分:1、先局部后整体2、若栏目较多,可加以编号;统计数字间有计算关系的,可用计算式表达。,二、统计表的制作规则,2019/12/4,第三章社会统计资料的整理,14,线格部分:1、统计表上下两端线应以粗线或双细线标划,表的左右两侧开口2、各栏间用直线标划,大项目间线条较粗,小栏目线条较细;各行间不必划线条数字部分:1、表中数字要对准位数2、不存在某数字时,用“”表示;缺少某项数字时,用“”表示3、数字较大时,加分位点其他规则:1、资料来源写在表格下方2、有说明解释需要时,在表下方注释。3、单位有数种时:,2019/12/4,第三章社会统计资料的整理,15,第三节变量数列的编制,变量数列:能够表示变量分布及其特征的统计表变量值X频数(f):总体单位在各组中出现的次数频率p:相对频数:各组频数除以总体单位数,2019/12/4,第三章社会统计资料的整理,16,一、定类变量表3-1第一次外出的决定最终由谁作出的(2000年调查)资料来源:家庭策略,还是个人自主?农村劳动力外出决策模式的性别分析,社会学2004.12,2019/12/4,第三章社会统计资料的整理,17,二、定序变量表3-2被访民工对城市发展与个人经历关系的认知资料来源:上海市民工对城市社会适应状况的调查,社会学.2004.11,2019/12/4,第三章社会统计资料的整理,18,什么是离散变量?1.单项式变量数列数列中每一组的变量值只有一个。用于离散变量整数值变动幅度较小时。表3.10某社区各户人口数统计表,三、定距变量(一)离散变量变量数列的编制,2019/12/4,第三章社会统计资料的整理,19,2.组距式变量数列数列中每一组由两个变量值差数的一个数值范围来表示。用于数据数值变动幅度较大,而且总体单位数又多时。组距(h)区间的距离:等距;异距(一般,当现象变动比较均匀时,宜用等距分组)组限组距两端的数值:下限()每组的起点数值;上限()每组的终点数值;闭口组上限和下限都齐全的组;开口组缺上限或下限的组h=-组中值上限和下限之间的中点数值m=(+)/2组中值充当该组的近似变量值,2019/12/4,第三章社会统计资料的整理,20,组中值(,学校数(,表3.11某地区小学班级数,2019/12/4,第三章社会统计资料的整理,21,离散变量组距编制注意:(1)相邻组的组限是间断的;(2)这两个组限在整数值上又必须衔接;(3)组限应使组中值为整数值,以便于运算;(4)计算时以组中值代表该组各变量值,2019/12/4,第三章社会统计资料的整理,22,(二)连续变量变量数列编制1.注意:只能编制组距式变量数列相邻两组的上限和下限共有一个组限(上限不包括在内原则),2019/12/4,第三章社会统计资料的整理,23,2.编制方法:(1)在全部数据中,找出最大值与最小值,计算出全距。全距:最大值-最小值(2)确定组数和组距:h=R/(1+3.322lgN),最佳决定还是依据常识和数列使用的目的而定。组距应不小于可以忽略的数值之差。一般地说,分成510个组,组距取整数比较合适。组数=全距/组距(3)确定各组组限;(4)汇总各组标志值出现的次数,绘制变量数列表,2019/12/4,第三章社会统计资料的整理,24,例60名男同学身高(以厘米计)的原始资料如下,请制作出频数分布表。,2019/12/4,第三章社会统计资料的整理,25,由低到高排成序列资料,2019/12/4,第三章社会统计资料的整理,26,2019/12/4,第三章社会统计资料的整理,27,3.开口组组中值计算:缺下限的组中值=上限-邻组组距/2缺上限的组中值=下限+邻组组距/2,2019/12/4,第三章社会统计资料的整理,28,2019/12/4,第三章社会统计资料的整理,29,4.异距分组异距分组主要在变量变动并不是均匀的、有急剧上升或突然下降之类情况发生时考虑。频数密度=频数/组距标准组距频数:(1)选定某一合适的组距为标准组距;(2)用标准组距除以各组组距,得到折合系数;(3)将各组的折合系数乘以各组的频数。,2019/12/4,第三章社会统计资料的整理,30,表315频数密度和标准组距频数计算表,2019/12/4,第三章社会统计资料的整理,31,(三)累计频数(F):向上累计以变量数列首组的频数为始点,逐个累计各组的频数,展示小于该组上限的频数和。向下累计以变量数列末组的频数为始点,逐个累计各组的频数,展示大于该组下限的频数和。,2019/12/4,第三章社会统计资料的整理,32,2019/12/4,第三章社会统计资料的整理,33,练习:3.1评价以下各统计表是否有误,为什么?表1某学校对最喜爱影片的调查表2某地民族构成,2019/12/4,第三章社会统计资料的整理,34,3.260名男同学身高(以厘米计)的原始资料如下,请制作出频数分布表和累计频数分布表。,2019/12/4,第三章社会统计资料的整理,35,选择题1、按某一标志分组的结果,表现出()。组内同质性和组间差异性组内差异性和组间差异性组内同质性和组间同质性组内差异性和组间同质性2、组距、组限和组中值之间的关系是()。组距=(上限下限)2组中值=(上限+下限)2组中值=(上限下限)2组限=组中值23、某连续变量数列,其末组为开口组,下限为500,又知其邻组组中值为480,则末组组中值为()。490500510520,2019/12/4,第三章社会统计资料的整理,36,4、统计分组的关键在于()。正确选择不同特征的品质标志和数量标志确定组距选择统计指标和统计指标体系选择分组标志和划分各组界限5、按连续变量分组,第一组4555,第二组5565,第三组6575,第四组75以上。则()。55在第一组65在第二组65在第三组75第三组6、某同学考试成绩为80分,应将其计入()。成绩为80分以下人数中成绩为7080分的人数中成绩为8090分的人数中根据具体情况来具体确定,2019/12/4,第三章社会统计资料的整理,37,直观但不及统计表精确一、定类、定序数据1.条形图(BarGraphs):以属于每一类型数据量的多少作为相应比例大小的矩形区域来表示。用长条的高度来表示资料类别的次数或百分数,宽度没有意义,一般画成等宽长条。2.圆形图(饼图)(CircleGraphs):以属于每一类型数据量的多少作为一个圆的相应比例部分来表示。图用于概括定性的或类型的数据(定类、定序)。,第四节统计图,2019/12/4,第三章社会统计资料的整理,38,2019/12/4,第三章社会统计资料的整理,39,2019/12/4,第三章社会统计资料的整理,40,练习:3.11.构做一个圆形图,表示中国消费者在2003年购货和服务时是如何支付款的:现金70%,信用卡和记帐卡9%,不清楚2%。3.12.用上题中的数据构做一个条形图。3.13以你的意见,圆形图或条形图哪一个能更好地表现所给的信息?请给出你的解释。,2019/12/4,第三章社会统计资料的整理,41,3.帕累托图(ParetoDiagram):一幅按最多数据量的类到最少数据量的类来排列的条形图,还包含一条显示累计百分数和这些条形的计数的线图。帕累托图在质量控制方面很流行。一张显示缺陷类型的帕累托图将显示出在缺陷率方面按影响次序有最大影响的那些类型。,2019/12/4,第三章社会统计资料的整理,42,2019/12/4,第三章社会统计资料的整理,43,3.14美国快照“怎样说我爱你”报告了某项关于表示感情最好的方法的调查结果。表感情最好的方法送礼物牵手拥抱/接吻微笑其他如此说的百分比10%10%51%20%9%画出一张图解上述信息的帕累托图。3.15装配线的最终检验的缺陷报告给出了一张帕雷托图。(1)在报告中总的缺陷数是多少?(2)验证表中擦伤缺陷列出的百分率30%。(3)管理部门已经给生产线提出要减少它们产品缺陷50%的目标。你主张他们在工作中哪两项缺陷应该予以特别的注意才能实现这个目标,请解释。,2019/12/4,第三章社会统计资料的整理,44,2019/12/4,第三章社会统计资料的整理,45,2019/12/4,第三章社会统计资料的整理,46,二、定距变量1.直方图(Histograms):由紧挨着的长条组成,但它与条形图不同,它的宽度是有意义的。一般说,直方图是以长条的面积来表示频次或频率,而条形的长度表示的是频次密度(单位组距所含有的频次)。直方图仅适用于定距变量。在等距分组时,用频次作为条形高度,图形的比例关系不受影响,但在非等距分组情况下,必须用频次密度作为高度。(前面异距分组时讲过),2019/12/4,第三章社会统计资料的整理,47,2019/12/4,第三章社会统计资料的整理,48,2019/12/4,第三章社会统计资料的整理,49,2.折线图(Polygon)用直线连接直方图中条形顶端的中点,就得到折线图。折线图可以使频数分布的趋势更加一目了然。当组距逐渐减小时,折线将逐步平滑为曲线。,2019/12/4,第三章社会统计资料的整理,50,当变量数列中的组数愈加增多,变量值也非常多时,折线图会逐步过渡到平滑曲线。频数分布曲线图实质上是对应于连续变量的频数分布的函数关系图。,三、曲线图,2019/12/4,第三章社会统计资料的整理,51,常见曲线图类型:1、钟形曲线:“中间大,两头小”对称分布:正态分布,非对称分布:偏态分布右偏、左偏以横轴为渐近线,与横轴所围的面积为1,代表变量X全部可能取值的概率婚龄、学生身高近似正态分布收入分配、资源配置偏态分布,2019/12/4,第三章社会统计资料的整理,52,2019/12/4,第三章社会统计资料的整理,53,2019/12/4,第三章社会统计资料的整理,54,2019/12/4,第三章社会统计资料的整
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年数据中心沉井施工劳务合同
- 2024年度演艺活动策划与执行合同
- 2024年新型能源工程设计技术服务合同
- DB4117T 207-2018 高蛋白夏大豆集成栽培技术规程
- DB4106T 50-2021 开办企业工作规程
- 2024年房屋损害赔付协议书
- 2024年家装清工承包合同样板
- 2024年挂靠车辆运营管理合同
- 信息必刷卷03-2023年高考地理考前信息必刷卷(全国乙卷)(原卷版)
- 2024年房产居间业务合作协议
- 第五节 错觉课件
- 2024-2030年陕西省煤炭行业市场发展分析及发展前景预测研究报告
- 【课件】Unit+3+SectionB+1a-2b+课件人教版英语七年级上册
- 国开2024年《中国法律史》平时作业1-3答案
- 呕吐(急性胃肠炎)诊疗指南(制订)编制说明排版
- 江堤道路工程施工方案#江苏
- (外研版)初中英语语法汇总[新版]
- 李燕璇植树问题卡通版5
- 有砟轨道铺设的施工讲解
- 烟草专卖食堂燃气泄露及火灾事故现场应急处置方案
- 国家电网公司十八项反措
评论
0/150
提交评论