版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章统计整理统计学第3章统计整理共53页,您现在浏览的是第1页!
教学目的
通过本章的学习,要求掌握各种不同类型资料的整理方法、整理原则、以及一些相关的概念,并能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。第三章统计整理统计学第3章统计整理共53页,您现在浏览的是第2页!第三章统计整理在学习过程中主要解决以下几个问题统计整理的意义和方法统计分组的含义和种类统计分组的方法统计分布和分配数列的编制统计表的结构和种类统计学第3章统计整理共53页,您现在浏览的是第3页!第三章统计整理统计调查搜集上来的资料,不论是哪一种类型的资料都必须经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方法也不同。统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程。一、统计整理的意义和方法第一节统计分组统计学第3章统计整理共53页,您现在浏览的是第4页!按成绩等级分组人数(人)各组人数占总人数比重(%)不及格及格中良优461215310.015.030.037.57.5合计40100.0第三章统计整理统计学第3章统计整理共53页,您现在浏览的是第5页!第三章统计整理统计整理的方法:分组、汇总、编表销售额(万元)企业数(个)0—5050—100100—150150—200250—3001225302310合计100统计学第3章统计整理共53页,您现在浏览的是第6页!2.作用主要有三个方面:
划分现象的类型揭示现象内部结构分析现象间依存关系统计学第3章统计整理共53页,您现在浏览的是第7页!说明社会经济现象的内部结构。⑵结构分组例年份19961997199819992000产业20.419.118.617.615.9第二产业49.550.049.349.450.9第三产业30.130.932.133.033.2合计100.0100.0100.0100.0100.0“九五”期间我国国内生产总值构成(%)统计学第3章统计整理共53页,您现在浏览的是第8页!二选择分组标志的原则根据研究问题的目的来选择要选择最能反映被研究现象本质特征的标志要结合现象所处的具体历史条件或经济条件来选择
选择什么样的分组标志,就会形成什么样的分组结果,因此,分组标志的选择是统计分组的关键。统计学第3章统计整理共53页,您现在浏览的是第9页!第三章统计整理变量分组方法以一个变量值代表一组。如:人口按年龄分组1岁一组,学生按报考科目分组等。这种分组适用于离散性变量,且变量值的个数较少的情况。
以变量值变动的一个区间作为一组,区间的距离称为组距。适用于连续型变量和离散型变量的变量值较多的情况。按品质标志对资料进行分组。这种分组有些比较简单,有些非常复杂,复杂的品质分组称为分类。如:人口按性别分组、按职业分组、企业按经济类型分组、等。单项式分组组距式分组三、统计分组方法品质标志分组统计学第3章统计整理共53页,您现在浏览的是第10页!第三章统计整理等距分组各组组距均相等。如:10—2020—3030—40以上各组组距均为10。这种分组适用于均匀分布的总体。不等距分组各组组距不一定相等。如:10—2020—5050—6060—70以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。统计学第3章统计整理共53页,您现在浏览的是第11页!第三章统计整理组中值每组上限与下限之间的中点数值,是各组的假定平均数。组中值=(上限值+下限值)÷2开口组组中值的计算:缺下限:组中值=本组上限—相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2产值(万元)50以下50—6060—7070以上组组中值:50-(10÷2)=45最后一组组中值:70+(10÷2)=75例统计学第3章统计整理共53页,您现在浏览的是第12页!例月工资分组(元)工人数(人)占总数比重(%)1000以下21039.61000-150018735.31500以上13325.1合计530100.0
组别(变量)次数(频数)频率(比率)频率:各组的频率大于0,各组的频率总和等于1或100%。统计学第3章统计整理共53页,您现在浏览的是第13页!二、分配数列的编制1、品质分配数列的编制:只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:第三章统计整理经济类型企业数比重(%)国有企业股份制企业合资企业独资企业1008050204032208合计250100统计学第3章统计整理共53页,您现在浏览的是第14页!第三章统计整理第四步:确定组限。
注意
组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。第五步:汇总出各组的单位数,计算频率,并编制统计表。统计学第3章统计整理共53页,您现在浏览的是第15页!例已知组距为5,组数为7,最大值39,最小值5,怎样分组?(c)(a)(b)(c)1-53-84-95-108-139-1410-1513-1814-1915-2018-2319-2420-2523-2824-2925-3028-3329-3430-3533-3834-39较合适是?(d)10以下10-1515-2020-2525-3030-3535以上统计学第3章统计整理共53页,您现在浏览的是第16页!三次数分布的特征1.次数分布的表示方法
⑴表示法——即用统计表来表示次数分布。例考分次数以下累计次数
(上限)以上累计次数
(下限)人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)50-6025.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090-100820.040100.0820.0合计40100.0----某班统计学考试成绩次数分配统计学第3章统计整理共53页,您现在浏览的是第17页!直方图(或次数分配曲线图)仍以上例考试成绩数据,画成如下直方图:405060708090100110统计学第3章统计整理共53页,您现在浏览的是第18页!直方图例10152025303540455055统计学第3章统计整理共53页,您现在浏览的是第19页!折线图还可用来表示累计次数分布(仍以上例数据):曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。向下累计向上累计统计学第3章统计整理共53页,您现在浏览的是第20页!还有其他形态J型分配曲线U型分配曲线统计学第3章统计整理共53页,您现在浏览的是第21页!第三章统计整理洛伦茨分布:专门用以检定社会收入分配的平等程度。统计学第3章统计整理共53页,您现在浏览的是第22页!例分组总产值(万元)职工人数(人)劳动生产率(元/人)P123大型中型小型合计2003年某月某公司各企业劳动生产率统计表
单位____横行标题主词宾词总标题纵栏标题数据资料(指标数值)统计学第3章统计整理共53页,您现在浏览的是第23页!三统计表的分类简单表总体未分组分组表总体按一个标志进行分组复合表总体按二个或二个以上标志进行复合分组例例例统计学第3章统计整理共53页,您现在浏览的是第24页!例统计学第3章统计整理共53页,您现在浏览的是第25页!宾词指标的分组配置平行配置层叠配置统计学第3章统计整理共53页,您现在浏览的是第26页!第三章统计整理一、判断对错1、对统计资料进行分组的目的就是为了区分各组单位之间质的不同。()×2、组中值是根据各组上限和下限计算的平均值,所以它代表了各组的平均分配次数。()×3、分配数列的实质是把总体单位总量按照总体所分的组进行分配。()√4、某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。()×5、对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。()√6、任何一个分布都必须满足:各组的频率大于0,各组的频数总和等于1或100%()×7、统计分组后掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。()√统计学第3章统计整理共53页,您现在浏览的是第27页!第三章统计整理三、多项选择题部分BCDE2、在次数分配数列中()A、总次数一定,频数和频率成反比B、各组的频数之和等于100C、各组频率大于零,频率之和等于1D、频率越小,则组的标志值所起的作用越小E、频率表明各组标志值对总体的相对作用程度CDE1、下列数列属于()按生产计划完成程度分组(%)企业数80─901590─10030100─1105合计50
A、品质分配数列B、变量分配数列C、组距式变量分配数列D、等距变量分配数列E、次数分配数列统计学第3章统计整理共53页,您现在浏览的是第28页!
例:
根据某班40名学生统计学考试成绩分析该班学生考试情况。57894984868775737268758297816781547987957671609065767270868589896457838178877261第三章统计整理统计学第3章统计整理共53页,您现在浏览的是第29页!第三章统计整理
再如:通过调查取得100个商业企业某月销售额资料:(单位:万元)20,60,45,90,105,56,250,89,130,30,98,…300。将这些数据资料按“销售额”的多少进行整理,得到下列整理结果:统计学第3章统计整理共53页,您现在浏览的是第30页!第三章统计整理统计分组:根据研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个部分。统计分组应达到的要求同一组内的单位性质相同,不同组所包括的单位性质相异。工业企业按经济类型分组,可分为以下几组:经济类型企业数(个)国有企业1000合资企业200合作经营企业300股份制企业500
工业企业按职工人数分组,可分为以下几组:职工人数企业数(个)500人以下50500—10002001000—1500100
工业企业按地区分组,可分为以下几组:地区企业数(个)北京市10000天津市8000上海市11000
二、统计分组的概念和作用例统计学第3章统计整理共53页,您现在浏览的是第31页!揭露社会经济现象的类型,反映各类型的特点。
⑴类型分组类型1999年2000年2001年2002年农业14106.213873.614462.814931.5林业886.3936.5938.81033.5牧业6997.67393.17963.18454.6渔业2539.02712.62815.02971.1合计24519.124915.826179.627390.8例单位:亿元统计学第3章统计整理共53页,您现在浏览的是第32页!研究经济现象之间的依存关系。⑶分析分组例耕作深度分组(cm)地块数平均收获率(斤/亩)10-12740012-141046014-161654016-1818-20125620680某乡某种农作物的耕作深度与收获率的关系统计学第3章统计整理共53页,您现在浏览的是第33页!统计分组的种类
按研究任务和作用不同
按分组标志的多少不同
按分组标志的性质不同类型分组结构分组分析分组简单分组复合分组品质分组变量分组第三章统计整理统计学第3章统计整理共53页,您现在浏览的是第34页!第三章统计整理在进行组距分组时,会涉及到一些问题,包括:等距分组和不等距分组、组限、组中值。统计学第3章统计整理共53页,您现在浏览的是第35页!组限组限就是每一组两端的数值。10—2020—3030—40下限上限确定组限的方法有两种:间断式组限和重叠式组限。职工人数(人)99以下100—199200—299300—399固定资产额(万元)50—6060—7070—8080—90间断式组限适用于离散变量重叠式组限适用于连续变量第三章统计整理统计学第3章统计整理共53页,您现在浏览的是第36页!第二节分配数列一、分配数列的概念和种类统计总体按照某一标志分组以后,用以反映总体各单位分配情况的统计数列,称分配数列,又可称次数分配,或次数分布。它由两部分组成:总体所分的各个组和各组所拥有的单位数(次数或频数)。
1.概念统计学第3章统计整理共53页,您现在浏览的是第37页!2.种类品质分配数列变量分配数列单项变量数列组距变量数列等距数列不等距数列以分组标志特征不同分为:(这种数列一般比较稳定,只要分组标准定的比较恰当,通常能准确地反映总体的分布特征。)统计学第3章统计整理共53页,您现在浏览的是第38页!第三章统计整理2、变量分配数列的编制:其基本步骤为:步:将原始资料按数值大小依次排列,计算全距。第二步:确定变量的类型和分组方法(单项式分组或组距分组)。第三步:确定组数和组距。当组数确定后,组距可计算得到:组距=全距÷组数全距=最大变量值-最小变量值统计学第3章统计整理共53页,您现在浏览的是第39页!间断式确定组限:汇总各组单位数时,按照“上下限均包括在本组内”的原则汇总。职工人数(人)499以下500—599600—699700—799重叠式确定组限:汇总各组单位数时,按照“上组限不在内”的原则汇总。产值(万元)50—6060—7070—8080—90单位数(个)单位数(个)因为有了“上组限不在内”的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。第三章统计整理统计学第3章统计整理共53页,您现在浏览的是第40页!序计划完成工人数比重向上累计向下累计号程度(%)(人)(%)人数比重人数比重160—7021.0270—8052.5380—90147.0490—1003115.55100—1106532.56110—1205226.07120—1302311.58130—14084.0合计2001003、累计频数或频率分配数列的编制方法通过累计频数分配数列可以反映累计到某一组出现的总次数或总频率。想一想:第四组的累计结果说明什么问题?第三章统计整理2721521171691922001.03.510.526.058.584.596.0100831831481791931982004.015.541.574.089.596.599.0100统计学第3章统计整理共53页,您现在浏览的是第41页!⑵图示法即用统计图来表示次数分布直方图折线图曲线图统计学第3章统计整理共53页,您现在浏览的是第42页!若组距不等的话,用标准组距人数,然后据此画直方图:按工人年龄分组(岁)组距人数(人)标准组距人数(人)频数密度=频数/组距15-20517173.420-25528285.625-30540408.030-35570701456.545-50510102.0合计-230--统计学第3章统计整理共53页,您现在浏览的是第43页!折线图在直方图的基础上连接各条形顶边的中点成折线图。如下图红笔围成的,即为次数分配曲线图:405060708090100110统计学第3章统计整理共53页,您现在浏览的是第44页!2.次数分布的主要类型一般次数分布呈正态分布曲线,或称正态曲线,但也有偏态分布曲线,或称偏态曲线对称型右偏型(上偏型)左偏型(下偏型)
非对称型YYX统计学第3章统计整理共53页,您现在浏览的是第45页!双峰曲线统计学第3章统计整理共53页,您现在浏览的是第46页!第三节统计表一统计表的结构和内容从形式上看:统计表由总标题、横行标题、纵栏标题、指标数值构成。从内容上看:统计表由主
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版木材行业风险管理咨询与解决方案合同4篇
- 2025年金融策略投资顾问合同协议3篇
- 2025年高端会议策划与销售服务合同模板
- 2025年度某局数字化转型劳务分包结算规范合同2篇
- 2025版办公楼小型装饰装修工程施工合同示范6篇
- 2025版建筑工地挖掘机驾驶员劳动合同标准范本3篇
- 《全球化与两岸关系》课件
- 可燃冰资源地质评价方法与实践考核试卷
- 2025版学校食堂蔬菜采购及食品安全追溯服务合同3篇
- 2025年度美术品艺术品投资顾问合同范本4篇
- 山东省桓台第一中学2024-2025学年高一上学期期中考试物理试卷(拓展部)(无答案)
- 中华人民共和国保守国家秘密法实施条例培训课件
- 管道坡口技术培训
- 2024年全国统一高考英语试卷(新课标Ⅰ卷)含答案
- 2024年认证行业法律法规及认证基础知识 CCAA年度确认 试题与答案
- 皮肤储存新技术及临床应用
- 外研版七年级英语上册《阅读理解》专项练习题(含答案)
- 2024年辽宁石化职业技术学院单招职业适应性测试题库必考题
- 上海市复旦大学附中2024届高考冲刺模拟数学试题含解析
- 幼儿园公开课:大班健康《国王生病了》课件
- 小学六年级说明文阅读题与答案大全
评论
0/150
提交评论