第四章统计学_第1页
第四章统计学_第2页
第四章统计学_第3页
第四章统计学_第4页
第四章统计学_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章第一节 统计整理、 统计整理的意义统计整理是根据统计研究任务的要求, 对调查所搜查的原始资料进行分组、汇总,使其条理化、系统化的工作过程。统计整理实现了从个别单位的标志值向说明总体数量特征的指标值过渡, 是人们对社会经济现象从感性认识上升到理性认 识的过渡阶段,为统计分析提供基础。、 统计整理的步骤a、设计和编制统计资料整理方案b、对原始资料进行审核c、对原始资料进行统计分组和统计汇总d、编制统计表或绘制统计图第二节统计分组、统计分组的概念统计分组是根据所研究事物的特点和统计研究的目的,按照某一标志将统计总体划分为若干个组成的一种统计方法。二、统计分组的作用a、揭露社会经济现象的类型,反

2、映各类型的特点b、反应现象总体的内部结构c分析现象之间的互相依存关系类型1999200020012002农业14106.213873.614462.814931.5林业886.3936.5938.81033.5牧业6997.67393.17963.18454.6渔业2539.02712.62815.02971.1合计24519.124915.826179.627390.8表:(一)类型分析19992002年我国农林牧渔业总产值单位:亿元年份19961997199819992000第一产业20.419.118.617.615.9第二产业49.550.049.349.450.9第三产业30.130

3、.932.133.033.2合计100.0100.0100.0100.0100.0(二)结构分组九五”期间我国国内生产总值构成 (%)(三)分析分组某乡某种农作物的耕作深度与收获率的关系耕作深度分组(cm)地块数平均收获率1012740012141046014161654015181262018205680三、统计分组的方法a正确选择分组标志1、根据统计研究的目的选择分组标志 2、选择最能反映事物本质特征的标志进行分组 3、选择分组标志时,要考虑到现象发展的历史条件和经济条件b按品质标志或按数量标志分组1、按品质标志分组 2、按数量标志分组c简单分组和复杂分组1、简单分组。简单分组是指对所研究

4、的总体按一个标志进行分组。2、复合分组。复合分组是指对研究的总体按两个或两个以上的标志进行的多层次分组。分组再分组按家庭月收入分组(元)户数(户)家庭拥有电视机的台数(台)1000以下50020010002000400100200030003002903000400045504000以上510按家庭月收入分组(兀)户数(户)1000以下50010003000600300040007454000以上5四、统计分组的几个基本概念a组数:是指将全体变量值分成多少组 b、单项分组与组距分组1、单项分组:在按数量标志分组时,将每一个变量值作为一组2、组距分组:将所有的变量值依次划分为几个区间,个区间内的

5、所有变量值归为一组,这样的分组成为组距分组。c组距:指分组条件下每组变量值的变化范围,即每组变区间的距离。d、等距分组与不等距分组1、等距分组,指各组组距相等,凡是在变量变动比较均匀的条件下, 可以采用等距分组。 列如: 身高, 体重, 零件尺寸的误差分组等。2、不等距分组,指各组组距不相等的分组。当变量值变动很不均匀时,常采用不等距分组。不等距分组中, 多数情况是根据事物性质变化的数量界限来确定组 距。如对少年儿童年龄的分组,必须注意到不同年龄 生理变化的特定。e组限:组限是指各组变量值变动的两端界限,是每组的起点和组点、每组的起点成为下限,每组的终点成为 上限。凡遇到某总值单位的变量值刚好

6、等于相邻两 组上下限时, 一般把比值归并到作为下限的那一组, 这成为“上限不在内”的原则。f、开口式分组与闭口式分组1、开口式分组:在组距式分组中,凡具有“以上”开口组)或“以下” (下开口组)的分组。2、闭口式分组:没有“以上”和“以下”的分组。g、组中值:指各组上限和下限的中点数值。其计算公式为:组中值 =(上限 +下限) /2开口组的组中值计算公式如下:1、开口组组中值 =上限-相邻组组距的一半2、上开口组组中值 =下限+相邻组组距的一半五、注意1、对于连续变量分组,相邻组的上限与下限必须重叠对于正指标,采用“上限不在内”原则(一般)对于逆指标,采用“下限不在内”原则2、对于离散变量分组

7、,相邻组的上限和下限必须间隔。第三节 次数分布一、次数分布的概念次数分布是指将总体中的所有单位按某个标志分组后,所形成的总体数在各组之间的分布。分布在各组的总体单位数叫做次数或频数。分类:a根据分组标志特征不同,次数分布数列可以分为品质分布数列和变量分布数列。b、按品质标志分组形成的次数分布数列叫品质分布数列,简称品质数列。C、按数量标志分组形成的次数分布数列叫变量分布数列,简称变量数列。、变量数列的种类a、单项变量数列单项数列是按数量标志分组后,用一个变量值代表一个 组形成的数列。b、组距变量数列组距变量数列是按照数量标志分组后,用变量值变动的一定范围(即组距)代表一个组所形成的数列。三、变

8、量数列的编制a将原始资料按数值大小依次排列b确定组数(k)和组距(i)k=1+3.322logni=R/k上述公式成为斯德吉斯组数公式。公式中, n 为数据个数,R 为全距。定组距和组数应考虑下列原则:1、要尽可能反映出总体单位的分布情况及总体单位的集中趋势2、要尽可能区分出组与组性质上的差异 c确定组限和组限的表示方法1 、最小组的下限要略低于最小变量值, 最大组的上限要略高于最大变量值。2、组限的确定应当有利于表现总体单位分布的规律性3、对于等距数列,如果组距是5,10,,100,,贝y每组的下限最好是它们的倍数。四、次数分布的表示方法a、表示法即用统计表来表示次数分布b图示法即用统计图来表示次数分布直方图 折线图 曲线图曲线图是组数趋向于无限多是折线图的极限描绘, 是一种理论实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论