版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
管理统计学学习目标了解统计数据的收集方法学会统计分组用Excel和SPSS作频数分布表和图形
统计数据的收集整理与显示2.1统计数据的收集统计是用来处理数据的数据由数字组成,但数据不是单纯的数字,是有内容的数字。数据不是单个的数字,是需要一定的量的统计数据要求:准确、及时完整间接来源研究者直接从公开出版物或通过网络渠道获取所需数据,如《中国统计年鉴》、《中国统计摘要》、《中国社会统计年鉴》直接来源研究者直接通过调查取得研究所需数据资料2.1统计数据的收集数据的来源2.1统计数据的收集常用的统计调查方式普查
抽样调查重点调查
典型调查简单随机抽样分层抽样等距样整群抽样普查普查是一种专门组织的一次性全面调查。是了解国情国力的重要方式。其具有能收集到其他调查方法所不能收集的更为详细的数据资料的优点,但缺点是普查工作量大,费用高,不适合经常进行。普查的组织形式有两种:(1)抽调配备较多的专门普查人员对调查单位直接进行登记。如人口普查。(2)利用调查单位的原始记录和核算资料颁发调查表,有调查单位填报,如物资库存普查。普查需要规定标准的时点:如第五次人口普查规定的标准时间为2010年11月1日零时为标准时间。统计报表统计报表是按照国家有关的规定,自上而下同一布置,自下而上逐级提供统计资料的调查组织方式。统计报表是我国特有的一种统计调查方式,是建立在各基层单位原始记录的基础上的一种统计调查方式,由于统计报表是逐级上报和汇总的,有利于各级部门了解本地区、本部门或本行的的社会和经济发展现状。抽样调查抽样调查是取得数据资料的最主要的一种方式,它是按照随机原则从总体中抽取部分单位组成样本,对样本指标进行测定,根据样本指标推断总体指标的一种非全面调查。抽样调查的具体组织形式抽样调查简单随机抽样分层抽样等距抽样整群抽样(1)简单随机抽样
只适用于总体单位数量有限的情况,否则编号工作繁重;对于复杂的总体,样本的代表性难以保证;不能利用总体的已知信息等每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式(2)分层抽样
先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本的方法分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性当总体是由差异明显的几部分组成时,往往选择分层抽样的方法例如,一个单位的职工有500人,其中不到35岁有125人,35岁至49岁的有280人,50岁以上的有95人.为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本,由于职工年龄与这项指标有关,决定采用分层抽样方法进行抽取.因为样本容量与总体的个数的比为1:5,所以在各年龄段抽取的个数依次为125/5,280/5,95/5,即25,56,19。(3)整群抽样将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式.优点是实施方便、节省经费;缺点是抽样误差往往大于简单随机抽样例如,调查中学生患近视眼的情况,抽某一个班做统计;进行产品检验;每隔8h抽1h生产的全部产品进行检验等(4)系统抽样首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种最主要的优势就是经济性。最大的缺陷在于总体单位的排列上。一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本先将总体从1~N相继编号,并计算抽样距离K=N/n。式中N为总体单位总数,n为样本容量。然后在1~K中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K……,直至抽够n个单位为止(5)多阶段抽样先从总体中抽取范围较大的单元,称为一级抽样单元,再从每个抽得的一级单元中抽取范围更小的二级单元,依此类推,最后抽取其中范围更小的单元作为调查单位重点调查重点调查是为了了解总体的基本情况,在总体中选择个别重点单位进行调查。重点单位的数目应较少,但其标志总量占全部单位标志总量的绝大比重的单位。重点调查有其自身的优势,即用很少的时间和精力就可得到对全局有举足轻重影响的那些重点单位的数据,从而了解中题的基本情况。但由于重点调查没有遵循随机原则,因而不能对总体指标做出推断典型调查典型调查是对总体单位有初步了解的基础上,有意识的选择部分有代表性的单位进行调查。代表性单位是指那些最充分、最集中地体现总体某些共性的单位。
典型调查有两种形式:(1)解剖麻雀式的典型调查:选择一个或几个典型单位,深入细致的了解情况,总结经验教训,研究新生事物,他侧重于对总体的定性认识。(2)划类选典式的典型调查:先对总体进行分组,然后在各组中有意识地选择一定数量的典型单位进行调查,并可粗略的估计总体指标。
数据资料的整理与显示是指将统计调查所得到的原始资料进行科学得分组和汇总,并用一定的方式将其显示出来,为统计分析推断提供系统化、条理化的说明总体数量特征的综合资料的过程。2.2统计整理1、统计分组的概念和作用
概念统计分组具有两方面的含义:对总体而言是分,即将总体区分为若干个性质不同的部分;对个体而言是合,即将具有某些共性的个体和为一组。作用(1)区分社会经济现象的类型。(2)反映和研究总体的内部构成。(3)分析研究现象之间的依存关系。2.2统计整理2、统计分组的原则与类型
类型(1)按品质标志分组时,组数和组限一般由品质标志的标志表现来决定,有多少个标志表现就可划分为多少个组,如人口按性别分组只能分为男性和女性两组(表2-1);
按性别分人数比重%男性2357.5女性1742.5合计40100表2-1原则——“不重不漏”
(1)完备性。即每一个个体必须有组可归;(2)互斥性。即每一个个体只能属于其中的一组。2.2统计整理2、统计分组的原则与类型
按数量标志分组时,统计分组可分为单项式分组分组方法等距分组异距分组单变量值分组组距分组单项式分组按年龄分学生数比重5201332.5216152225表2-2单项式分组2.2统计整理单项式分组是指每个组的组别或者组的名称只用一个变量值表示的分组方式,即每遇到一个不同的变量值要单独列一组,有多少个不同的变量值就有多少个组。组距式分组组距式分组是指每个组用表示一定变动范围的两个变量值表示,即将数量标志的取值范围划分成若干个区间,在同一区间内取值的个体为一组,划分了多少个区间就分成了多少组。组距式分组(表2-2)按性别分人数(人)比重(%)男性2357.5女性1742.5合计40100按性别分按职称分男性女性合计教授副教授讲师助教合计简单分组表2-4复合分组表2-52.2统计整理1、统计调查2、数据整理3、次数分布4、数据显示
第二章统计数据的收集整理与显示概念、类型分布数列的编制组中值的计算概念
把总体中的各个组与其对应的个体数目一一对应排列,形成反映全部数据按其分组标志在各组内的分布状况的数列称为频数分布或次数分布数列,简称分布数列。分布在各组内的数据个数称为频数或次数,各组次数之和称为总次数,各组次总次数的比值称为频率或比重。次数分布数列有两个构成要数:(1)组别,即各组的名称。(2)各组的次数或频率。
2.3
次数分布1、次数分布的概念和类型
第三步:组限的确定和组中值的计算。(1)第一组的下限应不高于最小的变量值,最后一组的上限应不低于最大的变量值。(2)若分组变量为连续性变量,相邻两个组的组限应采用重叠的变量值,遵循“上限不在内原则”。(3)若分组变量为离散型变量,相邻两组的组限可以重合也可以不重合,若重合仍然采用“上限不在内”的原则进行归类整理。2.3次数分布组中值是每组上限与下限的中点数值,反映各组数据的一般水平。组中值作为一组变量值一般水平的代表值,有一个必要的假定条件,即各组数据在本组内呈均匀分布或对称分布。
注意:开口组组中值的计算,假定开口组组中值与邻组组距相等
第四步:各组次数或频率的计算。累计频数有向上累计和向下累计累计两种。2.3次数分布例2.1:某地区所属的40个工业企业产品销售收入数据(万元)如下:试根据次数据编制组距式分布数列。(4)计算汇总各组的企业数,并将其与各组组别一一对应排列,形成分布数列如表2.8所示要点回顾:连续型变量相邻两组的组限必须重合,重合后遵循上限不在内原则,离散型变量可重可不重,组距与组数的乘积必须大于等于全距组中值的计算时,要注意开口组组中值的计算,开口组组距假定与邻组组距相等,但不能超过变量本身的取值范围。1、统计调查2、数据整理3、次数分布4、数据显示
第二章统计数据的收集整理与显示统计图统计表1、应用软件制作图表2、准确读取统计图所包含的信息3、了解统计图表的应用场合2.4数据显示未经整理的原始数据较为零乱,有几种常用方法对数据进行加工整理,以便从数据中提取信息。这些方法包括:1、为数据制一个表。2、为数据作一张图3、从数据计算一些东西统计表是用于显示统计数据的表格。把杂乱的数据有条理地组织在一张简明的表格内,使数据变得一目了然,清晰易懂。统计图用来显示分布数列,会更形象、直观的表示出数量变化的特征和规律。常用的统计图有直方图、折线图、曲线图、茎叶图、圆形图、环形图等。统计表的构成
表2-91995、2005年农村居民家庭人均生活消费支出项目19952005食品768.191162.2衣着89.79148.6
家庭设备用品及服务68.48111.4医疗保健42.48168.1交通通讯33.76245娱乐教育文化102.39295.5居住182.21370.2杂项商品及服务23.0654.5合计1310.362555.4资料来源:《中国统计年鉴》,中国统计出版社,1996年、2006年表头数字资料表末附注行标题列标题2.4数据显示统计表统计表统计表的设计(1)合理安排统计表的结构;(2)统计表的各种标题要力求简单明了;(3)统计表的左右两端不封口;(4)统计表的栏数较多时,需要编号以表明栏与栏之间的关系。2.4数据显示统计图直方图直方图是用矩形的宽度和高度来表示频数分布的图形。在直方图中,横轴表示数据分组,纵轴表示频数或频率,或者表示次数密度或频率密度。统计图折线图折线图是在直方图的基础上,把直方图顶部中点(即各组组中值与各组频数构成的坐标点)连接起来,然后各向前向后延长半个组距与横轴相交。折线图也可以用于表示累积频数分布,称为累积频数分布折线图。2.4数据显示累计曲线图根据累计频数或累计频率分布数列,可以绘制累计分布图。它以分组变量为横轴,以累计频数或累计频率为纵轴,以各组的上限(下限)与累计频数或累计频率为坐标点,平滑连接各点即成向上(向下)累计曲线。根据上表绘制向上、向下累计曲线图,见图2所示。在向上累计曲线中,一条很有名的曲线是用以反映居民收入分配平等程度的洛伦茨曲线。将一定区域的人口按照收入水平(财富水平)由小到大排序,并等分为5等份(或10等份),依次计算累计人口比重和累计收入(财富)比重,以累计人口比重与累计收入(财富)比重为坐标点即可绘制居民收入分配向上累计曲线,如图2-13所示。根据洛伦茨曲线,可以进一步计算基尼系数。统计图曲线图曲线图的种类很多,常见的有钟型分布(包括正态分布、偏态分布)、J型分布、U型分布等。2.4数据显示统计图茎叶图茎叶图由茎和叶两部分组成,其图形是数字组成的。一般高位数字作为茎,低位数字作为叶。茎叶图既能给出数据的分布状况,又能给出每一个原始数值。
茎叶
8789257100334557881102345567789912034567913567814262.4数据显示例一网站某商品55天的销售数量如下(单位:个),试编制茎叶图。11712212412913910711713012212510813112511712213312612214010815011812312613313412712311814111211213412712311911312012
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年新能源高压清洗车项目规划申请报告模范
- 2025年太阳能电池背膜项目申请报告模范
- 2024-2025学年梧州市蝶山区数学三年级第一学期期末学业水平测试试题含解析
- 2024-2025学年渭南市潼关县数学三上期末调研试题含解析
- 庆祝2021年教师节活动总结5篇
- 2025年商旅服务项目规划申请报告
- 教师课题申请书怎么写7篇
- 中学教师2022年度考核个人总结(7篇)
- 2025年淡水养殖产品种苗项目立项申请报告模范
- 2025年教育云项目申请报告模范
- 江西省赣州市2023-2024学年高一上学期期末考试化学试题 附答案
- 贵州省铜仁市2023-2024学年高二上学期期末质量监测试题 地理 含答案
- 人教版(2024新版)七年级上册数学全册重点知识点讲义
- 2022-2023学年北京市海淀区七年级上学期期末语文试卷(含答案解析)
- 化疗药物外渗预防及处理-中华护理学会团体标准课件
- 计算机专业大学生职业生涯发展展示
- 电气设备运行与维护ppt课件(完整版)
- 甲醇工艺流程图
- 片石挡土墙砌筑施工方案及工艺方法
- 分析刑法中认识因素和意志因素的关系
- 人体穴位作用图解
评论
0/150
提交评论