




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学的研究对象是客观现象总体数量的数量特征和数量关系,具有数量性、总体性和单位的变异性三个主要特点。统计研究的方法:大量观察法、统计分组法、综合指标法、统计模型法、归纳推断法等方法。统计总体:组成统计活动研究对象的所有事物的全体集合,简称总体(或母体);总体单位:总体中的各个个体事物,简称单位(或个体);样本:从总体中抽取的一部分元素(单位)的集合,也称抽样总体,或者子样;第一章要点回顾标志:总体各单位具有的属性或者特征;是用来说明总体单位特征的名称。不变标志&可变标志品质标志&数量标志;品质标志与标志值的区别统计指标(指标):说明总体的综合数量特征的概念和数值。数量指标:说明总体规模和水平的指标,又称总量指标质量指标:反映相对关系和工作质量的指标,包括相对指标和平均指标指标与标志的关系与区别数据(统计指标)的四种计量尺度:定类尺度、定序尺度、定距尺度、定比尺度;国内生产总值(GDP):一国(或地区)的常驻单位在一定时期内所生产和提供的最终产品和服务的价值和,是各部门的增加值之和。第一章要点回顾统计研究的过程收集数据(取得数据)整理数据(处理数据)解释数据(结果说明)分析数据(研究数据)实际问题统计设计例:商院学子摘获“挑战杯”全国一等奖作品《标会:标出什么?会了谁?向何方?——基于浙江温台地区165个标会1464个参会人员的分析》摘得全国一等奖。要参加“桃战杯”比赛,形成一个有价值的学术科技作品,最关键的第一步是必须要有一个好的选题。这个课题选取的是当今时事热点——民间金融中的标会问题。例:商院学子摘获“挑战杯”全国一等奖“我们的项目课题是从调查研究中挖掘出来的!”在标会活动频繁的浙江温岭、椒江、路桥、临海、玉环、苍南和乐清等地展开调研,共发放1800份问卷,回收1635份问卷,涉及165个标会、4264个涉会人次,累计18.37亿标会金额。调查方式:走访、问卷、现场采访、人员介绍、个别交谈、亲临实践、会议、图片、照片、统计报表、影视资料、集体组织。本报告研究的内容较敏感,在调查过程中,由于涉及标会运作中的核心内容,实践小组受到当地标会保护势力的威胁,几度要求收缴所有调研资料,但我们依靠勇敢和智慧将大量的调查结果保留了下来,即本文所用到的珍贵数据及图片材料。数据整理分析……(统计分组、统计表、统计图)统计研究的过程收集数据(取得数据)整理数据(处理数据)解释数据(结果说明)分析数据(研究数据)实际问题统计设计第二章
数据的搜集与整理统计学主要内容教材内容:2.1.统计数据的搜集2.2.数据整理2.3.变量数列补充内容:统计数据的图示学习目标重点:统计调查的种类和形式统计分组的种类、方法、原则频数分布数列及累计分布数列的特点与编制2.1统计数据的搜集一、统计数据搜集概述二、统计调查体系三、统计调查的各种形式四、统计调查的方案设计五、调查误差六、二手统计资料的主要来源2.1统计数据的搜集一、统计调查的方案设计(四)二、统计数据搜集概述(一)三、统计调查的各种形式四、统计调查体系(二)五、调查误差六、二手统计资料的主要来源一、统计调查方案设计——工作方案、调查基础(P46-48)1、确定调查目的(为什么调查),总体:根本性问题;确定研究的现象;如“浙江温台地区民间标会”2、确定调查对象和调查单位(向谁调查),即确定调查形式;调查对象即调查总体;调查单位即要调查的总体单位,标志的承担者;(区别)报告(填报)单位:向上报告提供资料的单位3、确定调查项目(调查什么):根据目的确定标志;调查项目:调查中所要登记的调查单位的特征;一系列品质标志和数量标志第一节统计数据的搜集一、统计调查方案设计——工作方案、调查基础4、选择调查方法调查表格:调查项目按一定顺序排列在一定表格上一览表:许多调查单位填写在同一表格上,项目较少单一表:每个单位单独填写一张表格,可容纳较多项目调查问卷:书面文字、表格。问题等形式了解被调查者的意见;主题明确、形式简明、文字通俗、容易理解、便于回答…5、确定调查时间和调查期限:调查时间(客观时间):调查资料所属的时点或时期;调查期限:调查工作进行的起讫时间。6、制定调查的组织实施计划:确定机构、组织培训人员、经费来源与开支、资料报送方法和公布时间……第一节统计数据的搜集第一节统计数据的搜集二、统计数据搜集概述:(P38-40)两种方式:统计调查:直接向调查对象搜集反映调查单位的统计资料(原始资料);概念:根据统计的目的和任务,运用科学的调查方法,有计划、有组织地向客观实际搜集和登记统计数据的过程。(统计的基础)次级资料的搜集:根据研究目的,搜集已经加工、整理过的、说明总体现象的资料(次级资料)。第一节统计数据的搜集二、统计数据搜集概述:七种调查方法:直接观测法:调查人员到现场观察,农产量抽样调查;报告法(通讯法):被调查者填写表格,统计报表;采访法:被调查者答复(口头询问、自填),;登记法:当事人到机构登记,出生、死亡、流动人口登记;电话访问法:电话询问、交谈,电脑辅助电话访谈(CATI);网络调查法:传统调查+网络技术;试验设计法:控制的条件下测试新产品、新工艺或新方法使用效果。第一节统计数据的搜集二、统计数据搜集概述:统计调查的分类:按调查对象包括的范围不同:全面调查:对调查对象的全部个体一一调查登记,如普查。非全面调查:对调查对象的部分个体调查登记,如抽样调查、重点调查、典型调查等。按照调查登记的时间是否连续:经常性调查/连续性调查:连续不断地调查登记,适用于时期现象的调查。一次性调查/间断性调查:间隔一段时间,不连续地调查,(并非调查一次之后再不调查)。适用于时点现象的调查。第一节统计数据的搜集三、统计调查的各种形式:(P41-46)统计调查的形式:指统计调查的组织形式,即组织统计调查,搜集信息资料的方式。普查、统计报表制度、抽样调查、重点调查和典型调查。核心在于如何选取调查对象。统计调查方法:获取数据的方法。直接观测法、报告法(通讯法)、采访法、登记法、电话访问法、网络调查法、试验设计法。核心在于如何获取数据。第一节统计数据的搜集三、统计调查的各种形式:1、普查:普查是专门组织的一种全面调查,主要用以搜集某些不能或不宜用报表搜集的统计资料。对国情国力的调查一般用普查,如人口、工业和农业普查。普查的特点:全面调查;非经常性调查。我国的普查制度:每逢末尾数字为“0”的年份进行人口普查;
“1”或“6”的年份基本统计单位普查;“逢3、逢8的年份经济普查;“5”的年份工业普查;“7”的年份进行农业普查。三、统计调查的各种形式:1、普查:组织普查必须遵循三项原则:必须统一规定调查资料所属的标准时点,避免重复和遗漏,保证资料的准确性。(第六次人口普查2010年11月1日零时)在普查范围内各调查单位或调查点尽可能同时进行,并尽可能在最短时限内完成,以便在方法上、步调上一致。(调查时限:数据搜集和报送的时间)调查项目一经确定,不能随意改变或增减,以免影响汇总总和,降低资料质量。普查的组织形式:专门组织普查机构并配普查人员直接登记(人口普查);利用原始资料由调查单位自填表格(物资库存普查)第一节统计数据的搜集三、统计调查的各种形式:2、统计报表制度:统计报表是依照国家有关法规(《中华人民共和国统计法》),自上而下的统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计数据的一种调查方式。是搜集国民经济和社会发展状况统计数据的主要方式。
主要特点:资料来源建立在基层单位的各种原始记录的基础上,基层单位可利用其资料;逐级上报和汇总,各级领导能了解其辖区的情况属于经常性调查,项目相对稳定,利于积累资料,动态对比。第一节统计数据的搜集三、统计调查的各种形式:2、统计报表制度:主要种类:(1)范围:全面统计报表和非全面统计报表。(2)时间:定期报表(进度报表[日报、旬报]、月报、季报、半年报)和年报(总结性报表)。(3)单位:基层报表和综合报表(逐级汇总而来)。(4)方式:电讯报表(电报、电话、电视、传真、网络等方式)和邮寄(书面)报表。(5)管理系统:国家统计报表(国民经济基本统计报表)、业务部门统计报表和地方统计报表。第一节统计数据的搜集三、统计调查的各种形式:3、抽样调查:(随机)抽样调查:是一种专门组织的非全面调查,它是按照随机原则在全部调查单位中抽取一部分单位组成样本进行调查,以样本数据推断总体数量特征的一种调查方法。是相对最科学、应用最广的调查方式。三个基本特征:按照随机的原则抽取单位,排除个人主观意图的影响;对一部分单位(样本)做深入细致的调查研究,取得数据,并据此从数量上推断总体。抽样误差可以事先计算并加以控制。第一节统计数据的搜集三、统计调查的各种形式:3、抽样调查:适用范围:不可能或很难进行全面调查的现象,必须采取抽样调查方法。如产品寿命等;没必要进行全面调查的社会现象,也可采用抽样调查。其他作用:对全面调查结果的检验修正。优点:经济性:调查单位少,专业化;时效性:专业队伍,直接取样;准确性:自上而下,随机抽样;灵活性:项目可多可少,范围可大可小。广泛应用第一节统计数据的搜集三、统计调查的各种形式:3、抽样调查:抽样调查的原则:随机原则:所有调查单位都有相同的被抽取概率,才符合概率论的要求,从而进行统计推断;最大抽样效果原则:既定的费用下是抽样误差最小,或者在给定的精确度下使费用最小。思考题:以下调查应采用什么调查方式?为什么?对河水水质进行检测;推断种子的发芽率;推断食品的保质期;民意测验第一节统计数据的搜集三、统计调查的各种形式:4、重点调查:重点调查:在调查对象范围内选择部分重点单位进行的非全面调查。重点单位——标志(值)总量所占比重很大,数量一般不多;从数量上反映总体在该标志总量方面的情况。重点单位的标准:在所研究现象的标志总量中所占的比重很大。先进或者重点管理单位不是重点调查单位。优点:单位较少,调查可较详细;部分单位集中反映基本情况时适用。例:我国银行业中的重点单位
截至2004年底,工、农、中、建四家国有商业银行各项贷款近13万亿元,占我国银行业贷款总额的72%,存款近25万亿元,占银行业存款总额的77%。从统计学的角度,四大国有商业银行就是重点调查中的重点单位。第一节统计数据的搜集三、统计调查的各种形式:5、典型调查:典型调查:在对调查对象全面分析的基础上,有意识地选取若干具有典型意义的或有代表性的单位进行深入、细致调查的一种非全面调查。特点:取决于调查者的主观判断与决策;调查范围小,调查单位少,可对某些复杂的专门问题进行深入、细致的调查。调查单位有代表性和典型性。中心问题:典型单位的选择要具有充分代表性——这些单位的标志表现(标志值)最能反映总体中各个单位的一般水平。第一节统计数据的搜集第一节统计数据的搜集四、统计调查体系:(P40-41)计划经济时期:统计报表制度为主,全面调查、层层汇总;统计口径难统一;基层统计人员不足;客观性……市场经济:必要的周期性普查为基础,经常性的抽样调查为主体,同时辅以重点调查、科学推算和部分全面报表综合应用的统计调查方法体系。普查:搜集全面详细的数据,提供基础资料;耗费大抽样调查:调查单位少,专业人员,科学推断;重点调查、典型调查、统计报表:传统形式,仍发挥作用。五、调查误差:(P48)对统计调查数据的基本要求:准确性、及时性、系统性、完整性、经济性总体要求:以准确为前提,准中求快,力争以较少的投入取得完整、系统的数据资料。调查误差:衡量统计调查数据的准确性;费用既定下误差越小越好第一节统计数据的搜集五、调查误差:调查误差的分类抽样误差:产生于抽样调查中,由于随机的原因导致样本的结构不能完全代表总体的特征而产生的误差;随机抽样的抽样误差可估算并控制非抽样误差:其他误差,原因众多、难以估量确定总体或抽样框:重复、包含异质单位、丢失单位……数据搜集:问卷设计不佳、调查者工作欠缺、被调查者不配合…数据整理:数据处理失误、被调查者提供数据不实……减小误差的手段:完善调查方案、科学选取调查方式方法、提高人员素质、完善统计制度……第一节统计数据的搜集六、二手(次级)统计资料的主要来源:(P49)统计年鉴:《中国统计年鉴》、《国际统计年鉴》、地方统计年鉴、《中国县(市)社会经济统计年鉴》、《中国金融年鉴》、《中国人口和就业统计年鉴》、《中国统计摘要》……外文出版物:世界银行各年度的《世界发展报告》、联合国的《联合国统计年鉴》、联合国粮农组织《生产年鉴》、国际货币基金组织的《国际金融统计月报》、亚太经合组织的《亚太统计数字》…有关期刊:《中国经济数据分析》、《经济预测分析》…有关网站:中国统计信息网、国研网、中国经济信息网、中国经济时报网……第一节统计数据的搜集课堂练习第一节统计数据的搜集()全面调查和非全面调查是根据调查结果所得到的资料是否全面来划分的。()对某市下岗职工生活状况进行调查,要求在一个月内报送调查结果,规定的时间是调查时间。()我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。()采用重点调查搜集资料时,选择的调查单位是标志值较大的单位。××√×课堂练习第一节统计数据的搜集()统计调查误差就是指由于错误判断事实或者错误登记事实而发生的误差。()重点调查与抽样调查的目的是一致的,即都是通过对部分单位的调查,来对总体数量特征进行推断估计。××()连续调查与不连续调查的划分依据是A、调查的组织形式不同B、调查登记的时间是否连续C、调查单位包括的范围是否全面D、调查资料的来源不同B课堂练习第一节统计数据的搜集()对一批商品进行质量检验,最适宜采用的方法是A、全面调查B、抽样调查C、典型调查D、重点调查
B()下列调查中,调查单位与填报单位一致的是A、企业设备调查B、人口普查C、农村耕地调查D、工业企业现状调查D()抽样调查的主要目的是A、计算和控制抽样误差B、推断总体总量C、对调查单位作深入研究D、广泛运用数学方法B()下述各项调查中属于全面调查的是A、对某种连续生产的产品质量进行检验B、某地区对工业企业设备进行普查C、对全面钢铁生产中的重点单位进行调查D、抽选部分地块进行农产量调查B2.2数据整理一、数据整理的内容二、统计分组〇、导读:统计资料中国家庭金融调查(ChinaHouseholdFinanceSurvey,CHFS)报告截至2011年8月,中国家庭资产平均为121.69万元,城市家庭平均为247.60万元,农村家庭平均为37.70万元。中国家庭自有住房拥有率为89.68%,远高于世界平均的60%。其中城市家庭为85.39%。(炒股)盈利的家庭占22.27%;盈亏平衡的家庭占21.82%;亏损的家庭比例达56.01%。可见,高达77%的炒股家庭没有从股市赚钱。这与人们上说的“二八”法则比较接近。在户主为青年的家庭中,炒股盈利占16.14%;盈亏平衡的家庭占27.67%;亏损的家庭占56.20%。在中年家庭中,炒股盈利的占23.71%;盈亏平衡的占17.01%;亏损的占59.28%。在老年家庭中,炒股盈利的占30.30%;盈亏平衡的占19.19%;亏损的占50.51%。……第二节数据整理〇、导读:原始数据报告基于全国25个省、80个县、320个社区共8438个家庭的抽样调查数据汇总分析形成,涉及家庭资产、负债、收入、消费、保险、保障等各个方面的数据,全面客观地反映了当前我国家庭金融的基本状况。家庭资产包括非金融资产和金融资产两大部分。家庭非金融资产包括农业、工商业等生产经营资产;房产与土地资产;车辆资产;以及家庭耐用品等资产。家庭金融资产包括活期存款;定期存款;股票;债券;基金;衍生品;金融理财产品;非人民币资产;黄金;借出款等资产。……原始资料:各家庭各方面的数据(标志)如何从零散的原始数据得到各种统计资料第二节数据整理〇、导读:统计表中国家庭金融调查(ChinaHouseholdFinanceSurvey,CHFS)报告:第二节数据整理
城乡地区
城市农村东部中部西部1套69.0580.4271.3180.2784.272套15.4412.2015.0814.038.033套以上3.632.104.121.160.80表7拥有不同住房数量家庭占比(%)〇、导读:统计图中国家庭金融调查(ChinaHouseholdFinanceSurvey,CHFS)报告:第二节数据整理图4:年龄与炒股盈亏一、统计整理的意义和内容:统计整理:对统计调查阶段所搜集到的大量原始资料进行分组、汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过程。是统计工作的第二阶段。作用:统计资料整理是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,是统计工作中一个十分重要的中间环节,起着承前启后的作用,即既是统计调查阶段的继续和深入,又是统计分析阶段的基础。第二节数据整理统计整理的内容:整理汇总方案的设计:统计分组&统计指标;汇总:计算各项指标;描述整理结果:统计表或者统计图的形式程序:调查资料的审核和筛选:发现、处理数据中的错误,保证数据的完整性与准确性;资料的分组和汇总:统计分组&统计指标;编制统计表和统计图(第三节);统计资料的积累、保管和公布。第二节数据整理二、统计分组:统计分组:根据统计研究目的和客观现象的内在特点,按照选定的某个或几个标志,将被研究的总体数据分成若干部分的科学分类。统计分组是基本的统计方法之一。目的:把同质总体中的具有不同性质的单位分开,把性质相同的单位合在一起;保持各组内统计资料的一致性和组与组间资料的差异性,以便进一步运用各种统计方法,研究现象的数量表现和数量关系,从而正确地认识事物的本质及其规律性。第二节数据整理二、统计分组:关键:分组标志的选择一种(标志)分组突出一种差异或矛盾,忽略其他矛盾;不同分组方法得出不同结论;根据研究目的选取。如学历与资历对收入的影响统计分组的基本作用:1)、划分现象的类型;例如,国民经济按行业分组,可以划分为20个行业门类;产业可以划分为第一产业、第二产业、第三产业;经济类型可以划分为国有、集体、民营、合营、个体、外资、中外合资等多种类型;2)、揭示现象内部结构;计算总体内各组成部分占全体的比重,以说明各个组成部分在总体中的分布状况,反映现象的内部结构和结构变化,从而揭示现象的性质和发展变化的规律。3)、分析现象之间的依存关系;分类变量间的关系;数值变量间的关系,但受另外变量的影响。第二节数据整理二、统计分组:统计分组的原则:(P53)穷尽原则:每个单位都分到某一组——不漏;互斥原则:每个单位都只能属于一个组——不重。(上限不在内)统计分组的种类:标志的多少:简单分组和复合分组(后详);标志的性质:品质分组(定类、定序尺度)和数量分组(定距、定比尺度)(后详)第二节数据整理二、统计分组:简单分组、复合分组和分组体系:简单分组又称单一分组,特点:只能反映现象在某一标志特征方面的差异情况,说明的问题比较简单明了。复合分组就是对同一总体选择两个或两个以上标志层叠起来进行分组。特点:可从几个不同角度了解总体内部的差别和关系,因此能更全面、更深入地研究问题;复合分组的组数随着分组标志的增加而成倍地增加。(例:工业企业分组)采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,在统计上叫做分组体系。第二节数据整理第二节数据整理
复合分组和复合分组体系按经济类型分组按投资规模分组国有企业:大型中型小型集体企业:大型中型小型外资企业:大型中型小型其他投资:大型中型小型品质分组与数量分组:品质分组:分组标志确定后,组名和组数确定;数量分组:单项式分组与组距式分组。1)、单项式分组:每个变量值作为一组;适用于离散型变量且变量变动范围不大的场合。比如某市居民家庭按家庭人口数分组。第二节数据整理2)、组距式分组:按变量值的区间分组。组距:区间的距离;组限:相邻两组的界限;适合于连续型变量或者变动范围较大的离散型变量。连续组距式分组与间断组距式分组连续型变量只能采用连续组距式分组(注意“上限不在内”原则的应用):比如产值、身高、体重。
如果变量值只是在整数间变动,可采用间断组距式分组,也可采用连续组距式分组。比如企业数、职工人数等。等距分组与异距分组:等距分组适用标志值变动比较均匀的情况。异距分组适用:标志值分布很不均匀的场合;标志值相等的量具有不同意义的场合(月对于婴儿和成人);标志值按一定的比例发展变化的场合。第二节数据整理组距式分组相关指标:组距
=本组上限-前组上限=后组下限-本组下限 =本组上限-本组下限(连续) =本组上限-本组下限+1(间断)组中值=(本组下限值+本组上限值)/2=本组下限值+本组组距/2=本组上限值-本组组距/2(连续)=本组下限值+(组距-1)/2=本组上限值-(组距-1)/2(间断)=(本组下限值+本组上限值+1)/2[连续变量间断化]
=(本组下限值+后组下限值)/2[连续变量间断化]=(本组下限值+本组上限值-1)/2[间断变量连续化]
第二节数据整理组距式分组相关指标:组中值开口组组中值的确定方法开口组:上限或下限不确定(组距不确定)的组;以相邻组的组距作为本组的组距组中值(连续式):
“××以上”组:组中值=本组下限值+相邻组组距/2
“××以下”组:组中值=本组上限值-相邻组组距/2组中值的作用计算平均指标等,组中值一般用来代替组内平均水平;组内分布越均匀代表性越强。
第二节数据整理组距式分组相关指标:组数:分组的个数组距越小组数越多,组距越大组数越多;经验上以5~20之间为好,组数不要太多,否则每组的数据太少;确定组数K的斯特格斯(Sturges)经验公式(仅供参考)组限与组距习惯上用5、10、……
第二节数据整理N15~’2425~4445~8990~179180~359K56789课堂练习第二节数据整理(
)对统计资料进行分组的目的就是为了区分各组单位之间质的不同。×(
)某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。×(
)统计分组后掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。√课堂练习第二节数据整理(
)下列分组中属于按品质标志分组的是A、学生按考试分数分组
B、产品按品种分组C、企业按计划完成程度分组
D、家庭按年收入分组B(
)有一个学生考试成绩为80分,在统计分组中,这个变量值应归到以下哪组A、60—70分
B、70—80分C、80—90分
D、90—100分C(
)某主管局将下属企业先按轻、重工业分组,再按规模分组,这种分组属于分组。A、简单分组
B、复合分组C、分析分组
D、结构分组B2.3变量数列一、变量数列的基本概念二、频数和频率三、累计频数和累计频率四、频数分布的类型补充:统计表、统计数据的图示第三节变量数列〇、导读:统计表
城乡地区
城市农村东部中部西部1套69.0580.4271.3180.2784.272套15.4412.2015.0814.038.033套以上3.632.104.121.160.80表7拥有不同住房数量家庭占比(%)第三节变量数列〇、导读:统计图图4:年龄与炒股盈亏第三节变量数列〇、导读:统计图图2:家庭金融资产配置2.3变量数列一、变量数列的基本概念二、品质数列的编制和图示三、变量数列的编制和图示四、频数分布的类型五、累计频数和累计频率六、统计表第三节变量数列一、分配数列的概念和种类在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为次数(频数)分配或分布(分配)数列。分布数列的相关概念(两个要素):总体按某种标志所分的组;分组标志在各组的数量表现形成标志值数列,又称变量,用x表示;频数:分布在各组的单位个数,又称次数、频次;用f表示;反应对标志值平均水平所起的作用(P58)频率:各组次数与总次数之比叫,又称比率、比重。频率非负[0,1]且和为1频数密度(=频数/组距)与频率密度(=频率/组距)(异距分组时频数受组距影响。)分配数列是统计分组的一种重要形式,它可以反映总体的结构分布状况和分布特征。根据分组标志的不同,分配数列可分为两种:品质分布数列;变量分布数列(单项数列和组距数列)。由各组名称和次数组成。
例1、品质数列:某班学生的性别构成情况按性别分组绝对数人数比重(%)男女30107525合计40100第三节变量数列例2、单项数列:某厂第二季度工人平均日产量工人平均日产量(件)工人数绝对数(人)比重(%)2345610153040208.713.026.134.817.4合计115100第三节变量数列例3、等距组距数列:某工厂工人完成生产定额情况表工人按完成生产定额分组(%)工人数绝对数(人)比重(%)80~9090~100100~110110~120120~130304060302016.722.233.316.711.1合计180100第三节变量数列人口按年龄分组人口数(万人)1岁以下(婴儿组)1-7岁(幼儿组)7-17岁(学龄儿童组)17-55岁(有劳动能力的人口组)55岁以上(老年组)161224.68.1合计51.7例4、异距组距数列:某地区人口分布状况第三节变量数列例5、开口组数列:我国土地状况分组表第三节变量数列二、品质数列的编制和图示[补充内容]:1、品质数列的编制:只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:第三节变量数列【例】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”
1.商品广告;2.服务广告;3.金融广告;4.房地产广告;5.招生招聘广告;6.其他广告。某城市居民关注广告类型的频数分布
广告类型人数(人)比例频率(%)
商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100二、品质数列的编制和图示[补充内容]:2、品质数列的图示——柱形图:第三节变量数列柱形图是用宽度相同的柱形的高度或长短来表示数据变动的图形。在表示品质数据的分布时,是用柱形图的高度来表示各类别数据的频数或频率。绘制时,各类别可以放在横轴,称为柱形图。各类别也可以放放在纵轴,称为条形图。人数(人)5191610211204080120
商品广告
服务广告
金融广告
房地产广告
招生招聘广告
其他广告广告类型
某城市居民关注不同类型广告的人数分布二、品质数列的编制和图示[补充内容]:2、品质数列的图示——柱形图:第三节变量数列柱形图有单式、复式等形式;复式:多个总体对比时,对条进行不同的修饰。图4:年龄与炒股盈亏二、品质数列的编制和图示[补充内容]:3、品质数列的图示——饼形图[补充内容]:第三节变量数列也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形;主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用;在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的;例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为3600×25.5%=91.80,其余类推。
其他广告1.0%
房地产广告8.0%
商品广告56.0%
金融广告4.5%
服务广告25.5%
招生招聘广告5.8%某城市居民关注不同类型广告的人数构成二、品质数列的编制和图示[补充内容]:3、品质数列的图示——环形图[补充内容]:第三节变量数列环形图主要用于对比多个总体中各组成部分所占的比例;在绘制环形图时,总体中各部分的中心角度,是按各部分占3600的相应百分比确定的;环形图可认为多个饼形图(变形后)的对比;4、品质数列的图示——柱形图与饼形图、象形图:(补充)选用合适统计图,柱状图常常可以和饼形图互相转换;柱形图:对比饼形图:结构(内部对比)右图不能用饼形图。比较的不是一个整体第三节分配数列4、品质数列的图示——柱形图与饼形图、象形图:(补充)选用合适统计图,思考:右图能否饼形图如何转换第三节分配数列图4:年龄与炒股盈亏4、品质数列的图示——柱形图与饼形图、象形图:(补充)柱形图的刻度:第三节分配数列4、品质数列的图示——柱形图与饼形图、象形图:(补充)柱形图:类别的排列顺序定须尺度按序排列;定类尺度按指标大小排列(如下);第三节分配数列4、品质数列的图示——柱形图与饼形图、象形图:(补充)饼形图:类别的排列顺序定须尺度按序排列;定类尺度按指标大小排列(如下);第三节分配数列图2:家庭金融资产配置4、品质数列的图示——柱形图与饼形图、象形图:(补充)象形图代替柱形图象形图:1:2夸张为(让人觉得)1:41:8第三节分配数列4、品质数列的图示——柱形图与饼形图、象形图:(补充)象形图:表示奶牛变多,但让人觉得“奶牛变大”第三节分配数列三、组距数列的编制和图示:第三节变量数列
与组距确定组数计算频数编制表格图示说明117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121【例】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。第三节变量数列三、组距数列的编制和图示:1)、确定组数:K=1+3.3*log(50)=6.64=72)、确定组距:全距/组数=5;排序(单项式分组表)第三节变量数列三、组距数列的编制和图示:零件数频数零件数频数零件数频数1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221123)、计算频数;4)、编制表格(上限不在内!)第三节变量数列三、组距数列的编制和图示:按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计50100第三节变量数列树茎树叶数据个数10*11。11*12。12*13。13*78802234577788890012222333344455667778890133445799358141064合计5050三、组距数列的编制和图示:5)、组距数列的图示——茎叶图[补充内容]:“。”表示个位数0-4,“*”表示个位数5-9。第三节变量数列三、组距数列的编制和图示:5)、组距数列的图示——茎叶图[补充内容]:茎叶图与变量数列:茎叶图不仅有频数,而且有原始数据;组限不是10、100等时,树茎有重合,需要别的符号区分;如果不是5、50等比较复杂;三、组距数列的编制和图示:5)、组距数列的图示——直方图[补充内容]:用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布;在平面直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图;直方图下的总面积等于1
第三节变量数列三、组距数列的编制和图示:5)、组距数列的图示——直方图[补充内容]:第三节变量数列频数(人)1512963105110115120125130135140日加工零件数(个)当纵轴为频率密度时,直方图下的面积之和等于1某车间工人日加工零件数的直方图一眼就能看出大多数人的日加工零件数在120~125之间!358141064第三节变量数列三、组距数列的编制和图示:5)、组距数列的图示——直方图[补充内容]:直方图与柱形图:直方图各矩形相邻,宽度为组距;柱状图各柱分开,柱的宽度无意义;茎叶图与直方图:直方图只有频数没有原始数据;茎叶图不仅有频数,而且有原始数据;茎叶图可以理解成横放的直方图;三、组距数列的编制和图示:5)、组距数列的图示——折线图[补充内容]:折线图也称频数多边形图(Frequencypolygon)是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的第三节变量数列三、组距数列的编制和图示:5)、组距数列的图示——折线图[补充内容]:第三节变量数列1512963105110115120125130135140日加工零件数(个)频数(人)折线图下的面积与直方图的面积相等!某车间工人日加工零件数的折线图数据越多,组距越小时,折线越平滑……四、次数分布的主要类型(P64,提前)(一)钟型分布:“两头小,中间大”1、对称分布2、偏态分布:右偏(上偏);左偏(下偏)第三节变量数列对称分布右偏分布左偏分布四、次数分布的主要类型(二)U型分布:“两头大,中间小”(三)J型分布:“一边小,一边大”1、正J型分布2、反J型分布第三节变量数列U型分布正J型分布反J型分布五、统计图制作原则和结构:(补充)原则:选用合适统计图,结合统计表一表一主题准确美观结构:标题:简明扼要,下中,编号图域:一般长方形标目:附单位图例:刻度:第三节分配数列五、统计图制作原则:(补充)原则:选用合适统计图,柱状图常常可以和饼形图互相转换;右图不能用饼形图。比较的不是一个整体的各个部分第三节分配数列五、统计图制作原则:(补充)排序问题第三节分配数列五、统计图制作原则:(补充)象形图的误导:1:2夸张为(让人觉得)1:41:8第三节分配数列五、统计图制作原则:(补充)刻度的选取:第三节分配数列五、统计图制作原则:(补充)刻度与原点的选取:第三节分配数列五、统计图制作原则:(补充)刻度与原点的选取:第三节分配数列五、累计频数分布数列:1、累计频数分布数列:总体中各单位数在各组间的分布,称为次数分布。将变量数列各组的次数和比率逐组累计相加而成累计次数分布。累计次数分布的两种计算方法:向上累计:以下累计或较小制累计:上限以下向下累计:以上累计或较大制累计:下限以上累计次数的特点:同一数值的向上累计和向下累计次数之和等于总体总次数,而累计比率之和等于1(或100%)。第三节变量数列例:某班统计学考试成绩次数分布考分次数向上累计向下累计人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)50~6060~7070~8080~9090~10027111285.017.527.530.020.0292032405.022.550.080.0100.0403831208100.095.077.550.020.0合计40100.0----------------第三节变量数列例:某班统计学考试成绩次数累计分布图第三节变量数列五、累计频数分布数列:2、累计频数分布曲线:五、累计频数分布数列:3、洛伦兹曲线与基尼系数(补充):最早由美国洛伦茨博士提出的累计分布曲线图,用以研究社会财富、收入等分配的平等程度。绘制方法如下:将分配的对象(如收入)和接受分配者的数量均化成结构相对数并进行向上累计;纵轴和横轴均为百分比尺度,纵轴自下而上,用以测定分配的内容(如一国的财富、土地或收入等),横轴由左向右用以测定接受分配者(如一国的人口);根据计算所得的分配对象和接受分配者的累计百分数,在图中标出相应的绘示点,连接各点并使之平滑化,所得曲线即所要求的洛伦茨曲线。第三节变量数列3、洛伦兹曲线与基尼系数(补充):例:某国收入所得分配情况第三节变量数列按收入所得水平分组人口收入累计收入(%)人口数(万人)结构%累计%月收入额(亿美元)结构%实际情况绝对平等绝对不平等(1)(2)(3)(4)(5)(6)(7)(8)最低128.512.8512.851.575512.850中下348.034.8047.654.08131847.650中等466.946.6994.3416.33527094.340较高45.64.5698.907.54249498.900最高11.01.10100.01.886100100.0100合计1000.0100.0-31.40100---3、洛伦兹曲线与基尼系数(补充):绘制洛仑兹曲线图的过程:先将人口、收入的数量(第(1)、(4)栏)计算成为结构相对数(第(2)、(5)栏),再求出累计百分比(第(3)、(6)栏);然后在制好的比率曲线图格上依累计百分比标出绘示点,连接各绘示点即为分配曲线见图;图中的曲线为实际收入分配曲线,对角线为绝对平等线;根据实际收入分配线与绝对平等线或绝对不平等线进行对比,可衡量其不平等程度。离绝对平等线越远分配越不平等;反之,越靠近绝对平等线分配越平等。第三节变量数列3、洛伦兹曲线与基尼系数(补充):绘制洛仑兹曲线图的过程:横坐标:第(3)栏累计人口百分比纵坐标:第(6)栏累计收入百分比第三节变量数列3、洛伦兹曲线与基尼系数(补充):如果某国绝大多数人口占有很少的收入(财富),而一小部分人占有绝大部分的收入(财富),则该国的洛伦茨曲线就靠近右下方。一般的国家,收入不是绝对平均的,即不是对角线,也不是绝对不平均的。洛伦茨曲线可以分析收入(财富)分配的平均程度。第三节变量数列累积的收入(财富)百分比AB累积的人口百分比洛伦茨曲线绝对公平线3、洛伦兹曲线与基尼系数(补充):基尼系数:20世纪初意大利经济学家基尼(G.Gini)根据洛伦茨曲线给出了衡量收入分配平均程度的指标A:实际收入曲线与
绝对平均线之间的面积B:实际收入曲线与绝对不平均线间的面积第三节变量数列累积的收入(财富)百分比AB累积的人口百分比洛伦茨曲线绝对公平线3、洛伦兹曲线与基尼系数(补充):基尼系数:如果A=0,则基尼系数=0,表示收入绝对平均如果B=0,则基尼系数=1,表示收入绝对不平均一般情况下,基尼系数在0和1之间取值一般认为,基尼系数小于0.2,表明分配平均;基尼系数在0.2至0.4之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;基尼系数在0.4被认为是收入分配不公平的警戒线,超过了0.4应该采取措施缩小这一差距。第三节变量数列3、洛伦兹曲线与基尼系数(补充):基尼系数:第三节变量数列第三节变量数列六、统计表(补充内容)一)、统计表的作用统计表是统计用数字说话的一种最常用的形式。1、能使大量的统计资料系统化、条理化,因而能更清晰地表述统计资料的内容。2、利用统计表便于比较个项目(指标)之间的关系,而且也便于计算。3、采用统计表表述统计资料比用叙述的方法表述统计资料显得紧凑、简明、醒目,使人一目了然。4、利用统计表易于检查数字的完整性和正确性。二)、统计表的结构从内容上看,统计表由主词和宾词两部分组成。主词说明总体及其分组,宾词说明总体的统计指标。从构成要素看,统计表包括以下三个部分:1、总标题。2、分标题(又叫做标目):横标目(主词)和纵标目3、纵、横栏组成的本身及表中的数字。(附注)2005年全国工业增加值资料来源:《中国统计摘要》,中国统计出版社2006年版,第133页。项目工业增加值产值(亿元)比重(%)轻工业重工业20584.645840.631.069.0合计66425.2100.0第三节变量数列三)、统计表的种类(按主词)1、简单表:表的主词未经任何分组的统计表。表的主词一般按时间顺序或按总体各单位名称排列。2、分组表:表的主词按照某一标志进行分组的统计表。3、复合表:表的主词按照两个或两个以上标志进行复合分组的统计表。第三节变量数列
2006年某公司所属两企业自行车合格品数量表(分组表)
厂别合格品数量(辆)甲厂5000乙厂7000合计12000
2005年某地区工业增加值和职工人数(复合表)项目增加值(万元)职工人数(人)大型9750
13800内资企业中型8600
45000小型4200
10050外商投资大型7300
7500经营企业中型5200
10400小型4400
4500第三节变量数列四)、宾词指标的设计大致有两种设计方式:一种是简单设计,将宾词指标做平行配置,一一排列;另一种是复合设计,把各个指标结合起来,做层叠配置,分层排列。第三节变量数列
某地区工业企业的工人性别和工龄(2005年底)企业按所有企工性别工龄制形式分组业人男女1年1-3年3-5年5-10年10年数数以下以上
(甲)
(1)(2)(3)(4)(5)(6)(7)(8)(9)国有单位集体单位合计第三节变量数列四)、宾词指标的设计简单设计:宾词指标做平行配置,一一排列;
某地区工业企业的工人性别和工龄(2005年底)企业按所企工龄有制形式业工人数1年以下1-3年3-5年5-10年10年以上分组数(百人)男女计男女计男女计男女计男女计男女计
(甲)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19国有单位集体单位合计第三节变量数列四)、宾词指标的设计复合设计:各个指标结合起来,做层叠配置,分层排列。五)、编制统计表应注意的问题1、统计表的标题(包括总标题和分标题)应十分简明地概括所要反映的内容。2、表中主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列各个项目,后列总体。3、表中必须注明数字资料的计量单位。4、表中数字上下位置要对齐。5、统计表的表式,一般是开口式,即表的左右两端不画纵线,表的上下通常用粗线封口。6、必要时,统计表应加以注解,连同数字的资料来源等一般都写在表的下端。第三节变量数列课堂练习第三节变量数列(
)分配数列的实质是把总体单位总量按照总体所分的组进行分配。√(
)任何一个分布都必须满足:各组的频率大于0,各组的频数总和等于1或100%×(
)组中值是根据各组上限和下限计算的平均值,所以它代表了各组的平均分配次数。×课堂练习第三节变量数列(
)在次数分配数列中
A、总次数一定,频数和频率成反比 B、各组的频数之和等于100 C、各组频率大于零,频率之和等于1 D、频率越小,则组的标志值所起的作用越小E、频率表明各组标志值对总体的相对作用程度CDE课堂练习第三节变量数列BCDE(
)下列数列属于
按生产计划完成程度分组(%)企业数
80─901590─10030100─1105
合
计
50
A、品质分配数列
B、变量分配数列C、组距式变量分配数列
D、等距变量分配数列E、次数分配数列简单次数分布数列的编制实例
[练习、例]数据资料
某车间40名工人日产零件如下:
657266579086836875658466596770795181546878869464777476966276988571798465728975
78简单次数分布数列的编制实例
编制步骤之一——数据排序并确定全距
将
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- T-ZSM 0052-2024“领跑者”评价技术要求 普通型立式带锯床
- T-ZSA 227-2024 低慢小无人驾驶航空器车载式预警处置系统
- 2025年度村级林业资源监测村级护林员职责合同
- 2025年度美甲服务连锁品牌合作协议
- 二零二五年度汽车维修保养抵押借款合同
- 2025年度美发店员工劳动合同及员工福利政策
- 二零二五年度个人心理咨询服务合同
- 2025年度消防车辆抵押借款合同范本
- 二零二五年度直播平台用户行为数据分析合同
- 2025年度石材石材加工定制采购协议
- (完整版)建筑工程技术毕业论文
- 鑫宇锌合金模具设计标准
- 整理我的小书桌(课件)小学劳动二年级通用版
- 森林抚育施工组织设计
- 切削刀具及其材料课件
- 山东省义务教育地方课程安全教育课程实施指导意见
- DL-T 736-2021 农村电网剩余电流动作保护器安装运行规程
- SB/T 10439-2007酱腌菜
- GB/T 33644-2017数控板料折弯机精度
- GB/T 32434-2015塑料管材和管件燃气和给水输配系统用聚乙烯(PE)管材及管件的热熔对接程序
- GB/T 17888.3-2020机械安全接近机械的固定设施第3部分:楼梯、阶梯和护栏
评论
0/150
提交评论