统计总论分析和评价_第1页
统计总论分析和评价_第2页
统计总论分析和评价_第3页
统计总论分析和评价_第4页
统计总论分析和评价_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计总论分析和评价课程介绍《统计学原理》是开放专科会计学专业的一门必修课。学分:5分学时:90学时考核说明形成性考核和终结性考核相结合的方式。形成性考核(即学习过程考核)包括4次平时作业、网上活动、到课率三部分。形成性考核成绩占学期总成绩的20%。终结性考核(即期末考试),期末考试成绩占学期总成绩的80%。试题类型大致分为客观性试题和主观性试题两大类。客观性试题包括填空、判断和选择题:1、判断题:通对基本理论、基本概念的记忆和理解对题目作出正确的判断。占全部试题的10%。2、单项选择及多项选择:前者是在列出的答案中选一个正确答案,后者是在列出的答案中选出两个或两个以上正确答案。这部分内容包括对基本概念的理解、计算公式的运用等。占全部试题的20%。主观性试题包括简答、计算题:3、简答:考核对基本概念、理论、方法的掌握及应用程度。占全部试题的20%左右。4、计算:考核对基本统计方法的掌握程度及综合应用的能力。占全部试题的50%。做计算题要求写出计算公式及主要计算过程。

统计学原理黄良文、陈仁恩主编第一章统计总论第二章统计调查第三章统计整理第四章综合指标第五章抽样估计第六章假设检验第七章相关分析第八章指数分析第九章动态数列分析第十章统计综合分析与评价第一章统计总论

教学目的

本章对统计学的基本问题进行了介绍,如统计学的研究对象、统计学的研究方法、统计工作过程、统计的职能、统计组织以及统计学的一些基本概念等等。本章的教学目的是,通过学习对统计学科的性质有一个基本的认识。

统计学的研究对象及其特点

统计学的研究方法

统计学的几个基本概念

统计的职能和组织在学习过程中主要解决以下几个问题第一章统计总论

统计一词的三种涵义及相互关系

“没有统计,其它科学可以存在,但是很渺小”一个医生说:“医学若无统计就不是科学”关于统计的一些论断

台湾辅仁大学一教授说“统计即生活,统计即人生”.

外国某机构评论:“统计是20世纪对人类社会贡献最大的四大学科之一”。一位资深的海外统计学家说:统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。为什么?当今社会(时代)被称为信息社会.信息社会的主要特征:信息在各个领域的重要性;信息数量庞大;信息处理和传输迅速…统计在信息社会中的重要作用:提供搜集信息的理论方法;提供加工处理信息的理论方法.感悟统计(之一)感悟统计(之二)撑死的人比饿死的人多!据统计,肥胖并发脑血栓和心衰的发病率比正常体重者高一倍,患冠心病者多2~5倍,高血压发病率多2~6倍,合并糖尿病者高4倍,合并胆石症者高4~6倍。美国生命保险协会的统计调查结果显示,超重25%和35%的肥胖症者的死亡率比正常人高28%和50%,表明肥胖程度和死亡率呈正相关。美国每年因肥胖伴有冠心病、高血压、高血脂、糖尿病和脑血管意外而死亡的人数大约有30万人。众所周知,《红楼梦》一书共120回,一般认为前80回为曹雪芹所写,后40回为高鹗所续,长期以来对这个问题一直有争议。能否从数学上做出论证?1985、1986复旦大学李贤平教授带领他的学生作了这项有意义的工作,他们创造性想法是将120回看成是120个样本,然后确定与情节无关的虚词作为变量(所以要抛开情节,是因为在一般情况下,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的),计算出每一回里变量出现的次数,用多元分析中的聚类分析法进行分类,果然将120回分成两类即前80回为一类,后40回为一类,很形象地证实了不是出自同一人的手笔。NEXT后40回出自谁的手笔后40回出自谁的手笔之后,又进一步分析前80回是否为曹雪芹所写?这时又找了一本曹雪芹的其它著作,做了类似计算,结果证实了用词手法完全相同,断定为曹雪芹一人手笔。而后40回是否为高鹗写的呢?论证结果推翻了后40回是高鹗一个人所写。这个论证在红学界轰动很大,他们用多元统计分析方法支持了红学界观点,使红学界大为赞叹。统计实践活动,它是对社会自然现象客观存在的现实数量方面进行搜集、整理和分析的活动过程。第一章统计总论例如:要了解我国人口情况,统计部门要完成下列工作:设计调查项目——编制调查表——派调查人员逐户调查——对调查结果进行整理、分析——最后得出反映我国人口基本情况的各种统计指标。它是统计实践活动过程中所取得的各项数字资料以及与之相关的其它实际资料的总称。统计资料统计工作统计一词的三种含义*07年8月份全国居民消费价格同比上涨6.5%城市上涨6.2%

*07年1-7月,我省规模以上工业企业主营业务收入17930.0亿元,比去年同期增长24.3%;利税总额1435.0亿元,增长26.0%,其中利润总额833.2亿元,增长30.3%,利税、利润增幅比1-6月分别回落1.1和2.0个百分点。统计学是关于认识客观现象总体数量特征和数量关系的科学第一章统计总论哪些是我们所需的资料?应当怎样搜集所需的资料?对搜集到的数字资料应当进行怎样整理才能反映资料的真实分布特征?用什么样的方法对数字资料进行深入分析才能反映现象发展变化的规律性?解决一切问题所用的方法均由统计学提供三种涵义的关系统计工作与统计资料是统计实践活动与统计成果的关系统计工作与统计学是统计实践活动与统计理论的关系统计学第一章统计总论统计学的研究对象社会经济统计学的研究对象就是社会经济现象的数量方面,包括数量特征和数量关系例如:对我国人口状况进行研究人口规模有多大?人口构成情况怎么样?人口数量有何变化?劳动力的就业情况怎么样?人民的生活状况如何?人口的平均寿命有何变化?…统计学研究对象的特点总体性社会经济统计是以社会经济现象的总体数量特征作为自己的研究对象变异性社会经济统计研究的总体的数量特征不是一成不变的构成总体的总体单位的各种特征其表现是不相同的数量性从质与量的辩证统一中来研究现象的量社会经济统计活动通过对社会经济现象总体数量的观察,来认识人类社会活动的条件、过程、结果,反映物质资料的占有关系、分配关系、交换关系以及其它社会关系第一章统计总论统计学的学科性质古往今来的统计学者对统计学给予了不同的定义。根据美国统计学家DavidFreedman等著的《统计学》(魏宗舒等译,中国统计出版社,1997年版)中的定义:统计学是对令人困惑的问题作出数字设想的艺术。

案例:

在一个水库中养着许多鱼,管理人员希望了解鱼的大致数量,这就是一个实践中的统计学问题。由于鱼是不听从指挥,会在各处自由游动的,因此,在进行统计时,必须创造性地提出解决方案。一种解决方法是先从水库的不同位置一共捕上来1000条鱼,在每条鱼的尾部作上一个标记,应当保证标记不会影响鱼的自由游动。然后,将鱼全部放回水库。几天后,从水库中再捕上来2000条鱼,检查其中尾巴上有标记的鱼的数量。假定在第二次捕上来的2000条鱼中,有20条尾巴上做了标记,则可以推断,水库中鱼的总数大致为1000/(20/2000)=10万条统计学的研究方法从根本上说,是从数据出发去研究自然和社会经济规律,这一点与其他科学存在着显著的区别。例如经济学,是通过对各种经济主体行为的理论分析,探讨经济规律,而统计学在研究经济现象时,是从结果出发,去探寻其中的规律。

上述这个案例在实践中是经常见到的,对于一个统计工作者来说,作出一个10万条鱼的估计是不够的,他还应当对这一估计的精度作出判断。但这种搜集统计数据的方法,更多地是一种艺术,是很难从书本上学到的。在实践工作中,统计的应用方面是十分复杂的,只有将统计理解为一种艺术,创造性地提出新的方法去解决新的问题,才是真正地掌握了统计的精髓。

统计学科简史最古老的统计可以上溯到远古时代人们对于土地和产量的测量,但这一时期的统计方法往往是粗陋的,没有形成完整的科学体系。统计学者比较认同的现代统计学的源头大致包括三个方面。1.1676年英国经济学家威廉·配弟发表的《政治算术》。在这本书中,配弟用大量的数字分析了英、法、荷等三国的经济实力,开创了利用统计数字进行经济学分析的先河。这一统计学分枝后来发展成了国势学派,今天的国民经济核算体系,就是源于这一学派的理论。2.1662年英国学者约翰·格朗特发表的《关于死亡表的自然观察与政治观察》。在本书中,格朗特分析了英国伦敦的人口死亡情况,成为最早的人口统计学研究。目前,人口统计学是统计学中最有活力的分枝之一。3.17世纪法国数学家帕斯卡尔和费尔马创立的古典概率论。在这一时期,两位数学家以通信的方式,讨论了赌博中各种具体情况的概率计算问题,发展了概率论理论。到19世纪末,古典统计学的框架基本形成,其主要的内容主要是今天描述统计学涉及的内容。

进入20世纪以来,随着大工业生产的发展,质量检验的统计理论迅速形成。1908年,英国酒作坊学徒工戈赛特(Gosset)以“Student”的笔名在《生物统计学》杂志上发表了一篇论文《平均数的概差》,提出了基于小样本的t统计量理论,极大地推动了推断统计理论的发展。20世纪中叶,英国统计学家RonaldAylmerFisher(1890-1962)等人分别对F统计量、极大似然估计、方差分析等理论进行了大量的探讨,从而建立起了推断统计学的庞大的学科体系。在1920年之前,由样本对总体进行估计的概念,一直是直观和模糊的,1925年,Fisher在其著名论文《研究人员用的统计方法》中,阐明和扩展了估计的概念,提出了最优估计概念,以及估计的效率和充分性等问题。在长期从事实验设计的过程中,Fisher还提出了重要的随机化原则,认为这是保证取得无偏估计的有效措施,也是进行可靠的显著性检验的必要基础。理论界认为,在1920年之前,统计研究属于“资料整理”时期,即描述统计学时期,从Fisher开始,进行了“分析统计”时期,即推断统计学时期。

第一章统计总论理论统计学与应用统计学统计学从学科分类上看,可以分为理论统计学和应用统计学两大部分。理论统计学(TheoreticalStatistics)是指统计学的基本原理,主要研究统计学的一般理论问题,尤其是各种统计方法的数学理论问题。如统计分布,统计估计与假设检验理论、相关与回归分析、方差分析,时间序列分析等。应用统计学(AppliedStatictics)是研究如何应用统计方法去解决实际问题的,应用统计学一般都与特定的领域相联系。例如,统计学在教育领域的应用,称为教育统计学;在经济领域的应用,称为经济统计学;等等。第一章统计总论描述统计学与推断统计学描述统计——研究如何对客观现象的数量特征进行计量、观察、概括和表述。用表和图表示,计算特征量(如平均值)等,所论不超出已有数据。推断统计(统计推断)——据数据所提供信息对数据所来自的总体(母体)的性质作推断,推断会有错误、误差,用概率论的术语和方法来描述和论证。误差的产生源于数据有误差。怎样尽可能减少推断的错误和误差,是统计推断的中心问题。目的描述数据特征找出数据的基本规律内容确定要研究的数量特征设计统计指标(说明这些数量特征的)搜集数据整理数据计算并显示指标数据描述统计目的对总体特征作出推断。内容参数估计假设检验相关回归分析样本总体推断统计描述统计与推断统计的关系反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息对总体的数量特征进行估计和检验等)概率论(包括分布理论、大数定律和中心极限定理等)描述统计(统计数据的搜集、整理、显示和分析等)总体数据样本数据图1-1统计学探索现象数量规律性的过程第一章统计总论统计学的研究方法(P7)大量观察法统计分组法综合指标法统计模型法归纳推断法大量观察法指统计研究社会经济现象和过程,要从总体上加以考察,就总体中的全部和足够多的单位进行调查观察并加以综合研究。统计分组法指根据事物的内在性质和统计研究任务的要求,将总体单位按照某种标志划分为若干组成部分的研究方法。例如:人口按年龄分组、企业按经济类型分类、国民经济按部门分类等。

综合指标法是指运用各种统计综合指标来反映和研究社会经济现象总体的一般数量特征和数量关系的研究方法。在统计分析中广泛运用着各种综合指标来反映总体内部的各种数量关系。如动态分析、因素分析、回归与相关分析等。统计模型法指根据一定的经济理论和假定条件,用数学方程去模拟现实经济现象相互关系的一种研究方法。统计模型包括三个基本要素:社会经济变量、基本关系式、模型参数归纳是一种从个别到一般,从事实到概括的一种推理方法,推断是通过对样本数据的观察,推断出总体的数量特征的研究方法。从某种意义上说,统计工作搜集的资料都是样本资料,样本资料分散、零碎,必须经过整理归纳才能据此推断总体的数量特征。所以归纳推断法在统计分析中得到广泛应用。第一章统计总论统计总体与总体单位单位标志与标志表现变异与变量统计指标与指标体系统计总体:是根据一定的目的和要求所确定的研究事物的全体,它是由客观存在的、具有某种共同性质的许多个体构成的整体。总体单位:是构成总体的个别事物。总体单位可以是人、物,也可以是企业机构、地域或状态、长度、时间等等。例如:①了解城镇居民生活状况,城镇全部居民就构成统计总体,城镇每一位居民就是总体单位。②了解工业企业经营情况,全部工业企业就构成统计总体,每一个工业企业就是总体单位。注意:总体与总体单位不是固定不变的,总体的范围可大可小,要根据研究目的确定总体的范围,当总体确定了则相应的总体单位也就确定了。根据总体包括的总体单位是否有限,统计总体可以分为无限总体和有限总体。无限总体:总体中包括的单位无限多,数不清。有限总体:总体中包括的单位有限多。可以数清。单位标志:简称标志,指总体中所共同具有的属性和特征。标志表现:标志的具体表现形式。标志品质标志:表明单位属性方面的特征。

其表现只能是文字。数量标志:表明单位数量方面的特征,其表现是数值,称为标志值。例如:职业是品质标志,标志表现具体为工人、公务员、商业职工、教师等。年龄是数量标志,标志表现具体为10岁、20岁、30岁等。变异:就是差异,指某个标志在总体各单位表现的不同。变量:一般把可变的数量标志称为变量。变量连续变量:其取值是连续不断的,不能以整数断开。如身高、体重、产值等变量。离散变量:其数值可以按一定顺序一一列举出来,通常取整数形式。如人数、企业数、机器台数等变量。统计指标:反映实际存在的社会经济总体某一综合数量特征的社会经济范畴。如工业总产值、商品销售额等。统计指标特点具体性:经济理论规定了指标的内涵,是客观现象量的具体反映。可量性:统计指标均可用数值表现,不存在不能用数值表示的统计指标。综合性:统计指标既是同质总体大量个别单位的总计,又是个别单位标志值的差异综合。统计指标和统计标志的联系和区别:区别:指标是说明总体特征的,标志是说明总体单位特征的;指标具有可量性,无论是数量指标还是质量指标,都能用数值表示,而标志不一定,只有数量标志才能用数值表示,品质标志不可以。联系:指标值往往是由数量标志值汇总而来的;在一定条件下,数量标志和指标存在着变换关系。标志才能用数值表示,品质标志不可以。联系:指标值往往是由数量标志值汇总而来的;在一定条件下,数量标志和指标存在着变换关系。指标种类数量指标:反映总体现象的总规模、工作总量。如总人口、企业总数等。质量指标:反映总体现象的相对水平,或工作质量。如平均工资、人口密度、出生率等。统计指标体系:是各种相互联系的指标构成的整体,用以说明所研究现象各方面相互依存和相互制约的关系。第一章统计总论

统计的职能国家统计系统是社会经济统计的主体,是国家管理系统的重要组成部分。现代国家管理系统包括决策系统、执行系统、信息系统、咨询系统和监督系统,国家统计则兼有其中的信息、咨询、监督三种系统的职能。

统计的组织综合统计系统专业统计系统基层单位的统计组织专业统计国务院各业务部门统计机构系统构成地方各级业务部门统计组织基层单位企事业单位统计组织统计组织乡镇统计组织综合统计国家统计局系统构成地方各级统计机构第一章统计总论一、判断对错1、社会经济统计的研究对象是社会经济现象总体的各个方面。()2、统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。()4、总体的同质性是指总体中的各个单位在所有标志上都相同。()3、社会经济统计学的研究对象是社会经济现象的数量方面,但它在具体研究时也离不开对现象质的认识。()5、品质标志表明单位属性方面的特征,其标志表现只能用文字表现,所以品质标志不能直接转化为统计指标。()××√×√6、品质标志说明总体单位的属性特征,质量指标反映现象的相对水平或工作质量,二者都不能用数值表示。()×第一章统计总论二、单项选择题1、构成统计总体的个别事物称为()。A、调查单位 B、标志值 C、品质标志D、总体单位D2、对某城市工业企业未安装设备进行普查,总体单位是()A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业企业B3、几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是()。A、品质标志B、数量标志C、标志值D、数量指标B4、统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种。其中数量指标的表现形式是()。

A、绝对数B、相对数C、平均数D、百分数A5、在全国人口普查中()。A、男性是品质标志B、人的年龄是变量C、人口的平均寿命是数量标志D、全国人口是统计指标B三、多项选择题部分第一章统计总论1、要了解某地区的就业情况()A、全部成年人是研究的总体B、成年人口总数是统计指标C、成年人口就业率是统计标志D、某人职业是教师是标志表现E、反映每个人特征的职业是数量指标ABD2、下列各项中,属于统计指标的有()A、1999年全国人均国内生产总值B、某台机床使用年限C、某市年供水量D、某地区原煤生产量E、某学员平均成绩ACD3、在工业普查中()A、工业企业总数是统计总体B、每一个工业企业是总体单位C、固定资产总额是统计指标D、机器台数是连续变量E、职工人数是离散变量BCE第二章统计调查教学目的统计调查是统计工作过程的第二个阶段,即搜集统计数据资料的阶段。所搜集的数据资料的质量状况直接影响到统计分析的结果,因此,搜集统计资料必须有一套科学的方式、方法。本章对此问题进行了介绍。通过本章的学习,要求了解统计调查的意义、种类,掌握统计调查方案的内容,各种统计调查方式、方法的应用条件。第二章统计调查在学习过程中主要解决以下几个问题统计调查的基本要求和统计调查的种类

统计调查方案的内容

统计调查方法

统计调查资料的检查第二章统计调查统计调查的基本要求统计调查的种类根据被研究总体的范围划分全面调查非全面调查按调查登记的时间是否连续划分连续调查非连续调查按搜集资料的方法划分直接调查凭证调查派员调查问卷调查准确性及时性第二章统计调查统计调查方案的内容(P42)调查目的调查对象调查项目调查表调查时间和期限调查的组织工作统计调查方案是指导统计调查工作的纲领性文件。调查方案设计的好坏直接影响到调查数据的质量。不同调查任务的调查方案在具体内容和形式上会有一定的差别,但包括的主要内容大体是一致的。第二章统计调查调查目的是调查所要达到的具体目标它回答的是:为什么调查?要解决什么样的问题?调查具有什么样的社会经济意义?调查目的的写作应简明扼要。例如:我国人口普查的目的是“为准确地查清我国在人口数量、地区分布、构成和素质方面的变化,为科学地制定国民经济和社会发展战略与规划,统一安排人民的物质和文化生活,检查人口政策执行情况,提供可靠的资料”。调查目的第二章统计调查调查对象是根据调查目的确定的调查研究的总体或调查范围。调查单位是构成调查对象的每一个单位,是搜集数据资料的基本单位。调查对象和调查单位所解决的问题是:——向谁调查?——由谁来提供所需资料?例如:人口普查的调查对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人。人口普查的调查单位是每一个人。注意:调查单位与填报单位的区别。调查对象和调查单位第二章统计调查它可以是调查单位的数量特征,如一个人的年龄、收入,一个企业的职工人数、产值;调查表是用于登记调查数据的一种表格,一般由表头、表体和表外附加三部分组成。调查项目是调查的具体内容也可以是调查单位的某种属性特征,如一个人的性别、职业,一个企业的经济类型等。某企业基本情况报表(表头)制表机关:调查项目项目代码计量单位实际数值甲1人乙2台丙3人…………表体说明:……(表外附加)调查项目和调查表第二章统计调查为确保调查资料的准确性,统计调查必须规定这两种时间是调查资料所属的时间。即规定所调查的是哪个时期或时点的资料。是进行调查工作的期限。即从调查工作开始到结束的时间长度。例如:第四次人口普查规定的标准时间是“1990年7月1日0时”,并要求在“1990年7月1日至10日完成普查的登记工作”。1990年7月1日0时就是调查时间,1990年7月1日至10日就是调查时限。调查时间:调查时限:调查时间和时限调查的组织工作这项内容包括的比较多,如调查机构的确定,调查人员的选择、培训,调查经费的来源和支出预算,以及其它一些调查工作的准备等。第二章统计调查普查抽样调查统计报表重点调查典型调查普查P47涵义:普查是专门组织的,一般用来调查属于一定时点上社会经济现象数量的全面调查。普查是专门调查特点普查是全面调查普查是一种不连续调查普查通常是一次性的或周期性的普查必须规定标准调查时间作用:普查主要用来搜集那些反映国情国力方面的基本统计资料。例如:人口普查、工业普查、物资库存普查、乡镇企业普查、商业饮食业普查等等。统计调查方法第二章统计调查

抽样调查(P51)抽样调查是一种非全面调查,它是按照随机原则从总体中抽取部分单位进行观察,用以推断总体数量特征的一种调查方式。是一种非全面调查,但是又要达到对总体数量特征的认识。按照随机原则抽选调查单位。经济性、时效性、准确性、灵活性能够解决全面调查无法或难以解决的问题。可以补充和订正全面调查的结果。可以用于对总体的某种假设进行检验。简单随机抽样类型随机抽样等距随机抽样整群随机抽样组织形式对总体不进行任何整理,直接从总体中按照随机原则抽选调查单位。作用特点涵义优点先对总体各单位按主要标志进行分类,再按随机原则抽选调查单位。将总体各单位按某一标志大小顺序排列,然后依一定间隔抽取样本单位进行调查。先将总体各单位划分为许多群,再以群为单位,从中随机抽选部分群,对中选群的所有单位进行调查。抽样调查的组织方式:1·简单随机抽样(纯随机抽样)方法:将总体单位编成抽样框,而后用抽签或随机数表抽取样本单位。适用:总体规模不大;总体内部差异小2·类型抽样(分层抽样)方法:将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本。总体N样本n等额等比例最优······3·等距抽样(机械抽样)方法:将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。排序依据的标志:(1)无关标志;(2)有关标志(总体单位按某一标志排序)············4·整群抽样方法:将总体全部单位分为许多个““群”,然后随机抽取若干““群”,对被抽中的各““群”内的所有单位登记调查。例:总体群数R=16样本群数r=4样本容量例:ABCDEFGHIJKLMNOPLHPD例:在某省100多万农户抽取1000户调查农户生产性投资情况。5·多阶段抽样第一阶段:从省内部县中抽取5个县第二阶段:从抽中的5个县中各抽4个乡第三阶段:从抽中的20个乡中各抽5个村第四阶段:从抽中的100个村中各抽10户样本n=100×10=1000(户)抽样方法1·放回抽样:抽出样本单位登记后放回总体,再抽时总体不变2·不放回抽样:抽出样本单位登记后不放回总体,再抽时总体渐次减少第二章统计调查统计报表(P55)什么是统计报表?基本特点是什么?有何作用?有哪几种类型?重点调查与典型调查(P58)

都属于非全面调查二者共同点根据客观标准选择重点单位在对现象分析的基础上有意识地选择典型单位调查目的不同选择调查单位的方法不同重点调查典型调查重点调查的目的是反映总体的基本情况典型调查的目的是推算总体的数量特征二者区别第二章统计调查调查资料的检查(P62)准确性完整性及时性准确性检查就是对调查误差的检查登记性误差代表性误差由于错误判断事实或错误登记事实而发生的误差。这种误差可以避免根据样本单位的数量特征推断总体数量特征时产生的误差。这种误差不可避免登记性误差:逻辑检查、计算检查代表性误差:可计算出误差,并通过调整一些条件控制误差的大小。检查方法第二章统计调查一、判断对错1、全面调查和非全面调查是根据调查结果所得到的资料是否全面来划分的。()2、对某市下岗职工生活状况进行调查,要求在一个月内报送调查结果。所规定的一个月时间是调查时间。()3、我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。()4、采用重点调查搜集资料时,选择的调查单位是标志值较大的单位。()5、统计调查误差就是指由于错误判断事实或者错误登记事实而发生的误差。()6、典型调查既可以搜集数字资料,又可以搜集不能用数字反映的实际情况。()7、重点调查与抽样调查的目的是一致的,即都是通过对部分单位的调查,来达到对总体数量特征的认识。()××√××√×第二章统计调查二、单项选择题1、连续调查与不连续调查的划分依据是()。A、调查的组织形式不同B、调查登记的时间是否连续C、调查单位包括的范围是否全面D、调查资料的来源不同B2、对一批商品进行质量检验,最适宜采用的方法是()。A、全面调查B、抽样调查C、典型调查D、重点调查

B3、下列调查中,调查单位与填报单位一致的是()。A、企业设备调查B、人口普查C、农村耕地调查D、工业企业现状调查D4、抽样调查的主要目的是()。A、计算和控制抽样误差B、推断总体数量特征C、对调查单位作深入研究D、广泛运用数学方法B5、下述各项调查中属于全面调查的是()。A、对某种连续生产的产品质量进行检验B、某地区对工业企业设备进行普查C、对全面钢铁生产中的重点单位进行调查D、抽选部分地块进行农产量调查B第二章统计调查三、多项选择题部分1、在工业设备普查中()A、工业企业是调查对象B、每个工业企业是填报单位C、每台设备是填报单位D、每台设备是调查单位E、工业企业的全部设备是调查对象BDE2、制定统计调查方案,应确定()A、调查目的和调查对象B、调查单位和填报单位C、调查项目和调查表D、调查资料的使用范围E、调查的时间和时限ABCE3、抽样调查和重点调查的共同点是()A、两者都是非全面调查B、两者选取单位都不受主观因素的影响C、两者都按随机原则选取单位D、两者都按非随机原则选取单位E、两者都可以用来推断总体指标AB4、调查单位是()A、需要调查的总体B、需要调查的总体单位负责人C、调查项目的承担者D、负责报告调查结果的单位E、调查对象所包含的具体单位CE第三章统计整理

教学目的通过本章的学习,要求掌握各种不同类型资料的整理方法、整理原则、以及一些相关的概念,并能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。第三章统计整理在学习过程中主要解决以下几个问题统计整理的意义和方法统计分组的含义和种类统计分组的方法统计分布和分配数列的编制统计表的结构和种类第三章统计整理统计调查搜集上来的资料,不论是哪一种类型的资料都必须经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方法也不同。统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程。一、统计整理的意义和方法

根据某班40名学生统计学考试成绩分析该班学生考试情况。57894984868775737268758297816781547987957671609065767270868589896457838178877261

按成绩等级分组人数(人)各组人数占总人数比重(%)

不及格410.0及格615.0中1230.0良1537.5优37.5 合计 40 100.0 第三章统计整理

再如:通过调查取得100个商业企业某月销售额资料:(单位:万元)20,60,45,90,105,56,250,89,130,30,98,…300。将这些数据资料按“销售额”的多少进行整理,得到下列整理结果:第三章统计整理销售额(万元)企业数(个)0—501250—10025100—15030150—20023250—30010合计100统计整理的方法:分组、汇总、编表第三章统计整理统计分组的含义和种类统计分组:根据研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个部分。统计分组应达到的要求同一组内的单位性质相同,不同组所包括的单位性质相异。二、例如:工业企业按经济类型分组,可分为以下几组:经济类型企业数(个)国有企业1000合资企业200合作经营企业300股份制企业500工业企业按职工人数分组,可分为以下几组:职工人数企业数(个)500人以下50500—10002001000—1500100工业企业按地区分组,可分为以下几组:地区企业数(个)北京市10000天津市8000上海市11000分组标志的选择选择什么样的分组标志,就会形成什么样的分组结果,因此,分组标志的选择是统计分组的关键。选择分组标志的一般原则必须根据统计研究的目的,在对现象进行分析的基础上,抓住具有本质性的区别及反映现象内在联系的标志来作为分组标志。(P81)统计分组的种类按研究任务和作用不同按分组标志的多少不同按分组标志的性质不同类型分组结构分组分析分组简单分组复合分组品质分组变量分组例:按所有制性质划分,我国现有8种经济类型:国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济

例:上海市按GDP计算的三次产业结构(%)1980年1990年1996年 1997年GDP 100 100100100 第一产业 3.2 4.3 2.5 2.3 第二产业 75.7 63.8 54.5 52.2 第三产业 21.1 31.9 43.0 45.5 例:中国农民家庭按收入分组的恩格尔系数(1984年)按收入分组(元)<200<300<400<500<600<800<1000恩格尔系数(%)64.960.256.754.450.549.943.6

第三章统计整理品质分组方法变量分组方法以一个变量值代表一组。如:人口按年龄分组1岁一组,学生按报考科目分组等。这种分组适用于离散性变量,且变量值的个数较少的情况。

以变量值变动的一个区间作为一组,区间的距离称为组距。适用于连续型变量和离散型变量的变量值较多的情况。按品质标志对资料进行分组。这种分组有些比较简单,有些非常复杂,复杂的品质分组称为分类。如:人口按性别分组、按职业分组、企业按经济类型分组、等。单项式分组组距式分组三、统计分组方法第三章统计整理等距分组各组组距均相等。如:10—2020—3030—40以上各组组距均为10。这种分组适用于均匀分布的总体。不等距分组各组组距不一定相等。如:10—2020—5050—6060—70以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。第三章统计整理在进行组距分组时,会涉及到一些问题,包括:等距分组和不等距分组、组限、组中值。组限组限就是每一组两端的数值。10—2020—3030—40下限上限确定组限的方法有两种:间断式确定组限和重叠式确定组限。职工人数(人)99以下100—199200—299300—399固定资产额(万元)50—6060—7070—8080—90间断式确定组限适用于离散变量重叠式确定组限适用于连续变量第三章统计整理组中值每组上限与下限之间的中点数值,是各组的假定平均数。组中值=(上限值+下限值)÷2开口组组中值的计算:缺下限:组中值=本组上限—相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2例如产值(万元)50以下50—6060—7070以上第一组组中值:50-(10÷2)=45最后一组组中值:70+(10÷2)=75第三章统计整理合理确定组中值例如:第一组:50人以下第二组:50—200人按公式应定下限为0注意:当连续型变量按离散变量表示,组距数列的编制采取相邻组限不重叠形式,组中值的确定应考虑到连续型变量自身的特点。(P58)第三章统计整理(一)统计分布

统计分布又称分配数列。它是把总体的所有单位按组归并排列后形成总体中各个单位在各组间的分布。它由两部分组成:总体所分的各个组和各组所拥有的单位数(次数或频数)。四、统计分布和分配数列的编制第三章统计整理工资分组 职工人数(人)各组人数所占比重(元)(次数或频数) (%)(频率)500—60010025600—70020050700—800 10025合计 400 100 频率:各组的频率大于0,各组的频率总和等于1或100%。(二)分配数列的种类

分配数列是在分组的基础上形成的,根据分组时采用的分组标志不同,分配数列可分为:品质分配数列变量分配数列单项式分配数列组距分配数列等距数列不等距数列分配数列(这种数列一般比较稳定,只要分组标准定的比较恰当,通常能准确地反映总体的分布特征。)第三章统计整理(三)分配数列的编制1、品质分配数列的只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:第三章统计整理100250合计4032208100805020国有企业股份制企业合资企业独资企业比重(%)企业数经济类型第三章统计整理2、变量分配数列的其基本步骤为:第一步:将原始资料按数值大小依次排列。第二步:确定变量的类型和分组方法(单项式分组或组距分组)。第三步:确定组数和组距。当组数确定后,组距可计算得到:组距=全距÷组数全距=最大变量值-最小变量值第三章统计整理第四步:确定组限。注意:第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。)第五步:汇总出各组的单位数,计算频率,并编制统计表。注意不同方法确定的组限在汇总单位数时的区别)见教材P89例题间断式确定组限:汇总各组单位数时,按照“上下限均包括在本组内”的原则汇总。职工人数(人)499以下500—599600—699700—799重叠式确定组限:汇总各组单位数时,按照“上组限不在内”的原则汇总。产值(万元)50—6060—7070—8080—90单位数(个)单位数(个)因为有了“上组限不在内”的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。序计划完成工人数比重向上累计向下累计号程度(%)(人)(%)人数比重人数比重160—7021.0270—8052.5380—90147.0490—1003115.55100—1106532.56110—1205226.07120—1302311.58

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论