第二章统计数据调查与整理_第1页
第二章统计数据调查与整理_第2页
第二章统计数据调查与整理_第3页
第二章统计数据调查与整理_第4页
第二章统计数据调查与整理_第5页
已阅读5页,还剩113页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章统计数据调查与整理第1页,共118页,2023年,2月20日,星期一第一节统计数据

一、统计数据的概念

统计数据是对客观现象计量的结果,表现形式有两种:数值型和文字型。第2页,共118页,2023年,2月20日,星期一

二、统计数据的分类(一)按数据的计量层次分类

1、定类数据。数据最低级,将数据按类别属性进行分类,类别间是平等并列的关系。如:某商场将顾客喜爱的顔色分为红色、白色、黄色等。

2、定序数据。数据的中间级,不仅可将数据分成不同类别,且各类别间可通过排序来比较优势。如:人的受教育程度可分为:文盲半文盲、小学、初中、高中、大学、硕士、博士。第3页,共118页,2023年,2月20日,星期一概念:定类尺度数据,使我们统计处理数据中级别最低的数据,它仅用来对数据进行分类。例:例1:下列哪个选项最好地描述了你所在的行业?

A教育工作者

B建筑工人

C制造业工人

D律师

E医生

F其他第4页,共118页,2023年,2月20日,星期一概念:比定类数据高一个级别。除了具有定类数据的特征外,定序数据可以将研究对象进行排序。例1:人事主管可以用定序数据对职工的生产效率从1—N排序。主管可以把其中的一位雇员视为效率最高的,一位视为效率最低的,其他的居中。第5页,共118页,2023年,2月20日,星期一例2:老师所教授的统计学对您

没有用有点用有一定帮助非常有用极其有用

12345第6页,共118页,2023年,2月20日,星期一非测量型数据(nonmetricdata)

概念:说明的是事物的品质特征,是不能用数值表示的,其结果通常表现为类别,这类数据是定类数据和定序数据的形成的.

第7页,共118页,2023年,2月20日,星期一

3、定距数据。是具有一定单位的实际测量值。不仅可知两不同变量值之间存在差异,还可通过加、减运算准确计算出各变量值间的实际差距。如考试成绩。

4、定比数据。也可以称为比例尺度,它与定距尺度属于同一层次,它与定距尺度的区别在于是否有绝对零点。在定距尺度中,“0”表示某一个数值,而定比尺度中,“0”表示“没有”或“无”。例如,温度是典型的定距尺度,因为在摄氏温度中,0℃表示在海平面高度上水结冰的温度;但对于销售人员来说,“0”表示没有成交量,所以销量属于定比尺度。第8页,共118页,2023年,2月20日,星期一3、定距数据(interval-leveldata)

概念:间隔尺度,它不仅能将事物区分为不同类型并进行排序,而且可以准确地指出类别之间的差距是多少。例1:使用华氏温度,可对温度进行排序,并且连续数据如20°,21°,22°之间的热量差是一样的。第9页,共118页,2023年,2月20日,星期一4、定比数据(ratio-leveldata)概念:比率数据,它是在定距尺度的基础上还存在可以作为比较的共同起点或基数.它除了具有定类、定序、定距三种计量数据的全部特性外,还具有一个特性,那就是可以计算两个测度值之间的比值.

第10页,共118页,2023年,2月20日,星期一例:生产周期、工作时间、旅程距离、卡车销售量、每万次飞行的投诉率及员工数量第11页,共118页,2023年,2月20日,星期一测量型数据(metricdata)概念:也称为定量数据,说明的是现象的数量特征,是能够用数值来表现的,这类数据是由定距数据和定比数据计量的.例如:生产工程过程、国家标准测试或标准会计程序中第12页,共118页,2023年,2月20日,星期一四种数据的关系图第13页,共118页,2023年,2月20日,星期一(二)按数据来源分类

第一手数据第二手数据第14页,共118页,2023年,2月20日,星期一(三)按时间状况分类

1、时间序列数据

指在不同的时间上搜集到的数据,反映现象随时间变化的发展情况。

2、截面型数据

指在相同或近似相同的时间点上搜集到的数据,描述现象在某一时刻的变化情况。第15页,共118页,2023年,2月20日,星期一第二节统计数据调查一、统计调查的概念:

就是对统计资料的搜集,它是根据统计研究的目的和任务要求,有组织、有计划地搜集原始资料的工作过程。包括对原始资料和对二手资料的搜集。统计调查专指对原始资料的搜集。二、统计调查工作的要求:

准确、及时、全面、系统。第16页,共118页,2023年,2月20日,星期一调查对象范围全面调查非全面调查调查时间经常调查一次性调查组织形式定期报表专门调查普查全面报表抽样调查重点调查典型调查普查重点调查典型调查抽样调查定期(周期性)不定期三、统计调查的种类和方法第17页,共118页,2023年,2月20日,星期一(一)按调查对象范围可分为☆全面调查——是对构成调查对象总体的所有总体单位,一一进行调查登记的一种调查方式方法。普查和全面统计报表都属于全面调查。☆非全面调查——是对构成调查对象总体的一部分总体单位进行调查登记的一种调查方式方法。

重点调查、抽样调查、典型调查均属此类调查。第18页,共118页,2023年,2月20日,星期一

1、普查

普查是专门组织的一次性的全面调查,它主要用于调查有关国情国力的重要资料在一定时点状态下的数量。如人口普查、工业普查等。

普查的特点:(1)普查是一次性或周期性的。(2)普查要规定统一的调查时点。(3)普查所得数据较全面、详尽、规范。(4)普查使用范围较窄。第19页,共118页,2023年,2月20日,星期一

2、统计报表

是按照国家或上级部门统一规定的表式、统一的指标、统一的报送程序和报送时间自下而上逐级提供基本资料的一种调查方式。

统计报表的优点:(1)内容全面,资料连续(2)报送时间统一、及时(3)资料准确第20页,共118页,2023年,2月20日,星期一种类按报表内容和实施范围分为:国家的、部门的和地方的统计报表按报送周期长短的不同分为:日报、旬报、月报、季报、半年报和年报按报送方式不同分为:邮寄报表和电讯报表电话、电报、传真、网络数据传送。第21页,共118页,2023年,2月20日,星期一

3、抽样调查

按照随机原则从总体中抽取一部分单位作为样本进行观察,取得数据资料,根据样本特征以此对总体数量特征做出具有一定可靠程度的推算的调查方法。

抽样调查的特点:

(1)样本单位是按照随机原则选取(2)结论可用于推断总体(3)抽样误差可事先计算并控制(4)节省大量的人力、财力、物力(5)适用范围广第22页,共118页,2023年,2月20日,星期一

4、重点调查

在调查对象中,只选择其中的一部分重点单位进行的调查,用以掌握所研究现象总体的基本情况。在总体中,这些单位虽数目不多,但就调查的标志值来说,它们的总量在总体中却占有绝对的比重,能够反映出总体的基本情况。

重点调查的特点:

(1)重点单位的选择不带主观因素,但有量的限制(2)其目的在于反映总体的基本情况第23页,共118页,2023年,2月20日,星期一

5、典型调查

根据调查目的,经过对实际情况作了全面的大略考察以后,在被研究对象中有意识地选出个别或少数有代表性的典型单位,进行深入的、周密的调查研究的方法。选择典型单位的基本准则是:要对被研究的社会经济现象进行全面的科学分析,并能反映调查的目的和任务及调查对象本身的特点,总的原则是典型单位不宜选得过多。第24页,共118页,2023年,2月20日,星期一(二)按调查时间分为:

经常性调查与一次性调查

※经常性调查

是随着调查单位情况的变化,随时将变化的情况进行连续不断的登记。例如,产品产量的调查。这类指标的数值变动很大,必须进行经常登记,才能满足需要。第25页,共118页,2023年,2月20日,星期一

※一次性调查

是间隔一定时间,一般是相当长的时期(比如说,一年以上)进行的调查。例如,固定资产总值。这类指标的数值在一定时期内变动不大,往往可以采用一次性调查的方式搜集资料。※经常性调查都是定期调查。一次性调查可以是定期的,也可以是不定期的。第26页,共118页,2023年,2月20日,星期一(三)按组织形式分为※统计报表:是按—定的表式和要求,自上而下统一布置,自下而上提供统计资料的一种统计调查方法。※专门调查:是为了研究某些专门问题,由进行调查的单位专门组织的调查。这种调查,多属一次性调查.如普查、抽样调查、典型调查等。第27页,共118页,2023年,2月20日,星期一二、统计调查方案

一个完整的统计调查方案应包括:确定调查目的;明确调查对象和调查单位;确定调查项目和设计调查表;确定调查时间和调查期限;拟订调查的组织实施计划。第28页,共118页,2023年,2月20日,星期一(一)确定调查目的※明确调查所要研究和解决的问题

要求目的明确,任务具体,以免造成理解不同而使搜集来的资料口径不一。第29页,共118页,2023年,2月20日,星期一(二)确定调查对象和调查单位※明确调查的范围以及向谁调查,由谁来提供具体资料调查对象——是需要研究的社会经济现象的全体,它是由性质相同的许多个别单位所组成的。调查单位——是构成调查对象的个体,是所要调查的具体单位,因此是调查标志的直接承担者。第30页,共118页,2023年,2月20日,星期一填报单位——是指负责提供调查资料的单位注:调查单位与填报单位有时一致有时不一致

例如一致:进行科研机构普查,每个科研机构既是调查单位,又是填报单位。

例如不一致:进行科研机构人员普查,调查单位是每一位科研人员,填报单位则是每一所科研机构。第31页,共118页,2023年,2月20日,星期一(三)确定调查项目和调查表※调查项目

是调查中所要了解的具体内容,是所要反映的调查单位的特征(标志)

注意:

1、根据需要和可能确定调查项目

2、调查项目涵义应明确、具体3、项目之间尽可能有联系第32页,共118页,2023年,2月20日,星期一

※调查表

是把已确定的调查项目按照一定的结构和顺序排列成的表格。

调查表的形式:单一表

适用于调查项目多,调查单位少时。一览表

适用于调查项目不多时,调查单位多时。第33页,共118页,2023年,2月20日,星期一(四)确定调查时间和调查期限※调查时间——调查资料所属的时间※调查期限——进行调查工作的时限,包括搜集和报送资料需要的时间。

例如:生产经营月报,规定基层单位填报时间为次月3日。调查时间一个月,调查期限3天。我国人口普查规定11月1日零时为标准时点,要求普查登记工作在11月10日完成。调查时间11月1日零时,调查期限10天。第34页,共118页,2023年,2月20日,星期一(五)确定调查的组织实施计划※主要内容:

1、调查的组织领导机构和调查人员的组成2、确定调查的方式和方法3、做好调查前的准备工作4、确定调查资料的报送办法4、调查经费的预算开支5、提供或者公布调查成果的时间第35页,共118页,2023年,2月20日,星期一三、统计调查问卷

问卷是调查者根据调查目的和要求所设计的,由一系列问题、调查项目、备选答案、说明等组成的一种调查工具。第36页,共118页,2023年,2月20日,星期一(一)问卷类型与结构1、问卷类型※按问卷的填写者不同可分为:访问式问卷

由调查者向被调查者提问,然后据被调查者的回答填写调查表。应答率、完整率较高;但费用高、压力大、可能拒答、谎答。自填式问卷

尊重隐私权,资料可靠;但应答率、完整率降低,而且不一定独立完成,会影响到质量。

第37页,共118页,2023年,2月20日,星期一

※据传递方式不同可分为:报刊问卷邮政问卷送发问卷访问问卷网络问卷第38页,共118页,2023年,2月20日,星期一2、问卷的基本结构※前言部分:

题目、问候语、填写说明、问卷编号等※主体部分:(问卷的核心内容)调查事项的问题和答案,以及答题说明※结语部分:

调查的基本信息,如时间、地点、调查员姓名等第39页,共118页,2023年,2月20日,星期一(二)问卷设计的程序和形式事前准备问卷设计事后检查确定所需资料确定调查方式确定分析方法提问项目的设计回答项目的设计问题顺序的设计模拟试验问卷修正问卷完成版面格式的设计

1、问卷设计的程序第40页,共118页,2023年,2月20日,星期一2、问卷设计的形式※开放式问题※封闭式问题※量表式问题①评比量表②李克特量表③配对比较量表第41页,共118页,2023年,2月20日,星期一附加内容:量表的类型根据测量尺度

1、类别量表2、顺序量表3、等距量表4、等比量表

第42页,共118页,2023年,2月20日,星期一类别量表

例如:“请问您知道×××牌洗发水吗?”①知道②不知道。注:例中每类答案的代表数值(1,2)只作分类之用,不能作数值计算。第43页,共118页,2023年,2月20日,星期一顺序量表

例如,“请在下列数字后依次给出您最喜欢的洗发水品牌、第二喜欢的品牌、第三喜欢的品牌……”

1.____________2.____________3.____________4.____________5.____________第44页,共118页,2023年,2月20日,星期一等距量表

例:“请您用10分制对×××公司的满意度进行打分,1分表示很不满意,10分表示很满意”

很不满意12345678910很满意第45页,共118页,2023年,2月20日,星期一等比量表

表示各个类别之间的顺序关系成比率的量表,它有一个正、真正的零点,比如对身高、体重、收入等变量的测量第46页,共118页,2023年,2月20日,星期一尺度量表得注意事项:

1、顺序量表是一种比较粗略的量表,它既无相等单位又无绝对零点,只是把事物按某种标准排一个顺序。

2、等距量表是一种有相等单位但没有绝对零点的量表,因此它只能做加减运算,不能做乘除运算。

3、比例量表既有绝对零又有相等单位,因此它除了可以测量对象之间的差别,还可以确定它们之间的比例。第47页,共118页,2023年,2月20日,星期一量表的类型根据态度答案数目1、平衡量表2、不平衡量表第48页,共118页,2023年,2月20日,星期一平衡量表和不平衡量表例:例如:“您对某超市服务态度有什么看法?”若答案为:非常好、很好、好、一般、不好、很差、非常差、(平衡表)若答案是:非常好、很好、好、一般、不好,(不平衡量表)第49页,共118页,2023年,2月20日,星期一四种类别尺度、变量与量表得关系图

第50页,共118页,2023年,2月20日,星期一市场调查常用的几种量表1、评比量表

2、鲍氏社会距离量表

3、李克特量表(Likertscale)

4、语义差异量表

5、数值化量表和多平等量表6、配对比较量表

第51页,共118页,2023年,2月20日,星期一1、评比量表

评比量表:是市场调查中最常用的一种顺序量表,调查者在问卷中事先拟定有关问题的答案量表,由回答者自由选择回答第52页,共118页,2023年,2月20日,星期一1、评比量表第53页,共118页,2023年,2月20日,星期一1、评比量表结构特点A、量表的两端为极端性答案B、在两个极端之间换分为若干阶段,阶段可多可少,少则3个阶段,多则5个、7个或7个以上阶段第54页,共118页,2023年,2月20日,星期一2、鲍氏社会距离量表例:探讨美国人与阿尔巴利亚人交往的意愿,可能会询问美国人如下问题:你愿意让阿尔巴尼亚人住在你的国家吗?你愿意让阿尔巴尼亚人住进你的社区吗?你愿意让阿尔巴尼亚人住在你家附近吗?你愿意让阿尔巴尼亚人住在你的隔壁吗?你愿意让你的孩子与阿尔巴尼亚人结婚吗?第55页,共118页,2023年,2月20日,星期一3、李克特量表(Likertscale)

是问卷设计中运用十分广泛的一种量表。是要求受访者表明对某一表述赞成或否定。但是它并不是受访者对这些问题的态度是简单的同意或不同意两类,而是将赞成度分为若干类,范围从非常赞成到非常不赞成,中间为中性类。它通过回答选项的类型增多,人们在态度上的差别就能充分体现出来

第56页,共118页,2023年,2月20日,星期一3、李克特量表例:您给下面的观点打分:很同意(5分)比较同意(4分)讲不清(3分)不太同意(2分)很不同意(1分)1、越是有钱,越应该参加保险2、年轻人没有必要买养老保险3、只有人们的收入达到一定的水平,才会考虑保险4、我不太爱生病,没必要参加的医疗保险……10.目前保险定价合理第57页,共118页,2023年,2月20日,星期一3、李克特量表的具体设计步骤

(1)收集大量(50~100)与测量的概念相关的陈述语句(2)有研究人员根据测量的概念将每个测量的项目划分为“有利”或“不利”两类第58页,共118页,2023年,2月20日,星期一3、李克特量表的具体设计步骤选择部分受测者对全部项目进行预先测试,要求受测者指出每个项目是有利的或不利的,并在下面的方向-强度描述语中进行选择,一般采用所谓“五点”量表“五点量表”:a.非常同意b.同意c.无所谓(不确定)d.不同意e.非常不同意。十分同意5分,同意4分,未定3分,不同意2分,十分不同意1分;消极语句的给分方法恰好相反:十分同意1分,同意2分,未定3分,不同意4分,十分不同意5分。(第59页,共118页,2023年,2月20日,星期一3、李克特量表的具体设计步骤根据受测者的各个项目的分数计算代数和,得到个人态度总得分,并依据总分多少将受测者划分为高分组和低分组。截取最高分数端的25%为高分组,最低分数端的25%为低分组。第60页,共118页,2023年,2月20日,星期一3、李克特量表的具体设计步骤选择有鉴别力的语句,组成正式量表。

量表制成后,其使用方法是:让应答者对每一语句作答复,然后转换成分数,并累加起来,这样就可以得到每一位应答者的态度分数,把所有应答者的得分平均起来,则可得出受调查者对该评价对象的总体态度。如果这些受调查者具有代表性,则可以推论出一般消费者的态度。第61页,共118页,2023年,2月20日,星期一4、语义差异量表语义差异量表又叫语义分化量表,要求受访者在两个极端之间进行选择。第62页,共118页,2023年,2月20日,星期一语言的因素类型评价性(evaluation)力量性(potency)活動性(activity)好的-壞的硬的-軟的主動的-被動的正向的-負向的强壯的-軟弱的快速的-緩慢的乐观的-悲觀的重的-輕的热-冷完成的-未完成的严肃的-寬大的兴奋的-平靜的合時宜的-不合時宜的固執的-服從的

第63页,共118页,2023年,2月20日,星期一语义差异量表的应用范围1、品牌形象的評估2、企业形象的研究3、政治议题4、人格測量5、组织研究第64页,共118页,2023年,2月20日,星期一5、数值化量表和多平等量表第65页,共118页,2023年,2月20日,星期一6、配对比较量表

所谓配对比较量表是通过配对比较的方法来测量人们态度的一种量表例:某可乐饮料经销者非常想了解几种牌子的可乐饮料在消费者心目中的地位的测试第66页,共118页,2023年,2月20日,星期一配对比较量表的步骤1、我们先将四个品牌其两两组合成六队,要求受访者(100名)成对比较,并指出何者为佳。2、选择答案为好的入选计数。

第67页,共118页,2023年,2月20日,星期一配对比较量表的步骤3、为了更进一步分析,可将次数转化为频率。同时将各牌子与自己比较的比率均为0.5,将每栏的比率相加,就可得出各种牌子的态度值。如表下表所示。第68页,共118页,2023年,2月20日,星期一配对比较量表的步骤4、四种牌子的态度值相比,选择最高值。第69页,共118页,2023年,2月20日,星期一推荐问卷调查设计网址/第70页,共118页,2023年,2月20日,星期一

四、统计调查误差(一)统计调查误差的含义和种类※统计调查误差,就是调查结果所得的统计数字与调查总体实际数量表现的差别。※例如,如果对某市的工业总产值进行统计调查的结果为30亿元,而该市工业总产值实际值为31亿元,那么,统计调查的误差就是1亿元,或3.2%。第71页,共118页,2023年,2月20日,星期一※登记误差:

是由于调查过程中各个有关环节上的工作不准确而带来的。产生登记误差的主要原因是计量错误,记录错误,计算错误,抄录错误,在逐级上报道程中的汇总错误,被调查者所报不实或调查者有意虚报瞒报,以及调查方案的规定不明确,等等。登记误差在全面调查和非全面调查中都会产生第72页,共118页,2023年,2月20日,星期一※代表性误差:

是在用样本数据推断总体时由于代表性不足所产生的误差。非全面调查从总体产抽出一部分单位进行观察,并用根据这部分单位算出的指标来估计总体的指标,这同总体的实际指标会有一定差别,这就是代表性误差产生的原因。代表性误差,只有在非全面调查中才有,全面调查不存在这类误差。第73页,共118页,2023年,2月20日,星期一(二)统计调查误差的控制※首先要正确制定统计调查方案,详细说明调查项目和计算方法,合理选定调查方法,使之切合调查对象的实际,并使调查人员或填报人员能够明确执行,不致产生误解。※其次,有科学的统计调查方案,还要切实抓好调查方案的贯彻执行工作。第74页,共118页,2023年,2月20日,星期一

※关于代表性误差的控制:

若是重点调查和典型调查,则调查进行前应该从多方面加以研究,并广泛征求有关方面意见,使选出的调查单位具有较高的代表性;如是抽样调查则应严格遵守随机原则,适当增加样本容量。第75页,共118页,2023年,2月20日,星期一第三节统计数据整理一、统计整理的概念※统计整理是指对调查所得到的原始资料进行分类、汇总,使之系统化、条理化的工作过程。统计整理是统计工作的第三阶段。这个阶段是统计调查的继续和深化,是统计分析的基础和前提。第76页,共118页,2023年,2月20日,星期一

二、统计资料整理的程序和内容(一)统计整理的程序

1、设计统计整理方案2、资料审核3、对资料进行分组和汇总4、编制统计图表5、统计资料的积累和保管第77页,共118页,2023年,2月20日,星期一(二)统计整理的内容

1、审核统计资料——统计整理的前提包括:完整性、准确性、及时性。2、进行统计分组——统计整理的关键

3、进行资料的汇总——统计整理的核心

4、编制统计表或统计图——统计整理的结果第78页,共118页,2023年,2月20日,星期一

三、统计分组(一)统计分组的概念和种类

1、统计分组的概念

根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究对象的总体划分为若干个不同性质的组或部分。第79页,共118页,2023年,2月20日,星期一※统计分组应遵循的原则穷尽原则

是指在所做的全部分组中,必须保证每一个单位或个体都能归属于某一组,不能有所遗漏。

互斥原则是指每一个单位或个体只能归属于某一组,不能在其他组中重复出现。第80页,共118页,2023年,2月20日,星期一

2、统计分组的种类(1)按分组标志的性质不同分为:(2)按分组标志的多少不同分为:品质标志分组

数量标志分组简单分组

复合分组

体系分组

第81页,共118页,2023年,2月20日,星期一例1:为了了解某地区银行存款的构成,可以选用存款性质、期限两个标志分别进行分组:按存款性质分组企业存款储蓄存款财政性存款按存款期限分组活期存款定期存款简单分组复合分组存款同时按其性质及期限分组企业存款活期定期储蓄存款活期定期财政性存款活期定期例2:职工按工龄分组:5年以下5~10年10~15年15~20年20年以上品质标志分组数量标志分组第82页,共118页,2023年,2月20日,星期一(二)统计分组的方法

※统计分组的关键在于选择分组标志和划分各组界限1、选择分组标志——统计分组的核心问题

分组标志:是将总体区分为性质不同的组的标准或依据

选择分组标志的原则:※结合一定的历史条件或经济条件※根据统计研究的目的和任务※选用那些最能反映现象本质特征的标志作为分组的依据第83页,共118页,2023年,2月20日,星期一2、选择分组种类品质标志分组数量标志分组单项式分组组距式分组主要根据研究任务来选择。(根据数量变动的特征不同来选择)第84页,共118页,2023年,2月20日,星期一

※分组标志确定之后,必须解决分组组数和各组界限的划分,即分组的具体方法问题。

※根据分组标志的特征不同,统计总体可以按品质标志分组,也可以按数量标志分组。第85页,共118页,2023年,2月20日,星期一按品质标志分组

就是选择反映事物属性差异的品质标志作为分组标志,并在品质标志的变异范围内划定各组界限,将总体划分成为若干个性质不同的组成部分例如:人口按性别分组,可分为男、女两组;企业按所有制分为全民、集体、合营、个体等组第86页,共118页,2023年,2月20日,星期一按数量标志分组

就是选择反映事物数量差异的数量标志为分组标志,并在数量标志的变异范围内划定各组界限,将总体划分为性质不同的若干组成部分。例如:居民家庭按子女数分组,可分为0人(无子女)、1人、2人、3人;等等。

第87页,共118页,2023年,2月20日,星期一(1)单项式分组与组距式分组如果变量的变异较小,我们可以将每个变量值单列一组,这种分组称为单项式分组。如果变量的变异较大,则可以把变量的整个取值范围依次划分为若干个区间,这样的分组称为组距式分组。第88页,共118页,2023年,2月20日,星期一区间的最大值称为上限区间的最小值称为下限上限与下限之差为组距,即:组距=区间的上限值-区间的下限值第89页,共118页,2023年,2月20日,星期一(2)等距分组与异距分组

按总体内各组组距是否完全相等,数量标志分组又可以分为等距式分组与异距式分组。

等距式分组适用于总体各单位的变量值由小到大呈现均匀变化的情况。

异距式分组则适用于总体各单位的变量值由小到大呈现不均匀变化的情况。第90页,共118页,2023年,2月20日,星期一(3)间断组距式分组与连续组距式分组

间断组距式分组:组限不相连。这种分组方法主要适用于离散型变量。

连续组距式分组:相邻两组的上下限重叠。这种分组方法主要适用于连续型变量。第91页,共118页,2023年,2月20日,星期一3、划分分组界限☆按品质标志分组只要根据事物的性质划分界限。目前我国实践中有制定和实施的几种最重要的、基础性国家分类标准。☆按数量标志分组要根据事物的数量变动来判断事物性质上的差异。注意客观界限。第92页,共118页,2023年,2月20日,星期一

第四节频数分布一、频数分布的概念在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各个单位数在各组间的分布,就叫做次数分布。分布在各组的个体单位数叫次数,又称频数。各组次数与总次数之比称比率,又称频率。第93页,共118页,2023年,2月20日,星期一

由于分组是次数分布的基础,因此有怎样的分组就形成怎样的次数分布。次数分布的类型,可归纳为:次数分布品质数列数量数列单项数列组距数列等距数列异距数列间断组距数列连续组距数列二、分布数列的种类第94页,共118页,2023年,2月20日,星期一

根据分组标志特征的不同.分布数列分为☆品质数列——属性数列按品质标志分组形成的分布数列☆数量数列——变量数列按数量标志分组形成的分布数列第95页,共118页,2023年,2月20日,星期一例1:某地人口的性别分布按性别分组次数人数(人)比重(%)男女154349271461329751.3748.63合计30048224100.00例2:学生的成绩分布学生按成绩分组x次数学生数(人)f比重(%)f/∑f60以下60-7070-8080-9090以上2820155416403010合计50100变量数列品质数列第96页,共118页,2023年,2月20日,星期一三、变量数列的编制

变量数列由各组变量值x和次数f(f/∑f)构成1、确定变量数列的形式根据变量的性质及特点选择不同的变量数列2、将变量值按顺序排列,并计算全距全距(R)=最大变量值-最小变量值第97页,共118页,2023年,2月20日,星期一3、确定组距和组数。对于等距分组

组距=全距/组数组数过多,组距太小,要避免将相同性质的单位分到不同组中去;反之,如果组数过少,组距太大,要避免将不同性质的单位分到同一组中去。第98页,共118页,2023年,2月20日,星期一当偏度系数不大时,用斯特吉斯(H.A.Sturges)经验公式确定组数:k为组数,N为总体单位数,d为组距R为全距,即最大值(xmax)与最小值(xmin)的差。根据这个公式,可得出如下的组数参考标准:N15~2425~4445~8990~179180~359k56789第99页,共118页,2023年,2月20日,星期一

4、划分组限(1)客观数量界限(2)第一组的下限和最后一组的上限。有极端值时,第一组和最后一组可采用开口组(3)尽可能采用5或10的倍数

5、计算各组次数第100页,共118页,2023年,2月20日,星期一四、累计频数与累计频率☆向上累计频数(频率):将各组次数(频率)由变量值低的组向变量值高的组累计,用以反映各组上限以下的累计次数或累计频率。☆向下累计频数(频率):将各组次数(频率)由变量值高的组向变量值低的组累计,用以反映各组下限以上的累计次数或累计频率。第101页,共118页,2023年,2月20日,星期一五、频数分布的类型各种不同性质的社会经济现象都有着特殊的次数分布。概括起来,主要有下列几种类型:☆钟形分布☆U形分布☆J形分布第102页,共118页,2023年,2月20日,星期一1、钟形分布钟形分布的符征是“两头小、中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少。绘成曲线图,宛如一口古钟。第103页,共118页,2023年,2月20日,星期一☆钟形分布具体可分为对称分布和非对称分布对称分布的特征是中间变量值分布的次数最多,两侧变量值分布的次数则随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布,如图①。第104页,共118页,2023年,2月20日,星期一

对称分布中的正态分布最为重要,许多社会经济现象统计总体的分布都趋近于正态分布。例如:农业平均亩产量的分布、零件公差的分布、商品市场价格的分布等。正态分布在社会经济统计学中具有重要意义。在非对称的分布中,有不同方向的偏态,如图②、③所示。第105页,共118页,2023年,2月20日,星期一第106页,共118页,2023年,2月20日,星期一2、J形分布☆正J形分布是次数随着变量值的增大而增多,绘成曲线图,犹如英文字母“J”字。☆反J形分布是次数随着变量值的增大而减少,绘成曲线图,犹如反写的英文字母“J”字。见图:第107页,共118页,2023年,2月20日,星期一

在社会经济现象中,有些统计总体呈J形分布例如:资本主义社会中,投资额按利润率大小分布,一般均呈正J形分布;而人口总体按年龄大小分布,则一般均呈反J分布。第108页,共118页,2023年,2月20日,星期一3、U形分布☆U形分布的待征与钟形分布恰恰相反,靠近两端的变量值分布的次数多,靠近中间的变量值分布的次数少,形成“两头高、中间低”的分布持征。绘成曲线图,象英文字母“U”字。第109页,共118页,2023年,2月20日,星期一

有些社会经济现象的分布表现为U形分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论