第二章-统计调查与统计整理_第1页
第二章-统计调查与统计整理_第2页
第二章-统计调查与统计整理_第3页
第二章-统计调查与统计整理_第4页
第二章-统计调查与统计整理_第5页
已阅读5页,还剩114页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1教学目标与重难点统计调查、整理和显示第二章1.了解数据的计量尺度与数据的类型2.了解统计调查方式、收集方法3.掌握统计调查的常见的组织形式4.掌握调查方案的设计5.会用excel生产数据频数分布表。2第一节

数据的计量与类型3一、数据的计量尺度**(一)定类尺度(nominalscale)

1.概念:又称列名尺度或类别尺度,是按照事物的某种属性对其进行平行的分类或分组。

2.举例:人的性别、籍贯、民族;企业的所有制性质、行业隶属。

3.特征

(1)只能区分事物的类别,无法比较优劣或大小。(2)对事物的区分必须遵循穷尽和互斥的原则。(3)对定类尺度计量分析的统计量主要是频数和频率。

4(二)定序尺度(ordinalscale)1.概念:又称顺序尺度,它是对事物之间等级或顺序差别的一种测度。2.举例:教师的职称(助教、讲师、副教授、教授)、学历(本科、研究生、博士),商品的质量等级(一等品、二等品、三等品)。

3.特征

(1)对事物可以分类、比较优劣和大小。(2)对事物的分类要求穷尽和互斥。(3)对定序尺度计量分析的统计量除频数和频率外,还有累计频数和累计频率。

5(三)定距尺度(intervalscale)

1.概念:又称间隔尺度,是对事物类别或次序之间的间隔进行的一种测度。2.举例:学生的考试成绩、人的身高、温度等。

3.特征

(1)能分类、排序、比较大小,计量差距。(2)没有绝对零点,即定距尺度的计量值可以为0,这里的0表示一个数值。“0”表示“0”水平,而不表示“没有”或“不存在”。例1:一个学生的统计学成绩为0,表示统计学成绩水平为0,并不是说没有考试成绩或没有统计学知识。例2:一个地区的温度为0摄氏度,表示一地温度的水平。由此可见,定距尺度中的0是一个有意义的值。6(四)定比尺度(ratioscale)

1.概念:也称比率尺度,它与定距尺度属于同一层次,其计量的结果也表示为数值。除了具备前三种计量尺度的特性外,还有一个特性,那就是两个测度值之间的比值。2.举例:人的收入支出、企业的产值利润、某地区的人口总数、失业人数等。3.特征(1)分类、排序、比较大小、求出差异、计算两个数值之间的比率。(2)具有绝对零点,即数字“0”表示“没有”或“不存在”。

**应用:举一现实生活中的例子说明定比尺度的两个特征。例1:一个人的月工资收入为600,另一个人的为300,那么我们可以得出第一个人的工资是第二个人的两倍。例2:一个人的身高为0,那么表示这个人不存在。

7表2-1四种计量尺度的比较8二、数据的类型(一)数据的类型和表现形式1.定性数据(品质数据)(1)概念:说明事物的品质特征,不能以数值表示,只能以文字表述,由定类和定序尺度计量形成。

(2)举例:高校教师职称有助教、讲师、教授等。2.定量数据

(数量数据)(1)概念:说明现象的数量特征,以数值表示。由定距和定比尺度计量形成。

(2)举例:考试成绩80分、95分、100分,身高1.73米、1.80米等。**应用:举例说明还有哪些常见的定性数据和定量数据。9(二)变量及其类型1.变量的含义

说明现象某种属性或数量特征的概念称为变量。统计数据就是变量的具体表现。2.变量的类型(1)品质变量:反映事物品质特征的名称,表现为定性数据。如教师职称。(2)数值变量:反映事物数量特征的名称,表现为定量数据。如人的身高。3.数值变量的分类(1)离散变量:只能取有限个值,间断计数的变量。如人口数、设备台数等。(2)连续变量:可以取无穷多个值,连续计数的变量。如产值、利润、收入、年龄等。思考:一个灯泡的寿命X是什么变量?10三、统计数据的表现形式(一)两种基本表现形式

1.绝对数时期数(反映现象在一段时期内的总量)

时点数(反映现象在某一瞬间上的总量)2.相对数:两个绝对数的比值,反映事物的相对数量。(二)绝对数的计量单位1.实物单位:根据事物的具体属性和特点,如车以辆为单位。2.价值单位:以货币形式对现象进行度量。3.复合单位:由两种计量单位复合而成的。(三)比例:一个总体中各个部分的数量占总体数量的比重。

比率:各不同类别的数量的比值。11第二节统计数据的收集12当一项统计工作开始时,我们就要明确需要准备哪些资料,进而要考虑如何收集资料以及到哪里去收集资料,是采用间接的现成材料还是要直接亲自收集。对于直接引用现成资料,我们要熟知有哪些统计资料可以直接用,比如各级政府的公报、年鉴、各种专业数据库等。另外,需要掌握现代的检索方法,以便更快更有效的收集到所需要的信息。若是所要收集的资料需要我们自己去搜集的话,要明确要采取什么样的研究方式。一般有两种方法取得资料:实验式(P17)和非实验式(P17)(观察法)。

统计数据的直接来源渠道有二:一是专门组织调查,二是科学实验。专门组织调查是取得社会经济数据的重要渠道,而科学实验是取得自然科学数据的主要渠道。下面我们重点讨论取得社会经济数据的方式和方法。13一、按调查对象包括的范围分类

全面调查非全面调查调查范围普查全面统计报表典型调查重点调查抽样调查一、统计调查的组织形式14(一)普查指为某一特定目的而专门组织的一次性全面调查。作用特点重大国情国力的基本统计信息可以为抽样调查提供抽样框可以搜集统计报表所不能提供的反映通常是一次性的或周期性的。由于需要大量的人力、物力和财力,不宜经常进行一般需要规定统一的标准调查时间,以避免重复和遗漏。人口普查7月1日零时数据一般比较准确,规范化程度较高适用对象较狭窄,一般是最基本、最一般现象的时点状况普查15指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断总体的数量特征的一种非全面调查组织方式抽样调查机理优点按随机原则抽取样本单位目的是推断总体的数量特征抽样误差可以事先计算并控制能用较少的人力、物力和时间达到全面调查的目的(经济性、时效性)广泛性适用于对各个领域、各种问题的调查调查资料的准确性较高、受人为干扰的可能性较小随机原则(二)抽样调查16(三)统计报表

优点局限能保证统计资料的全面性和连续性能保证统计资料的统一性和及时性能满足各级部门对统计资料的需要统计报表过多会增加基层负担有可能由于虚报瞒报而影响统计资料质量指按照国家有关法规的规定,自上而下的统一布置、自下而上地逐级提供基本统计数据的一种调查方式(统一表式、内容、时间和程序)类型统计报表按实施范围不同:国家、部门、地方报表按调查范围不同:全面、非全面报表按报送周期长短:日、旬、月、季、半年、年报按填报单位不同:基层、综合按报送方式不同:电讯报表、书面报表17只适用于客观存在着重点单位的情况重点调查这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况作用局限能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。重点单位(四)重点调查重点调查的关键是要选择好重点单位。重点单位的选择着眼于标志量的比重,因而重点单位的选择具有客观性18典型调查在对调查对象有一定了解的基础上,有意识地选择若干具有代表性的典型单位进行调查的一种非全面调查组织方式一定条件下能估计总体指标数值可以补充全面调查的不足可以用来研究新生事物不能确定推断的把握程度,无法计算和控制推断误差作用局限(五)典型调查19抽样调查、重点调查与典型调查的区别一是:调查单位取得方式不同。重点调查是选择为数不多但标志量占总体标志量绝大比重的单位进行调查;抽样调查中的样本单位是按照随机原则从研究总体中抽取的,具有较高的代表性;典型调查时对总体情况分析的基础上有意识的抽选出的调查单位。二是:研究的目的不同。重点调查时为了了解现象总体的一般情况,但不能推断总体总量;而抽样调查的目的在于在于以样本量来推断总体总量,研究总体的数量特征;典型调查说明总体的发展变化规律。三是:推断的可靠程度不同。抽样调查的结果最具有科学性,其他两种具有一定代表性。四是:适用场合不同。

重点调查适用于部分单位可以比较集中地反映所研究的项目;抽样调查最适宜于那些不能或者很难进行全面调查而又需要全面数值的场合,比如研究检查产品质量合格状况。典型调查适用于对总体现象进行分析,通过典型反映规律。抽样调查、典型调查与重点调查之间的根本区别在于选取调查单位的方法不同。20二、统计数据的来源212223三、数据的收集方法P20-21(一)访问调查:通过面对面的交谈获取资料。(二)邮寄调查:通过邮寄或其他方式将调查问卷送至被调查者,由被调查组填写,然后寄回或投放到指定收集点的方法。(三)电话调查:调查人员利用电话通受访者进行交流获取资料的方式。(四)座谈会:也称集体访谈法。(五)个别深度访问:一次只有一名受访者参加的特殊的定性研究。24四、统计调查方案的设计(一)确定调查的目的和任务(为什么调查)这是设计方案的首要问题。(二)确定调查对象和调查单位(向谁调查)1.调查对象:需要进行调查的某一社会经济现象的总体。对应于统计总体。2.调查单位:调查对象中需要调查的具体单位。对应于总体单位。它是调查资料的直接承担者。3.报告单位:指调查资料的提交者。(三)确定调查项目(调查什么)

25统计调查方案用来指导整个调查工作的纲领性文件,是统计设计在统计调查阶段的具体化.

一、确定调查目的二、确定调查对象和调查单位三、确定调查项目和调查表四、确定调查时间和调查期限五、制定调查的组织实施计划26一、确定调查目的——明确调查所要研究和解决的问题

要求目的明确,任务具体,以免造成理解不同而使搜集来的资料口径不一。例如:①了解银行的基本情况了解各项方针政策在银行的执行情况了解银行机构设置和人员配备情况②对农民经济情况进行调查从农业生产方面来研究从农民消费方面来研究2728二、确定调查对象和调查单位——明确调查的范围以及向谁调查,由谁来提供具体资料。调查对象需要研究的社会经济现象的全体,它是由性质相同的许多个别单位所组成的。调查单位构成调查对象的个体,是所要调查的具体单位,因此是调查标志的直接承担者。例如:要了解银行的经营状况,则所有的银行是调查对象,每一银行是调查单位。29例如:农业人口统计一、常住人口中直接参加农林牧渔业生产活动的劳动力及赡养人口二、兼营农业和非农业劳动者,全年从事农业生产活动时间累计达到或超过四个月的三、如果不足四个月,但农业纯收入占总纯收入比重超过50%的

30调查单位填报单位与一致不一致进行科研机构普查,每个科研机构既是调查单位,又是填报单位。进行科研机构人员普查,调查单位是每一位科研人员,填报单位则是每所科研机构例如有时一致有时不一致填报单位指负责提供调查资料内容的单位当调查单位自己负责向上报告时,它同时也是填报单位;当调查单位的资料由它的上级组织收集整理并向上报告时,填报单位与报告单位则不一致。31三、确定调查项目和调查表(调查问卷的设计)调查项目——调查中所要了解的具体内容,是所要反映的调查单位的特征(标志)

调查表——把已确定的调查项目按照一定的结构和顺序排列成的表格。

单一表:适用于调查项目多,调查单位少时。一览表:适用于调查项目不多时,调查单位多时。注意:1、需要且可能(少而精)2、涵义明确、具体3、项目之间尽可能有联系32适用于调查项目多,调查单位少时将一个调查单位的项目登记在一份表或一种卡片上。这便于容纳较多的项目,且便于整理、分类,缺点是繁琐。单一表33身体发育状况调查表

适用于调查项目不多时,调查单位多时把许多调查单位和相应的项目按次序登记在一张表格里。这便于汇总,但缺点是分不开,故调查深度不够;编号:一览表341、问卷设计的步骤1).根据研究目的建立分析架构2).决定问卷之形式3).编拟问卷初稿4).邀请专家学者检查、修订问卷5).预试问卷6).问卷定稿并订定使用说明352、问卷的基本结构

问卷的基本结构开头部分甄别部分主体部分背景部分问候语,

填写说明,

问卷编号

也称过滤,通过一些问题筛掉不符合条件的被调查者。要调查的全部问题,以及这些问题可供选择的答案。被调查者的性别,职业,收入,文化程度,婚姻状况等363.问卷中问题的设计

(1)提问的内容尽可能短。

问题中应该坚决摒弃多余的修饰词,提问

的内容尽可能的短,若问题比较复杂,应将

其分为几个问题来问。“我国越来越多的人去国外旅游。您曾经去别的国家旅游过吗?如果去过,您也许是为了欣赏风光才去的。那么,别国的风光对您决定出国旅游有多重要?”Q1:您出国旅游过吗?1、是2、否(终止访问)Q2:那里的风光对您决定去旅游有多重要?37(2)用词要确切通俗,避免不具体的问题问卷中的用词要确切、通俗,应容易被人理

解,应避免使用过于专业的术语(例如严重急性呼吸系統綜合症);设计的问题要适合所有被调查者;提问目的要明确,避免模棱两可。

Q:您对本餐厅是否满意?□1.满意□2.一般□3.不满意

满意一般不满意Q1:您对本餐厅饭菜质量是否满意?□□□Q2:您对本餐厅环境设施是否满意?□□□Q3:您对本餐厅服务态度是否满意?

□□□38(3)一项提问只包含一项内容一个问句最好只问一个要点。一个问句中如果包含过多询问内容,会使被调查者无从答起,给统计处理也带来困难。你经常看电影和电视吗?39(4)避免诱导性提问

应避免诱导性、暗示性的提问。诱导性

提问会导致两个不良后果:被调查者不加考虑就同意所诱导问题中暗示的结论;由于诱导性提问大多是引用权威或大多数人的态度,被调查者就会产生心理上的顺向反应。

“绝大多数饮用过光明奶的人都认为它口味纯正,

您认为是这样吗?”

40(5)避免否定形式的提问否定式的提问会影响到被调查者的思维,

或容易造成相反意愿的回答。

Q:您不认为听到国歌不立正不是不对的吗?□1.是□2.不是41(6)避免敏感性问题敏感性问题是指与个人或单位的隐私或私人利益有关而不便向外界透露的问题。问卷中要尽量避免提问敏感性问题或容易引起人们反感的问题,对敏感性问题的调查应当在提问的方式上进行推敲,尽量采用间接询问的方式,用语也要特别婉转,以降低问题的敏感程度。

你是否在考试中作过弊?您是否有酒后驾车行为?

424.问卷中答案的设计

开放性问题是指对问题的回答未提供任何具体的答案,由被调查者根据自己的想法自由做出回答,属于自由回答型。

封闭型问题是指对问题事先设计出了各种可能的答案,由被调查者从中选择。

封闭型问题答案的设计方法主要有:两项选择法、多项选择法、顺序选择法、评定尺度法等。

43(1)、二项选择法二项选择法也称二分法,即提出的问题只有两种答案:“是”或“否”,“有”或“无”等。这两种答案是对立的、排斥的,被调查者的回答非此即彼,不能有更多的选择。如:

您是否购买了笔记本电脑?A、是B、否(一)问卷中答案的设计方法44(2)、多项选择法

有些问题还需要采用选择多个答案,以统计出多个答案的重要性及差别。

Q1您购买山地自行车的原因是()(可多选)A、经济条件许可

B、用于代步工具

C、便于郊外旅游,锻炼身体

D、别人有你也想有,赶时髦

E、作为礼物送给亲人朋友

F、其它

45(3)、顺序选择法顺序选择法的问题是列出若干个答案,

要求被调查者按其重要性或记忆的先后顺序将它们一一排列。

Q:您在找工作的过程中遇到的主要问题是(请您依次排序)()A专业不对口B没有本地户口C缺乏社会关系D招聘信息不足E性别歧视F其他

46(4)、评定尺度法评定尺度法也称量表法,量表是一种工具,

是将一些主观的、抽象的概念定量化。

Q:您对我校教学评估体系总体感觉如何?A、非常满意B、比较满意C、一般D、不太满意

E、非常不满意

47(二)、设计问题答案时的注意事项答案要穷尽。答案要互斥。您上月的支出中花费最多的是:A食品B服装C书籍D饮料E其它485.设计问题顺序应注意的问题(1)问题的安排应具有逻辑性;(2)问题的安排应先易后难、由浅入深;(3)问卷主体部分的问题通常按过滤性、热身性、容易性、困难性的顺序进行排列。49四、确定调查时间和调查期限

调查时间是指调查资料所属的时间

时期现象,是现象变动过程的起迄时间。

时点现象,要明确规定统一的标准时点。

调查期限是指进行调查工作的时限,包括搜集和报送资料需要的时间。

我国人口普查规定7月1日零时为标准时点,要求普查登记工作在7月10日完成。调查时间调查期限例如:

7月1日零时十天50思考我国第五次人口普查规定,2000年11月1日零时为普查登记的标准时点,要求2000年11月10日以前完成普查登记。请问:1.调查时间是多少?

2.调查期限是多少?51五、确定调查的组织实施计划——调查工作顺利开展的保证主要内容:调查的组织领导机构和调查人员的组成;调查前的准备工作,如宣传教育、干部培训等;明确调查的方式和方法;制定调查工作程序和进度安排调查经费的预算开支;提供或者公布调查成果的时间以及其他事项。52

游客对宽窄巷子历史街区景观偏好调查问卷您好!首先非常感谢您抽出宝贵时间来做答问卷。我是四川大学旅游管理专业的研究生,现正在做游客对宽窄巷子景观偏好的硕士论文,需要耽误您几分钟宝贵的时间回答以下问题并根据照片结合个人感受给予评价。本问卷不用署名,只作为研究所用。再次非常感谢您的配合!第一部分宽窄巷子景观偏好调查6.请对以下1-32张图片展示的宽窄巷子街区景观的喜好进行评分,分值1-5之间,其中1分代表不喜欢,2分代表不太喜好,3分代表中立,4分代表比较喜好,5分代表喜好),并回答问题。例如图1:(1)请根据您对该街区景观的喜好程度进行打分()A、1分B.2分C3分D.4分E.5分(2)请选出该景观使您产生好感的方面()(可多选)A.颜色美B.形态美C.结构布局合理D.历史文化内涵E.现代感F.怀旧感G创意感H.有意境I.无好感J.参与性强(3)请指出该景观使您获得哪方面的满足感()(可多选)A.视觉享受B.增长知识和信息C.情感上的满足D.获得新的感悟E.无满足感第二部分人口学统计特征1、您的性别:()A、男B、女2、您的年龄段:()A、18岁以下B、19-30C、31-50D、51-60F、60以上3、您的教育程度:()A、初中及以下B、高中及中专C本科或大专D.硕士或博士4、您的家乡在:()A、北方B、南方5、您是否去过宽窄巷子()A.是B.否

再次非常感谢您的帮助!5354复习小结一、统计数据的计量尺度

(一)定类尺度

(二)定序尺度

(三)定距尺度

(四)定比尺度二、统计数据的类型

(一)定性数据:由定类和定序尺度计量而成,反映事物的品质特征。

(二)定量数据:由定距和定比尺度计量而成,反映事物的数量特征。55复习小结三、统计数据的来源

(一)直接来源:统计调查和科学试验。

(二)间接来源:引用他人调查或试验的数据。四、统计调查(数据最主要的直接来源)

(一)统计调查的种类和方法(二)统计调查方案的设计(三)统计调查的组织方式:有普查、统计报表、抽样调查等,其中重点调查是最常用的最科学的调查方法。五、统计数据的间接来源

包括公开的统计出版物和其他渠道。一、判断对错1、全面调查和非全面调查是根据调查结果所得到的资料是否全面来划分的。()2、对某市下岗职工生活状况进行调查,要求在一个月内报送调查结果。所规定的一个月时间是调查时间。()3、我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。()4、典型调查既可以搜集数字资料,又可以搜集不能用数字反映的实际情况。()5、重点调查与抽样调查的目的是一致的,即都是通过对部分单位的调查,来达到对总体数量特征的认识。()思考与练习1、在统计调查中,调查内容的承担者是()

A.调查对象B.调查单位

C.填报单位D.统计报表2、对我国各铁路交通枢纽的货运量调查以了解铁路货运的总体状况,这属于(

A.普查B.重点调查

C.抽样调查D.典型调查思考与练习二、单项选择题3、在国营工业企业设备普查中,调查单位是()

A.国营工业企业的每台设备

B.每个国营工业企业

C.国营工业企业的全部设备

D.所有国营工业企业4、抽样调查是一种()A.非全面调查B.周期性调查

C.全面调查D.经常性调查

E.大量观察法5、对一批商品进行质量检验,最适宜采用的方法是()

A.全面调查B.抽样调查C.典型调查D.重点调查6、抽样调查的主要目的是()

A.计算和控制抽样误差B.推断总体数量特征

C.对调查单位作深入研究D.广泛运用数学方法60了解统计数据整理意义,熟悉整理的原则和内容,并能进行预处理掌握分组的概念、特点和原则,了解分组的种类掌握频数分布的概念,熟悉频数分布的编制方法掌握组限的表现形式、组距和组中值的计算掌握统计表的含义及其构成,熟悉统计表的编制学习目的和要求

1第三节统计数据的整理61分组的概念原则分组的作用频数分布的概念及其构成组距和组中值的计算统计表的编制方法和原则学习重点262统计分组的方法频数分布的编制学习难点3一、统计整理的意义和内容资料的积累和保管审核原始资料对数据的分组、汇总绘制统计图表整理的中心工作显示数据的基本特征深入分析的基础起着承前启后的作用统计整理的内容数据排序二、统计分组的意义和作用(一)统计分组的意义根据统计研究的需要,将总体按照一定的标志区分为若干个组成部分的一种统计方法。目的:突出组内同质性、组间差异性65(二)统计分组的作用划分现象的类型揭示现象内部结构分析现象之间的依存关系根据研究问题的目的来选择选择最能反映被研究现象本质特征的标志分组标志数量标志品质标志三、分组标志的选择简单分组复合分组对总体只按一个标志分组;只反映现象在某一标志特征上的差异选择两个及以上标志层叠起来分组;从不同角度反映总体内部的差异分组体系用一系列标志对总体的多种分组结合成的体系。四、(一)按分组标志的多少四、统计分组的种类68牲畜按经济用途分组牲畜按经济用途、性别分组简单分组

复合分组

举例:69分组体系70(二)按分组任务和作用的不同71(三)一、分配数列的概念和种类:某地区从业劳动者产业分组统计第四节频数分布

构成要素:总体按某标志所分的组和各组对应的单位数。

反映总体结构分布状况及特征总体的各个组各组的单位数(频数)、频率73单项式变量数列实例

表3-4某市居民家庭按家庭人口数分组

74品质分配数列数值变量分配数列单项式分配数列组距分配数列分配数列种类(由品质标志分组)(由数量标志分组)等距数列不等距数列75表3-2某高校在校生性别状况分组表品质变量分配实例数值变量分配数列实例表3-3

某市餐饮业按营业额分组

76组距式变量数列实例

表3-5某车间工人按月工资分组

77说明:二、组距数列的编制调查得到40家个体餐饮企业上月的营业额如下(元):

899、975、1258、1879、1988、2270、2593、2889、3012、34583598、3688、3954、4015、4115、4228、4332、4402、4557、4682、4689、4794、4856、5105、5112、5234、5581、5622、5645、5876、5987、6078、6250、6315、6384、6572、6850、7224、7753、8874

顺序排列数字资料,观察其中的集中与变异情况,确定数列形式,计算全距全距=8874–899=7975确定组数、组距、组限(等距分组)(一)组距和组数分多少组合适可按照斯特格斯的经验公式计算:组数K=1+lgN/lg2。分多少组合适可按照斯特格斯的经验公式计算:组数K=1+lgN/lg2。

实际分组时,主要通过定性分析来确定组数。79R-全距K-组数i-组距组距=(最大值-最小值)/组数在实际应用中,组距应是5或10的整倍数。而且第一组的下限要低于最小变量值,最后一组的上限应大于最大变量值。例子见教材P31.计算各组频数、频率(等距分组)

(二)等距分组和不等距分组频数(率)密度=频数(率)/组距(异距分组)等距分组不等距分组各组组距均相等。如:

10—2020—3030—40以上各组组距均为10。这种分组适用于均匀分布的总体。各组组距不一定相等。如:

10—2020—5050—6060—70以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。(三)组限和组中值

1、组限组限就是每一组两端的数值。

10—2020—3030—40下限上限确定组限的方法有两种:间断式确定和重叠式确定职工人数(人)

99以下

100—199200—299300—399固定资产额(万元)

50—6060—7070—8080—90间断式确定组限适用于离散变量重叠式确定组限适用于连续变量84比如60这一数值不计算在50~60这一组内,而是计算在60~70组中。■如何确定组限重叠组限----“上组限不在内”原则

分组所遵循的原则是“不漏不重”。不漏:组下限≤数据的最小值;组上限≥数据的最大值;不重:可采用相邻两组组限间断的办法(如[6-10],[11-15]等);可采用相邻两组组限重叠,根据“上限不在内原则”(如[5,10),[10,15)等)。2、组中值每组上限与下限之间的中点数值,是各组的假定平均数。并不是各组标志值的平均数,它很难计算出来,常用组中值近似地代替。仅存在于组距式分组数列中。单项式分组中没有组中值。组中值

=(上限值+下限值)÷2开口组组中值的计算:缺下限:组中值=本组上限—

相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2例如产值(万元)50以下50—6060—7070以上第一组组中值:50-(10÷2)=45最后一组组中值:70+(10÷2)=7586单项数列的编制适用范围离散型变量,变量值的种数较少时。步骤将变量值排序

计算频数和频率

编制统计表单项数列的编制组距数列的编制适用范围离散型变量,变量值的种数较多时;

连续型变量。87组距式数列编制步骤排序,确定最大值、最小值,计算全距确定组距数列类型。等距OR不等距?确定组数和组距。●●●●●●确定组限和组限表示方法。同限OR异限?计算频数、频率,编制统计表从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。向上累计向下累计三、累计次数分布(重在理解会求)89累计次数分布数列的编制实例[例3-2]根据例3-1编制的累计次数分布表如下:表3-7某车间工人日产零件累计分组表(一)钟型分布四、次数分布的主要类型钟型分布的特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少,其曲线图宛如一口钟,如右图所示。钟形分布91(二)U型分布

U型分布的形状与钟型分布相反,靠近中间的变量值分布次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U型分布。如人口死亡率分布,人口总体中,幼儿和老人死亡率高,而中青年死亡率低。如下图所示。U

U形分布92(三)J型分布J形分布

J型分布有两种类型,一种是次数随着变量的增大而增多。另一种呈反J型分布,即次数随着变量增大而减少。如下图93(四)洛伦兹分布

专门用于检定社会收入分配的平等程度。洛伦兹曲线拓展可运用于其他社会经济现象,研究总体各单位标志分布的集中状况或平均性。其运作的条件是:现在总体的各组频率与相应的各组标志总量的比重。表5.1各类节目收视情况统计表一、统计表宾词总标题纵栏标题横行标题数值主词第五节统计图表统计表的构成95说明:(1)由上表我们可以看出,统计表一般由四个主要部分构成:表头、行标题、列标题、数字资料,必要时可在表的下面加上表外附加。(2)表头应放在表的上方,用来说明统计表的主要内容(3)行标题和列标题通常放在统计表的第一列和第一行,表示所研究问题的类别名称和指标名称,通常被称为类。(4)若是时间序列数据,行标题和列标题也可以是时间,数据较多时,通常将时间放在行标题的位置。(5)表外附加通常在表的下方,主要包括资料来源、指标的解释和必要的说明等内容。

统计表的种类复合表简单表分组表主词未经任何分组的统计表主词按一个标志分组的统计表主词按两个及以上标志分组的统计表A:根据主次是否分组及分组的情况分为97我国城乡居民家庭人均收入

简单表主词

宾词

98按两个或两个以上特征或标志结合起来分组。表2-9某省某工厂1994、1998年四项检测指标异常检出率

:TTT(麝香草酚浊度试验),:GPT(谷丙转氨酶)。

(丁建生等.中国卫生统计1999;16(3):166)复合表99分析表调查表汇总表B:根据统计表作用的不同分为统计表的设计注意事项(1)合理安排统计表的结构。行标题、列标题及数字资料的位置合理。(2)表头一般应包括表号、总标题和表中数据的单位等内容。(3)表中的上下两条横线一般用粗线,中间的其他线用细线。通常,统计表的左右两边不封口,列标题之间一般用竖线隔开,行标题不用。表中,尽量少用横竖线。数据一般右对齐。二、统计图:1.直方图折线图营业额(元)企业个数410862折线图是将直方图的各条形中点用线连接起来而得到。直方图是用矩形的宽度和高度表示频数分布2.曲线图钟形分布J形分布U形分布3.条形图用长短或高矮来显示数值的大小4.饼形图是以圆形的分割来表示总体的分组及结构1045.茎叶图105茎叶显示(Stem-and-leafdisplay):一种探索性数据分析技术,同时排列定量数据顺序并提供其分布形态的相关信息。茎叶图由两部分组成:茎(stem):通常由每组数的高位数值(leadingdigits)形成,按组竖立在左边;叶(leaf):通常由每组数的低位数值(lastdigits)形成,按组横排在“茎”的右边。

通过茎叶图,我们可以看出数据的分布形状及数据的离散情况,比如,分布是否对称,数据是否集中,是否有极端值等。

茎叶图的关键是如何设计好树茎。树茎一旦确定,树叶就自然长着了相应的树茎上了。106看一个例子:107例如1081096.散点图散点图:用点的密集程度和趋势表示两种现象间的相关关系。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论