Chapter2统计调查与整理_第1页
Chapter2统计调查与整理_第2页
Chapter2统计调查与整理_第3页
Chapter2统计调查与整理_第4页
Chapter2统计调查与整理_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学习目的学习目的 了解数据的类型 掌握数据搜集的组织方式 重点掌握统计分组统计分组 掌握数据的显示掌握数据的显示 (一)(一) 为何需要数据为何需要数据 ?统计学要研究各种随机变量,通过对这些随机变统计学要研究各种随机变量,通过对这些随机变量的观察所获取的数据包含了我们所需的信息,量的观察所获取的数据包含了我们所需的信息,这些信息能有助于我们在许多场合中做出更为正这些信息能有助于我们在许多场合中做出更为正确的决策。确的决策。例如:例如: 市场研究者需要对产品的特性进行评估市场研究者需要对产品的特性进行评估,以区分不同的产品。,以区分不同的产品。 药品制造厂商需要判别一种新药是否药品制造厂商需要

2、判别一种新药是否比现在正使用着的药更有效。比现在正使用着的药更有效。 审计人员想通过查看某家公司的财务报表,以确认审计人员想通过查看某家公司的财务报表,以确认这家公司是否是依据了通行的会计准则做报表。这家公司是否是依据了通行的会计准则做报表。 财务金融分析人员想判断在未来的五年中,哪些行财务金融分析人员想判断在未来的五年中,哪些行业中的哪些公司最具有成长性。业中的哪些公司最具有成长性。 经济学家想估计我国国内生产总值今年的增长速度经济学家想估计我国国内生产总值今年的增长速度。生产部门的经理按惯例要检查生产过程,以检验其生产部门的经理按惯例要检查生产过程,以检验其生产的产品质量是否符合公司的标准

3、。生产的产品质量是否符合公司的标准。 (二)(二)数据数据分类的原则分类的原则互斥原则互斥原则:每一个数据只能划归到某一类型中,而每一个数据只能划归到某一类型中,而不能既是这一类,又是那一类不能既是这一类,又是那一类 。穷尽原则:穷尽原则:所有被观察的所有被观察的数据数据都可被归属到适当的都可被归属到适当的类型中,没有一个类型中,没有一个数据数据无从归属。无从归属。(三)(三)数据数据的类型的类型1. 定性数据和定量数据定性数据和定量数据定性数据:定性数据:用文字描述的用文字描述的 。定量数据:用数字描述的。如:定量数据:用数字描述的。如:企业的净资产额、企业的净资产额、 净利润额等净利润额等

4、2. 离散型数据和连续型数据离散型数据和连续型数据变量变量 若我们所研究现象的属性和特征的具体若我们所研究现象的属性和特征的具体表现在不同时间、不同空间或不同单位表现在不同时间、不同空间或不同单位之间可取不同的数值,则可称这种数据之间可取不同的数值,则可称这种数据为变量。为变量。 类型类型离散型变量:数据只能取整数。离散型变量:数据只能取整数。如一家公司的职工人数如一家公司的职工人数。连续型变量的数据连续型变量的数据可以取介于两个可以取介于两个数数值之间的任意值之间的任意数数值值。如销售额、经济增长率等。如销售额、经济增长率等。 3. 数据的数据的四个等级四个等级 定类数据定类数据例如,对人口

5、按性别划分为男性和女性例如,对人口按性别划分为男性和女性两类。两类。也称定名数据,这种数据只对事物的某也称定名数据,这种数据只对事物的某 种属性和类别进行具体的定性描述。种属性和类别进行具体的定性描述。 能够进行的唯一运算是计数,即计算每一能够进行的唯一运算是计数,即计算每一个类型的频数或频率(即比重)。个类型的频数或频率(即比重)。定类数据定类数据例如,对企业按经营管理的水平和取得例如,对企业按经营管理的水平和取得的效益划分为一级企业、二级企业等的效益划分为一级企业、二级企业等。定序定序数据,数据,也称序列也称序列数据,是对数据,是对事物所具事物所具有的属性顺序进行描述。有的属性顺序进行描述

6、。 定距定距数据数据如如1010、2020等。它不仅有明确的高低等。它不仅有明确的高低之分,而且可以计算差距,如之分,而且可以计算差距,如2020比比1010高高1010,比,比55高高1515等。等。 也称间距也称间距数据数据,是比定序,是比定序数据的描述功能数据的描述功能更好更好一些的定量一些的定量数据数据。 定距测定的量可以进行加或减的运算,但定距测定的量可以进行加或减的运算,但却不能进行乘或除的运算。却不能进行乘或除的运算。 定比定比数据数据如产量、产值、固定资产投资额、居民如产量、产值、固定资产投资额、居民货币收入和支出、银行存款余额等。货币收入和支出、银行存款余额等。也称比率也称比

7、率数据数据,是比定距,是比定距数据数据更高一级的更高一级的定量定量数据数据。它不仅可以进行加减运算,而。它不仅可以进行加减运算,而且还可以作乘除运算。且还可以作乘除运算。 测定层次测定层次特征特征运算功能运算功能举例举例1. 定类测定定类测定2. 定序测定定序测定3. 定距测定定距测定4. 定比测定定比测定分类分类分类;排序分类;排序分类;排序;分类;排序;有基本测量单位有基本测量单位分类;排序;分类;排序;有基本测量单位;有基本测量单位;有绝对零点有绝对零点计数计数计数;排序计数;排序计数;排序;计数;排序;加减加减计数;排序;计数;排序;加减加减乘除乘除产业分类产业分类企业等级企业等级温度

8、温度商品销售商品销售额额4. 截面数据和时间序列数据截面数据和时间序列数据 截面数据截面数据:所搜集的不同单位在同一时间的数据。所搜集的不同单位在同一时间的数据。例例如,所有上市公司公布的如,所有上市公司公布的20042004年年度的净利润。年年度的净利润。时间序列数据时间序列数据:所搜集的同一总体或单位在不同时间所搜集的同一总体或单位在不同时间的数据。的数据。某公司公布的某公司公布的19931993年到年到20042004年的年度净利润就是时间年的年度净利润就是时间序列数据。序列数据。 5. 原始数据原始数据和和次级数据次级数据 原始数据原始数据:指直接从各个调查单位搜集的、尚未经过指直接从

9、各个调查单位搜集的、尚未经过整理的统计数据资料,也称一手数据。整理的统计数据资料,也称一手数据。次级数据次级数据: :指那些已经加工整理过的,往往是公开发表指那些已经加工整理过的,往往是公开发表的数据的数据,也称二手数据。也称二手数据。 如从报如从报纸纸杂志、统计年鉴、会计报表上取得的数据杂志、统计年鉴、会计报表上取得的数据 。(四)(四)数据数据的来源的来源1.1. 从政府机构、各种行业组织、公司和企业所公布的从政府机构、各种行业组织、公司和企业所公布的数据中获取。数据中获取。就是把政府机构、各种组织和公司所公布的数据作为就是把政府机构、各种组织和公司所公布的数据作为来源,这种数据往往是来源

10、,这种数据往往是次级数据次级数据。 2. 2. 设计一次试验以获取必要的数据。设计一次试验以获取必要的数据。 例如,在检验洗衣机洗净程度的研究例如,在检验洗衣机洗净程度的研究中,研究人员中,研究人员 通过实际洗涤脏衣服,来通过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最佳。研究哪种牌子的洗衣机效果最佳。 3 3. .从观察研究中获取。研究人员通常是在自然状态下从观察研究中获取。研究人员通常是在自然状态下, ,进行直接的观察。进行直接的观察。 例如,观察路口的交通流量、观察顾客在商场的购买例如,观察路口的交通流量、观察顾客在商场的购买行为和观察流水线上的产品质量等。行为和观察流水线上的产品质量等

11、。4. 4. 进行一次调查。进行一次调查。它对所调查人们的行为不进行任它对所调查人们的行为不进行任何控制,仅提出诸如出生年月、爱好、消费习惯、对何控制,仅提出诸如出生年月、爱好、消费习惯、对某一事件的看法和其他特征方面的问题,然后对他们某一事件的看法和其他特征方面的问题,然后对他们回答的结果进行整理、编码、列表和分析。回答的结果进行整理、编码、列表和分析。调查方调查方案的主案的主要内容要内容 确定调查确定调查目的目的确定调查确定调查对象对象和和调查单位调查单位 拟订调查拟订调查提纲提纲确定调查确定调查时间时间 编制调查的编制调查的组织计划组织计划(一)普查、抽样、统计报表制度和重点调查(一)普

12、查、抽样、统计报表制度和重点调查 1.普查普查特点:特点: 工作量大,时间性强工作量大,时间性强,需要大量人力和财力。需要大量人力和财力。任务:任务:搜集重要的搜集重要的国情国力和资源状况国情国力和资源状况的全面资的全面资料,为政府制定规划、方针政策提供依据。料,为政府制定规划、方针政策提供依据。方式:方式:建立专门机构,配备专门人员调查。建立专门机构,配备专门人员调查。利用基层单位原始记录和核算资料进行调查。利用基层单位原始记录和核算资料进行调查。原则:原则:规定统一的标准时点。规定统一的标准时点。规定统一的普查期限。规定统一的普查期限。规定统一的调查的项目和指标。规定统一的调查的项目和指标

13、。2.抽样调查抽样调查特点特点:1.按按随机原则随机原则从总体中抽取样本;从总体中抽取样本;2.以样本指标(统计量)为依据以样本指标(统计量)为依据推断总体参数推断总体参数 或或检验总体的某种假设检验总体的某种假设;3.抽样误差可以事先抽样误差可以事先计算计算并加以并加以控制控制。3.3.统计报表制度统计报表制度 是按一定的表式和要求,是按一定的表式和要求,自上而下自上而下统一布置,统一布置,自下而上自下而上提供统计资料的一种统计调查方法。提供统计资料的一种统计调查方法。 这种搜集统计数据方法是伴随着计划经济而这种搜集统计数据方法是伴随着计划经济而产生的,并曾在我国占主导地位。现在,在产生的,

14、并曾在我国占主导地位。现在,在社会主义市场经济条件下,仍是我国搜集统社会主义市场经济条件下,仍是我国搜集统计数据的组织方式之一。计数据的组织方式之一。4.重点调查重点调查特点:特点:在总体中选择在总体中选择个别或部分重点单位个别或部分重点单位进行调查进行调查。任务:任务:及时了解总体基本情况,为主管部门指导工及时了解总体基本情况,为主管部门指导工作服务。作服务。方式:方式:重点单位重点单位指在总体中有举足轻重地位的单位,指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。其标志值在总体标志总量中占有绝大比重。经常性调查;同报表制度结合,用统计报表经常性调查;同报表制度结合,用

15、统计报表调查。调查。 例如,要了解全国钢铁生产的基本情况,例如,要了解全国钢铁生产的基本情况,只要调查鞍钢、宝钢、首钢、武钢、包钢只要调查鞍钢、宝钢、首钢、武钢、包钢等十几家特大型的钢铁企业就可以掌握全等十几家特大型的钢铁企业就可以掌握全国钢铁企业生产的基本情况国钢铁企业生产的基本情况 。(二)抽样的优点(二)抽样的优点 1.适用的范围广。适用的范围广。对于有限总体,从理论上讲,既可以进行普查也可以对于有限总体,从理论上讲,既可以进行普查也可以进行抽样;进行抽样;对于无限总体,就只能进行抽样。若理论上可以而实对于无限总体,就只能进行抽样。若理论上可以而实际上很难采用全面普查的情况,也只能采用抽

16、样。际上很难采用全面普查的情况,也只能采用抽样。如产品质量的破坏性检验、居民住户调查等。如产品质量的破坏性检验、居民住户调查等。2.2.与全面普查相比,抽样最大的优点是节省人、财、与全面普查相比,抽样最大的优点是节省人、财、物力和时间。物力和时间。 3.3.随机抽样可以比普查更为精确。随机抽样可以比普查更为精确。 (三)抽样的类型(三)抽样的类型 非随机抽样非随机抽样 随机抽样随机抽样 判断抽样判断抽样 定额抽样定额抽样 方便抽样方便抽样 简单随机抽样简单随机抽样 抽样类型抽样类型系统抽样系统抽样 分层抽样分层抽样 整群抽样整群抽样 非随机抽样非随机抽样 又称为非概率抽样又称为非概率抽样 ,是

17、是不按照随机原不按照随机原则则来抽取样本中的单位或个体。来抽取样本中的单位或个体。 特点特点具有方便、快速和低成本具有方便、快速和低成本精确性差,结论缺乏普遍性精确性差,结论缺乏普遍性 判断抽样判断抽样 又称为典型调查,是从事有关工作的专家按照一定的又称为典型调查,是从事有关工作的专家按照一定的标准标准有意识地有意识地在总体中选择若干有代表性的单位组成在总体中选择若干有代表性的单位组成样本进行调查,代表单位的选取标准应根据统计研究样本进行调查,代表单位的选取标准应根据统计研究的目的而定。的目的而定。 定额抽样定额抽样 是根据已定的单位数抽取样本,是根据已定的单位数抽取样本,往往是对总体了解甚少

18、往往是对总体了解甚少的时采用。的时采用。如想获取某地区化妆品的销售情况,对该地区的如想获取某地区化妆品的销售情况,对该地区的5 5家商家商厦进行调查。厦进行调查。方便抽样方便抽样 是为了取样方便,随意地抽取样本单位。是为了取样方便,随意地抽取样本单位。街头偶遇式调查就是一种最为常见的方便抽样。街头偶遇式调查就是一种最为常见的方便抽样。随机抽样随机抽样 是根据是根据随机原则随机原则来抽取样本单位来抽取样本单位 .简单随机抽样简单随机抽样 方法方法:在抽样框中的每个单位都具有相同的被抽中的机在抽样框中的每个单位都具有相同的被抽中的机会会, ,每个容量相同的样本被抽中的机会也是相同的。每个容量相同的

19、样本被抽中的机会也是相同的。 亦称为纯随机抽样亦称为纯随机抽样抽取样本的方法:抽取样本的方法:有放回抽样和无放回抽样。有放回抽样和无放回抽样。 适合适合:总体内部差异不是很大,规模也不大的情况总体内部差异不是很大,规模也不大的情况 。系统抽样系统抽样方法:方法:抽样框中的抽样框中的N N个单位被分成个单位被分成k k个系统,个系统,k k等于抽样等于抽样框的容量框的容量N N除以所需的样本容量除以所需的样本容量n n,在抽样框中前面的在抽样框中前面的k k个个体或单位中随机抽出第一个样本单位,然后,可在个个体或单位中随机抽出第一个样本单位,然后,可在其后的每隔其后的每隔k k个单位抽取样本中其

20、余的部分。个单位抽取样本中其余的部分。亦可称为等距抽样亦可称为等距抽样 编号有两编号有两种方法:种方法:一种是利用原有的顺序或编号一种是利用原有的顺序或编号 。如学生的注册名单,或者是从生产流水线上如学生的注册名单,或者是从生产流水线上下来的、有编号的产品等。下来的、有编号的产品等。对所研究的总体已有所了解,则可用已知对所研究的总体已有所了解,则可用已知的相关变量对抽样框中的单位进行编号的相关变量对抽样框中的单位进行编号。分层抽样分层抽样 亦可称为类型抽样亦可称为类型抽样 方法:方法:将总体全部单位分类,形成若干个类型组,后将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合

21、成样本。从各类型中分别抽取样本单位,合成样本。总体总体N样本样本n等额等额等比例等比例最优最优kiiknnnnn121nNNni12NkN1N1n2nknnNNniiii221整群抽样整群抽样 方法:方法:首先把总体中的首先把总体中的N个单位划分成为若干个群,个单位划分成为若干个群,并要求每个群对整个总体都具有代表性,然后对并要求每个群对整个总体都具有代表性,然后对群进行简单随机抽样,并对抽中群内的所有单位群进行简单随机抽样,并对抽中群内的所有单位进行调查研究。进行调查研究。 总体群数总体群数R=16 样本群数样本群数r=4 样本容量样本容量ABCDEFGHIJKLMNOPLHPDhlpdnn

22、nnn适合:适合:比简单随机抽样的方法能节约更多的成本,特别当总比简单随机抽样的方法能节约更多的成本,特别当总体的分布地域非常辽阔体的分布地域非常辽阔 时时。二、统计数据搜集的方法二、统计数据搜集的方法数据的搜集方法数据的搜集方法统计调查法统计调查法科学实验法科学实验法访问调查访问调查(概念要点)调查者与被调查者通过面对面地交调查者与被调查者通过面对面地交谈而获得资料谈而获得资料有标准式访问和非标准式访问有标准式访问和非标准式访问标准式访问通常按事先设计好的问卷进标准式访问通常按事先设计好的问卷进行行非标准式访问事先一般不制作问卷非标准式访问事先一般不制作问卷邮寄调查邮寄调查(概念要点)也称邮

23、寄问卷调查也称邮寄问卷调查是一种标准化调查是一种标准化调查调查者与被调查者没有直接的语言交流,信调查者与被调查者没有直接的语言交流,信息的传递依赖于问卷息的传递依赖于问卷通过某种方式将调查表或问卷送至某调查者通过某种方式将调查表或问卷送至某调查者手中,由被调查者填写,然后将问卷寄回指手中,由被调查者填写,然后将问卷寄回指定收集点定收集点问卷或表格的发放方式有邮寄、宣传媒介传问卷或表格的发放方式有邮寄、宣传媒介传送、专门场所分发三种送、专门场所分发三种电话调查电话调查(概念要点)调查者利用电话与被调查者进行语调查者利用电话与被调查者进行语言交流以获得信息言交流以获得信息时效快、成本低时效快、成本

24、低问题的数量不宜过多问题的数量不宜过多电脑辅助调查电脑辅助调查(概念要点)又称电脑辅助电话调查又称电脑辅助电话调查电脑与电话相结合完成调查的全过电脑与电话相结合完成调查的全过程程一般需借助专门的软件进行一般需借助专门的软件进行硬件设备要求较高硬件设备要求较高座谈会座谈会(概念要点) 1. 也称集体访谈也称集体访谈 2. 将一组被调查者集中在调查现场,将一组被调查者集中在调查现场,让他们对调查的主题发表意见以获得让他们对调查的主题发表意见以获得资料资料 3. 参加座谈会的人数不宜过多,一般参加座谈会的人数不宜过多,一般为为610人人 4. 侧重于定性研究侧重于定性研究个别深度访问个别深度访问(概

25、念要点)一次只有一名受访者参加、针对特殊问题一次只有一名受访者参加、针对特殊问题的调查的调查适合于较隐秘的问题,如个人隐私问题;适合于较隐秘的问题,如个人隐私问题;或较敏感的问题,如政治方面的问题或较敏感的问题,如政治方面的问题侧重于定性研究侧重于定性研究直接观测法直接观测法(概念要点)由调查人员深入调查现场,根据研究目的,由调查人员深入调查现场,根据研究目的,运用感觉器官或借助科学仪器,对调查对象运用感觉器官或借助科学仪器,对调查对象进行现场直接观察、点数、计量或测量,以进行现场直接观察、点数、计量或测量,以此获取所需数据资料的一种调查方法。此获取所需数据资料的一种调查方法。如农产品抽样调查

26、中的实割实测、商品库存如农产品抽样调查中的实割实测、商品库存盘点、车辆流量调查、旅客流量调查等都采盘点、车辆流量调查、旅客流量调查等都采用直接观测法。用直接观测法。实验法实验法(概念要点)在设定的特殊实验场所、特殊状态下,在设定的特殊实验场所、特殊状态下,对调查对象进行实验以获得所需资料对调查对象进行实验以获得所需资料有室内实验法和市场实验法有室内实验法和市场实验法调查方案设计调查方案设计调查方案的内容调查方案的内容调查目的调查目的调查要达到的具体目标调查要达到的具体目标回答回答“为什么调查?为什么调查?”调查之前必须明确调查之前必须明确调查对象和调查单位调查对象和调查单位调查对象调查对象:调

27、查研究的总体或调查范调查研究的总体或调查范围围调查单位调查单位:需要对之进行调查的单位。需要对之进行调查的单位。可以是调查对象的全部单位(全面调可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分查),也可以是调查对象中的一部分单位(非全面调查)单位(非全面调查)回答回答“向谁调查?向谁调查?”调查项目和调查表调查项目和调查表 1. 调查项目调查项目:调查的具体内容调查的具体内容 2. 调查表调查表:表现调查项目的表格或问卷表现调查项目的表格或问卷 3. 回答回答“调查什么?调查什么?” 调查时间调查时间: 统计资料所属时间统计资料所属时间 统计调查的时间统计调查的时间 调查方法调

28、查方法 包括资料的搜集方法和调查的组织形式包括资料的搜集方法和调查的组织形式 需要与调查对象和调查单位的实际结合使需要与调查对象和调查单位的实际结合使用用调查工作的组织实施计划调查工作的组织实施计划 调查工作的领导机构和办事机构;调查工作的领导机构和办事机构; 调查人员的组织调查人员的组织 调查资料的报送办法调查资料的报送办法 调查前的宣传、培训、调查文件的准备调查前的宣传、培训、调查文件的准备工作工作 调查经费的预算和开支办法调查经费的预算和开支办法 调查方案的传达、试点及其他工作调查方案的传达、试点及其他工作调查的目的调查的目的 判断调查误差的大小判断调查误差的大小 登记性误差:登记性误差

29、:代表性误差代表性误差系统性的代表性误差系统性的代表性误差 登记、汇总、过录时产生的误差,登记、汇总、过录时产生的误差,以及无回答误差和测量误差等以及无回答误差和测量误差等 偶然性的代表性误差偶然性的代表性误差即为抽样误差即为抽样误差 调查中的道调查中的道德性问题德性问题 1.1.调查者别有用意地、有意识地选择导向性的问题,调查者别有用意地、有意识地选择导向性的问题,使回答者出现有倾向性的回答。使回答者出现有倾向性的回答。 2.2.询问者有意识地通过语气、语调引导被询问者出询问者有意识地通过语气、语调引导被询问者出现有倾向性的回答。现有倾向性的回答。 3.3.回答者不重视或不愿意回答调查的内容

30、,就很可回答者不重视或不愿意回答调查的内容,就很可能提供错误的信息。能提供错误的信息。 我国统计调查体系 建立以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和少量的全面报表综合运用的统计调查方法体系 统计搜集到的大量资料是分散的,不系统计搜集到的大量资料是分散的,不系统的,只能说明各个单位的特征和属性,统的,只能说明各个单位的特征和属性,必须按照科学的原则加以必须按照科学的原则加以整理整理,使之,使之条条理化和系统化理化和系统化,成为便于储存和传递的、,成为便于储存和传递的、反映总体特征的数据。反映总体特征的数据。统计数据统计数据的整理的整理 统计数据统计数据的

31、展示的展示统计分组统计分组频数分布编制频数分布编制统计表统计表统计图统计图数据预处理数据预处理(一)(一) 统计数据的预处理统计数据的预处理1.数据的审核数据的审核 原始数据原始数据二手数据二手数据完整性完整性准确性准确性逻辑检查逻辑检查计算检查计算检查适用适用 时效时效目的目的:发现数据中的错误:发现数据中的错误2. 数据的筛选数据的筛选:找出符合条件的数据找出符合条件的数据 当发现数据中的错误不能予以纠正,或者有些数据不当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行符合调查的要求而又无法弥补时,需要对数据进行筛选筛选内容包括:内容包括:将某些不符

32、合要求的数据或有明显错误的数据予将某些不符合要求的数据或有明显错误的数据予以剔除以剔除将符合某种特定条件的数据筛选出来,而不符合将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出特定条件的数据予以剔出3. 数据的排序数据的排序:发现数据的基本特征发现数据的基本特征把定量数据按从大到小或从小到大的顺序排列,把定量数据按从大到小或从小到大的顺序排列,把定性数据按习惯的文字顺序排列,便于我们研究把定性数据按习惯的文字顺序排列,便于我们研究其其条理条理 方法:升序和降序方法:升序和降序统计分组统计分组对于定性数据就是依据属性的不同将数据对于定性数据就是依据属性的不同将数据划分成若干组,对

33、于定量数据就是依据属划分成若干组,对于定量数据就是依据属性数值的不同将数据划分成若干组。性数值的不同将数据划分成若干组。 基本原则:组内同质性,组间差异性基本原则:组内同质性,组间差异性 作用:作用: (1)划分现象的类型)划分现象的类型 (2)表明总体内部的结构及整个结构的类表明总体内部的结构及整个结构的类型和特征型和特征 (3)揭示现象间的依存关系揭示现象间的依存关系1.1.按按分组标志个数分组标志个数不同不同 1 1)简单分组)简单分组: :把总体只按一个标志分组 2) 2)复合分组复合分组: :对同一总体选择两个或两个以上标志层叠起来进行分组。例如,可以 同时选择学科、学制、 性别三个

34、标志对某学院全体在校学生这个总体 进行分组。 2.2.按分组标志按分组标志种类种类不同不同 1) 1) 品质标志分组品质标志分组 2) 2) 数量标志分组数量标志分组 统计分组的形式A.单项式分组:即变量的一个取值为一即变量的一个取值为一组,适用于离散型变量,并且变量的取值较少。组,适用于离散型变量,并且变量的取值较少。 如家庭人如家庭人口数分组口数分组 1 1人人 2 2人人 3 3人人 4 4人人 5 5人人 6 6人人2) 2) 数量标志分组数量标志分组 B组距式分组:即每一组有一个即每一组有一个上限值和一个下限值所形成的区间,上限值和一个下限值所形成的区间,适用于连续性变量,或离散型变

35、量适用于连续性变量,或离散型变量且变量的取值较多不便一一列举的且变量的取值较多不便一一列举的情况。情况。 按销售额分组按销售额分组( (万元万元) )5050以下以下5050200200200200400400400400600600600600800800800800以上以上例:对商店按销售额进行分组例:对商店按销售额进行分组组距分组组距分组(要点)(要点)将变量值的一个区间作为一组将变量值的一个区间作为一组适合于连续变量适合于连续变量适合于变量值较多的情况适合于变量值较多的情况必须遵循必须遵循“不重不漏不重不漏”的原则的原则可采用等距分组,也可采用不可采用等距分组,也可采用不等距分组等距分

36、组组距分组组距分组(步骤)(步骤)确定组数:组数的确定应以能够显示数据的分布特征和规律为确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按目的。在实际分组时,可以按 Sturges 提出的经验公式来确提出的经验公式来确定组数定组数K)2lg()lg(1nK分组中要注意的关键分组中要注意的关键 1.选择分组标志 选择分组标志时,一般应考虑原则: 根据研究问题的目的和任务选择分组标志 在若干标志中,选择能反映问题本质的标志 结合现象所处的历史条件具体情况具体分析 2.划分各组的界限:在分组标志的变异范围内,划定各相邻组之间的性质界限和数量界限组距分组组距分组(几个概念

37、) 下下 限:限:一个组的最小值一个组的最小值 上上 限:限:一个组的最大值一个组的最大值 组组 距:距:上限与下限之差上限与下限之差 组中值:组中值:下限与上限之间的中点值下限与上限之间的中点值 ( (闭口组闭口组) ) (缺上限的开口组)(缺上限的开口组) (缺下限的开口组)(缺下限的开口组) 2上限上限下限下限组中值组中值 2邻组组距邻组组距下限下限组中值组中值 2邻组组距邻组组距上限上限组中值组中值 次数分布次数分布 一、次数分布的概念一、次数分布的概念 在统计分组的基础上将总体的所有单位按组在统计分组的基础上将总体的所有单位按组归类,形成总体单位数在各组的分布。归类,形成总体单位数在

38、各组的分布。 二、次数分布的表示二、次数分布的表示 (一)列表法(一)列表法 (二)图示法(二)图示法 三、次数分布的主要类型三、次数分布的主要类型 四、次数分布的编制四、次数分布的编制 编制次数分布表的步骤编制次数分布表的步骤二、次数分布的表示二、次数分布的表示(一)列表法(一)列表法1 1、某高校学生性别分布表、某高校学生性别分布表 性性 别别 人人 数(人)数(人) 频频 率(率(% %) 男男 732 732 57.14 57.14 女女 549 549 42.86 42.86 合合 计计 1281 1281 100.00 100.002 2、某厂工人日产量分布表、某厂工人日产量分布表

39、按日产量分组按日产量分组(件)(件) 工人数(人)工人数(人) 比比 率(率(% %) 9 9 12 12 4.00 4.00 10 10 38 38 12.67 12.67 11 11 65 65 21.67 21.67 12 12 85 85 28.33 28.33 13 13 60 60 20.00 20.00 14 14 30 30 10.00 10.00 15 15 10 10 3.33 3.33 合合 计计 300 300 100.00 100.003 3、某班学生按考试成绩分组、某班学生按考试成绩分组 按成绩分组按成绩分组(分)(分) 人数(人)人数(人) 比率(比率(% %)

40、60 60以下以下 7 7 8.8 8.8 60 607070 21 21 26.2 26.2 70 708080 25 25 31.2 31.2 80 809090 19 19 23.8 23.8 90 90以上以上 8 8 10.0 10.0 合合 计计 80 80 100.0 100.0( (二二) )图示法图示法 1 1、直方图、直方图(1)(1)单式直方图单式直方图20022002年我国旅客周转量年我国旅客周转量( (亿人公里亿人公里) )2 2、折线图、折线图3 3、曲线图、曲线图 返回返回三、次数分布的主要类型三、次数分布的主要类型1 1、钟型分布、钟型分布(1)(1)对称的钟型

41、分布对称的钟型分布日产日产量量( (件件) )(2)(2)左偏分布左偏分布日日产产量量( (件件)(3)(3)右偏分布右偏分布日日产产量量( (件件) )2 2、型分布、型分布3 3、J J型分布型分布(1)(1) 价格价格 返回返回型分布()型分布()价格价格频数分布表的编制频数分布表的编制(实例) 117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120

42、123 127 135 137 114 120 128 124 115 139 128 124 121分组方法分组方法分组方法分组方法等距分组等距分组异距分组异距分组单变量值分组单变量值分组组距分组组距分组等距分组表等距分组表(上下组限重叠)表表2-5 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105110110115115120120125125130130135135140358141064610162820128合计合计50100等距分组表等距分组表(上下组限间断)表表2-6 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105109110114115119120124125129130134135139358141064610162820128合计合计50100等距分组表等距分组表 (使用开口组)表表2-7 某车间某车间50名工人日加工零件数分组表名

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论