




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学统计是“认识社会的最有力的武器之一”
——列宁2002年2月1统计整理统计调查客观现象数量表现统计总体数量特征统计研究的程序统计研究目的统计设计推断分析描述分析第二章统计数据的搜集与整理§2.1统计数据的搜集§2.2数据的搜集与整理§2.3变量数列返回2.1统计数据的搜集§2.1.1统计测量尺度§2.1.2原始数据的搜集方法§2.1.3次级资料的搜集§2.1.4统计调查误差返回§2.1统计测量尺度一、统计测量尺度的概念与种类二、统计测量尺度的作用三、测量层次与测量尺度的正确应用测量:用仪器确定空间、时间、温度、速度、功能等的有关数值。统计测量:运用某种方法使自然或社会经济现象量化。测量结果:形成变量或指标分类、标识自然或社会经济现象变量或指标某个人口总体人口总数及分类数、性别结构、比例等按性别不同分类男性女性按收入不同分类1000元以下1000元~2000元……居民总收入、人均收入、收入差异等分类、标识即统计测量过程按数量不同分类按性质不同分类统计测量尺度的种类定比测量(尺度、指标)定类测量(尺度、指标)定序测量(尺度、指标)定距测量(尺度、指标)定类尺度按现象性质差异进行的辨别与区分。测量结果形成定类变量或定类指标。定类变量或指标确切的值是以文字表述的,可以用数值标识,但仅起标签作用。定类变量或指标的各类别间是平等的,没有高低、大小、优劣之分。性别、种族、运动项目等等例如:《统计学》第二章统计数据的搜集定序尺度按现象顺序差异进行的辨别与区分。测量结果形成定序变量或定序指标。定序变量或指标确切的值是以文字表述的,也可以用数值标识,也仅起标签作用。定序变量或指标各类别间有高低优劣之分,不能随意排列。-≠-≠≠>>大学生中学生小学生定距尺度按现象绝对数量差异进行的辨别与区分。测量结果形成定距变量或定距指标。定距变量或指标的值以数字表述,有计量单位,可以进行加减运算。定距变量或指标各类别间自然有大小之分,但没有绝对的零点,不能乘除计算。1971年出生30岁1986年出生15岁甲乙二人年龄之差:1986-1971=15岁或30-15=15岁二人年龄之比:30÷15=2(倍)
1986÷1971=1.0076(倍)
定比尺度按现象绝对差异与相对差异进行的辨别与区分。测量结果形成定比变量或定比指标。定比变量或指标确切的值也以数字表述,有计量单位
,可以进行加减运算。定比变量或指标有绝对意义上的零点,既可以加减运算,也可以乘除运算。零高度零重量零体积零面积零人口零产量零资产真正的零:一无所有返回§2.1统计测量尺度一、统计测量尺度的概念与种类二、统计测量尺度的作用三、测量层次与测量尺度的正确应用★★第一,决定数据的整理、显示方法第二,决定数据的分析方法第三,决定计算机的处理方法统计测量尺度的作用:《统计学》第二章统计数据的搜集定序测量定距测量定比测量顺序性差异顺序性差异、绝对差异距离顺序性差异、绝对差异距离、相对差异文盲半文盲、小学、初中、高中、大专、大学本科、硕士研究生、博士研究生(定序测量)对受教育程度的度量方法文盲半文盲博士研究生对数量差异的度量,要注意层次测量尺度的正确应用定序测量定距测量定比测量顺序性差异顺序性差异、绝对差异距离顺序性差异、绝对差异距离、相对差异0年、6年、9年、12年、16年、19年、22年(定比测量)对受教育程度的度量方法文盲半文盲博士研究生对数量差异的度量,要注意层次测量尺度的正确应用一个指标体系中的指标应属于相同的测量尺度实际值标准值总资产贡献率15%10.7%资本保值增值率130%120%资产负债率60%60%全员劳动生产率20000元16500元成本费用利润率4.8%3.71%流动资产周转率1.8次1.52次产品销售率97%90%环保等级优秀良好对于指标体系,要注意统一性测量尺度的正确应用?返回§2.2原始数据的搜集方法一、统计调查概述二、统计调查方案三、问卷设计(初级资料)原始数据源加工数据源(次级资料)政府统计、企业统计、民间统计等机构,数据库、出版物、账册等形式普通的数据使用者统计调查数据查询已存在数据源实验数据源对过程加以控制指直接从各调查单位搜集的用来反映个体特征的数据资料统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败搜集原始数据资料的统计活动过程统计调查要求:准确、及时、全面、系统《统计学》第二章统计数据的搜集按调查单位的范围大小分为全面调查非全面调查一次性调查经常性调查统计报表专门调查统计调查的种类按调查时间是否连续分为按调查的组织方式不同分为普查抽样调查典型调查重点调查
指按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度统计报表制度优点局限能保证统计资料的全面性和连续性能保证统计资料的统一性和及时性能满足各级部门对统计资料的需要统计报表过多会增加基层负担有可能由于虚报瞒报而影响统计资料质量统计调查的组织方式《统计学》第二章统计数据的搜集指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查作用局限可以为抽样调查提供抽样框可以搜集统计报表所不能提供的反映重大国情国力的基本统计信息由于需要大量的人力、物力和财力,不宜经常进行普查统计调查的组织方式《统计学》第二章统计数据的搜集为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式作用局限能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料只适用于客观存在着重点单位的情况重点调查这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况统计调查的组织方式《统计学》第二章统计数据的搜集典型调查在对调查对象有一定了解的基础上,有意识地选择少数典型单位
进行调查的一种非全面调查组织方式一定条件下能估计总体指标数值可以补充全面调查的不足可以用来研究新生事物不能确定推断的把握程度,无法计算和控制推断误差作用指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量局限统计调查的组织方式
按照
随机原则
从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式抽样调查指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会特点优点按随机原则抽取样本单位目的是推断总体的数量特征抽样误差可以事先计算并控制能用较少的人力、物力和时间达到全面调查的目的调查资料的准确性较高、受人为干扰的可能性较小统计调查的组织方式总体单位调查单位统计调查的组织方式总体单位调查单位报表制度可以全面调查,但通常是调查限定规模以上的总体单位统计调查的组织方式总体单位调查单位普查统计调查的组织方式对全部单位进行调查总体单位调查单位重点调查只调查重点单位(单位数不多但其标志量占标志总量比重较大的单位)统计调查的组织方式总体单位调查单位典型调查对典型单位进行调查,典型单位的选择并不一定按规模统计调查的组织方式总体单位调查单位抽样调查按随机原则选择调查单位,各单位被选中的机会相同。统计调查的组织方式
我国统计调查方法体系改革的目标模式是:建立以周期性普查为基础,以经常性的抽样调查为主体,以必要的统计报表、重点调查、综合分析等为补充,搜集、整理基本统计资料的统计调查方法体系模式
观察记录法报告法采访法统计调查的主要技术方法被调查者受调查者的强制与约束调查者与被调查者平等合作
登记法网络调查法试验设计法口头询问被调查者自填电话访问统计调查方案用来指导整个调查工作的纲领性文件,是统计设计在统计调查阶段的具体化基本内容:⒈调查目的;⒉调查对象与调查单位;⒊调查项目与调查表;⒋调查时间;⒌制定调查工作的组织实施计划。(为什么调查)(向谁调查)(调查什么)调查对象指被调查现象的物质承担者,是总体在调查阶段的具体化。调查单位指构成调查对象的每一个总体单位。注意调查单位与填报单位的区别:当调查单位自己负责向上报告时,它同时也是填报单位;当调查单位的资料由它的上级组织收集、整理,并向上报告时,填报单位与报告单位则不一致。负责报告调查内容的单位问卷调查指非政府性统计机构或个人所从事的对人的主观意见的调查工作,也称作民意调查或民意测验调查问卷的基本格式:表头表体表脚说明词:解释调查意义、表达感激之情等主题问句:被调查者基本情况、调查项目作业记录:时间、操作者等表头表体表脚名称、编号、制表单位、填表日期等等被调查者的基本情况、调查项目等等备注、指标解释等调查表的基本结构:您认为吸烟有哪些害处?①危害自身健康②影响他人健康③浪费钱财④容易引起火灾⑤破坏家庭团结封闭式问题您认为吸烟有哪些害处?开放式问题容易控制,但不易全面调查问卷的问题类型:容易滋生腐败您认为吸烟有哪些害处?①危害自身健康②影响他人健康③浪费钱财④容易引起火灾⑤破坏家庭团结⑥其他不易控制,但内容丰富问卷设计的基本要求:问题的提出要紧扣主题问句和标准答案要易于理解和回答先易后难、先封闭后开放、先基本问题后派生问题以不超过20分钟为宜主题明确提问科学逻辑性强容量适度⒈您是否吸烟(如果选②,则跳过⒉、⒊题)①吸烟②不吸⒉您每天大约吸多少支烟①5支以下②5-10支③10-15支④15-20⑤20-25支⑥25支以上⒊您的吸烟历史大约有多长①1年以下②1-5年③5-10年④10年以上⒋您是否认为吸烟有害健康(请写出理由)调查单位中吸烟人所占比例吸烟人群日吸烟数量情况吸烟人群吸烟历史情况调查对象对吸烟的看法⒈您是否吸烟(如果选②,则跳过⒉、⒊题)①吸烟②不吸⒉您每天大约吸多少支烟①5支以下②5-10支③10-15支④15-20⑤20-25支⑥25支以上⒊您的吸烟历史大约有多长①1年以下②1-5年③5-10年④10年以上⒋您是否认为吸烟有害健康(请写出理由)调查单位中吸烟人所占比例吸烟人群日吸烟数量情况吸烟人群吸烟历史情况§2.3次级资料的搜集次级资料指已经被收集、加工整理成型的数据信息次级资料的主要收集渠道:⒈查阅公开出版物;⒉向政府统计机构咨询;⒊向其他机构咨询;⒋网上查询。《统计学》第二章统计数据的搜集返回2.1统计数据的搜集★§2.1统计测量尺度§2.2原始数据的搜集方法§2.3次级资料的搜集§2.4统计调查误差★★★§2.4统计调查误差调查误差指收集来的数据资料与真实情况间的差异真值调查值调查误差§2.4统计调查误差调查误差指收集来的数据资料与真实情况间的差异调查值调查误差真值?§2.4统计调查误差调查误差指收集来的数据资料与真实情况间的差异真值?调查值调查误差?研究调查误差的主要目的是找出导致误差产生的原因,进而采取对策避免、减少误差或控制误差水平。调查误差的种类由于人的主观故意或失误而产生的误差,理论上它可以用某种方法加以消除登记误差代表性误差由部分单位数值来推断总体数值所产生的误差,它不可以消除,但可以加以控制(随机误差)§2.4统计调查误差2.2
数据整理★§2.2.1统计资料整理的基本程序
§2.2.2统计分组§3.3分布数列的编制§3.4统计整理中最常用的显示方法§2.2.1统计资料整理的基本程序
(一)统计资料整理的概念(二)统计资料整理的基本程序★统计整理是指根据统计研究的目的和任务,将统计调查所得的原始资料进行科学的分类和汇总,或对已经加工的综合资料进行再加工,为统计分析准备系统化的、条理化的综合资料的工作过程。
统计数据的处理:
统计资料的分组、汇总及制表统计数据的管理:
数据的传输、贮存、更新及输出内容§2.2.1统计资料整理的基本程序(一)统计资料整理的概念(二)统计资料整理的基本程序★★资料的审核资料分组、汇总汇总结果的显示统计资料整理的基本程序统计资料的积累、保管和公布2.2.⒈审核原始资料完整性、准确性和客观性内容就是对调查取得的原始资料进行审查与核实。
资料审核是指原始资料是否准确可靠.准确性
一是逻辑检查,检查调查资料内容是否合理,各个项目之间有没有相互矛盾的地方,答案是否合乎逻辑.其审核方法是指所有的调查表格或问卷是否都已收齐,所有的问题是否都有答案。完整性
二是计算检查,检查调查表格或问卷中各项数字在计算方法和计算结果上有无错误,数字的计量单位有没有差错,等等。就是在调查资料搜集上来之后,再根据资料的内容、性质和特征进行分类。事后分类也称事前分类,它是在调查之前,设计调查提纲、调查表或问卷时,根据所要调查的事物或问题的性质与特征,分门别类地设计调查项目或指标,然后按照分类指标来搜集调查资料。事先分类2.2.2.统计分组1.统计分组的概念根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。统计分组标志:品质标志或数量标志2.分组的性质兼有分和合双重含义,对于现象总体,是“分”,对于单位,是“合”。按分组标志的多少,分为简单分组和复合分组按分组的标志的性质不同,分为品质分组(或称属性分组)和数量分组(或称变量分组)。3.统计分组的种类1、简单分组2、复合分组
即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。
复合分组是指对所研究的总体按两个或两个以上的标志进行的多层次分组。可用于对事物多方面、多层次的分析研究。
统计分组的形式性别人数(人)比重%男3075女1025合计40100英语成绩人数(人)比重%优37.5良922.5中1230及格1025不及格615合计40100英语成绩性别人数(人)比重%优男25女12.5良男615女25中男1127.5女512.5及格男820女25不及格男37.5女00合计40100学生按性别、英语成绩分组简单分组复合分组分布数列种类
专业前途预期人数比重%非常有前途214.29有前途535.71一般535.71没前途17.14不知道17.14合计14100.00购买转移书数量数量比重%1428.572321.433321.43417.145以上321.43合计14100.00品质数列变量数列单项数列2.2.3、统计分组的原则和方法穷尽原则:使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。互斥原则:就是在特定的分组标志下,总体中的任何一个单位的只能归属于某一组,而不能同时或可能归属于几个组。1.统计分组的原则:品质分组:按品质标志分组数量分组:按数量标志分组单项式分组组距式分组;间断组距式分组和连续组距式分组;“上限在不内”原则:凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。等距分组与异距分组2.统计分组的方法组距数列月生活费人数(人)比重%100以下13100—200310200—300517300—4001240400—500620500以上310合计30100职工人数企业个数(个)比重%10以下21.2710—993019100--39910063.3400—9992012.7100—499953.165000以上10.63合计158100.00连续组距式分组间断组距式分组学生按生活费支出分组职工人数分组组距数列月生活费人数比重%100以下13100—200310200—300517300—4001240400—500620500以上310合计30100双休课外学习时间人数比重%1以下214.291—2321.432--3321.433—5321.435—8214.298以上17.14合计14100.00等距数列异距数列(1)组距连续组距分组的组距=本组上限–本组下限间断式组距且等距分组的条件下:
组距=本组上限–前组上限
或=本组下限–前组下限
或=本组上限–本组下限+1(2)组数(3)组中值上限+下限)/2(4)开口组的组距与组中值3.组距式分组的相关概念开口式组距数列组中值的计算:
首组假定下限=首组上限-相邻组组距末组假定上限=末组下限+相邻组组距先计算开口组的假定上、下限:
因此有:首组组中值末组组中值某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上组限U下组限L如:组距d=U-L=100-50=50(万元)如:组中值x=(U+L)/2=(100+200)/2=150(万元)假定上限400假定下限02.2统计数据的整理与显示★§3.1统计资料整理的基本程序
§3.2统计分组§3.3分布数列的编制§3.4统计整理中最常用的显示方法★统计分组的作用:区分现象质的差别
反映总体的内部结构
研究现象之间的依存关系
统计分组的作用:研究现象之间的依存关系
分组体系的选择
分组体系指同时使用两个以上标志分组时,分组标志表现的组合形式。
对同一总体选择两个或两个以上标志分别进行简单分组。各分组标志表现并列使用。各分组标志表现交叉结合使用。平行分组体系交叉分组体系平行分组体系对教师的分类按性别分类男性女性按职称分类按年龄分类高级中级初级青年中年共计7组2+3+2交叉分组体系按性别分类按职称分类按年龄分类男女高级中级初级青年中年共计12组2×3×2对教师的分类2.3分布数列§3.3分布数列的编制§3.4统计整理中最常用的显示方法§3.2分布数列的编制一、分布数列的概念与种类二、变量数列的编制三、累计次数与累计频率★变量数列品质数列是在统计分组的基础上,汇总计算各组的总体单位数(如为抽样资料,则为抽样单位数),借以说明总体单位数在各组之间的分配情况。
分布数列种类分组标志的具体表现各组的次数或频率构成要素是指将数据组依据非数值特性分类所形成的数列。是指将数据组依据数值特性分类所形成的数列。
变量数列品质数列种类通常我们用X表示变量,变量数列由两串数字组成,一串数字为变量的不同取值,另一串为次数或频率。
用表示变量值,表示次数。
用变量数列品质数列种类异距数列等距数列组距数列单项数列变量数列按每个组的变量取值形式不同将若干个相邻的变量值合并为一组,使每个组有一个变量值变动范围,以组距形式表示的变量数列。组距数列的每组变量值为一个区间。是按数量标志分组后,用一个变量值代表一个组形成的数列。即一个变量值为一组。§3.2分布数列的编制一、分布数列的概念与种类二、变量数列的编制三、累计次数与累计频率★★单项变量数列的编制单项数列同时具备变量是离散变量变量的不同取值个数较少编制条件:编制步骤或内容排序汇总组单位数(次数)
制作单项变量数列统计表【例】统计某企业40名工人在一个工作日内生产的零件数量(见表3-3)。请根据表中资料编制变量数列。表3-340名工人一个班次生产的零件数量找出最大值和最小值排序汇总组单位数(次数)
制作单值变量数列统计表【解】【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。日产量(件)X工人数(人)f202122232425263564321合计24编制结果如下:组距数列指每个组的变量值用一个区间来表现的变量数列变量数列的编制变量是连续变量;或:总体单位数较多变量不同取值个数也较多的离散变量。
编制条件:变量值变动区间的长度相等变量值变动区间的长度不完全相等等距数列异距数列组距数列的编制编制步骤或内容《统计学》第三章统计数据的整理与显示计算组中值排序确定组限计算变异全距确定组数、组距汇总组单位数【例】统计某企业40名工人在一个工作日内生产的零件数量(见表3-3)。请根据表中资料编制组距数列。制作组距数列统计表⒊确定组数及组距等距数列编制步骤:《统计学》第三章统计数据的整理与显示【解】⒈排序⒉计算变异全距计算组数(组数不宜过多,也不宜太少)计算组数(我们使用斯特基斯公式)其中,N是单位总数。编制等距数列《统计学》第三章统计数据的整理与显示本例中(当的结果为整数时)(当的结果为小数时)因此,取本例中,m=7,则有(当的结果为整数时)(当的结果为小数时)《统计学》第三章统计数据的整理与显示确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征由于R≤组距(d)×组数(m)⒋确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上组限不计入”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法编制等距数列《统计学》第三章统计数据的整理与显示编制等距数列
日产量(件)组中值次数合计—《统计学》第三章统计数据的整理与显示试分组?
日产量(件)组中值次数82以下82~8686~9090~9494~9898~102102以上合计—⒌计算次数
日产量(件)组中值次数82以下82~8686~9090~9494~9898~102102以上04918531合计—40?
日产量(件)组中值次数83以下83~8787~9191~9595~9999~103103以上131710621合计—40试分组?编制等距数列编制结果:
日产量(件)组中值次数83以下83~8787~9191~9595~9999~103103以上131710621合计—40《统计学》第三章统计数据的整理与显示??⒍制作组距数列编制等距数列练习题己知某地区某年50个商店商品销售额的资料如下(单位:百万元):
7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.05.810.516.322.0要求编制组距数列。《统计学》第三章统计数据的整理与显示⒊确定组数及组距等距数列编制步骤:《统计学》第三章统计数据的整理与显示【解】⒈排序⒉计算变异全距计算组数(我们使用斯特基斯公式)其中,N=50编制等距数列《统计学》第三章统计数据的整理与显示本例中因此,取本例中,m=7,则有《统计学》第三章统计数据的整理与显示确定组距的原则:⒋确定组限编制等距数列
日产量(件)组中值次数合计—《统计学》第三章统计数据的整理与显示试分组?
日产量(件)组中值次数82以下82~8686~9090~9494~9898~102102以上合计—⒌计算次数
日产量(件)组中值次数82以下82~8686~9090~9494~9898~102102以上04918531合计—40?
日产量(件)组中值次数83以下83~8787~9191~9595~9999~103103以上131710621合计—40试分组?编制等距数列编制结果:
日产量(件)组中值次数83以下83~8787~9191~95
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 液压与液力技术在地质勘探设备中的应用考核试卷
- 派遣员工关系管理考核试卷
- 租赁设备选型与配置考核试卷
- 纺纱工艺对纱线柔软性的调控考核试卷
- 上海高三语文各区作文题
- 毛皮制品的工伤保险制度考核试卷
- 毛皮制品加工车间布局设计考核试卷
- 有机化学原料的绿色化学标准制定考核试卷
- 电视设备智能安全防范技术考核试卷
- 胰岛素皮下注射团体标准解读
- 藏毛窦护理业务查房课件
- 普通高等学校军事理论教程
- 水土保持-新时代水土保持重点工作课件
- 矿井有计划停电停风通风安全技术措施
- 医院评审员工应知应会手册2
- 新《用字母表示数》说课
- 河南省矿山储量动态检测技术指南
- 光学系统的像质评价和像差公差
- :AHA心肺复苏和心血管急救指南(完整版)
- 垃圾焚烧炉渣综合利用方案
- 12J1 工程做法 天津市建筑标准设计图集(2012版)
评论
0/150
提交评论