第二章 统计数据的收集整理与显示_第1页
第二章 统计数据的收集整理与显示_第2页
第二章 统计数据的收集整理与显示_第3页
第二章 统计数据的收集整理与显示_第4页
第二章 统计数据的收集整理与显示_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第2 2章章 统计数据的收集整理与显示统计数据的收集整理与显示 2.1 统计数据的收集统计数据的收集 2.2 统计数据的整理统计数据的整理学习重点学习重点1、统计数据的搜集、统计数据的搜集2、分组的概念、特点和原则,分组的作用,能、分组的概念、特点和原则,分组的作用,能 熟练进行分组熟练进行分组3、频数分布的概念及其构成;、频数分布的概念及其构成;4、组限的表现形式及原则、组距和组中值的计算、组限的表现形式及原则、组距和组中值的计算5、统计表的含义及其构成,统计表的编制方法和原、统计表的含义及其构成,统计表的编制方法和原则则本部分难点本部分难点1.调查方法的比较;2. 统计分组的方法;3.频

2、数分布的编制;4.组限的表现形式、组距和组中值的计算?2.1 统计数据的收集数据来源科学实验统计调查:按照统计研究的任务,运用科学的 统计调查方法,有计划、有组织地 向客观实际搜集资料的过程 :在实验中控制实验对象而收集到的 数据,称为实验数据 收集数据的要求:准确、及时拟定统计调查方案:确定统计调查的目的、调查的对象、 调查的项目等内容 天津广播听众调查问卷 目的目的:了解我市听众收听天津人民广播电台节目的一些 基本情况,为提高节目质量、推出优秀节目提供 科学依据。对象和单位:对象和单位:天津市市民调查项目调查项目和调查表:和调查表: 调查项目:听众收听天津人民广播电台节目的 一些基本情况

3、调查表:调查项目以表格的形式来表现。调查什么2.1.1 统计调查方案的确定 1确定调查目的(为什么调查) 2确定调查对象和调查单位(向谁调查) 3设计调查项目和调查表(调查什么) 4方案设计中的其他内容(如何调查)调查方式调查时间调查的组织与实施2.1.2 常用的统计调查方法1普查普查:是专门组织的一般用来调查属于一定时点上 社会经济现象数量的全面调查。优点优点:全面、系统缺点缺点:只限于有限总体、工作量大、时间性强4抽样调查:抽样调查:是从调查对象中随机抽取一部分单位作为 样本进行调查的一种非全面调查 优点优点:经济灵活、时效性强、适应面广和准确性高3典型调查典型调查:在对研究对象进行全面分

4、析的基础上,有 意识地选择部分有代表性单位进行调查优点优点:调查范围小、省时省力、具体深入缺点缺点:具有主观性2重点调查重点调查:只在对象中选择一部分重点单位进行调查 以了解总体情况的一种非全面调查优点优点:省时、省力、不带主观性。比重较大人为选择的典型单位随机原则:调查单位以等可能被抽到,保证代表性 最大抽样效果原则:误差尽量小or调查费用尽可能小。 5统计报表统计报表是按照国家有关法规的规定,自上而下地逐级提供统计数据的一种调查方式。特点:特点:是由政府部门组织、采用统一的表格、自上而下布置、自下而上报告。统计报表是经常性的全面调查。种类种类:(1) 调查范围调查范围:全面报表、非全面报表

5、全面报表:要求调查对象每一个单位都填报。非全面报表:要求调查对象中的部分单位填报。(2) 内容和实施范围内容和实施范围:国家/部门/地方统计报表(3) 报送周期长短报送周期长短:日报、旬报、月报、季报、半年报、年报 (4)报送单位不同报送单位不同:基层统计报表、综合统计报表。2.1.3 调查问卷设计与问卷调查表的编码调查问卷设计与问卷调查表的编码2.1.3.1 调查问卷设计调查问卷设计1问卷的基本结构问卷的基本结构 问卷是调查者根据调查目的和要求所设计的,一般由开头部分、甄别部分、主体部分和背景部分组成。主体部分是调查问卷的核心内容,它包括了所要调查的全部问题。例例:见P356 案例开头部分开

6、头部分 开头部分也是问候语,说明调查的目的,消除被调查者的顾虑,争取合作。甄别部分甄别部分 甄别部分是为了符合调查的需要,而对被调查者进行筛选。 背景部分主要是有关被调查者的一些背景资料。背景部分背景部分主体部分主体部分 主体部分是调查问卷的核心内容,包括了所要调查的全部问题。2设立问卷问题的注意事项设立问卷问题的注意事项(1) 提问的内容尽可能短。(2) 问题设计的用词要准确,用语要含义明确。 例例:您通常喜爱选购什么样的鞋? 您外出旅游时,会选购什么牌号的旅游鞋? 例例:您对它的价格和服务质量满意还是不满意? 您对它的价格是否满意? 您对它的服务质量是否满意? 例例:您最常用的获取新闻的方

7、式是什么?(只适合单选)例:例:最近您是否浏览过网站? 今天您是否浏览过网站? (3) 在问卷中的问题,必须是能够获得诚实回答的问题。例:例: 你对本课程的任课教师是否满意?(实名调查)(4) 问题的不同提法,可能导致不同的回答结果。例例:1941年罗格(Rugg)进行的试验: A:您是否认为美国应该禁止反对民主的公开言论? B:您是否认为美国应该允许反对民主的公开议论? 调查结果:A54 “是” B75 “否” (5) 尽量避免诱导性、否定性和敏感性问题。例:例:购买盗版制品是不道德的,你是否购买过盗版制品。 您并不认为应该增加反污染法规吧? 您的个人收入是多少? 3设立问卷答案的注意事项设

8、立问卷答案的注意事项 (1) 对单选问题,备选答案应当是一个空间的完整划分。 A:您对食堂的伙食满意么? (a)非常满意(b)满意(c)不满意 (2) 对单选,备选答案不应当是两个空间(层面)的混淆。 A:您至今未买电脑的原因是什么?(单选不可以,多选可以)(a)买不起(b)没有用(c)不懂(d)其它 (3) 无论多单选题,任一个备选答案都不能有多重含义。A.您选择信息专业的目的是:(a)自己喜欢,好就业(b) (4) 无论多单选题,备选答案之间不能有包含关系。A.您上大学的目的是:(a)将来有一份收入高的工作(b)能够过上比较富裕的生活(c) 4问卷设计的基本原则问卷设计的基本原则1)主题鲜

9、明目的明确,重点突出,没有可有可无的问题。 2) 结构合理先封闭后开放,先易后难。封闭性问题封闭性问题:事先设计好答案开放性问题开放性问题:自由回答例如,您对学校的教学管理有何更具体的看法?3) 适当控制回答时间(尽量不超过30分钟)4) 便于计算机处理易于编码、录入、汇总和数据出表2.1.3.2 问卷调查表的编码问卷调查表的编码1单选题问卷调查表的编码单选题问卷调查表的编码(1) 题号代号不能重复。(2) 同一量表的题号最好有相同的识别码。(3) 名义或类别问题的代号最好与其意义内涵有关, 以36个英文字母简写代表最好。例:例:年龄为AGE,年级为YEAR,工作类别为JOB等,学生性别为SE

10、X,教育程度为EDU等。2复选题问卷调查表的编码。表2-1 问卷调查表您的性别:1男生 2女生您的职务:1主任 2组长 3教师一您认为目前教改阻力来自哪些单位?(可复选)1教育行政单位 2学校行政人员 3家长团体4教师本身 5其他团体二.您认为目前教改对哪些人会有影响?(可复选)1教师 2行政人员 3学生 4其他A1A11A15A14A13A12A2A21A24A23A22表2-2 变量编码表NUMNUMSEXSEXJOBJOBA A1111A A1212A A1313A A1414A A1515A A2121A A2222A A2323A A2424001111011011010021200

11、1111000编码表说明:编码表说明:NUM- 编码 SEX- 性别 jOB- 职务 A11A15代表第一题中5个选项,选中者输入1, 未选中者输入0。A21A24代表第二题中4个选项,选中者输入1, 未选中者输入0。2.1.4 统计数据的误差l 统计数据的误差:统计数据的误差:指统计数据与客观现实之间的差距。l 研究误差的目的研究误差的目的:找出导致误差产生的原因,进而采取对策避免、减少误差或控制误差水平。l 误差的主要来源误差的主要来源:登记性误差和代表性误差。1登记性误差登记性误差(非抽样误差非抽样误差)登记性误差:登记性误差:人为因素所造成的误差。l 调查者调查者 规定或解释不明确导致

12、的填报错误; 调查员粗心,记录出现错误; 调查员的态度、情绪以及责任心等。l 被调查者被调查者 不理解规定或解释不明确导致的填报错误; 有意虚报或瞒报调查数据等。注:注:登记性误差理论上讲是可以消除的。2代表性误差代表性误差( (抽样误差抽样误差) )代表性误差:代表性误差:用样本数据推断总体时所产生的误差。l影响误差的主要因素影响误差的主要因素样本容量的大小样本容量的大小:样本容量越大,代表性误差就越小总体的离散程度的高低总体的离散程度的高低:总体中各个体间的差异越大,抽样误差也就越大注:代表性误差通常无法消除,但事先可以进行注:代表性误差通常无法消除,但事先可以进行控制和计算。控制和计算。

13、 本节小结本节小结统计数据搜集统计数据搜集统计调查涵义统计调查涵义统计报表统计报表普普查查 本节小结统计数据搜集统计数据搜集重点调查重点调查典型调查典型调查抽样调查抽样调查 本节小结统计数据误差统计数据误差登记性误差登记性误差代表性误差代表性误差2.2 统计数据的整理 整理数据的中心任务:分组编制频数分布表。2.2.1 统计数据分组统计数据分组统计数据分组:统计数据分组:就是根据统计研究的需要,将统计数据按照一定的标志划分为若干组成部分的一种统计方法。分组的标志:数量标志品质标志 1按品质标志分组品质型数据:主要是做分类整理。例如例如:按所有制性质划分,我国的经济类型可分为国有 经济,集体经济

14、,私营经济,个体经济,联营经济,股份 制经济,外商投资经济,港、澳、台投资经济8组。例如. 你是否认为你的任课教师在本门课程方面学识渊博。 为学生提供了以下几个选择: 1=非常赞同 2=赞同 3=不赞同 4=非常不赞同 从九个学生处得到如下数据: 3,2,2,4,2,1,3,1,4对数据进行分组得到: 1,1 2,2,2 3,3 4,42按数量标志分组数值型数据:主要是按照数值进行分组。 例例:对学生成绩分组,可分为60分以下、6070分、 7080分、8090分、90分以上5个组。按数量标志分组的方法: 单项式分组 组距式分组 单项式分组:单项式分组:把每一个变量值作为一组。适用条件:适用条

15、件:通常只适于离散变量且变量值较少的情况 例2.1 某车间50个工人看管机床台数资料如下:3 6 2 4 3 2 6 4 3 2 4 2 5 2 6 2 3 5 4 32 3 6 5 4 2 4 3 2 2 3 5 4 5 6 2 2 6 4 3 2 6 3 4 5 4 5 2 3 5试对数据进行分组。解:由于机器台数属于离散型变量,因此使用单项式分组方法。将原始资料按变量值升序排列,然后将相同变量值分为一组,最后将资料分成若干组。2 2 2 2 2 2 2 2 2 2 2 2 23 3 3 3 3 3 3 3 3 34 4 4 4 4 4 4 4 45 5 5 5 5 5 56 6 6 6

16、6 62) 组距式分组组距式分组:组距式分组:将全部变量值依次划分为若干区间,并将这一区间的变量值作为一组。适用条件:适用条件:连续变量离散变量且变量值较多组距:组距:等距分组:等距分组: 适用于变量值的变动比较均匀 不等距分组:不等距分组: 适用于变动很不均匀,且变动幅度大例:对学生成绩的分组可以分为020分、2040分、 4060分、6080分、80100组 例:学生成绩分组也可分为060(D)、 6080(C) 8090(B)、90100(A)关键问题:关键问题:分组数目的确定组距的确定等距分组不等距分组l等距分组的基本步骤:等距分组的基本步骤:数据排序分组数目的确定 使每组所包含的数据

17、个数,平均不少于4个或5个,或采用斯特吉斯经验公式,即 k=1+3.322lgNk为组数;N为总体中的个体数。表2-3 分组组数参考表N15242544458990179180359k56789组距的确定 组距=(最大值-最小值)组数。组限的确定(1)第一组的下限应略低于最小变量值,最后一组的上限应高于最大变量值。(2)对于离散型变量,相邻组的上下限可以不重叠;如:, 对于连续型变量,相邻两组的上下限应重叠,用“上限不在内”原则解决不重问题(左闭右开)如:,),),)(3)开口组:当变量值变动范围较大时,最小组为“以下”,或最大组为“以上”。如:以下,),),),以上组中值的确定 组中值=(上

18、限+下限 )2 开口组的组中值 =下限+邻组组距/2(缺上限) =上限邻组组距/2(缺下限)见例2.2P392.2.2 2.2.2 频数分布频数分布频数频数(frequency)=分布在各组内的数据个数.频率频率 (percentage)=各组频数/全部频数之和频数分布频数分布:在统计分组的基础上,将总体中所有的个体按某一标志进行归类排序2.2.2.1 频数分布表频数分布表频数分布表:将频数分布用表格的形式表现出来频数分布 品质频数分布:按品质标志分组 变量频数分布:按数量标志分组1品质频数分布表2-5 职工性别的频数分布表按性别分组频数/人数频率/%男女48504951合计981002变量频

19、数分布 单项式频数分布:每一组只有一个值 组距式频数分布:按组距式分组1)单项式频数分布表 宿舍所住学生数的频数分布表宿舍所住学生数/人频数/户频率/%45678203560122513.1623.0339.477.8916.45 合计152 1002) 组距式频数分布步骤:步骤:a 、分组 b 、统计出每组变量的频数,频率 c 、按各组组限的大小顺序列出组距式变量数列 d 、给出频数分布表 表2-7 某品牌汽车的销售量的频数分布表按销售量分组/辆频数/天频率/%21010202030941987325.854.220合计3651002.2.2.2 累计频数和累计频率1累计频数(cumulat

20、ive frequencies)频数逐级累加2累计频率或百分比(cumulative percentages)频率逐级累加累计频数(率)方法:累计频数(率)方法:到小向下累加:变量值从大到大向上累加:变量值从小例:例:某单位按某种产品的销售量分组统计,可以得到 如表2-8所示的频数分布。 表2-8 某种产品的销售量的频数分布表频数分布向上累计向下累计按销售量分组/台频数/天数频率/%累计频数累计频率累计频数累计频率1401501501601601701701801801901902002002102102202202302302404916272017108453.337.5013.3322.

21、5016.6714.178.336.673.334.17413295676931031111151203.3310.8324.1646.6663.3377.5085.8392.5095.8310012011610791644427179510096.6789.1775.8453.3436.6722.5014.177.504.17合计120140150 160 170销量台数10203040向上累计140150 160 170销量台数10203040120向下累计2.2.3 统计表与统计图2.2.3.1 统计表.统计表统计表将数据资料经汇总整理后,按一定顺序填在以纵横交叉的线条所绘制的表格内。统

22、计表的结构统计表的结构由表头、行标题、列标题、数字资料组成。 2统计表的设计(1) 表头设计要明确地表达其内容。(2) 左右两边通常不封口,列标题之间通常用竖 线分开,而行标题之间通常不用横线分开。(3) 应注明数字资料的计量单位。(4) 数字应对准位数。3统计表的分类 1)简单分组下的统计表 简单分组简单分组:只按一个标志进行的分组。 表2-11 19821990年北京市人口 (单位:万人)年份总人口198219831984198519861987917.83933.20945.20957.90971.23987.97资料来源:资料来源:8080年代中国人口变动分析年代中国人口变动分析( (

23、中国人口续篇中国人口续篇) )2) 复合分组下的统计表复合分组:复合分组:采用两个或两个以上的标志进行分组。表2-12 东北三省19931996年国内生产总值 (单位:亿元)资料来源:资料来源:中国统计年鉴中国统计年鉴(1997)(1997) 年份地区1993199419951996辽宁吉林黑龙江2010.82717.951203.222461.78936.781618.632793.371129.202014.533157.691337.162402.582.2.3.2 统计图统计图:利用各种几何图形表现统计资料的形式。1) 条形图(bar chart)条形图:条形图:用宽度相同的条形的高度或长短来表示数据频数分布变化的图形。适用条件:适用条件:用于用于比较、分析同类指标在不同时间或地区的发展差异,多用用于顺序和分类变量的分析。2) 饼形图(pie chart)饼形图饼形图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论