版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计是什么?1、搜集资料2、整理资料3、进行分析和推断1、总体2、样本3、推断4、推断的可靠性统计要素统计内容第2章统计资料的搜集和整理2.1统计调查的概念和方案的设计
2.2统计调查的方式和方法2.3问卷的设计2.4统计分组2.5频数分布和统计表导入案例:三大姓氏是如何统计的1982年,我国进行了一次全国性的人口普查。1986年此次普查的相关数据被统计出来。国家统计部门根据相关的资料数据,开始对我国的姓氏做统计研究。1987年,统计出中国的姓氏有12000个到13000个。同年,中国科学院正在进行有关姓氏研究的消息被一些媒体广泛传播。1987年5月2日,国家统计部门将此次姓氏统计中排名前一百位的姓氏公之于众,被称为“新百家姓”。“新百家姓”中,“李、王、张”位居前三甲。
据公安部治安管理局最近一次对全国户籍人口的统计分析显示:截至2007年,王姓是我国第一大姓,有9288.1万人,占全国人口总数的7.25%,也就是说每13个人中就有一个人姓王,这相当于四川省的总人口,比德国的总人口还高1000万人;第二大姓是李,有9207.4万人,占全国人口总数的7.19%;第三位是张姓,有8750.2万人,占全国人口总数的6.83%。三大姓氏总人口数已达2.7亿,这已接近了美国总人口数。§2.1统计调查的概念和方案的设计统计调查:按照
,运用科学的统计调查方法,有计划、有组织地向调查对象搜集原始资料和次级资料的过程研究目的及要求广州广播听众调查问卷目的:了解我市听众收听广州人民广播电台节目的一些基本情况,为提高节目质量、推出优秀节目提供科学依据。对象和单位:广州市市民调查项目和调查表:
调查项目:听众收听广州人民广播电台节目的一些基本情况调查表:调查项目以表格的形式来表现。调查什么2.1.2统计调查方案的确定(见例1)
1.确定调查目的:为何调查,解决什么问题(why)
2.确定调查对象和调查单位(who)
3.设计调查项目和调查表(what)
4.方案设计中的其他内容(how)调查时间/调查的组织与实施2.2常用的统计调查方式(专门调查、统计报表)1.普查:是专门组织的一般用来调查属于一定时点上社会经济现象数量的全面调查。优点:全面、系统人口普查,农业普查,工业普查缺点:只限于有限总体、工作量大、时间性强要求:一次性或周期性;统一调查时间为特定目的而专门进行,多属一次性调查全国总人口为1370536875人。其中:普查登记的大陆31个省、自治区、直辖市和现役军人的人口共1339724852人。香港特别行政区人口为7097600人。澳门特别行政区人口为552300人。台湾地区人口为23162123人。大陆31个省、自治区、直辖市和现役军人的人口中,男性人口为686852572人,占51.27%;女性人口为652872280人,占48.73%。总人口性别比(以女性为100,男性对女性的比例)由2000年第五次全国人口普查的106.74下降为105.20。4.抽样调查:是从调查对象中随机抽取一部分单位作为样本进行调查的一种非全面调查
优点:经济灵活、时效性强、适应面广和准确性高3.典型调查:在对研究对象进行全面分析的基础上,有意识地选择部分有代表性单位进行调查优点:调查范围小、省时力、具体深入缺点:具有主观性用途:推广先进经验,吸取落后教训2.重点调查:只在对象中选择一部分重点单位进行调查以了解总体基本情况的一种非全面调查优点:省时、省力、不带主观性。钢铁的生产情况比重较大人为选择的典型单位随机原则:调查单位以等可能被抽到,保证代表性最大抽样效果原则:误差尽量小or调查费用尽可能小。
5.统计报表是按照国家有关法规的规定,自下而上地逐级提供统计数据的一种调查方式。特点:是由政府部门组织、采用统一的表格、自上而下布置、自下而上报告。统计报表是经常性的全面调查。统计报表的分类:按调查范围的不同:分为全面和非全面统计报表按报表内容和实施范围的不同:分为国家统计报表、部门统计报表和地方统计报表按报送周期长短:分为日报、旬报、月报、季报、半年报和年报按填报单位的不同:分为基层统计报表和综合统计报表统计调查法直接观察法报告法采访法邮寄调查法1.要了解广东省居民家庭的收支情况,最适合的调查方式是(
)A、普查B、重点调查
C、抽样调查D、典型调查2.普查是为了某种特点的目的而进行的(
)。A、专门组织的一次性的全面调查
B、专门组织的经常性的全面调查C、非专门组织的一次性的全面调查
D、非专门组织的经常性的全名调查3.对连续大量生产的某种小件产品进行质量检验,最恰当的调查方法是(
)A、典型调查
B、重点调查
C、统计报表
D、抽样调查4、下列调查中,最适合采用重点调查的是(
)A、了解全国人口总数
B、了解广州市居民家庭的收支情况C、了解全国钢铁生产的基本情况
D、了解某校学生的学习情况2.3调查问卷设计1.问卷的基本要素
问卷是调查者根据调查目的和要求所设计的,一般由前言、问题和答案、编码和资料登录地址组成。问题和答案是调查问卷的核心内容,它包括了所要调查的全部问题。2.3.3问卷调查表的编码您手脚发凉吗()1、没有2、很少3、有时4、经常5、总是您受凉或吃(喝)凉东西后,容易腹泻吗()
1、没有2、很少3、有时4、经常5、总是编码的目的是使资料数量化,以便测量和统计2.设立问卷问题的注意事项问题和答案—核心内容(1)提问的内容尽可能短。(2)问题设计的用词要准确,用语要含义明确。例:您通常喜爱选购什么样的鞋?√您外出旅游时,会选购什么牌号的旅游鞋?例:您对它的价格和服务质量满意还是不满意?√您对它的价格/服务质量是否满意?(分别给出)例:您最常用的获取新闻的方式是什么?(只适合单选)××(3)在问卷中的问题,必须是能够获得诚实回答的问题。例:你对本课程的任课教师朱新河是否满意?(实名调查)(4)问题的不同提法,可能导致不同的回答结果。例:1941年罗格(Rugg)进行的试验:
A:您是否认为美国应该禁止反对民主的公开言论?
B:您是否认为美国应该允许反对民主的公开议论?调查结果:A54%“是”
B75%“否”
A:您至今未买电脑的原因是什么?
(a)买不起(b)没有用(c)不懂(d)其它
B:您至今未购买电脑的主要原因是什么?(a)价格高(b)用途较少(c)性能不了解(d)其它2.4统计分组
统计数据的整理是将收集到的各种原始数据条理化、系统化,使之符合统计分析与推断要求。整理数据的中心任务:分组/编制频数分布表。2.4.1统计分组统计分组:就是根据统计研究的需要,将统计信息按照一定的标志划分为若干组成部分的一种统计方法。按性别分组男女按民族分组汉族组藏族组回族组……按专业分组会计学组财务管理组审计学组ACCA组86按人数分组8553按期末成绩分组<6060~7070~80……按身高分组1.5~1.61.6~1.71.7~1.81.8~1.9按数量标志分组按品质标志分组统计分组的标志:1.按品质标志分组按品质标志分组就是按事物的品质特征进行分组。由于品质数据是用文字来表现的,每种表现即为一种类别,因此对品质型数据主要是做分类整理。例如:按所有制性质划分,我国的经济类型可分为国有经济,集体经济,私营经济,个体经济,联营经济,股份制经济,外商投资经济,港、澳、台投资经济8组。2.按数量标志分组按数量标志分组就是按事物的数量特征进行分组。由于数值型数据表现为具体的数值,因此对数值型数据主要是按照数值进行分组。例:对学生成绩分组,可分为60分以下、60~70分、
70~80分、80~90分、90分以上5个组。2.4.2统计分组体系简单分组:总体按照一个标志进行分组平行分组体系:同一个总体的几个简单分组按某一规定排列起来就构成一个平行分组体系。按性别分组男女按民族分组汉族组藏族组回族组……按专业分组会计学组财务管理组审计学组ACCA组(2)复合分组体系如果总体同时按两个或两个以上的标志层叠起来分组,就称为复合分组,由复合分组形成的分组系列就称为复合分组体系。
高等学校学生总体文科学生组本科学生组专科学生组理科学生组本科学生组专科学生组男生组女生组男生组女生组男生组女生组男生组女生组2.5频数分布和统计表频数分布在统计分组的基础上,将总体中所有的个体按某一标志进行归类排序,并用表格的形式表现出来就是频数分布表。频数(frequency)是指分布在各组内的数据个数.频率(percentage)为各组频数与全部频数之和的比值根据分组标志特征的不同,分布数列可分为属性分布数列和变量分布数列两种。频数分布表频数分布:属性分布数列/变量分布数列1.属性分布数列属性分布数列是指按照品质标志进行的分组所编制的频数分布。表2-5职工性别的频数分布表按性别分组频数/人数频率/%男女48504951合计981002.变量分布数列变量分布数列是指按照数量标志进行的分组所编制的频数分布。可分为单项式频数分布和组距式频数分布。86按人数分组8553按期末成绩分组<6060~7070~80……按身高分组1.5~1.61.6~1.71.7~1.81.8~1.91)单项式变量数列单项式变量数列是指数列中每个组的变量值只有一个。一般在离散型变量变异幅度不太大的情况下被采用。2)组距式频数分布组距式频数分布是指按组距式分组形成的频数分布。表-学校教师年龄分布(单项式)按年龄分组(分)人数(人)比率/%283442505538144110.026.746.713.33.3合计30100.0各组变量值频数表-某校教师年龄分布(组距式)按年龄分组(岁)人数(人)比率/%25~3535~4545~551114536.7%46.7%16.6%合计30100.02.频数分布表的编制(1)整理原始资料:确定最大最小值,并计算全距2)确定变量数列的形式:对于离散型变量,可以按一定的次序一一列举数值;对于连续型变量,不能编制单项式变量数列,而只能编制组距式变量数列。(3)编制组距式变量数列应注意的问题①确定组距:组距的大小要适度,要能正确地反映总体的分布特征及其规律。如果资料分布比较均匀,就可采用等距分组,否则应采用不等距分组。组距=(最大值-最小值)÷组数。第四,组限的确定组限的选择应做到第一组的下限应略低于最小变量值,最后一组的上限应高于最大变量值。离散型变量:相邻组的上下限可以不重叠连续型变量:相邻两组的组限应重叠,即上一组的上限同时也是下一组的下限。用“上限不在内”原则解决不重问题当变量值变动范围较大时,最小组为“……以下”,最大组为“……以上”的开口组。1、某企业职工的工资分为四组:(1)800元以下,(2)800~1000元,(3)1000~1500元,(4)1500元以上,则1500元以上这组的组中值应近似为(
)。A、1500元B、1600元C、1750元D、2000元2、某连续数列变量,首组为60分以下,其邻组的组中值为75,则首组的组中值为(
)。A、30
B、35
C、40
D、452.5.3累计频数和累计频率1.累计频数(cumulativefrequencies)累计频数就是将各有序类别或组的频数逐级累加起来。2.累计频率或百分比(cumulativepercentages)累计频率就是将各有序类别或组的频率逐级累加起来。累计频数(率)方法:例:某单位按某种产品的销售量分组统计,可以得到如表2-5所示的频数分布。表2-5某种产品的销售量的频数分布表频数分布较小制累计较大制累计按销售量分组/台频数/天数频率/%累计频数累计频率累计频数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业社会责任战略研究
- 2024年地调院食堂互联网外卖服务合同2篇
- 2024年度电商内容运营与策划合同3篇
- 2024年度租赁合同及设备购买协议
- 2024年度股权投资合同:创业企业股权投资协议
- 2024年度电机技术合作开发与共享合同
- 金属家具节能设计与制造
- 农村坟地买卖合同协议书模板完整版
- 2024年度展览馆厕所设计与安装合同
- 二零二四年度茶叶包装材料供应合同
- 马克思的资本有机构成理论与当代中国的经济发展
- 《秸秆还田》ppt课件
- 食品加工企业安全设计设施专篇
- 颈动脉斑块科普知识PPT参考幻灯片
- 封头容积、质量、内表面积和总高度计算
- 反射隔热涂料施工方案(完整版)
- 海南省建设工程施工阶段监理服务费计费规则
- [精编]《工伤保险》之铁路企业职工工伤保险试行办法
- 创建五星级班组PPT课件
- TBJWA001-2021健康直饮水水质标准
- 监理日报模板
评论
0/150
提交评论