版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
推荐书目/网站统计学(第5版)庞皓西南财经大学出版社2009年9月中国统计热点问题解读(第1版)国家统计局中国统计出版社2011年9月1日概率论与数理统计(第4版)盛骤高等教育出版社2008年6月第4版国家统计局中国统计信息网精选典型案例和统计改革举措,对GDP、CPI、房价、居民收入与支出等统计热点问题,从理论和实践相结合的角度做深入浅出的解答,文字生动、事例鲜活,图文并茂、通俗易懂,是公众学习统计知识、把握统计原理的重要辅助材料21:131第一页,共69页。本课件依托教材统计学:思想、方法与应用袁卫刘超中国人民大学出版社第1版(2011年9月1日)21:132第二页,共69页。作者简介
袁卫,中国人民大学统计学教授。我国首批经济统计学博士,获国家有突出贡献的中青年专家、全国优秀教师、首都五一劳动奖章,享受政府特殊津贴,入选教育部首批跨世纪优秀人才培养计划
刘超,中国人民大学经济学博士,清华大学经管学院博士后,现为北京航空航天大学数学与系统科学学院讲师、硕士生导师。研究方向为数理统计、数据挖掘、风险管理与保险等21:133第三页,共69页。目录第1章统计学导论第2章概率第3章分类数据的描述分析第4章定量数据的描述方法第5章
参数估计第6章假设检验第7章方差分析第8章相关与回归分析第9章时间序列与指数第10章国民经济统计初步基本概念/发展史和数学、统计软件的关系等数据的预处理频数表统计图等分布的集中位置,离散程度分布形态的度量误用描述方法扭曲事实概率的计算离散、连续随机变量的分布使用概率来检验假设样本统计量和总体参数点估计抽样分布与中心极限定理区间估计、合适样本量的确定怎样回答零假设所提出的问题显著性水平正态总体均值的假设检验总体比例的假设检验假设检验和置信区间单因素方差分析方差分析回顾双因素方差分析两个变量间关系、强度回归分析总体中的关系多元回归分析虚拟变量时间序列的成分平滑技术趋势分析指数国内生产总值(GDP)国民收入指标价格指数和总体价格水平失业率国际收支21:134第四页,共69页。课前思考1,同学们如何理解统计这个课程/专业2,统计学理论与现实的差异21:135第五页,共69页。第1章什么是统计学?如何运用统计学?统计学的基本概念数据的收集数据阵/数据文件统计学和数学、统计软件的关系21:136第六页,共69页。学习目标1.理解统计学的含义2. 理解描述统计和推断统计3.了解统计学的应用领域/发展史4.了解数据的类型5.理解统计中的几个基本概念21:137第七页,共69页。
统计数据与统计学
2011全年GDP471564亿元,按可比价格计算,比上年增长9.2%。居民消费价格比上年上涨5.9%全班统计学平均成绩77.5分上面陈述中的“数据事实”(numericalfacts)被称为统计数据/统计资料,它们是在统计学理论指导下,通过统计工作完成的。21:138第八页,共69页。1.1什么是统计学统计学是研究收集数据、整理数据、分析数据以及由数据分析得出结论的方法,简称为“数据的科学”。
比较:统计数据与统计学一般规律21:139第九页,共69页。大量数据如果不去分析它,那也仅仅是一堆数据而已,没有什么用处。因为有用的信息恰恰藏在数据的里面统计可以在多方面帮助你分析数据利用统计简化繁杂的数据用图表重新展示数据,进行比较分析建立数据模型进行预测1.1什么是统计学21:1310第十页,共69页。考试成绩人数甲班乙班优36良615中189及格98不及格4221:1311第十一页,共69页。2010年6月3日,第64届联合国大会第90次会议通过决议,确定每年10月20日为“世界统计日”。2011年初,国务院学位委员会在新的研究生专业目录中将统计学上升为一级学科,为统计学科和统计教育的发展提供了更广阔的平台,也显示出统计对科学研究、经济增长和社会发展的重要性。1.1什么是统计学21:1312第十二页,共69页。统计学的产生与发展
一、统计实践活动的产生与发展
统计实践活动产生于奴隶社会,当时的统治阶级为了对内统治和对外战争,需要征兵征税,开始了人口、土地和财产的统计。
封建社会末期,特别是进入资本主义社会以后,社会生产力迅速发展,统计逐步成为社会分工中的一个独立的部门和专业。同时欧洲出现了一些统计理论著作,标志着统计学的产生。统计学产生后形成了不同的学派。21:1313第十三页,共69页。二、古典统计学时期(十七世纪至十八世纪)1、政治算术学〈1〉创始人:威廉·配第
〈2〉产生的背景:当时的英国统治阶级为了管理国家、发展经济、争夺世界霸权,需要了解国内外的社会经济状况,于是在英国产生了政治算术学派。〈3〉研究方法:从数量方面研究社会经济现象21:1314英国古典政治经济学创始人,统计学家。主要有《赋税论》(1662),《献给英明人士》(1664),《政治算术》(1672),《爱尔兰政治剖析》(1674),《货币略论》等第十四页,共69页。二、古典统计学时期(十七世纪至十八世纪)2、
国势学派〈1〉创始人:海尔门·康令
〈2〉产生的背景:当时的德国正处于封建制度解体的时期,统治者要了解国内外的政治经济情况,决定国策,在当时封建制的德国产生了国势学派。
〈3〉研究方法:对国家重要事项的记述,几乎完全偏重于品质方面而忽视了量的分析。21:1315第十五页,共69页。三、近代统计学时期(十八世纪末至十九世纪末)
1、数理统计学派〈1〉创始人:阿道夫·凯特勒〈2〉产生的背景:当时资本主义国家的自然科学有了很大发展,促使英美统计学界尝试用研究自然的方法研究社会经济现象,并引入概率论,产生了数理统计学派.〈3〉研究方法:用大数定律从社会经济现象复杂不定的偶然性中寻找其规律性。21:1316第十六页,共69页。2、社会统计学派(1)创始人:德国的克尼斯(2)产生的背景:实现了统一的德国,为了发展资本主义、争夺殖民地和海外市场,迫切需要掌握国内外大量的国民经济统计资料,以揭示社会经济现象的规律性,于是在德国形成了社会统计学派。
(3)研究方法:在对统计资料进行搜集、整理、分析的基础上,明确现象内部的联系和规律性三、近代统计学时期(十八世纪末至十九世纪末)
21:1317第十七页,共69页。四、现代统计学时期(二十世纪初至今)1、数理统计学
这一时期的数理统计学,在深度和广度上都有了迅速的发展,出现了新的分支和边缘科学,成为现代统计学的主流学派。2、社会统计学
这一时期的社会统计学也有所发展,其基本趋势是由实质性科学向方法论科学的转变,但相对缓慢。指这类科学的内容及任务在于揭示客观事物发展变化的规律,以指导人们按照客观规律的要求去改造世界,如经济学、人口学、财政学、市场营销学等,都属实质性科学人们认识世界、改造世界的一般方法,是人们用什么样的方式、方法来观察事物和处理问题。概括地说,世界观主要解决世界“是什么”的问题,方法论主要解决“怎么办”的问题21:1318第十八页,共69页。3、
社会经济统计学
在德国社会统计学的影响下,以前苏联为首的社会主义国家逐步建立和发展了社会经济统计学,曾成功地应用于社会主义的计划经济分析。由于当时国际意识形态的对立,这些国家用武断的方法解决学术上的争议,使得统计科学没有按照科学自身的规律不断进步,因此发展缓慢。4、中国的统计学
新中国成立后,输入了苏联的社会经济统计学,虽然曾经发挥了重要作用,但同样进步迟缓。八十年代以后,统计进入了全面改革的新时期,统计方法更加丰富、应用更加广泛,统计学得到了很大的发展。四、现代统计学时期(二十世纪初至今)21:1319第十九页,共69页。理解统计对大众的必要性在外出旅游时,需要关心一段时间内的详细天气预报在投资股票时,需要了解股票市场价格的信息,了解某只特定股票的有关财务信息理解统计对管理者更重要一个统计办公室的主管也是一个行政事务官,一次与一些统计学者开会,统计学者抱怨从其他部门收到的一些估计值没有给出标准误差(估计时的误差大小,表示估计的精度),这个主管马上问道:“对误差也有标准吗?”健康大臣对一个统计学者的报告中提到的去年由于某种疾病,平均1000中死亡人数为3.2这个数字发生了兴趣。他问他的私人秘书,3.2个人是如何死法?他的秘书说:“先生,当一个统计学家说死了3.2个人时,意味着3个人已经死了,两个人正要死。”1.2如何运用统计学
21:1320第二十页,共69页。统计应用
用简单的描述量得到一个重要发现
费舍在1952年的一篇文章中举了一个例子,说明如何由基本的描述统计量知识引出一个重要的发现。20世纪早期,哥本哈根卡尔堡实验室的施密特发现不同地区所捕获的同种鱼类的脊椎骨和鳃线的数量有很大不同;甚至在同一海湾内不同地点所捕获的同种鱼类,也发现这样的倾向。然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值和标准偏差值施密特由此断定所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的。后来名为“戴纳(Dana)”的科学考察船在一次远征中发现了这个场所21:1321第二十一页,共69页。让你说出哪些领域不使用统计,这很困难,因为几乎找不到一个不用统计的领域;让你说出哪些领域应用统计,同样也很困难,因为几乎所有的领域都应用统计举出一个统计没有用途的领域名称比举出一个统计作为其组成部分的领域名称要困难得多(RobertJohnson)几乎所有的领域都要用统计21:1322第二十二页,共69页。统计的应用领域actuarialwork(精算)agriculture(农业)animalscience(动物学)anthropology(人类学)archaeology(考古学)auditing(审计学)crystallography(晶体学)demography(人口统计学)dentistry(牙医学)ecology(生态学)econometrics(经济计量学)education(教育学)electionforecastingandprojection(选举预测和策划)engineering(工程)epidemiology(流行病学)finance(金融)fisheriesresearch(水产渔业研究)gambling(赌博)genetics(遗传学)geography(地理学)geology(地质学)historicalresearch(历史研究)humangenetics(人类遗传学)21:1323第二十三页,共69页。统计的应用领域hydrology(水文学)industry(工业)linguistics(语言学)literature(文学)manpowerplanning(劳动力计划)managementscience(管理科学)marketing(市场营销学)medicaldiagnosis(医学诊断)meteorology(气象学)militaryscience(军事科学)nuclearmaterialsafeguards(核材料安全管理)ophthalmology(眼科学)pharmaceutics(制药学)physics(物理学)politicalscience(政治学)psychology(心理学)psychophysics(心理物理学)qualitycontrol(质量控制)religiousstudies(宗教研究)sociology(社会学)surveysampling(调查抽样)taxonomy(分类学)weathermodification(气象改善)中国国民党中央执行委员会调查统计局国民政府军事委员会调查统计局21:1324第二十四页,共69页。理论统计学应用统计学描述统计学推断统计学国民经济统计学社会统计学人口统计学研究的内容是运用于某一特定领域的统计问题统计学的分科研究的内容是统计的一般理论和方法21:1325第二十五页,共69页。描述统计
(descriptivestatistics)是用图形、表格和概括性的数字对数据进行描述的统计方法。内容搜集数据整理数据展示数据描述性分析目的描述数据特征找出数据的基本规律一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”21:1326第二十六页,共69页。推断统计
(inferentialstatistics)是利用样本数据来推断总体特征的统计学方法内容参数估计假设检验目的对总体特征作出推断样本总体为了解某高寒地区小学生血红蛋白含量的平均水平,某人于2012年6月随机抽取了该地小学生708名,算得其血红蛋白均数为103.5g/L,标准差为1.59g/L。试求该地小学生血红蛋白均数的95%可信区间21:1327第二十七页,共69页。描述统计和推断统计的关系21:1328第二十八页,共69页。1.3统计学的基本概念1.3.1
随机性和规律性当不能预测一件事情的结果时,这件事就和随机性联系起来了。例如,掷硬币,参加统计考试是否会达到预期的分数当把大量随机事件放在一起时,就表现出一定的规律性例【1】:掷硬币例【2】:新生婴儿的性别比例表面看:某些家庭的新生婴儿性别没有一定规律大量观察:男女婴比:107:100。(再如人的寿命)上述比例由人类自然发展的内在规律所决定。(男性死亡率略高于女性)
统计可以看做是一项对随机性中的规律性的研究。
请注意:规律也表现为某种随机性随机性与规律性:你中有我,我中有你。21:1329第二十九页,共69页。1.3.2
概率概率(probability)
:某一事件发生的机会有多大。概率为统计学的第三个方面——如何从数据中得出结论——奠定了基石。我们可能永远不能确定两个数字的差异是否超出了随机性本身所预期的范围,但是我们可以确定,这种差异发生的概率是大还是小。根据这个基本思想,在很多情况下,我们可以得出关于我们所处的这个世界的重要结论。21:1330第三十页,共69页。1.3.3变量(variable)
指一个可以取两个或更多个可能值的特征、特质或属性。如商品销售额、受教育程度、产品的质量等级等变量的具体表现称为变量值。变量可以分为分类变量(categoricalvariable):说明事物类别的名称.如性别(男,女)。特点是:平行排列顺序变量(rankvariable):说明事物有序类别的名称。如产品等级。特点是:可排序,比较大小数值型变量(metricvariable):说明事物数字特征的名称。如:成绩、年龄、产量离散变量:取有限个值连续变量:可以取无穷多个值与变量对应的是常数21:1331第三十一页,共69页。1.3.3变量(variable)
21:1332第三十二页,共69页。1.4数据的收集1.4.1定义变量数据收集的第一个准则是要清楚测量的是什么。换句话说,变量必须有一个明确的适合研究目的的定义这有时是说起来容易做起来难。如果我们对问题考虑得不全面,那么就没理由指望回答问题的人(一般称为响应者)能按照我们期望的回答问题。在我们做研究之前,对变量必须要有一个清晰、详尽的定义。如,"在您的家庭中有多少个孩子?"如果一个家庭中包含大于18岁的亲生子女、前妻或前夫的孩子、养子或养女、过继子女或者其他年轻的亲戚,那该怎么办呢?对于不和亲生父母生活在一起的孩子怎么算呢?对于父母离了婚而共同抚养的孩子怎么算呢?21:1333第三十三页,共69页。1.4.2收集数据的方法观测访问问卷调查实验观测:是指仅通过对世界的观察(而没有操纵或控制它),并记录观测的结果。访问:是通过座谈会、走访等方式取得数据。问卷:是通过发放问卷的方式取得到数据。实验:是在实验中控制一个或多个变量并测量操纵的结果。(目的:寻找原因)。区别:观测数据的研究者尽量不干涉研究对象的行为模式,但不能对因史数据进行观测。访问在一定程度上对被访问者心理造成干扰,则收集到的数据会有误差;问卷常会产生未响应误差;实验时需要其控制它变量的影响。
如,为了解碘盐对人体的影响,在某地区进行实验,一个区域的人吃碘盐,另一个不吃,一定时期后观察样本人群的某些指标值21:1334第三十四页,共69页。总体和样本总体(population)所研究的全部个体(数据)的集合,其中的每一个个体也称为元素分为有限总体和无限总体有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的样本(sample)从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本容量或样本量(samplesize)人口普查,总体有限空气质量,则总体无限21:1335第三十五页,共69页。样本的选择统计研究者所面临的一个关键问题是如何选择样本。我们希望基于样本得出的结论能够适用于总体,这依赖于获得一个"好"的样本,否则这是不可能实现的。当我们品尝一勺我们做的汤时,我们关心的不是这勺汤怎样,而是整个锅里的汤味道如何。如果锅里的汤被充分搅拌了,我们只需品尝一勺即可知道整锅汤的味道。这正如我们从总体中选择一个样本,从某种意义上来说,需要选择一个来自"搅拌均匀"的总体的样本。如果总体能被搅拌均匀,那么一个包含1000个个体的样本,不管它是以整个国家为总体,还是以一个城市为总体,都可以告诉我们同样多的内容。21:1336第三十六页,共69页。读者文摘的总统选举调查
这个故事有关一次著名的失败的统计调查。
1936年美国总统选举前,一份名为读者文摘的杂志曾进行了一次民意调查。调查的焦点是谁将成为下一届总统——是挑战者,堪萨斯州州长阿尔夫·兰登,还是现任总统富兰克林·德拉诺·罗斯福。
为了了解选民意向,民意调查专家们根据电话簿和车辆登记簿上的名单给一大批人发了简单的调查表。尽管发出的调查表大约有一千万张,但收回的比例并不高。在收回的调查表中,兰登非常受欢迎。于是,该杂志预测兰登将赢得选举。21:1337第三十七页,共69页。样本的选择目的:推断总体随机样本:按照随机原则从总体中抽取的用以代表总体的样本。如,从一个纸箱子中抽签对学生点名回答问题。方便样本:能够很容易、很经济地得到的样本称为方便样本。研究者们经常习惯于研究手头方便的总体中的个体。例如,医学研究者经常对他们自己的病人做研究。从方便样本中得出的结果有时候很难推广到整个总体。21:1338第三十八页,共69页。抽样方式21:1339第三十九页,共69页。概率抽样概率抽样:也称随机抽样,按一定的概率以随机原则抽取样本特点抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率21:1340第四十页,共69页。是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式简单随机抽样(纯随机抽样)21:13方法:在抽样框中的每个单位都具有相同的被抽中的机会,每个容量相同的样本被抽中的机会也是相同的。
抽取样本的方法:有放回抽样和无放回抽样。适合:总体内部差异不是很大,规模也不大的情况。41第四十一页,共69页。简单随机抽样
案例应用21:13要对一批小包装饼干进行卫生达标检查,只能从中抽取一定数量的饼干作为检验的样本,用样本的卫生情况来估计这批饼干的卫生情况.如果对这批饼干全部检验,费时费力,等检查完了,这批饼干可能就超过保质期了,再就是会破坏这批饼干的质量,导致无法出售.获取样本的方法是:将这批小包装饼干,放入一个不透明的袋子中,搅拌均匀,然后不放回地摸取,这样就可以得到一个样本.通过检验样本来估计这批饼干的卫生情况.42第四十二页,共69页。简单随机抽样
练习21:13为了检验某种产品的质量,决定从100件产品中抽取10件进行检查,如何用简单随机抽样抽取样本?43第四十三页,共69页。简单随机抽样
练习21:13①将这100件产品编号为1,2,…,100;②做好大小、形状相同的号签,分别写上这100个号码;③将这些号签放在一个不透明的容器内,搅拌均匀;④连续抽取10个号签;⑤然后对这10个号签对应的产品检验另一种:利用电脑产生随机数44第四十四页,共69页。分层抽样——将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本。总体N样本n等额等比例······能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标21:13最优45第四十五页,共69页。分层抽样
实例应用21:13一个单位职工有500人,其中不到35岁有125人,35至49岁有280人,50岁以上有95人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本。
由于职工年龄与该指标有关,决定采用分层抽样方法进行抽取。因为样本容量与总体的个数的比为1:5,所以在各年龄段抽取的个数依次为125/5、280/5、95/5,即25、56、19。46第四十六页,共69页。分层抽样
练习21:13某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为A.15,5,25B.15,15,15C.10,5,30D.15,10,2047第四十七页,共69页。系统抽样(机械抽样或等距抽样)——将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。随机起点半距起点对称起点(总体单位按某一标志排序)按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。21:1348第四十八页,共69页。系统抽样(机械抽样或等距抽样)案例应用21:13某企业有职工5000名,现要随机抽取100人进行家庭收入水平调查。抽取方法:按与研究目的无直接关系的姓名笔划对总体进行排列,把总体划分为100个人数为(K=5000/100)50人相等的间隔,在第1至第50人中随机抽取一名,如抽到第10名,后面间隔依次抽取第60,110,160,210,…直到4960为止,总共抽取100名职工组成一个样本。49第四十九页,共69页。系统抽样(机械抽样或等距抽样)练习21:13为了了解某大学一年级新生英语学习的情况,拟从503名大学一年级学生中抽取50名作为样本,如何采用系统抽样方法完成这一抽样?50第五十页,共69页。系统抽样(机械抽样或等距抽样)练习21:13
分析:总体个数503,样本容量50,不能整除,采用随机抽样的方法从总体中剔除3个个体,然后采用系统抽样方法。
1,将学生随机编号为1,2,3,…,503。
2,用抽签法或随机数表法,剔除3个个体,对剩下的500名学生重新编号,或采用补齐号码的方式。
3,确定分段间隔k,将总体分为50个部分,每一部分包括10个个体。
4,第1部分简单随机抽样确定起始的个体编号,例如是5。
5,依次在第2部分,第3部分,…,第50部分,取出号码为15,25,…,495这样得到一个容量为50的样本。
点评:总体中的每个个体,都必须等可能地入样,为了实现“等距”入样且又等可能。因此,应先剔除,再“分段”,后定起始位。51第五十一页,共69页。整群抽样(集团抽样)——将总体全部单位分为若干“群”,然后随机抽取一部分“群”,被抽中群体的所有单位构成样本例:总体群数R=16样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差21:1352第五十二页,共69页。整群抽样(集团抽样)案例应用21:13上级部门想了解某学院学分制情况,从该学院500个寝室(每室住6人),随机无放回的抽取10个宿舍,询问每个学生这学期副课的选修门数,试问全院人均选修副课的门数,并给出95%下的置信区间,以及群内相关系数与设计效应53第五十三页,共69页。非概率抽样抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查
有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式21:1354第五十四页,共69页。非概率抽样:方便样本:能够很容易、很经济的得到的样本判断样本:指根据调查人员的主观经验从总体样本中选择那些被判断为最能代表总体的单位作样本的抽样方法配额样本:是指调查人员将调查总体样本按一定变量分类或分层,确定各类(层)单位的样本数额,在配额内任意抽选样本的抽样方式自愿样本:被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息滚雪球样本:以若干个具有所需特征的人为最初的调查对象,然后依靠他们提供认识的合格的调查对象,再由这些人提供第三批调查对象……依次类推,样本如同滚雪球般由小变大21:1355第五十五页,共69页。误差:指收集来的数据资料与真实情况间的差异1.4.3收集观测数据时的错误和误差—数据的质量数据误差抽样误差非抽样误差调查员误差响应误差未响应误差研究调查误差的主要目的是找出导致误差产生的原因,进而采取对策避免、减少误差或控制误差水平21:1356第五十六页,共69页。从全部学生中随机抽取20人组成样本并计算平均体重:样本一:52.35样本二:50.26样本三:53.19…真值:51.18抽样误差21:1357第五十七页,共69页。抽样误差:并非错误的"误差"调查中的有些误差纯粹是统计上的,即抽样误差这并不是某件事出错造成的误差,而是指这样的一个事实:如果研究被再做一遍,结果未必会和上次一模一样。例如,前面提到过的第二个100次掷硬币中,也许就有49次正面朝上,不同于第一个的52次。又如,在下一次的抽样中,也许并不是60%的人赞同政府开征的房地产税,而是57%或63%或其它相近比例的人赞同。但是,即便不同的样本会产生不同的答案,大部分答案仍都位于总体中的真正比例的某一变化范围内。例如,通过每次大约1000个响应者的多次抽样,大部分样本(95%)得出的比例和实际的比例至多相差3个百分点。也就是说,抽样误差等于加或减三个百分点(±3%)。21:1358第五十八页,共69页。未响应误差另一种误差是未响应误差,是指由于一部分人未回答调查而造成的误差。这可能是电话未通,或通后却拒绝回答。邮寄调查通常比电话调查有更多的未响应误差。有时,一次好的电话调查,通常会有85%至90%的响应率;而一次邮寄调查的响应率很少有到达50%的.对研究者来说,高拒绝率是一个很大的问题,因为他们对于被选中但未参与调查的人了解很少。于是出现许多无法回答的问题:是什么使得人们有了不响应和响应的区别?相对响应者来说,未响应者是富有还是贫穷?保守还是自由?有影响力还是缺乏影响力?如果他们响应,他们的回答会怎样影响研究结果?21:1359第五十九页,共69页。未响应误差假定计划调查1200个人,却只有1000人接受了调查,这意味着缺了200人的数据。在1000个响应者中,600人(或60%)赞成某事物而其余人反对。如果假定另外200人也赞成,那么在1200人中就有800人赞成,比例为67%。但另一方面,如果假定那200人反对,那么1200人中只有600人赞成,比例为50%。因此,仅仅由于未响应误差,观测样本中60%的赞成比例有可能实际只是50%和67%之间的一个随机数。这就可能给结论带来很大的差别。一些经验表明,大部分情况下,未响应者和响应者并无多大差别。如果我们开始时有一个高的响应率,那么可假定未响应者也依同样的比例作出回答。但是如果响应率很低,例如不超过50%,那么不响应的影响可能会很大。21:1360第六十页,共69页。
响应误差如果研究者小心一点的话,是有可能避免响应误差的。
响应误差是在调查过程中,由于问题的提问方式、问题所处的位置或访员的影响而使得响应者在回答问题时产生的偏差。即使所有的问题都有了回答,我们所知道的也仅仅是调查时人们告诉访员的,而未必是他们实际上做的、感觉的或想的。
当我们在报纸上读到,在最近的一次调查中有55%的人认为他们的生活很幸福,那么我们应该知道这句话其实是这个意思:被调查并回答了问题的人在当时有55%对访员说他们认为生活很幸福。21:1361第六十一页,共69页。1.5
数据阵/数据文件数据表通常叫做数据阵或数据文件表1.2一次抽样调查的原始数据序号年龄性别态度120男反对223男赞成317女反对438女中立525女赞成643男赞成738男中立851女赞成935男赞成1039女反对21:1362第六十二页,共69页。1.5
数据阵/数据文件表1.3适合计算机处理的一次抽样调查的数据序号年龄性别态度12011223133170143802525036431373812851039351310390121:1363第六十三页,共69页。1.6统计学和数学、统计软件的关系统计学基础是数学,统计推断牢牢地建立于数学基础之上
没有数学知识也有可能学会统计,这是本书的讲述方式要学会基本的统计思想——某些专业术语,数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二四年农产品出口贸易代理合同3篇
- 二零二五年度出租车驾驶员培训与就业合同2篇
- 2025年度个人住宅租赁合同示范文本更新版
- 2025年度油气田钻井工程合同执行监督合同范本4篇
- 2025年度瓷砖行业绿色生产与环保标准合同4篇
- 2025年度电商商铺支付结算平台安全性与稳定性保障合同4篇
- 2025年度网络安全技术服务合同样本下载4篇
- 2025年度企业庆典场地借用合同模板3篇
- 2025年度出口货物运输国际法规遵守合同4篇
- 2025年度进口车辆转让及售后服务保障合同4篇
- 2025年上半年江苏连云港灌云县招聘“乡村振兴专干”16人易考易错模拟试题(共500题)试卷后附参考答案
- DB3301T 0382-2022 公共资源交易开评标数字见证服务规范
- 人教版2024-2025学年八年级上学期数学期末压轴题练习
- 江苏省无锡市2023-2024学年八年级上学期期末数学试题(原卷版)
- 俄语版:中国文化概论之中国的传统节日
- 2022年湖南省公务员录用考试《申论》真题(县乡卷)及答案解析
- 妇科一病一品护理汇报
- 哪吒之魔童降世
- 2022年上海市各区中考一模语文试卷及答案
- 2024年全国统一高考数学试卷(新高考Ⅱ)含答案
- 地震工程学概论课件
评论
0/150
提交评论