管理统计学课件_第1页
管理统计学课件_第2页
管理统计学课件_第3页
管理统计学课件_第4页
管理统计学课件_第5页
已阅读5页,还剩452页未读 继续免费阅读

VIP免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

管理统计学

中美纯水公司的产品是“纯水”,如果想要使该名称给人们一种“纯净”的感觉,那么“中美纯”将是最好的商品名称;如果想要使该名称给人们一种“清爽”的感觉,那么“玉泉”将是最好的商品名称。中美纯水公司接受了调查统计研究所的建议,没有用“波澜”这个名称,而用了“中美纯”作为品牌的名称。实践证明,它的确是一个成功的品牌名称。由直观图可以看出,“波澜”(Name5)与“洗衣机”(Product7)产品相联系,引起的感觉是“兴奋”,因此“波澜”不是合适的纯净水品牌名称。结论统计数据搜集能力统计数据整理能力统计数据分析能力支撑能力

沟通协调能力

写作和表达能力

计算机应用能力统计能培养哪些能力?促进就业:逻辑思维能力增强,自学能力突出。这些能力对于事业的成功可以说是至关重要的。毕业生的去向有政府统计部门,银行、证券公司、保险公司等金融机构,信息咨询公司等。自主创业:经过数据分析,你准确预测了某地区房屋需求及供给关系的走势,或者发现特殊人群的消费倾向,那么无穷的商机就清晰的展现在你的面前。继续深造:事实上,统计学不光就业前景十分光明,其深造前景也相当不错。尤其是美国顶级商学院(如斯坦福,哈佛等),比较喜欢招收具有很好统计学及数学背景的人才。对于怀有美国商学院梦的同学们,统计学会是一个不错的选择。就业前景如何…….统计学概念和分类(掌握)统计学产生和发展阶段(了解)统计学研究对象和方法(掌握)统计学研究过程和基本要素(了解)第一章绪论Statistics1、统计资料的复数2、统计学统计学研究如何收集、整理、分析反映社会经济管理问题的有关数据,并对研究对象进行统计分析、推断的科学。管理统计学管理统计学是统计方法应用于管理并与管理相结合而形成的一门管理科学;它研究如何有效地收集、整理和解释反映社会和经济管理实践的数据,以期认识数据的规律性及内在的社会和经济含义。一、统计学相关概念第一章统计资料第二章统计资料的整理第三章统计资料的综合第四章统计抽样与抽样分布第五章参数估计第六章假设检验第七章方差分析第八章一元线性回归分析第九章多元线性回归分析第十章时间序列与指数章节安排描述统计学

研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。推断统计学

研究如何通过样本数据去推断总体数量特征。是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。二、统计学分类描述统计举例:图解全球油价举例:图解全球油价举例:图解全球油价举例:图解全球油价举例:图解全球油价举例:图解全球油价举例:图解全球油价推断统计举例:广告费用与销售额的关系

美国七大品牌的软饮料相关统计数据表:

分析广告费用与销售数量的关系。品牌广告费用(百万美元)销售数量(百万箱)Coca-Cola131.31929.2Pepsi-Cola92.41384.6Diet-Coke60.4811.4Sprite55.7541.5Dr.Pepper40.2546.9MoutainDew29.0535.67-Up11.6219.5推断统计(相关和回归分析)统计学探索客观现象数量规律性的过程反映客观现象的统计数据描述统计学(统计数据的收集、整理、显示和分析)推断统计学(利用样本信息和概率论对总体数量特征进行估计并检验)概率论(分布理论、大数定律、中心极限定理)总体内在的数量规律推断统计和描述统计统计的发展历史可以追溯到原始社会。

如,古代埃及、希腊、罗马和中国。

我国在公元前2000多年的夏禹时代,就有了人口、土地的历史记载。最早的统计,是作为国家重要事项的记录。统计学作为一门科学,距今已有300多年的历史。三、

统计学的产生和发展阶段统计学的萌芽期(17世纪中~18世纪中、末叶)统计学的近代期(18世纪末~19世纪末)统计学的现代期(20世纪初至今)统计学发展的三个阶段国势学派:德国,康令(H.Conring)。

也称为记述学派,提出了统计学(Statistics)这个名称。

指导国家重要事项系统地罗列出来,但忽视了量的分析。

“有统计学之名,无统计学之实”。政治算数学派:英国,威廉·配地(W.petty)。

主张通过数量分析,用数字来说话,并开始用朴素的图表来概括数字资料。

第一本关于人口统计的著作,约翰.格朗特(人口统计的创始人)

1662年,《关于死亡表的自然观察与政治观察》。

无统计学之名,有统计学之实。统计学的萌芽期(17世纪)数理统计学派:比利时凯特勒,近代统计学之父。

起源于赌博中的数量规律研究,统计学与概率论的结合。

提高了统计计量上的准确性,使统计学产生了质的飞跃,为近代统计学奠定了基础。社会统计学派:德国,恩格尔。

认为统计学的研究对象是社会现象,目的在于明确社会现象内部的联系和相互关系。

19世纪末建成了古典统计学(描述统计学)的框架。统计学的近代期(18-19世纪)大工业的发展对产品质量检验问题提出新的要求。1907年,英国戈赛特,提出小样本t统计量完成对全部产品的质量检验和推断。20世纪30年代,由描述统计学转向推断统计学。20世纪60年代之后,三个明显的趋势:

1.依赖数学的发展

2.以统计学为基础的边缘学科形成

3.计算机在统计学中发挥的作用增强统计学是一门方法论的综合性学科。统计学的现代期(20世纪初至今)研究对象:随机问题?确定问题?模糊问题?定量关系?定性关系?四、统计学的研究对象和方法大量观察法综合指标法统计推断法四、统计学的研究对象和方法大量观察法:对总体的全部或足够多数的单位进行调查并进行综合分析。大数定律

(lawoflargenumbers),是一类描述当试验次数很大时所呈现的概率性质的定律。在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。

比如,抛硬币。问题:新生婴儿的性别比是1:1吗?大量观察法一般人认为,新生婴儿的男女性别比为1比1。实际上,如果对新生婴儿的性别进行“大量观察”,

会发现男孩稍多于女孩,大致比例为:这就是新生儿性别的数量规律性。(14:13)

它是由人类社会长期遗传和发展所决定的,古今中外都大致相同。举例:新生婴儿的性别比是1比1吗?107:100新生儿男多于女,不是性别不平衡了吗?但是,儿童时期,男孩的死亡率要高于女孩,到了中青年时期,男女人数就大致相同了,进入老年后,男性的死亡率仍高于女性,男性平均预期寿命比女性短,老年男性反而少于女性。举例:新生婴儿的性别比是1比1吗?从全人类看,婴幼儿时男多于女,中青年时大致相同,老年时女多于男。这样,在中青年结婚生育时性别大致平衡,总人口上性别也是大致平衡的,保证了人类社会的进化与发展。对人类性别比例的研究是统计学的起源之一,也是统计方法探索的最早的数量规律性之一。举例:新生婴儿的性别比是1比1吗?但是。。。。

2008年国民经济和社会发展统计公报显示,出生人口男女性别比为120.56:100;2009年,该数据为119.45:1002010年,该数据为117.94:100;2011年,该数据为117.78:1002014年,该数据为115.88:1002008-2014年,总体为115:100。扩展阅读:出生人口性别比举例:新生婴儿的性别比是1比1吗?2012年,温州出生人口性别比为121.81金华第二,为115.45台州112.43,宁波112.61,舟山110.13,杭州109.38,嘉兴108.88。国际社会公认的人口性别比值则在103-107之间。温州金华最为“重男轻女”光棍危机!

中国光棍危机将于2016年左右全面爆发。男性人口将大幅超过女性,到2016年超出女性人口30%以上。总光棍人数将由2012年的1000万上升到2017年的3000多万,2022年近4000万。娶上媳妇今后将作为成功男人的标志!光棍危机!

人口普查(census),是指在国家统一规定的时间内,按照统一的方法、统一的项目、统一的调查表和统一的标准时点,对全国人口普遍地、逐户逐人地进行的一次性调查登记。人口普查工作包括对人口普查资料的搜集、数据汇总、资料评价、分析研究、编辑出版等全部过程,它是当今世界各国广泛采用的搜集人口资料的一种最基本的科学方法,是提供全国基本人口数据的主要来源。2010年11月,全国第六次人口普查。举例:人口普查电子化和抽样调查:芬兰等国使用这种最先进的方式进行人口普查,人头费用20美分;邮寄问卷辅以电话调查:美国使用,人头费用36美元;入户调查:中国使用。人头费用约8美元(按北京推算,北京投6亿人民币搞人口普查)。人口普查的三种方式综合指标法:在大量观察的基础上,对于大量观察所获得的大量原始数据进行整理汇总,计算各种综合指标。例如,2010年上半年国内生产总值139862亿元,按可比价格计算,同比增长7.1%,比一季度加快1.0个百分点。上半年,城镇居民家庭人均总收入9667元。其中,人均可支配收入8856元,同比增长9.8%,扣除价格因素,实际增长11.2%。综合指标法中国国家统计局8月10日公布的数据显示,2014年7月份,全国居民消费价格总水平同比上涨2.3%。其中,城市上涨2.3%,农村上涨2.1%;食品价格上涨3.6%,非食品价格上涨1.6%;消费品价格上涨2.2%,服务价格上涨2.5%。1-7月平均,全国居民消费价格总水平比去年同期上涨2.3%。综合指标法我们所观察的单位常常是部分单位或有限单位,而所要判断的总体对象范围却是大量的。统计推断法:以一定的置信标准,根据样本数据来判断总体数量特征的归纳推理方法,例如,产品检验,新产品试用,新药品试验,病理研究。抽样调查。统计推断法1936年美国总统选举,民主党罗斯福VS共和党兰登。《文摘》按照电话本名录和俱乐部会员名册随机邮寄了1000万份调查表;收回240万份,预测兰登获得57%的选票获胜。而盖洛普研究所仅仅随机抽取了2000

多选民,预测罗斯福将得到54%的选票获胜。选举结果是罗斯福获得62%的选票获胜。此后,盖洛普研究所每年用1000~1500人的样本快速准确的预测选举,误差在2%之内。例子:1936年美国总统选举的预测五、统计工作的过程和要素明确调查的总体从总体中抽取样本,并对样本信息加以分析根据样本对总体做出推断对推断的可靠性加以测度统计学的基本要素常用的统计应用软件

ExcelSPSS(StatisticalPackagefortheSocialSciences)(StatisticalProductandServiceSolutions)SAS(StatisticalAnalysisSystem)Eviwes(Econometrics

Views)统计网站

国家统计局国家统计局

天津统计信息网天津统计信息网

上海统计网上海统计网

美国统计局美国统计局

美国劳工统计局美国劳工统计局

统计之都统计之都中国统计学会中国统计学会最喜爱的饮料(手机、运动鞋)品牌大学生日常消费情况调查五年规划4S店售后服务质量移动用户满意度调查学生会影响力调查报志愿动因调查……大学生生活学习现况调查大学生兼职情况调查大学生恋爱问题调查大学生玩网络游戏情况调查大学生幸福感调查天津市居民住房状况调查中小型公司人才需求调查一份国际标准智商测试问卷……/flash/2006-06-04/1149404540199.swf1.1统计资料

统计资料(Statisticaldata)是指可用以推导出某项结论的一些事实或数字第一章统计资料基本构成要

素元素(Element)变量(Variable)观测(Observation)关于元素的一种属性或特征研究对象由各元素组成资料中关于某一元素所有各变量的信息变量(Variable)定量变量(Quantitativevariable) 结果可用数字表示定性变量(QualitativeVariable) 结果不可用数字表示

第一章统计资料1.1统计资料姓名性别年龄身高(m)体重(kg)民族公司服务年限受教育年限甲男331.8565汉318乙女251.6555回216丙男261.7260满115丁女351.6053回416戊男321。8368汉219表1-1员工个人资料表1.1统计资料第一章统计资料数据类型定序型定距型定比型类别型第一章统计资料1.1统计资料F.W.Taylor的科学管理理论中的工作定额原理,用实验式的方法获得工人合理的日工作量资料。气象资料收集,商品价格的变化对商品需求量的影响。统计资料的收集间接引用直接收集实验式收集统计资料非实验式收集统计资料1.2统计资料的收集第一章统计资料

直接收集统计资料,无论是实验式的还是非实验式的,都称为统计调查。

工作方式直接观察口头询问发调查表或问卷1.3统计调查第一章统计资料提问的种类选择式自由式让回答人在几个事先指定的备选答案中选择答案。若备选答案过多,或受提问措辞和语气的影响,可能使被调查人做不出合乎本意的选择

必须用自己的语言表达本人的意愿,但所填答案会多种多样。常常只用于小规模的调查研究提问的种类1.3统计调查第一章统计资料试点调查试点调查当一个调查表设计完毕后,常在一小范围进行试点调查可发现一些意料之外的问题,以便在大规模调查前改正应尽量在真实的环境中进行,同时也应保持效度试点调查的时机试点调查的作用注意问题1.3统计调查第一章统计资料第二章统计资料的整理调查收集到的原始统计资料常常是大量的。它必须经过加工整理,如分类归并汇总,按时间前后或按数值大小重新排列等,才容易发现数据的规律性,并便于做进一步的统计分析。加工整理,归并汇总,重新排列调查得到的原始统计资料发现数据的规律性,作进一步的统计分析第二章统计资料的整理统计表类型将变量所取值按时间顺序排列序列表分类表按数值分类定性分布频数分布时间序列表地域序列将变量所取值按地域排列按性质分类2.1统计表频数第二章统计资料的整理2.1统计表第二章统计资料的整理定性变量:首先建立一个元素的类别系统,使得各类互相排斥,而且是完备的,使被观测的各元素能既不重复又无遗漏地分到各类中去。然后记录分到同类中的元素个数,或将同类中各元素的观测值加以归并,这样得到定性分布。元素分类观测值记录与归并定性分布2.1统计表第二章统计资料的整理2.1统计表第二章统计资料的整理频数分布:先确定组数,再计算组距按变量所取的值进行分类,于是资料中每个观测值都分到相应类中去。记录各类中观测值出现的次数,制成频数分布表。确定组数k找出xmin与xmax计算组距h确定每组上下限将相应数据归并到各组Xmin

最小值,xmax最大值2.1统计表第二章统计资料的整理分数计数人数(f)40—49150—59正正1460—69正正正正正正正正正正正5570—79正正正正正正正正正正正5880—89正正正正正正正正正正5290—99正正正17100—1093总数200某校200个学生高等数学考试成绩2.1统计表第二章统计资料的整理表2-5

某校200个学生高等数学考试成绩的频数分布表分数人数(f)分数人数(f)40—45176—812546—51082—874252—571288—931058—632994—991164—6928100—105370—7539总数2002.1统计表第二章统计资料的整理第二章统计资料的整理表2-5与表2-6的对比表2-5中组距等于6,频数分布的规则性,仍然可以维持,同时细节的损失也可减轻表2-6中的组距等于2,各组频数分布就变得很不规则了。由此可见,组数的确定应适当,亦不宜太多2.1统计表第二章统计资料的整理累积频数(CumulativeFrequency):由第一组起至第i组止各频数之和称为第i组的累积频数,记为Fi,即:频率(PercentFrequency):就是频数除以总数n:fi/n,经常以百分数表示。累计频数与频率2.1统计表第二章统计资料的整理第二章统计资料的整理统计图:统计资料整理成统计表后,可以比较清晰地展示变量的变化规律。为了使这种规律更有直观性,常采用统计图表示。包括:线图、条形图、圆饼图等统计图线图条形图圆饼图2.2统计图

2.2统计图

第二章统计资料的整理第二章统计资料的整理第二章统计资料的整理第二章统计资料的整理第二章统计资料的整理双变量的统计资料:对每一元素观测两个特征,记录观测结果,就是双变量的统计资料双变量常用(X,Y)形式表示,以区别两个单变量X和Y2.3双变量的二元分布第二章统计资料的整理错误发生时的飞行状态,分起飞(T),巡航(C)和着陆(L)三种。错误发生的原因,分规范理解错误(R),仪表读数错误(M)和其它原因(O)三种。在飞行模拟训练时,用计算机测定并打印出飞行动作的错误,从两方面进行测定:2.3双变量的二元分布第二章统计资料的整理测定45次的打印记录如下:2.3双变量的二元分布第二章统计资料的整理根据该记录整理的二元分布表如下:从表中看出,在起飞(T)时容易发生规范理解错误(R)和仪表读数错误(M),而着陆(L)时不太容易发生规范理解错误。2.3双变量的二元分布第二章统计资料的整理啤酒偏好淡啤酒普通啤酒黑啤酒合计男性20402080女性30301070合计507030150第二章统计资料的整理边际分布:在二元分布表最下行(合计行)和最右列(合计列)分别是X和Y的单变量分布,称为边际分布。二元分布表最下行二元分布表最右行X的单变量分布Y的单变量分布边际分布统称2.3双变量的二元分布第二章统计资料的整理3.1表示集中位置的特征数3.1.1平均数算术平均数(Arithmeticaverage)几何平均数(GeometricMean)调和平均数定义:一组n个观测值x1,x2,…,xn的算术平均数,定义为(1)算术平均数(Arithmeticaverage)如果资料已经分组,组数为k,用x1,x2,…,xk

表示各组中点,f1,f2…,fk

表示相应的频数,那么(1)算术平均数(Arithmeticaverage)表3-1某校125位大学一年级新生体重表体重(公斤)组中值(x)

人数(f)46—4847449—51502052—54532555—57563858—60592161—63621264—66655(1)算术平均数(Arithmeticaverage)其平均体重:===55.592(1)算术平均数(Arithmeticaverage)

当时最小

性质(1)算术平均数(Arithmeticaverage)在数据为环比类型的问题中,算术平均数是不适用的。例如下表是天津市工业总产值在“十五”期间的逐年增长率,如求该期间平均增长率,算术平均数是不恰当的。几何平均数可以解决这个问题。(2)几何平均数(GeometricMean)表3-2天津市工业总产值年份比上年增长%2000200114.0200219.6200324.1200431.0200520.8(天津市2005统计年鉴)

(2)几何平均数(GeometricMean)定义:一组n个数据的几何平均数定义为在上式中,依次为114.0,119.6,124.1,十五期间天津市工业总产值年均增长率为21.8%。131.0,120.8于是几何平均数:(2)几何平均数(GeometricMean)当数据是相对变化率,求平均数时,算术平均数也不恰当。例如:甲乙两地相距120公里,某人乘车往返甲乙两地之间,去时速度每小时20公里,回来时速度为每小时30公里,若求平均速度,这时用算术平均数是不对的,但调和平均数可解决此类问题。(3)调和平均数在上例中,(公里/小时)定义:一组n个数据的调和平均数H,由下式定义(3)调和平均数算术平均数表示了集中位置特征,它照顾到每一个值,但它不见得是出现次数最多的值(甚至也可能不是观测值中的一个)。所以有必要研究表示集中位置的其它的特征数。3.1.2众数(Mode)定义:对于有频数分布的变量,它的众数指频数最大的变量的值表3-3频数分布表Xf3155273对于已分组且等组距的频数分布,根据最大频数,可求得众数所在组。根据众数定义,可知众数不唯一。3.1.2众数(Mode)算术平均数作为集中位置的特征还有一缺点,就是受观测值中极端值的影响很大,而一组观测值中的极端值常常没有代表性。中位数将避免这种影响。3.1.3中位数(Median)

一组n个观测值按数值大小排列,处于中央位置的值称为中位数以表示,,当n为奇数,当n为偶数定义:即3.1.3中位数(Median)第25百分位数又称第一个四分位数(FirstQuartile),用Q1表示;第50百分位数又称第二个四分位数(SecondQuartile),用Q2表示;第75百分位数又称第三个四分位数(ThirdQuartile),用Q3表示。中位数是第50百分位数一组n个观测值按数值大小排列如x1,x2,x3,x4…处于p%位置的值称第p百分位数。定义:3.1.4百分位数(Percentile)计算第p百分数第1步:以递增顺序排列原数据(即从小到大排列)。第2步:计算指数

第3步1.若i不是整数,将i向上取整。大于I的毗邻整数为第p百分位数的位置。2.若i是整数,则第P百分位数是第i项与第(i+l)项数据的平均值。如何计算百分位数数据的变异程度产品质量检查的结果说明生产是否稳定测量的结果说明测量方法或仪器是精密还是粗糙学生的成绩成绩是否整齐(而不是高低)3.2表示变异(分散)程度的特征数定义

其中xmax和xmin分别为数据中的极大值和极小值。3.2.1极差(或称全距Range)R对于已分组的频数分布(组数为k)定义平均差M.D.是离差的绝对值的平均数,即3.2.2平均差(MeanAbsoluteDeviation)方差

样本

对于已分组的频数分布(组数为k)总体

样本

总体

3.2.3方差(Variance),标准差(Standard

Deviation)标准差样本标准差总体标准差样本标准差总体标准差对于已分组的频数分布(组数为k)标准差的单位与X的单位相同。3.2.3方差(Variance),标准差(Standard

Deviation)定义变异系数C是一个无量纲的量。它适于用在比较有不同算术平均数或有不同量纲的两组数据的情况。例如比较大学生身高与小学生身高,或比较130名大学生身高和体重哪个变化波动范围比较大时,都可用变异系数。3.2.4变异系数(CoefficientofVariation)定义变异系数C是一个无量纲的量。它适于用在比较有不同算术平均数或有不同量纲的两组数据的情况。例如比较大学生身高与小学生身高,或比较130名大学生身高和体重哪个变化波动范围比较大时,都可用变异系数。3.3表示偏倚情况或程度的特征数

3.3.1比较众数、中位数和算术平均数的相对位置

下图列举出了对称的、具有左偏态(负偏态)和右偏态(正偏态)的频数分布的例子。注意到它们的特点是:①对称的分布的众数、中位数和算术平均数相同;②具有偏倚性的分布,算术平均数突出在外,偏向分布的尾端,而中位数则介于众数与算术平均数之间。偏倚性是表示各观测值分布不对称情况或程度的。3.3表示偏倚情况或程度的特征数

图3-13.3.1比较众数、中位数和算术平均数的相对位置>Me>Mo<Me<Mo

=Me=Mo可以看出,对于单峰的分布,对称态:左偏态:右偏态:3.3.1比较众数、中位数和算术平均数的相对位置(1)Pearson偏倚系数Pearson分布对称,则k=0左偏态,则k<0右偏态,则k>03.3.2定量地描述偏倚性,常用的两个公式(2)用标准化的三阶矩阵g表示3.3.2定量地描述偏倚性,常用的两个公式

3.4五数概括法五数概括法(2)第1四分位数(Q1)。(3)中位数(Q2)。(4)第3四分位数(Q3)。(5)最大值。(1)最小值。首先将数据按递增顺序排列,然后很容易就能确定最小值、3个四分位数和最大值了。对12个月薪数据的样本,按照递增顺序排列如下:221022552350|238023802390|242024402450|255026302825Q1=2365Q2=2405Q3=2500上述起薪数据以五数概括为:2210,2365,2405,2500,2825。3.4五数概括法盒形图实际上是以图形来概括数据。我们将盒形图延至这一章才讲是因为它的关键是计算中位数和四分位数Q1和Q3。此外还将用到四分位数间距IQR=Q3-Q1

。盒形图的画法步骤如下:

(1)画一个方盒,其边界恰好是第1和第3四分位数。对于上述的起薪数据,Q1=2365,Q3=2500。这个方盒包含了中间的50%的数据。(2)在方盒上中位数的位置画一条垂线(对起薪数据,中位数为2405)。因此中位数将数据分为相等的两个部分。3.5盒形图(3)利用四分位数间距IQR=Q3-Q1,来设定界限。盒形图的界限定于低于Q1以下1.5个IQR和高于Q3以上1.5个IQR的位置。上、下限以外的数值作为异常值。

(4)在图3-4中的横线叫做须线(whisker),须线从方盒的边线出发,直至在上、下限之内的最大值和最小值。(5)最后,任一异常值的位置以符号“*”标出。3.5盒形图盒形图例图图3-23.5盒形图例:11名学生各科成绩

编号英语数学经济学营销学统计176659374552909581879139751768568471748869735707866908469363798081786918377708838292846997875789194108571867462118155787071美国大选【环球网报道实习记者何丹】据俄罗斯卫星网10月31日报道,美国《华盛顿邮报》和ABC电视台联合举行的民调显示,距离美国总统大选仅剩9天之际,民主党总统候选人希拉里·克林顿的支持率仅以1%的微弱差距领先共和党总统候选人唐纳德·特朗普。民调结果显示,支持希拉里的选民占46%,支持特朗普的则有45%。《华盛顿邮报》指出,28日美国联邦调查局恢复对希拉里电子邮件的调查的消息并没有影响到大部分选民的决定。在早期的ABC新闻的跟踪调查结果显示,60%的选民不赞成希拉里邮件门事件的处理,这其中百分之七是她自己的支持者,另外百分之九十三是特朗普的支持者。据悉,此次调查共有1160人参加,统计误差为正负3%。特朗普此前曾多次称《华盛顿邮报》和ABC电视台的立场偏向希拉里。

《洛杉矶时报》30日公布的有3000多人参与的调查则显示特朗普以46%的支持率领先希拉里的44.1%。民调的主要方法很简单,用得是最基本的统计采样的理论,就是在全部选民中随机挑选一批选民,了解他们的投票倾向,综合起来,就得到全国选民的意向了。假如是一场胶着的大选,随便找一个人来问问,你只能得出一边倒的结论,但当你找了上万人的时候,平均起来的结果就相当准了。比如要是从一万人里得出希拉里的支持率在51%,那他真正的支持率,应该有95%的机率在50%-52%之间,这个叫置信区间。一般来说,民调很少会用到这么多的样本,采到一千以上,就可以让刚提到的95%的置信区间控制在正负3%以内。而一般的全国民调,都至少要这个数或更高,乃至上万。民调如何开展

例如,根据民调公司RasmussenReports的共和党初选民调,特朗普和布什的支持率分别是17%和10%,看似特朗普优势巨大,但事实上,这个民调样本只有651人,误差范围是正负4%,这说明特朗普的支持率可能只有13%,而布什可能是14%,从而反败为胜!为了解决样本分布不理想的问题,调查机构们会对样本的结果进行权重调整。但如何选择权重因子来确保样本反映选民总体的年龄、性别、党派、教育程度的分布,就是各个机构自己的事了。某个1000人的样本中,成功访谈到的中年拉丁裔男性只有1位,只占样本的千分之一,远远低于他代表的群体在选民中的比例。为了克服这个弊端,可能需要赋予他一个50倍的因子--他一个人的声音生生被放大50倍,反映不出该群体内部的意见分歧。民调如何开展4.1关于抽样的基本概念

为什么要抽样? 为了收集必要的资料,对所研究对象(总体)的全部元素逐一进行观测,往往不很现实。抽样原因元素多,搜集数据费时、费用大,不及时而使所得的数据无意义总体庞大,难以对总体的全部元素进行研究检查具有破坏性炮弹、灯管、砖等1、简单随机抽样(x1,x2,……,xn): 简单随机抽样是指从总体中抽取样本容量为n的样本时,x1,x2,……,xn这n个随机变量必须具备以下两个条件:这n个随机变量与总体X具有相同的概率分布;它们之间相互独立。4.1关于抽样的基本概念

简单随机抽样注意要点:(1)要求样本的总体个数有限;(2)从总体中逐个抽取;(3)不放回抽样;(4)等概率抽样。如:从个体数目为N的总体中采用简单随机抽样的方式抽取样本容量为n的样本,每个个体被抽中的概率相同4.1关于抽样的基本概念

随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素

甲乙丙丁四个生产商,其产品质量如下表所示: 如果仅从甲乙两个生产商的产品中进行抽样,抽样质量就偏高;如果仅从丙丁两个生产商的产品中进行抽样,抽样质量就偏低; 因此采用简单随机抽样保证随机样本与总体具有相同的概率分布。甲乙丙丁质量高高低低表4-14.1关于抽样的基本概念

(1)一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见留下了座位号为20的30名听众进行座谈。这里选用了哪种抽取样本的方法?写出抽取过程。(2)要抽样了解某年参加高考考生的语文考试成绩,我们可以①按照科目分类:文科、理科、艺术、体育和外语五个层次。②按照地区分类:大城市、中等城市、城镇、乡镇四个层次。③按照学校分类:重点、非重点两个层次。(3)为了了解天津市各个律师事务所的性别、年龄、学历、职称特征,应当如何抽样。(4)某地质检部门要对当日运到的蒙牛液态奶进行检查,该批牛奶为小纸箱包装,每箱内装有20袋,为了不影响正常销售,检查人员从2000箱中随机抽取了20箱开箱检查,这20箱中的400袋被取做样本进行检查。

2、系统抽样当总体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成均衡的部分,然后按照预先定出的规则,从每一部分中抽取1个个体,得到所需要的样本,这种抽样称为系统抽样。4.1关于抽样的基本概念

一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见留下了座位号为20的30名听众进行座谈。这里选用了哪种抽取样本的方法?2、系统抽样先将总体中的N个个体进行编号(号码从1~N)确定分组间隔K=N/n,或K=N`/n,将总体编号分为n段在编号的起始第一段用简单抽样方法确定起始样本编号

l按规则选取n个个体作为样本,(通常选择

l,l+K,l+2K,…,)系统抽样时,将总体中的个体均分后的每一段进行抽样时,采用简单随机抽样;系统抽样每次抽样时,总体中各个个体被抽取的概率也是相等的;如总体的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行。需要说明的是整个抽样过程中每个个体被抽到的概率仍然相等。3、分层抽样当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样。其中所分成的各部分叫做层。由于分层抽样的要求不同,各层的抽样的样本容量也不相同,所以,应当按照实际情况,合理地将样本容量分配到各个层,以确保抽样的合理性,研究时可以根据不同的要求来分层抽样。分层抽样的一个重要问题是一个总体如何分层。分层抽样中分多少层,要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。例、一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?

分析:这总体具有某些特征,它可以分成几个不同的部分:不到35岁;35~49岁;50岁以上,把每一部分称为一个层,因此该总体可以分为3个层。由于抽取的样本为100,所以必须确定每一层的比例,在每一个层中实行简单随机抽样。解:抽取人数与职工总数的比是100:500=1:5,则各年龄段(层)的职工人数依次是125:280:95=25:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。答:在分层抽样时,不到35岁、35~49岁、50岁以上的三个年龄段分别抽取25人、56人和19人。3、分层抽样(1)总体与样本容量确定抽取的比例。(2)由分层情况,确定各层抽取的样本数(3)各层的抽取数之和应等于样本容量。(4)对于不能取整的数,求其近似值。

类别

共同点各自特点相互联系使用范围简单随机抽样

抽样过程中每个个体被抽取的概率从总体中逐个抽取是其他抽样方法的基础总体中的个体数较少系统抽样将总体先分成几部分,再按规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样

在各层中按比例抽取各层抽样时采用简单随机抽样或系统抽样方法总体由差异明显的几部分组成四、整群抽样

整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。确切地说,这种抽样组织形式应称为单级整群抽样。

分群的原则尽量扩大群内差异,而缩小群间差异。整群抽样和分层抽样的区别?想了解天津市各个律师事务所的性别、年龄、学历、职称结构等。样本统计量与抽样分布: 在简单随机抽样中,样本具有随机性,样本的参数,s2等也会随着样本不同而不同,故它们是样本的函数,记为g(x1,x2,……,xn),称为样本统计量。

统计量的概率分布称为抽样分布(Sample distribution)

4.1关于抽样的基本概念

几种概率分布正态分布分布

F分布

t分布4.2几种与正态分布有关的概率分布若随机变量X的概率密度函数记为(1)正态分布图4-1一般正态分布(1)正态分布标准正态分布:

当时, 记为U∽N(0,1)图4-2标准正态分布(1)正态分布非标准正态分布向标准正态分布的转化

标准化因子

则U∽N(0,1)(1)正态分布 查表 当u大于零时,可查正态分布表 但如果u<0时,则可由式φ(-u)=1-φ(u)求出(1)正态分布线性性质: 如果,且相互独立。对于常数,有下式成立:(1)正态分布 相互独立且均为服从N(0,1)分布的随机变量,则称随机变量所服从的分布是自由度为n的分布,且记。定义(2)分布图4-3χ2分布图(2)分布查表:对于给定的α,0<α<1,可在分布表中查得,即 例如

即指(2)分布性质:如果,则;设,且相互独立,则若,已知相互独 立,,则(2)分布总体,是X的一个样本,

为样本的平均数,

为样本的方差。 则: a.相互独立

b.(2)分布 设相互独立的随机变量V和W分别服从自由度为n1,n2的分布,即, 则随机变量服从F分布。n1,n2分别是它的第一自由度和第二自由度,且通常记为定义(3)F分布图4-4F分布图F(3)F分布查表性质(3)F分布 设随机变量U服从标准正态分布,随机变量W服从自由度为n的分布,且U与W相互独立, 则称随机变量服从自由度为n的t分布,记为T~t(n)。定义(4)t分布(Students分布)图4-5n=∞正态分布n=10n=1t分布图(4)t分布(Students分布)查表或性质: 当n很大时, 此时,tα/2≈uα/2,t分布近似标准正态分布。

(4)t分布(Students分布)无限总体: 设总体X~N(μ,σ2),X1,X2,…

,Xn是总体X的随机样本,样本平均数,则4.3样本平均数的抽样分布有限总体 有限总体若采取有放回抽样,则与无限总体等价。有限总体容量为N而采取无放回抽样,且n/N≤0.1,仍可视为无限总体,而当n/N>0.1时则 称式为有限总体的修正系数。4.3样本平均数的抽样分布统计方法描述统计推断统计参数估计假设检验第五

章参数估计引言

随着“亲信干政”事件持续发酵,韩国总统朴槿惠的支持率直线下滑,并自她就任以来首次跌破10%。11月1日,韩国《来日新闻》与民调机构全国民意调查中心(TheOpinion)公布的调查结果显示,朴槿惠的支持率从10月的34.2%跌至9.2%。此次调查针对1000名成年人进行,结果显示,67.3%的受访者“赞成朴槿惠下台”,80.9%的受访者表示“即使改组青瓦台秘书团队也不能收拾局面”。朴槿惠在其政治故乡大邱和庆尚北道的支持率甚至低于平均值,仅为8.8%。

11月2日,美国《洛杉矶时报》公布的最新跟踪民调结果显示,特朗普的支持率为47.8%,相较于上周提高了4个百分点,而希拉里的支持率则下滑3个百分点跌落至现在的42.4%。这是今年5月以来,首次有民调显示特朗普领先希拉里。大选投票日之前,美国南加州大学多尼斯夫学院联合《洛杉矶时报》进行跟踪民调,他们每天会询问约3000名美国民众的投票意向,以求掌握选情的变化趋势。引言要是从一万人里得出希拉里的支持率在51%,那他真正的支持率,应该有95%的机率在50%-52%之间,这个叫置信区间。一般来说,民调很少会用到这么多的样本,采到一千以上,就可以让刚提到的95%的置信区间控制在正负3%以内。而一般的全国民调,都至少要这个数或更高,乃至上万。民调公司RasmussenReports的共和党初选民调,特朗普和布什的支持率分别是17%和10%,看似特朗普优势巨大,但事实上,这个民调样本只有651人,误差范围是正负4%。2008年8月主要内容5.1参数估计的基本原理5.2一个总体参数的区间估计5.3两个总体参数的区间估计5.4样本量的确定2008年8月案例分析

上海五洲信息咨询公司市场部刘经理在新年上班第一天,刚走进办公室,传真机就响了,这是一份来自美国Lion投资公司的委托书,委托书上的文字十分简单:“2008年10月,美国Lion公司的品牌香槟将进入中国市场,现需了解上海市场的有关情况,委托业务费用10万美元。”随后是Lion产品介绍。刘经理高兴得差点跳了起来,马上和同事讨论是否可以接下这项工作。资料经过讨论,大家认识到,这是一个十分典型的市场调查和抽样推断的项目。1调查目的:需要掌握洋酒市场价格、需求量、消费群体、产品市场定位、促销手段、同类产品的市场占有率、销售状况以及消费者心态、未来洋酒需求能力的推断、潜在用户挖掘的可能性等。为了解能够得到进行推断的市场信息,刘经理布置大家现搜集有关资料,看是否有相关的二手数据,如果没有二手数据则应确定市场调查是否可行。2.调查方式绝大多数洋酒的进入并非为了希望尽快倾销产品,获得较大的利润回报,而往往是为了抢占中国巨大的市场,扩大其品牌的知名度,为将来中国居民生活水平有相当提高后潜在的消费需求做准备。正因为如此,洋酒进入中国后,其营销手段也相对比较单一:往往是寻找一个代理商,然后直销或代销,有些则直接与国内的糖烟酒公司签订协议,代以销售。在上海市场洋酒的零售大多集中在大型百货公司或食品公司的某些专柜上,或者宾馆、饭店的商品小卖部里,也有部分是在糖烟酒公司经营的名烟名酒专卖店中销售,而在接近于百姓生活的为数众多的像华联、联华、农工商等连锁超市中几乎没有。

这样看来,要推断销售额,只需要调查宾馆、百货公司及专卖店就可以获得所需的数据。由于调查总体范围单一,这样的调查,只要设计合理,时间和费用应该不多,而且从经营单位获得数据,数据的准确性也有相当的保证。于是,刘经理接下了这个项目开始准备市场调查。市场调查之后,刘经理需要根据这些抽样的数据,来估计一下整个上海市洋酒市场的销售额,借此来预测上海市场的洋酒市场容量。刘经理的这种从部分来推断总体的方法就是我们讲的参数估计。参数估计是统计推断的重要内容之一,它是在抽样和抽样分布的基础上,根据样本统计量来推断反映总体特征的总体参数。5.1参数估计的基本原理

5.1.1点估计与区间估计

5.1.2评价估计量的标准第5章参数估计点估计含义:从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计。1.点估计的可靠性用标准误差来衡量。2.一个具体的点估计值无法给出估计的可靠性度量区间估计含义:在点估计的基础上,给出总体参数估计取值的一个区间范围。样本统计量

(点估计)置信区间置信下限置信上限1.置信区间

由样本统计量对总体参数进行估计时的估计区间。在某种程度上确信置信区间中包含总体参数的真值2.置信水平(置信度、置信系数)

包含总体参数真值的置信区间占所有置信区间的比例。常用1-α表示置信水平。区间估计a.总体参数的真值是未知的、固定的,构造出的置信区间可能包含真值,也可能不包含真值;

b.设置信水平为95%,则说明有95%的置信区间包含总体真值,有5%的置信区间不包含总体真值。区间估计5.2一个总体参数的区间估计

5.2.1总体均值的区间估计

5.2.2总体比例的区间估计

5.2.3总体方差的区间估计第5章参数估计一个总体参数的区间估计总体参数符号表示样本统计量均值比例方差一个总体参数的区间估计待估参数均值大样本

2已知Z分布

2未知Z分布小样本

2已知Z分布

2未知t分布比例大样本Z分布方差

2分布总体分布样本量σ已知σ未知正态分布大样本(n≥30)小样本(n≤30)非正态分布大样本(n≥30)一个总体参数的区间估计5.2.1总体均值的区间估计5.2一个总体参数估计的区间估计总体均值的区间估计

(用Z统计量的情况)大样本方差未知小样本正态总体方差已知或大样本方差已知总体均值的区间估计1. 假定条件总体服从正态分布,且方差(

2)已知或者,如果不是正态分布,是大样本(n>30),可由正态分布来近似2.使用正态分布统计量总体均值

在1-

置信水平下的置信区间为估计误差抽样标准误差正态分布(判断数据的正态性)对数据画出频数分布的直方图或茎叶图若数据近似服从正态分布,则图形的形状与上面给出的正态曲线应该相似2.绘制正态概率图。有时也称为分位数—分位数图或称Q-Q图或称为P-P图用于考察观测数据是否符合某一理论分布,如正态分布、指数分布、t分布等等P-P图是根据观测数据的累积概率与理论分布(如正态分布)的累积概率的符合程度绘制的Q-Q图则是根据观测值的实际分位数与理论分布(如正态分布)的分位数绘制的总体均值的区间估计

【例5-1】一家保险公司收集到由36个投保人组成的随机样本,得到每个投保人的年龄(单位:周岁)数据如下表。试建立投保人年龄90%的置信区间。36个投保人年龄的数据233539273644364246433133425345544724342839364440394938344850343945484532解:已知n=36,1-

=90%,z

/2=1.645。根据样本数据计算得:

总体均值

在1-

置信水平下的置信区间为投保人平均年龄的置信区间为37.37岁~41.63岁大样本方差未知总体均值的区间估计【例5-2】一家食品生产企业以生产袋装食品为主,为对食品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3解:已知X~N(

,102),n=25,1-

=95%,z

/2=1.96。

根据样本数据计算得:。由于是正态总体,且方差已知。总体均值

在1-

置信水平下的置信区间为该食品平均重量的置信区间为101.44g~109.28g正态总体方差已知

总体均值的区间估计

(采用t统计量的情况)t分布

t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布。xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z总体均值的区间估计(小样本)1. 假定条件总体服从正态分布,但总体方差(

2)

未知,且为小样本(n<30)使用t

统计量总体均值

在1-

置信水平下的置信区间为小样本正态总体方差未知总体均值的区间估计【例5-3】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:h)如下。建立该批灯泡平均使用寿命95%的置信区间。16只灯泡使用寿命的数据1510152014801500145014801510152014801490153015101460146014701470解:已知X~N(

,2),n=16,1-

=95%,t

/2=2.131

根据样本数据计算得:,

总体均值

在1-

置信水平下的置信区间为该种灯泡平均使用寿命的置信区间为1476.8h~1503.2h正态总体方差未知案例分析(续)

刘经理的咨询公司在2007年上海市场上抽取了100个单位进行洋酒销售额的调查,这些单位分别是宾馆饭店、百货公司、食品店及酒类专卖店。获得如下汇总数据:

由于我们的估计大多要求总体是正态的,首先应根据上述三个表的数据对三个总体作正态性的检验分析。经过分析知道,食品及酒类专卖店这一组洋酒销售量是不服从正态分布的,不过好在这部分是抽取的大样本,对估计的影响不大。而另外两组,宾馆饭店和百货公司的总体服从正态分布。下面我们首先对三类企业的洋酒销售额作估计,(取置信水平)由于总体方差未知,而宾馆饭店和百货公司的样本是小样本,所以对这两类企业我们采用t统计量进行估计,而食品及酒类专卖店是大样本,我们采用Z统计量进行估计,计算如下:2008年8月2008年8月2008年8月2008年8月

结论:上海有近500家有可能销售洋酒的总体单位,因此2007年上海洋酒销售额估计在25827.61万元~35775.39万元之间。5.2.2总体比例的区间估计5.2一个总体参数估计的区间估计总体比例的区间估计1. 假定条件总体服从二项分布可以由正态分布来近似np(成功次数)和n(1-p)(失败次数)均应该大于10使用正态分布统计量z3.总体比例

在1-

置信水平下的置信区间为总体比例的区间估计【例5-4】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间解:已知n=100,p=65%,1-=95%,z/2=1.96该城市下岗职工中女性比例的置信区间为55.65%~74.35%

一项有10000个人回答调查,同意某种观点的人的比例为70%(有7000人同意),可以算出总体中同意该观点的比例的95%置信区间;另一个调查者调查了50个人。他声称有70%的比例反对该种观点,并说总体中反对该观点的置信区间和上面的置信区间一样。你更愿意接受谁的调查结论?为什么?请计算出第二个调查结论的置信度5.2.3总体方差的区间估计5.2一个总体参数估计的区间估计总体方差的区间估计1. 估计一个总体的方差或标准差2. 假设总体服从正态分布总体方差的点估计量为s2,且4.总体方差在1-

置信水平下的置信区间为总体方差的区间估计(例题分析)【例5-5】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体方差的区间估计(例题分析)解:已知n=25,1-

=95%,根据样本数据计算得

s2=93.21

2置信度为95%的置信区间为该企业生产的食品总体重量标准差的的置信区间为7.54g~13.43g5.3样本量的确定

5.3.1估计总体均值时样本量的确定

5.3.2估计总体比例时样本量的确定第5章参数估计5.3.1估计总体均值时样本量的确定5.4样本量的确定2008年8月估计总体均值时样本量n为样本量n与总体方差

2、允许的估计误差E、置信水平之间的关系样本量的圆整法则:当计算出的样本量不是整数时,将小数点后面的数值一律进位成整数,如24.68取25,24.32也取25等等估计一个总体均值时样本量的确定其中:2008年8月估计一个总体均值时样本量的确定

【例5-12】拥有管理学学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本量?2008年8月估计一个总体均值时样本量的确定解:已知

=2000,E=400,1-

=95%,z/2=1.96

应抽取的样本量为即应抽取97人作为样本2008年8月估计两个总体均值之差时样本量的确定设n1和n2为来自两个总体的样本,并假定n1=n2根据均值之差的区间估计公式可得两个样本的容量n为其中:5.4.2估计总体比例时样本量的确定5.4样本量的确定2008年8月根据比例区间估计公式可得样本量n为估计一个总体比例时样本量的确定

E的取值一般小于0.1

未知时,可取使方差达到最大的值0.5其中:现实问题有人讲,“经济管理学院会计专业的平均年薪不会超过5万元”,你如何对他进行反驳?(除了动用拳头之外)。目前,PineGreek高尔夫球场400个运动者中有100个女性,能否认为女性比率比过去的20%增加了?一罐草莓酱上写到“净重200克”。(1)解释这句话的意思是不是当你仔细称这罐酱时,它将恰好是200克?(2)解释是否其他罐中酱的分量都与第一罐的相等?(3)请设计一个实验,指出如何通过分析结果数据来判断制造商是否有权声称酱的净重是200克。写出相应的数据分析步骤和计算公式。某大酒店有500张客床,正常时间每床位日租金为100元,平均定位率为70%,现在经理进行一项优惠促销活动,采取优惠措施把房价降低15%,经过36天统计,平均每天出租406张,其标准差为78张。如果你是酒店老板,你是否支持这个优惠促销绩效开展下去?现实问题一个大米加工厂卖给一个超市一批表明10kg重的大米。而该超市怀疑该厂家缺斤短两,随机抽取10包大米进行称重,得到下面的结果:9.939.839.769.9510.079.8910.039.979.899.87如果已知打包的大米重量服从正态分布。由于发生分歧,各方同意用这个数据进行检验。H0:=10H1:<10(1)超市用全部数据进行t检验(拒绝)(2)大米加工厂的老板只用前两个数据进行t检验(接受)(2)大米加工厂老板的律师用全部数据进行符号检验(接受)现实问题《财富》杂志2005年6月26日刊载了会计师和财务计划人员的起始年薪。他们分别抽取了12名会计师和14名财务计划人员作为样本,得到他们的起始年薪,能否说这两种职业的平均起薪有明显差异?对于“丈夫在外工作、妻子没有收入的婚姻,离婚后妻子应该拥有结婚期间积累财产的一半”进行的一项民意测验发现,在被随机调查的300名男子和300名女子当中分别有255名和279名同意。你能否认为对此问题男女的态度有差异?(显著性水平为0.05)现实问题本章重点一个正态总体参数的检验两个正态总体参数的检验假设检验的基本问题假设问题的提出假设的表达式两类错误假设检验中的值假设检验的另一种方法单侧检验

对总体参数的的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为该地区新生婴儿的平均体重为3190克!假设检验的基本问题什么是假设检验?

(hypothesistesting)

事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立总体

假设检验的过程抽取随机样本均值

X=20

我认为人口的平均年龄是50岁提出假设

拒绝假设!

别无选择.作出决策假设检验的步骤提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策提出原假设和备择假设

什么是原假设?(nullhypothesis)待检验的假设,又称“0假设”研究者想收集证据予以反对的假设总是有等号=,

表示为H0H0:H0:

某一数值

什么是备择假设?(alternativehypothesis)与原假设对立的假设,也称“研究假设”研究者想收集证据予以支持的假设总是有不等号:

,

表示为H1H1:

<某一数值,或

某一数值例如H1:

<3910(克),或

3910(克)提出原假设和备择假设

什么检验统计量?1. 用于假设检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论