统计学-在经济管理中的应用 课件 第五章 抽样估计与假设检验_第1页
统计学-在经济管理中的应用 课件 第五章 抽样估计与假设检验_第2页
统计学-在经济管理中的应用 课件 第五章 抽样估计与假设检验_第3页
统计学-在经济管理中的应用 课件 第五章 抽样估计与假设检验_第4页
统计学-在经济管理中的应用 课件 第五章 抽样估计与假设检验_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章抽样估计与假设检验第一节抽样调查与抽样估计第二节假设检验第三节方差分析众所周知,随机性是创造性不可缺少的因数……随机性是人类思维中内在的特性,不是通过赌博、衰减原子核、随机数表和其他你所知的而人为培植的,如果认为随机性是随心所欲的话,则是对人类创造性的侮辱。

—1961年诺贝尔物理学奖得主R·霍夫斯塔特学习目标1、理解抽样调查的概念与方法2、理解并掌握抽样分布3、掌握点估计与区间估计的基本方法4、样本容量的确定5、理解假设检验的基本原理6、掌握假设检验的基本方法7、理解并掌握方差分析的基本原理8、掌握单因素方差分析

统计在生活的应用(分布)二战期间,德国有一个时期物资特别紧缺,对面包实行配给制:政府把面粉发给指定面包房,面包师傅烤好了面包再发给居民。有一个统计学家怀疑其所在区域的面包师傅私扣面粉。于是,他天天称自己面包,过了一段时间,统计学家去找面包师傅说:“政府规定配给面包为400克,因模具和其他因素的影响,你烤出的面包可能是398、399克,也可能是401、402克。按照统计学正态分布原理,这么多天的面包重量平均应该等于400克,但你给我的面包平均重量只有398克,因此我有理由怀疑你使用了较小模具,私吞了面粉。”面包师傅承认确实私吞了面粉,并再三道歉,保证马上更换正常模具。又过了几个月,这个统计学家又去找面包师傅说:“虽然最近几个月你卖给我的面包都在400克以上,可能你没有私吞面粉,但也可能是你从面包里特意挑大的给我。同样,根据正态分布原理,这么多天的面包不可能没有低于400克的面包。所以,我认为你只是特意给了我比较大的面包,而不是更换了正常模具。我会立刻要求政府检查模具。”面包师傅只好当众认错道歉,接受处罚。第一节抽样调查与抽样估计一、概率抽样与非概率抽样(一)概率抽样概率抽样又称为随机抽样,就是按随机原则从总体中抽取样本。随机原则即为总体中的每个单位都有一定的概率被选为样本单位,每个总体单位能否被选为样本单位是随机的。从理论上讲,概率抽样是最理想、最科学的抽样方法,能保证样本数据对总体参数的代表性,而且能够将调查误差中的抽样误差限制在一定的范围之内。相对于非概率抽样来说,概率抽样也是花费较大的抽样方法。1、简单随机抽样(Simplerandomsampling)也称为纯随机抽样,是最基本的抽样形式,它是完全随机地选择样本。简单随机抽样在社会经济工作和科学研究中被广泛应用。在不可能、不必要进行全面调查时,一般用简单随机抽样来推断总体。要求有一个完美的抽样框,或者总体中有一个个体的详尽名单。2、分层抽样(Stratifiedsampling)也叫分类抽样、类型抽样。根据调查目的,确定某个主要标志,并根据这个标志将总体单位划分为若干层或类型,然后从各层中按随机原则分别抽取一定数目的单位构成样本。各层的抽样数目可采用等比例抽样或不等比例抽样来确定。分层抽样是统计分组法和抽样原理的结合,可提高样本的代表性,进而提高抽样推断的准确性;可获得总体指标的估计值,也可由各子样本指标推算相应的子总体指标。分层抽样可加深对内部有差异性的现象的认识,可以满足分层次管理的需要。如:城市职工收入调查、农产品产量抽样调查A.二阶抽样(Twostagesampling)为抽样方便,有时需把总体分成两个级别的抽样单元:初级抽样单元和次级抽样单元。每个初级抽样单元由若干次级抽样单元组成,先按某种方法在由初级单元构成的一级抽样框中抽样,然后在中选的初级单元中由次级单元构成的二级抽样框中抽样,抽样过程分为两个阶段进行。例如在企业职工收入调查中,把企业作为初级抽样单元,职工作为次级抽样单元,先对企业进行抽样,再在被抽中企业内对职工进行抽样,然后对被抽中的职工进行调查。在二阶抽样中,如果对初级单元不再进行随机抽样,让所有的初级单元都入样,而在初级单元中对次级单元进行随机抽样,这样的二阶抽样就是分层随机抽样。3、二阶抽样与多阶抽样B.多阶抽样(Multi-stagesampling)如果总体可以划分成多个级别的抽样单元,每一级别的抽样单元由若干下一级别的抽样单元组成,相应地存在多个级别的抽样框,抽样时先在一级抽样框中对一级单元抽样,再在中选的一级单元中对二级单元抽样,依次类推。例如在省抽县、县抽乡、乡抽村、村抽户的农产量四阶抽样中,凡未被抽中的县、乡、村、户就不必编制关于乡、村、户的抽样框。多阶抽样的主要缺点是估计量的结构比较复杂,估计量方差的估计也很复杂。4、整群抽样(Clustersampling)在二阶抽样中如果把初级抽样单元称作由次级抽样单元组成的群,在抽中的群内不再对次级单元进行抽样而是进行普查,那么这种抽样方法就称为整群抽样。整群抽样的优点是只需具备群即初级抽样单元的抽样框即可,无需具备关于次级单元的抽样框。例如,在市场调查的入户调查中,可以对被选作抽样单位的某个居民区的每家每户进行调查。5、系统抽样(Systematicsampling)又称等距抽样。若总体中的抽样单元都按一定顺序排列,在规定的范围内随机抽取一个单元作为初始单元,然后按照一套事先定好的规则确定其他样本单元,这种抽样方法称为系统抽样。等距抽样的优点是实施简单,整个样本中只是初始单元需随机抽取,其余单元皆由此决定。其主要缺点是估计量精度的估计比较困难。(二)非概率抽样非概率抽样也称非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从总体中有意识地、不是完全按随机原则抽取若干单位构成样本。非概率抽样有三种形式。A.由调查人员自由选择被调查者的非随机选样。例如在购物中心采访100位妇女,这100位被调查者可以非随机选择。B.通过某些条件过滤选择某些被调查者参与调查的判断抽样法。在许多情况下,由于研究对象可能仅限于一部分居民,因而有时采用这种方法能节省大量时间和经费。C.大多数种类的研究,如产品测试、座谈会等,只要不是属于要进行总体推论的调查都可使用非概率抽样法。(三)抽样框抽样框是指抽样调查所涉及的全部抽样单位的名单框架。编制抽样框是实施抽样的基础。一般地,抽样框的类型主要有三种:名单抽样框:列出全部总体单位的名录一栏表,如职工名单、企业名单等。区域抽样框:按地理位置把总体范围划分为若干小区域,并以小区域为抽样单位。如农作物产量抽样调查:大地块——小地块——标号。时间表抽样框:把总体的时间过程分为若干个小的时间单位,并按时间顺序对总体单位进行抽样。如流水线产品质量检查。二、抽样误差及其度量一般地说,抽样误差是指样本指标与被它估计未知的总体参数(总体特征值)之差。具体地是指样本平均数与总体平均数μ的差,样本成数p与总体成数π的差(p-π)。例:2008年我国谷物平均产量为5548千克/公顷,假如通过抽样调查得到的平均产量为5580千克/公顷或5534千克/公顷,则样本平均每公顷产量与实际平均每公顷产量之间的误差分别为32千克或−14千克。1、抽样误差的种类统计调查误差按产生的原因:1)登记性误差:在统计调查和整理、汇总过程中,由于观察、测量、登记、计算等等方面的差错。登记性误差不是抽样调查特有的。登记性误差是一种可以避免的误差。2)代表性误差:用样本指标推断总体指标时,由于样本结构与总体结构不一致、样本不能完全代表总体而产生的误差。这类误差又可以分为系统性误差和随机性误差两类。系统性误差(也叫偏差必然性误差)是由非随机因素引起的样本代表性不足而产生的误差,或者说是由于在抽样调查时,违反抽样调查的随机原则而产生的误差。如:抽样框与目标总体不一致、有意多选较好或较差的单位等。随机性误差(也叫偶然性误差):抽样调查虽然遵循了随机原则,但由于各种随机因素(偶然性因素)引起的代表性误差。这种误差不可避免,但可控制。登记性误差和系统性误差都是可以避免的。在计算抽样误差时,通常假定不存在登记性误差和系统性误差。影响抽样误差的因素:A.总体各单位标志值的差异程度;B.样本单位数;C.抽样方法。一般情况下重复抽样误差比不重复抽样误差要大一些。D.抽样调查的组织形式。不同的抽样组织形式就有不同的抽样误差。2、抽样误差的度量实际抽样误差:某一具体样本的样本估计值与总体参数的真实值之差(-)。抽样平均误差:样本估计量的标准差。反映抽样指标和总体指标间的平均误差程度。计算公式为:

式中:n为可能的样本数在抽样平均误差计算时,由于抽样有重复抽样和不重复抽样两种情况,因此平均数抽样和成数抽样的平均误差的计算也不一样。抽样极限误差(允许误差):是指在一定的概率下抽样误差的可能范围。即样本指标与总体指标之间误差可允许的最大范围。即:|-|≤Δ|-|≤Δ

标准误标准差除以样本量的平方根。衡量对应样本统计量抽样误差大小的尺度。标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。【例】某企业有5个工人的日产量分别为(单位:件):6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。则抽样平均误差为多少?解:根据题意可得:总体标准差答:抽取2个工人的日产量进行调查的抽样平均误差为2件。【例】根据历史经验,在正常情况下,某企业生产某种产品的合格率为90%,现从5000件产品中抽取50件进行检验,求该产品合格率的抽样平均误差。解:根据题意,在重复抽样条件下,合格率的抽样平均误差为:在不重复抽样条件下,合格率的抽样平均误差为:答:抽取50件产品进行检验,该产品合格率的抽样平均误差为4.22%。三、样本统计量样本提供的信息是分散的,不便于有效地对总体进行推断。为了能有效地推断总体,必须对样本进行“加工”,把样本中所包含的有关总体某一特征的信息“提取”出来并“聚集”在一起,这就需要根据推断问题的需要构造样本的适当函数,不同的样本函数反映总体的不同特征,一旦有了样本观察值就可以由此给出总体特征的推断值。因此自然要求这种样本函数应不包含任何未知参数。称这种样本函数为统计量。如样本均值:四、抽样分布

(一)抽样分布的概念从理论上说,某个样本统计量的抽样分布,就是在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对数频数分布或概率分布。因此,抽样分布是指样本统计量的概率分布。抽样分布反映样本指标的分布特征,是抽样推断的重要依据。根据抽样分布的规律,可以揭示样本指标与总体指标之间的关系,估计抽样误差,并说明抽样推断的可靠度。抽样分布实际上是一种理论分布。在抽样推断中,统计量一般都服从正态分布或以正态分布为渐进分布,所以正态分布是最常用的。当然,还有

2分布、t分布和F分布等精确分布。抽样分布的形成过程

(samplingdistribution)总体计算样本统计量,如:样本均值、比例、方差等样本(二)样本平均数的抽样分布从单位数为N的总体中抽取样本容量为n的随机样本,在重复抽样的条件下共有Nn个可能的样本,在不重复抽样条件下,共有个可能样本。对于每一个样本,都可以计算出样本的均值,所有的样本均值形成的分布就是样本均值的抽样分布。样本均值是一个随机变量。同样,可以得到样本比例的抽样分布和样本标准差的抽样分布。样本均值的抽样分布

(例题分析)【例】设一个总体,含有4个元素(个体)

,即总体单位数N=4。4

个个体分别为x1=1,x2=2,x3=3,x4=4

。总体的均值、方差及分布如下总体分布142300.10.20.3均值和方差样本均值的抽样分布

(例题分析)现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)样本均值的抽样分布

(例题分析)

计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值()x样本均值的抽样分布1.000.10.20.3P

(x)1.53.04.03.52.02.5样本均值的分布与总体分布的比较

(例题分析)

=2.5σ2=1.25总体分布142300.10.20.3抽样分布P(

x)1.000.10.20.31.53.04.03.52.02.5x中心极限定理

(centrallimittheorem)当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布设从均值为

,方差为

2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体x样本均值的抽样分布

与中心极限定理

=50

=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值

x也服从正态分布,

x的数学期望为μ,方差为σ2/n。即

x~N(μ,σ2/n)中心极限定理

(centrallimittheorem)

x的分布趋于正态分布的过程1.样本均值的数学期望2.样本均值的方差重复抽样不重复抽样样本均值的抽样分布

(数学期望与方差)(三)样本比例的抽样分布比率也称比例,又称成数。总体比例:某一现象总体中具有某种特征的单位占全部单位的比例(比重),用π表示。样本比例:样本中具有相同特征的单位占全部样本单位的比例(比重),用p表示。如产品合格率、某种商品的市场占有率等。总体比例

式中:N0为总体中具有某种特征的单位数;N为总体单位数。设总体中具有另一种特征的单位数为N1,则有:N1/N=1-π样本比例式中:n0为样本中具有某种特征的单位数;n为样本单位数。设样本中具有另一种特征的单位数为n1,则有:n1/n=1-p当n很大时,样本比例p的抽样分布可用正态分布近似。对于样本比例p,若np≥5或n(1-p)≥5,就可以认为样本容量足够大。1.样本比例的数学期望2.样本比例的方差重复抽样不重复抽样样本比例的抽样分布

(数学期望与方差)五、参数估计的一般问题(一)参数估计概念在许多实际问题中,我们需要了解总体的情况,如总体分布、总体参数等,但总体参数及其概率分布往往是未知的。例如在农民收入调查中,根据实际经验和理论分析如概率论中的中心极限定理,我们可以断定农民收入服从正态分布,但分布中的参数取何值却是未知的,这就导致统计估计问题。统计估计问题专门研究由样本估计总体的未知分布或分布中的未知参数。直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知,仅需对分布的未知参数进行估计的问题称为参数估计。在参数估计中,假定抽样方法为重复简单随机抽样,样本的每个分量都与总体同分布,它们之间相互独立。估计量与估计值总体的特征数在参数估计中被称作总体参数,用

表示。用来估计总体参数的统计量被称为估计量,如样本均值、样本比例、样本方差等都可以是一个估计量。估计量用表示。估计量是一个随着抽样波动而波动的随机变量。当有了样本数据后,可用估计量计算出具体数值,该数值就称为估计值。(二)点估计与区间估计参数估计方法有点估计与区间估计两种。1.参数估计的点估计法一般地说,用样本估计量的值直接作为总体参数的估计值称为点估计。如:用样本均值直接作为总体均值的估计。例如,对某地区的水稻亩产量进行估计,我们抽取一个样本后得到的平均亩产量为600千克,我们就把该产量作为该地区的水稻亩产量,并以此估计出该地区的水稻总产量。没有给出估计值接近总体参数程度的信息2.参数估计的区间估计法通过点估计,虽然可以给出未知参数的一个估计量(或估计值),但不知道与

到底相差多少?这就需要在点估计的基础上,给出总体参数的一个范围。人们希望利用样本给出一个范围,要求它以足够大的把握程度包含待估计参数的真值。这就是区间估计。

P{

}=1-

其中[,]是置信区间;,是置信区间上、下限;1-

是置信度、置信系数;

在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在75~85之间,置信水平是95%

样本统计量

(点估计)置信区间置信下限置信上限(三)评价估计量的标准对总体参数,可用若干种方法去估计。例如,如果我们要估计总体的均值μ,可采用很多种方法:一是只从总体中抽取一个样本值,即用x1估计μ

二是用样本的中位数进行估计;三是用样本的众数估计;四是在样本(x1,x2,…,xn)中取其最大值与最小值之差的1/2去估计μ

;五是用样本平均数估计μ

。对于这些估计方法来说,哪种方法的估计值好些?哪个差些?也就是说,对于所估计的均值,哪个更接近总体均值的真实值?这就提出了对估计量的评价标准问题。无偏性

(unbiasedness)无偏性:估计量抽样分布的数学期望等于被估计的总体参数P(

)BA无偏有偏有效性

(efficiency)有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效

AB

的抽样分布

的抽样分布P(

)一致性

(consistency)随着样本容量的增大,点估计量的值越来越接近被估计总体的参数。样本容量越大,点估计量的抽样分布的方差或标准差就越小。与有效性一致。也称相合性六、一个总体参数的区间估计(一)总体均值的区间估计1、正态总体且方差已知;或非正态总体、方差未知、大样本情况下设样本来自正态总体是总体均值,是总体方差。当已知时,数理统计已证明服从正态分布,从而Z=服从标准正态分布,对给定的置信系数,查正态分布表,可得上分位点,使得从而有取则即是则的置信水平为

的置信区间

在总体服从正态分布或总体分布情况不知道,但样本为大样本情况下,如果总体方差未知,可用样本方差S2代替。在不重复抽样条件下,置信区间为:[例]某保险公司从投保人中随机抽取36人,计算得36人的平均年龄岁,已知投保人平均年龄近似服从正态分布,标准差为7.2岁,试求全体投保人平均年龄的置信水平为99%的置信区间。解:已知:查正态分布表,得故全体投保人平均年龄的置信水平为99%的置信区间为[36.41,42.59][例]某学院从某专业的1000名学生中采用不重复抽样方式随机抽取了200名学生,并调查这200名学生英语课程的成绩,以此来估计1000人的平均成绩。这200人的平均成绩为78分,由以往经验知总体方差为90分,不知总体服从何种分布。在置信水平为90%的条件下建立1000名学生平均成绩的置信区间。解:由题意知:则:答:1000名学生英语平均成绩在77.01~78.99之间。2、正态总体、方差未知、小样本情况下如果总体服从正态分布,无论样本容量大小,样本均值的抽样分布都服从正态分布。只要总体方差已知,即使在小样本情况下,也可以按前面的公式计算总体均值的置信区间。如果总体方差未知,需用样本方差S2代替,在小样本情况下,应用t分布来建立总体均值的置信区间。T检验T检验,亦称studentt检验(Student′sttest),主要用于样本容量较小(例如n<30),总体标准差σ未知的正态分布资料。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与F检验、卡方检验并列。t检验是戈斯特为了观测酿酒质量而发明的。戈斯特在位于都柏林的健力士酿酒厂担任统计学家,基于ClaudeGuinness聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政策。戈斯特于1908年在Biometrika上公布t检验,但因其老板认为其为商业机密而被迫使用笔名(学生)。t分布是类似正态分布的一种对称分布,通常要比正态分布平坦和分散。随着自由度的增大,t分布逐渐趋于正态分布。在已知总体服从正态分布,但方差未知、小样本情况下,总体均值在置信水平下的置信区间为:(重复抽样条件下)

(不重复抽样条件下)其中为t分布临界值,可以查t分布临界值表得到。【例]为了估计电视台播放一分钟广告的平均费用,现在抽出15家电视台进行调查,得到这15家电视台播放一分钟广告的平均费用为10000元,标准差为2000元。假设总体近似服从正态分布,试在置信水平为95%的条件下建立广告平均费用的置信区间。解:根据题意,已知:,查t分布表,有

即电视台播放一分钟广告的平均费用在8894~11106元之间。(二)总体比例的区间估计(二)总体比例的区间估计在大样本(一般经验规则:)条件下,样本比例的抽样分布可用正态分布近似。在这种情况下,数理统计已经证明如下结论:置信水平为1-a的置信区间为:(重复抽样)

(不重复抽样)[例]某城市想要估计下岗职工中女性所占的比例,采取重复抽样方法随机抽取了100名下岗职工,其中65人为女性。试以95%的置信水平估计该城市下岗职工中女性所占比例的置信区间。解:由题意,已知,,得:即65%±9.35%=(55.65%,74.35%)答:95%的置信水平下该城市下岗职工中女性所占比例在55.65%~74.35%之间。,,

[例]某灯泡生产企业为检验灯泡的质量,对一批灯泡抽取1%进行检验,结果测得这批灯泡的平均寿命为1010小时,抽样平均误差为5.6小时;合格率为92%,抽样平均误差为2.4%。要求在95%的可靠程度下,对该批灯泡的平均寿命和合格率进行区间估计。解:据题意知:由于1-

=95%,

=0.05,查表得则:灯泡的平均寿命区间为:

灯泡的合格率区间为:

答:在95%的可靠程度下,该批灯泡的平均寿命在999.02到1020.98小时之间,合格率在87.3%和96.7%之间。七、样本容量的确定(一)影响样本容量的因素在参数区间估计的讨论中,估计值和总体的参数之间存在着一定的差异,这种差异是由样本的随机性产生的。在样本容量不变的情况下,若要增加估计的可靠度,置信区间就会扩大,估计的精度就降低了。若要在不降低可靠性的前提下,增加估计的精确度,就只有扩大样本容量。增大样本容量要受到人力、物力和时间等条件的限制,所以需要在满足一定精确度的条件下,尽可能恰当地确定样本容量。一个常用的准则是在使精度得到保证的前提下寻求使成本最省的样本量。由于成本通常是样本量的正向线性函数,故使费用最省的样本量也就是使精度得到保证的最小样本量。1.总体的变异程度(总体方差)。2.允许误差的大小。3.置信水平1-α的大小。4.抽样方法不同。(二)样本容量的确定

1.估计总体均值时样本容量的确定在简单随机重复抽样下,设样本来自正态总体,总体均值的点估计为样本均值。再可靠度为情况下,要求以估计时的绝对误差不超过,即要求的最小样本容量为(重复抽样条件下)

(不重复抽样条件下)[例]在某企业中采用简单随机抽样调查职工月度平均奖金额,设职工月度奖金额服从标准差为10元的正态分布,要求估计的绝对误差为3元,可靠度为95%,试问应抽取多少职工进行调查?解:根据题意知:则(人)答:该企业需抽取43名职工作为样本进行调查。2.估计总体比例时样本容量的确定在简单随机重复抽样条件下,估计总体比例时,根据数理统计原理,可以定义绝对误差为:从而得到样本容量:

(重复抽样条件下)同理,在简单随机不重复抽样条件下,我们可以得出估计总体比例时样本容量的计算公式为:

(不重复抽样条件下[例]根据以往的生产统计,某企业某种产品的合格率为90%,现要求绝对误差不超过5%,在置信水平为95%时,应抽取多少件产品作为样本?解:已知,则

=答:该企业应抽取139件产品作为样本进行调查。件在估计成数时,计算样本容量时需要总体的成数,但是总体的成数通常是未知的,在实际的抽样调查时,可先进行小规模的试调查求得样本的成数来代替。也可用历史的资料,如果有若干个成数可供选择,则应选择最靠近50%的成数,使样本成数的方差最大,以保证估计的精确度。估计德军坦克数量(参数估计)在二战前期,德国在坦克战中占了很多便宜,直到后来,苏联的坦克才能和德国坦克一拼高下。德军有多少坦克是盟军非常希望获得的重要情报,有很多盟军特务的任务就是窃取德军坦克总量情报,然而根据战后所获得的数据,真正可靠的情报不是来源于盟军特务,而是统计学家。统计学家做了什么事情呢?这和德军制造坦克的惯例有关,德军坦克在出厂之后按生产的先后顺序编号,1,2...n,这是一个十分傻的传统,正是因为这个传统德军送给了盟军统计学家需要的数据。盟军在战争中缴获了德军的一些坦克并且获取了这些坦克的编号,现在统计学家需要在这些编号的基础上估计n,也就是德军的坦克总量。这其实是均匀分布边界的估计,公式是:

(1+1/缴获德军坦克的总量)×所有缴获坦克中的最大编号第二节假设检验一、假设检验的基本原理二、假设检验的基本方法三、假设检验中的两类错误四、一个总体参数的假设检验一、假设检验的基本原理参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断。推断的角度不同:参数估计是在总体参数未知的情况下用样本统计量估计总体参数。假设检验是先对总体参数提出一个假设,然后利用样本信息去检验这个假设是否成立,如果成立,就接受这个假设,否则就放弃。什么是假设检验?

(hypothesistest)先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理二、假设检验的步骤【例】

某企业生产一种零件,过去的大量资料表明,零件的平均长度为5厘米,标准差为0.1厘米。为了提高零件的精度,该企业对这种零件的生产工艺进行了改革。改革工艺后,抽查了100个零件,测得样本平均长度为4.94厘米。现问:(1)工艺改革前后零件的长度是否发生了显著的变化?(2)工艺改革后的零件长度是否比原来有所缩短?(3)工艺改革后的零件长度是否比原来的长?1、提出原假设和备择假设对每个假设检验问题,要同时提出两个相反的假设:原假设和备择假设。原假设又称零假设,是待检验的假设,是研究者想收集证据予以反对的假设,记为H0;总是有符号

,

或。备择假设是拒绝原假设后可供选择的假设,是研究者想收集证据予以支持的假设,记为H1。总是有符号

,

或。原假设和备择假设是相互对立的,并构成一组完备假设。检验结果二者必取其一。接受H0则必须拒绝H1;反之,拒绝H0则必须接受H1。原假设和备择假设不是随意提出的,应根据所检验问题的具体背景而定。常常是采取“不轻易拒绝原假设”的原则,即把没有充分理由不能轻易否定的命题作为原假设,而相应地把没有足够把握就不能轻易肯定的命题作为备择假设。一般地,假设有三种形式:1)H0:μ=μ0;H1:μ≠μ0。这种形式的假设检验称为双侧检验。如前例中的第一个问题可提出假设:H0:μ=5厘米;H1:μ≠5厘米。2)H0:μ≥μ0;H1:μ<μ0。这种形式的假设检验称为左侧检验。如前例中的第二个问题可提出假设:H0:μ≥5厘米;H1:μ<5厘米。3)H0:μ≤μ0;H1:μ>μ0。这种形式的假设检验称为右侧检验。如前例中的第三个问题可提出假设:H0:μ≤5厘米;H1:μ>5厘米。左侧检验和右侧检验统称为单侧检验。采用哪种假设,要根据所研究的实际问题而定。如果对所研究问题只需判断有无显著差异或要求同时注意总体参数偏大或偏小的情况,则采用双侧检验。如果所关心的是总体参数是否比某个值偏大(或偏小),则宜采用单侧检验。双侧检验与单侧检验

(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:m=m0H0:m

m0H0:m

m0备择假设H1:m≠m0H1:m<m0H1:m>m0【例】一家研究机构估计,成都市居民家庭拥有汽车的比率超过40%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。提出假设(例题分析)解:研究者想收集证据予以支持的假设是“成都市居民家庭拥有汽车的比率超过40%”。建立的原假设和备择假设为

H0:

40%H1:

40%【例】一家研究机构估计,成都市居民家庭拥有汽车的比率超过40%。为验证这一估计是否正确,另一家机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。2、选择适当统计量并确定其分布形式不同的假设检验问题需选择不同的统计量。用于假设检验问题的统计量称为检验统计量。选择什么统计量作为检验统计量,应根据具体问题和不同的条件而定。例如,用于进行检验的样本是大样本还是小样本,总体方差已知还是未知,等等。检验统计量(teststatistic)与拒绝域检验统计量:根据样本统计量得到的,并能衡量样本统计量与零假设差异的统计量通常检验统计量取为:

根据样本计算检验统计量的值,如该值与0相差很大,说明零假设不正确;否则,不能认为零假设不正确。拒绝域:检验统计量(或样本统计量或样本)取值的集合,当根据样本观测结果算得检验统计量的值属于该集合时,零假设应被拒绝。

3、选择显著性水平а,确定临界值显著性水平表示原假设H0为真时拒绝原假设的概率,即拒绝原假设所犯错误的概率,一般用а表示,统计上把α称为假设检验中的显著性水平(Significantlevel),也就是决策中所面临的风险。所以,显著性水平是指当原假设为正确时人们却把它拒绝了的概率或风险。这个概率是由人们事前确定的,通常取α=0.05或α=0.01,这表明,当做出接受原假设的决定时,其正确的可能性(概率)为95%或99%。给定了显著性水平а,也就确定了原假设H0的接受区域和拒绝区域。通过查分布表,得到临界值,这个临界值就是接受区域和拒绝区域的临界点。对于不同形式的假设,H0的接受区域和拒绝区域也有所不同。双侧检验的拒绝区域位于统计量分布曲线的两侧;左侧检验的拒绝区域位于统计量分布曲线的左侧;右侧检验的拒绝区域位于统计量分布曲线的右侧。显著性水平和拒绝域

(双侧检验)抽样分布0临界值临界值a/2a/2

样本统计量拒绝H0拒绝H01-

置信水平显著性水平和拒绝域

(双侧检验

)0临界值临界值a/2

a/2

样本统计量拒绝H0拒绝H0抽样分布1-

置信水平显著性水平和拒绝域

(单侧检验

)0临界值a样本统计量拒绝H0抽样分布1-

置信水平显著性水平和拒绝域

(左侧检验

)0临界值a样本统计量拒绝H0抽样分布1-

置信水平观察到的样本统计量显著性水平和拒绝域

(右侧检验

)0临界值a样本统计量拒绝H0抽样分布1-

置信水平观察到的样本统计量4、作出结论1)给定显著性水平,查表得出相应的临界值z

或z/2,t

或t/22)将检验统计量的值与水平的临界值进行比较3)作出决策双侧检验:I统计量I>临界值,拒绝H0左侧检验:统计量<-临界值,拒绝H0右侧检验:统计量>临界值,拒绝H0假设检验步骤的总结1.陈述原假设和备择假设2.从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据算出其具体数值4.确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0三、假设检验中的两类错误1. 第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率记为

被称为显著性水平2. 第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率记为

(Beta)

H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–a)第Ⅱ类错误(b)拒绝H0第Ⅰ类错误(a)正确决策(1-b)假设检验就好像一场审判过程统计检验过程

错误和

错误的关系

你不能同时减少两类错误!

和的关系就像翘翘板,小就大,大就小影响错误的因素1)总体参数的真值随着假设的总体参数的减少而增大2)显著性水平

当减少时增大3)总体标准差

增大时增大4)样本容量n当n

减少时增大四、一个总体参数的假设检验z检验(单侧和双侧)

t检验(单侧和双侧)z

检验(单侧和双侧)

2检验(单侧和双侧)均值一个总体比率方差总体均值的检验

(作出判断)

是否已知小样本容量n大

是否已知否t检验否z检验是z检验

是z检验(一)总体均值的检验1、总体方差已知时对正态总体均值的假设检验设总体X~N(μ,σ2),总体方差σ2

为已知,(x1,x2,…,xn)为总体的一个样本,样本平均数为。现在的问题是对总体均值μ进行假设检验。H0:μ=μ0

(或μ≤μ0、μ≥μ0

)。根据抽样分布定理,样本平均数服从N(μ,σ2/n),所以,如果H0成立时,检验统计量Z及其分布为:利用服从正态分布的统计量Z进行的假设检验称为Z检验法。根据已知的总体方差、样本容量n和样本平均数,计算出检验统计量Z的值。对于给定的检验水平,查正态分布表可得临界值,将所计算的Z值与临界值比较,便可做出检验结论。[例]根据过去大量资料,某公司所生产产品的使用寿命服从正态分布N(1020,1002)。该公司在进行了技术革新后,需要检验技术革新后的产品使用寿命是否有显著改善,现从最近生产的一批产品中随机抽取16件,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?解:根据题意,提出假设:H0:μ≤1020;H1:μ>1020,检验统计量由α=0.05,查表得临界值z0.05=1.645由于Z=2.4>Z0.05=1.645,所以应拒绝H0而接受H1,即这批产品的使用寿命确有显著提高。总体均值的检验条件检验条件量拒绝域H0、H1(1)H0:μ=μ0H1:μ≠μ0

z(2)H0:μ≤μ0H1:μ>μ0(3)H0:μ≥μ0H1:μ<μz0z00非正态总体n≥30σ2已知或未知ZaZa2、总体方差未知时对正态总体均值的假设检验设总体X~N(μ,σ2),但总体方差σ2

未知,此时对总体均值的检验不能用上述Z检验法,因为此时的检验统计量Z中包含了未知参数。为了得到一个不含未知参数的检验统计量,很自然会用总体方差的无偏估计量即样本方差S2

来代替σ2

,在小样本时采用t统计量。检验统计量t及其分布为:t利用服从t分布的统计量去检验总体均值的方法称为t检验法。双侧检验时,若,则拒绝H0,接受H1。左侧检验时,若t<–tα,则拒绝H0,接受H1。右侧检验时,若t>tα,则拒绝H0,接受H1。【例】从长期的资料可知,某公司生产的某种电子元件的使用寿命服从均值为200小时,标准差未知的正态分布。通过改变部分生产工艺后,抽得10件样本作分析(小时):202,209,213,198,206,210,195,208,200,207试根据抽查的样本,判断该公司所生产的电子元件的使用寿命是否有了提高。(α=0.05)解:根据题意,检验目的是考察电子元件使用寿命的平均值数据是否有所提高。因此,可建立如下假设:根据已知数据求得=204.8,S=5.789检验统计量由α=0.05,查表得临界值由于,所以拒绝H0接受H1,即可以接受“在新工艺下,这种电子元件使用寿命的平均值有所提高的假设”。t检验法讨论t检验法适用于小样本情况下总体方差未知时对正态总体均值的假设检验。随着样本容量n的增大,t分布趋近于标准正态分布。所以大样本情况下(n>30),总体方差未知时对正态总体均值的假设检验通常近似采用Z检验法。同理,大样本情况下非正态总体均值的检验也可用Z检验法。因为,根据大样本的抽样分布定理,总体分布形式不明或为非正态总体时,样本平均数趋近于正态分布。这时,检验统计量Z中的总体标准差用样本标准差S来代替。(二)总体比例的假设检验由比例的抽样分布定理可知,样本比例服从二项分布,因此可由二项分布来确定对总体比例进行假设检验的临界值,但其计算往往十分繁琐。大样本情况下,二项分布近似服从正态分布。因此,对总体比例的检验通常是在大样本条件下进行的,根据正态分布来近似确定临界值,即采用Z检验法。其检验步骤与均值检验时的步骤相同,只是检验统计量不同。首先提出待检验的假设:检验统量为

[例]调查人员在调查某企业的主要产品生产线时,被告知生产线性能良好,产品生产稳定,产品合格率达99%。为了验证这一说法,调查人员随机抽查了200件产品,其中195件产品合格,判断厂方的宣称是否可信?(α=10%)。解:依题意,可建立如下假设:样本比例由于样本容量相当大,所以可近似采用Z检验法。给定α=0.1,查正态分布表得由于,应接受原假设,即认为厂方的宣称是可信的。(三)总体方差的假设检验在实际生产活动或生活中,仅仅知道样本均值或比率维持在一个特定的范围内是不够的,因为这还不足以保证整个过程(如生产线)的稳定性。在生产产品过程中,产品的方差大就意味着所生产的产品质量或生产产品的生产线的性能不稳定,但由于抽样中受偶然因素的影响,所观察到得样本信息(如样本均值或比率)可能提供了产品质量符合要求,从而使管理人员作出错误的判断。因此,总体方差的检验也是一项主要的内容。与总体均值、总体比率的检验不同,在总体方差检验中,不论样本容量n大小,都要求总体服从正态分布,这是因为总体方差的检验统计量的抽样分布为(卡方)分布。用表示假定的总体方差的某一数值,则总体方差的假设形式、检验的统计量和拒绝域如下表所示。

总体方差检验的拒绝域

20

拒绝域总体方差的检验方法假设双侧检验左侧检验右侧检验假设形式H0

2=

02H1:

2

02H0

2

02H1:

2<

02H0:

2

02H1

2>

02统计量拒绝域【例】某电工器材厂生产保险丝,为保证质量稳定,要控制保险丝融化时间的方差,希望其不超过也不低于60分钟,方差太大说明生产质量不稳定,而太小说明生产精度太高,厂家所花费的成本太高。从中抽出10根保险丝进行检验,测得样本方差为104分钟。以0.1为显著性水平检验该厂生产的保险丝融化时间的方差是否符合要求。解:根据题意,可作如下假设:

已知:n=10,s2=104分钟,=60分钟。则检验的统计量为:由а=0.1,查表,得:由于3.325<15.6<16.919,所以没有显著证据表明方差不符合要求。第三节方差分析一、方差分析的原理二、单因素方差分析三、方差分析中的多重比较利用假设经验,可以对两个总体分布的均值是否相等进行检验,但在实际经济活动中,如果我们需要检验多个总体分布的均值是否相等时,又应该任何处理呢?思路一:对多个总体分布的均值进行两两比较思路二:是采用方差分析(ANOVA)方法对多个总体分布的均值同时进行检验。方差分析(ANOVA)概念由英国统计学家R.A.Fisher于1923年在农业实验中首次提出。通过方差分析找出提高农作物产量的主要因素。现在方差分析方法已广泛应用于科学实验,医学,化工,管理学等各个领域,范围广阔。一、方差分析的原理某饮料生产企业开发出了一种新型饮料,饮料的颜色共有四种:橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。为了试验颜色对该新型饮料销售量是否有影响,该公司在一些超市试销了一个月。现从这些试销的超市中随机抽取了5家超市以收集该种饮料的销售情况(如下表所示)。该公司现在需要确定颜色是否对饮料的销售量产生影响?某种新型饮料不同颜色试销1个月的销售量xij(单位:件)超市编号(i)无色粉色橘黄色绿色126.531.227.930.8228.728.325.129.6325.130.828.532.4429.127.924.231.7527.229.6—32.8为了分析不同的颜色对饮料销售是否有影响,我们可以把每种颜色的饮料所可能达到的销售量看作一个总体现象,每一家超市的试销量就分别构成了4个样本。4种颜色对商品的促销影响力是否相等的问题,可以通过判定4个总体的平均数是否相等来解决。如果4种颜色所实现的平均销售量相等,那么我们可以认为这4种颜色对商品的促销作用力相等,如果4种颜色所实现的平均销售量不相等,那么我们可以认为这4种颜色对商品的促销作用力具有明显的差异。在方差分析中,涉及两类变量。因变量是在方差分析中实际测量的、作为结果的变量。是一个数值型变量。自变量是作为原因、把观测结果分成几个组以进行比较的变量。是一个分类型变量。在方差分析中,自变量也被称为因素(factor),因素是方差分析研究的对象,是一个可控制的条件。如上例中的颜色。因素的不同表现,即因素中所包含的内容,称为因素的“水平”或“处理”(treatment)。方差分析就是通过分析多个总体的均值是否相等来判断分类型的自变量(如上例中的颜色)对数量型的因变量(如上例中的销售量)的影响是否显著。方差分析有多种类型。根据分析的对象可以分为单因素方差分析(只对一个可控因素进行分析)、双因素方差分析(对两个可控因素进行分析)、多因素方差分析(同时对多个可控因素进行分析)。方差分析的基本假设⑴每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。⑵各个总体的方差必须相同。也就是说,各组观察数据是从具有相同方差的总体中抽取的。⑶观察值之间是相互独立的。二、单因素方差分析(一)数据结构(二)分析步骤

(一)单因素方差分析的数据结构

(one-wayanalysisofvariance)

观察值(j)因素(A)i

水平A1水平A2

水平Ak12::n

x11

x21

xk1x12

x22

xk2::

:

:::

:

:x1n

x2n

xkn表中:A表示因素,因素的k个水平(总体)用A1、A2、A3、…Ak来表示,观测值用xij(i=1、2、3……k,j=1、2、3……n)表示,xij即为第i个水平的第j个观测值。表

颜色对饮料销售量有无影响的数据结构超市编号(j)颜色(A)i无色A1粉色A2橘黄色A3

绿色A412345

26.531.227.930.828.728.325.129.625.130.828.532.429.127.924.231.727.229.6—32.8分析思路误差来源:系统性误差、随机性误差组间方差:系统性误差、随机性误差组内方差:随机性误差思路:组间方差与组内方差的大小1、提出假设

若可控因素的不同水平对试验结果无显著性影响,那么观测值Xij应该来自同一正态总体,即:Xij

N(

,

2)。所以检验对应的零假设是(1)一般提法H0

1=

2=…=

k自变量对因变量没有显著影响H1:

1

2

,…

k不全相等自变量对因变量有显著影响式中:

i为第i个总体的均值(i=1,2,…k)。(2)注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等(二)分析步骤

3、上例的检验假设

H0:

1=

2=

3=

4

即:颜色对饮料销售量无显著影响

H1:

i(i=1,2,3,4)不全相等即:颜色对饮料销售量有显著影响如果不拒绝H0,则不能认为颜色与饮料销售量之间有显著关系;如果拒绝H0,则意味着颜色与饮料销售量之间有显著关系。在拒绝H0时,表明至少有两种颜色的饮料销售量的均值不相等,而非所有颜色的饮料销售量的均值都不相等。2、构造检验统计量为检验H0是否成立,需要确定检验的统计量,并以此来判别不同水平对试验结果有无显著性影响。下面我们通过上述颜色对饮料销售量是否有影响的例子来说明如何构造和计算检验统计量。构造检验的统计量

(计算各样本的均值)假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数计算公式为式中:ni为第i个总体的样本观察值个数

xij为第i个总体的第j个观察值

根据上表中的数据,计算出无色饮料销售量的样本均值为:

同理,可以计算出粉色、橘黄色和红色的均值,计算结果见下表。构造检验的统计量

(计算全部观察值的总均值)全部观察值的总和除以观察值的总个数计算公式为根据上表中的数据,计算出总均值为:构造检验的统计量(例题分析)超市编号(j)颜色(A)i无色A1粉色A2橘黄色A3

绿色A412345

26.531.227.930.828.728.325.129.625.130.828.532.429.127.924.231.727.229.6—32.8样本平均数27.3229.5626.4331.46总平均数28.81构造检验的统计量

(计算总误差平方和SST)全部观察值与总平均值的离差平方和反映全部观察值的离散状况其计算公式为

前例

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论