第4章参数估计和假设检验课件_第1页
第4章参数估计和假设检验课件_第2页
第4章参数估计和假设检验课件_第3页
第4章参数估计和假设检验课件_第4页
第4章参数估计和假设检验课件_第5页
已阅读5页,还剩181页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章参数估计和假设检验ppt课件第4章参数估计和假设检验ppt课件4.1参数估计4.1.1参数估计的基本概念4.1.2总体均值和比例的区间估计4.1.3必要样本容量的确定2中央财经大学统计学院22224.1参数估计4.1.1参数估计的基本概念2中央财经大学统4.1.1参数估计的基本概念总体样本算术平均数统计量用来推断总体参数的统计量称为估计量(estimator),其取值称为估计值(estimate)。同一个参数可以有多个不同的估计量。参数是唯一的,但估计量(统计量)是随机变量,取值是不确定的。

参数3中央财经大学统计学院34.1.1参数估计的基本概念总体样本算术平均数统计量用来推点估计点估计:用估计量的数值作为总体参数的估计值。一个总体参数的估计量可以有多个。例如,在估计总体方差时,和都可以作为估计量。4中央财经大学统计学院4点估计点估计:用估计量的数值作为总体参数的估计值。4中央点估计量的常用评价准则:无偏性无偏性:估计量的数学期望与总体待估参数的真值相等:P(

)BA无偏有偏5中央财经大学统计学院5点估计量的常用评价准则:无偏性无偏性:估计量的数学期望与总体点估计量的常用评价准则:有效性在两个无偏估计量中方差较小的估计量较为有效。AB的抽样分布的抽样分布P(

)6中央财经大学统计学院6点估计量的常用评价准则:有效性在两个无偏估计量中估计量的常用评价准则:一致性指随着样本容量的增大,估计量越来越接近被估计的总体参数。AB较小的样本容量较大的样本容量P(X)X7中央财经大学统计学院7估计量的常用评价准则:一致性指随着样本容量的增大,估计量越来第4章参数估计和假设检验课件第4章参数估计和假设检验课件抽样分布:几个要点抽样分布是统计量的分布而不是总体或样本的分布。在统计推断中总体的分布一般是未知的,不可观测的(常常被假设为正态分布)。样本数据的统计分布是可以直接观测的,最直观的方式是直方图,可以用来对总体分布进行检验。抽样分布一般利用概率统计的理论推导得出,在应用中也是不能直接观测的。其形状和参数可能完全不同于总体或样本数据的分布。10中央财经大学统计学院10抽样分布:几个要点抽样分布是统计量的分布而不是总体或样本的分抽样分布的一个演示:重复抽样时样本均值的抽样分布(1)设一个总体含有4个个体,分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差及分布如下。均值和方差总体的频数分布14230.1.2.311中央财经大学统计学院11抽样分布的一个演示:重复抽样时样本均值的抽样分布(1)设一个抽样分布的一个演示:重复抽样时样本均值的抽样分布(2)

现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表.3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)12中央财经大学统计学院12抽样分布的一个演示:重复抽样时样本均值的抽样分布(2)现抽样分布的一个演示:重复抽样时样本均值的抽样分布(3)各样本的均值如下表,并给出样本均值的抽样分布x样本均值的抽样分布1.00.1.2.3P(x)1.53.04.03.52.02.53.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)13中央财经大学统计学院13抽样分布的一个演示:重复抽样时样本均值的抽样分布(3)各所有样本均值的均值和方差1.样本均值的均值(数学期望)等于总体均值2.样本均值的方差等于总体方差的1/nM为样本数目14中央财经大学统计学院14所有样本均值的均值和方差1.样本均值的均值(数学期望)等于第4章参数估计和假设检验课件第4章参数估计和假设检验课件f(X)X小样本中心极限定理从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。大样本(n

30)17中央财经大学统计学院17f(X)X小样本中心极限定理从均值为,方差为2的一个任标准误(StandardError)简单随机抽样、重复抽样时,样本均值抽样分布的标准差等于,这个指标在统计上称为标准误。统计软件在对变量进行描述统计时一般会输出这一结果。18中央财经大学统计学院18标准误(StandardError)简单随机抽样、重复抽样有限总体校正系数

FinitePopulationCorrectionFactor简单随机抽样、不重复抽样时,样本均值抽样分布的方差略小于重复抽样的方差,等于这一系数称为有限总体校正系数。当抽样比(n/N)<0.05时可以忽略有限总体校正系数。19中央财经大学统计学院19有限总体校正系数

FinitePopulationCor4.2总体均值和比例的区间估计20中央财经大学统计学院204.2总体均值和比例的区间估计20中央财经大学统计学院相关理论总体正态?n≥30?σ2已知?否是是否否是实际中总体方差总是未知的,因而这是应用最多的公式。在大样本时t值可以用z值来近似。根据中心极限定理得到的近似结果。

σ未知时用s来估计。增大n?数学变换?21中央财经大学统计学院21相关理论总体正态?n≥30?σ2已知?否是是否否是实际中总体当时总体比例的置信区间可以使用正态分布来进行区间估计。(样本比例记为,总体比例记为π)总体比例的置信区间22中央财经大学统计学院2222当关于置信区间的补充说明置信区间的推导:有限总体不重复抽样时,样本均值或比例的方差需要乘以“有限总体校正系数”(当抽样比f=n/N小于0.05时可以忽略不计),前面的公式需要进行相应的修改。23中央财经大学统计学院23关于置信区间的补充说明置信区间的推导:23中央财经大学统计学关于置信度含义的说明样本均值的抽样分布在所有的置信区间中,有(1-)*100%的区间包含总体真实值。对于计算得到的一个具体区间,“这个区间包含总体真实值”这一结论有(1-)*100%的可能是正确的。说“总体均值有95%的概率落入某一区间”是不严格的,因为总体均值是非随机的。=

1-/2/2X_σx_x24中央财经大学统计学院24关于置信度含义的说明样本均值的抽样分布在所有的置信区间中,Example:用SPSS进行区间估计例:儿童电视节目的赞助商希望了解儿童每周看电视的时间。下面是对100名儿童进行随机调查的结果(小时)。计算平均看电视时间95%的置信区间。39.719.534.727.041.315.120.531.318.317.021.529.915.016.436.823.424.128.923.424.440.646.423.639.435.519.529.331.220.634.915.531.638.938.727.226.514.715.628.424.043.920.629.19.521.042.413.932.829.832.933.038.028.720.619.738.637.117.015.123.421.021.829.321.322.823.432.511.343.830.815.823.220.333.530.037.824.426.929.027.727.122.036.123.022.126.522.926.930.225.223.835.321.635.730.822.724.521.926.550.325中央财经大学统计学院25Example:用SPSS进行区间估计例:儿童电视节目的赞助SPSS输出结果(数据:tv.xls)

操作:分析->描述统计->探索

统计量标准误均值27.191.8373均值的95%置信区间下限25.530

上限28.852

5%修整均值26.977

中值26.500

方差70.104

标准差8.3728

极小值9.5

极大值50.3

26中央财经大学统计学院26SPSS输出结果(数据:tv.xls)

操作:分析->描述统总体比例的置信区间:例子解:显然有因此可以用正态分布进行估计。Z/2=1.645结论:我们有90%的把握认为悉尼青少年中每天都抽烟的青少年比例在19.55%~23.85%之间。1986年对悉尼995名青少年的随机调查发现,有216人每天都抽烟。试估计悉尼青少年中每天都抽烟的青少年比例的90%的置信区间。

27中央财经大学统计学院27总体比例的置信区间:例子解:显然有结论:我们有90%的把握认SPSS的计算结果在SPSS中将“是否吸烟”输入为取值为1和0的属性变量,权数分别为216和779。计算这一变量均值的置信区间即为比例的置信区间。

统计量标准误均值.2171.01308均值的90%置信区间下限.1956

上限.2386

5%修整均值.1857

中值.0000

方差.170

标准差.41247

极小值.00

极大值1.00

范围1.00

四分位距.00

28中央财经大学统计学院28SPSS的计算结果在SPSS中将“是否吸烟”输入为取值为1和4.3必要样本量的计算样本量越大抽样误差越小。由于调查成本方面的原因,在调查中我们总是希望抽取满足误差要求的最小的样本量。29中央财经大学统计学院294.3必要样本量的计算样本量越大抽样误差越关于抽样误差的几个概念实际抽样误差抽样平均误差最大允许误差30中央财经大学统计学院30关于抽样误差的几个概念实际抽样误差30中央财经大学统计学院实际抽样误差样本估计值与总体真实值之间的绝对离差称为实际抽样误差。由于在实践中总体参数的真实值是未知的,因此实际抽样误差是不可知的;由于样本估计值随样本而变化,因此实际抽样误差是一个随机变量。31中央财经大学统计学院31实际抽样误差样本估计值与总体真实值之间的绝对离差称为实际抽样抽样平均误差抽样平均误差:样本均值的标准差,也就是前面说的标准误。它反映样本均值(或比例)与总体均值(比例)的平均差异程度。例如对简单随机抽样中的样本均值有:

或(不重复抽样)我们通常说“抽样调查中可以对抽样误差进行控制”,就是指的抽样平均误差。由上面的公式可知影响抽样误差的因素包括:总体内部的差异程度;样本容量的大小;抽样的方式方法。32中央财经大学统计学院32抽样平均误差抽样平均误差:样本均值的标准差,也就是前面说的标最大允许误差最大允许误差(allowableerror):在确定置信区间时样本均值(或样本比例)加减的量,一般用E来表示,等于置信区间长度的一半。在英文文献中也称为marginoferror。置信区间=最大允许误差是人为确定的,是调查者在相应的置信度下可以容忍的误差水平。33中央财经大学统计学院33最大允许误差最大允许误差(allowableerror):如何确定必要样本量?必要样本量受以下几个因素的影响:1、总体标准差。总体的变异程度越大,必要样本量也就越大。2、最大允许误差。最大允许误差越大,需要的样本量越小。3、置信度1-

。要求的置信度越高,需要的样本量越大。4、抽样方式

。其它条件相同,在重复抽样、不重复抽样;简单随机抽样与分层抽样等不同抽样方式下要求的必要样本容量也不同。34中央财经大学统计学院34如何确定必要样本量?必要样本量受以下几个因素的影响:34中央简单随机抽样下估计总体均值时

样本容量的确定式中的总体方差可以通过以下方式估计:根据历史资料确定通过试验性调查估计35中央财经大学统计学院35简单随机抽样下估计总体均值时

样本容量的确定式中的总体方差可简单随机抽样下估计总体比例时

样本容量的确定式中的总体比例π可以通过以下方式估计:根据历史资料确定通过试验性调查估计取为0.5。36中央财经大学统计学院36简单随机抽样下估计总体比例时

样本容量的确定36中央财经大学不重复抽样时的必要样本量比重复抽样时的必要样本量要小。式中n0是重复抽样时的必要样本容量。37中央财经大学统计学院37不重复抽样时的必要样本量比重复抽样时的必要样本量要小。37中样本量的确定(实例1)需要多大规模的样本才能在90%的置信水平上保证均值的误差在±5

之内?前期研究表明总体标准差为45.nZE===≈222222(1645)(45)(5)219.2220.向上取整38中央财经大学统计学院38样本量的确定(实例1)需要多大规模的样本才能在90%的置样本量的确定(实例2)一家市场调研公司想估计某地区有电脑的家庭所占的比例。该公司希望对比例p的估计误差不超过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)?解:已知E=0.05,=0.05,Z/2=1.96,当π未知时取为0.5。39中央财经大学统计学院39样本量的确定(实例2)一家市场调研公司想估计某地区有电脑的家实例3 你在美林证券公司的人力资源部工作。你计划在员工中进行调查以求出他们的平均医疗支出。你希望有95%置信度使得样本均值的误差在$50以内。过去的研究表明约为$400。需要多大的样本容量?nZE===≈222222(196)(400)(50)24586246..40中央财经大学统计学院40实例3 你在美林证券公司的人力资源部工作。你计划在员工中进行4.2假设检验4.2.1假设检验的基本问题4.2.2单个总体参数的检验4.2.3两个总体参数的检验41中央财经大学统计学院4.2假设检验4.2.1假设检验的基本问题41中央财4.2.1假设检验的基本问题基本原理零假设和备择假设检验统计量和拒绝域两类错误与显著性水平42中央财经大学统计学院424.2.1假设检验的基本问题基本原理42中央财经大学统计实际中的假设检验问题假设检验:事先作出关于总体参数、分布形式、相互关系等的命题(假设),然后通过样本信息来判断该命题是否成立(检验)。产品自动生产线工作是否正常?某种新生产方法是否会降低产品成本?治疗某疾病的新药是否比旧药疗效更高?厂商声称产品质量符合标准,是否可信?……

43中央财经大学统计学院43实际中的假设检验问题假设检验:事先作出关于总体参数、分布形案例美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进行的一项研究调查了50名失业者,平均失业时间为15.54周。根据调查结果能否认为费城的平均失业时间高于全国平均水平?澳大利亚统计局公布的2003年第一季度失业率为6.1%。而RoyMorgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为RoyMorgan的结果显著高于统计局的数字吗?

44中央财经大学统计学院44案例美国劳工局公布的数字表明,1998年11月美国的平均失业假设检验的基本原理利用假设检验进行推断的基本原理是:小概率事件在一次试验中几乎不会发生。如果对总体的某种假设是真实的(例如学生上课平均出勤率≥95%),那么不利于或不能支持这一假设的事件A(小概率事件,例如样本出勤率=55%)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了(样本出勤率=55%),就有理由怀疑该假设的真实性,拒绝提出的假设。45中央财经大学统计学院45假设检验的基本原理利用假设检验进行推断的基本原理是:45中央假设检验的步骤根据实际问题提出一对假设(零假设和备择假设);构造某个适当的检验统计量,并确定其在零假设成立时的分布;根据观测的样本计算检验统计量的值;根据犯第一类错误的损失规定显著性水平;确定决策规则:根据确定检验统计量的临界值并进而给出拒绝域,或者计算p值等;下结论:根据决策规则得出拒绝或不能拒绝零假设的结论。注意“不能拒绝零假设”不同于“接受零假设”。46中央财经大学统计学院46假设检验的步骤根据实际问题提出一对假设(零假设和备择假设);1、零假设和备择假设的选择零假设和备择假设是互斥的,它们中仅有一个正确;等号必须出现在零假设中;最常用的有三种情况:双侧检验、左侧检验和右侧检验。检验以“假定零假设为真”开始,如果得到矛盾说明备择假设正确。双侧检验左侧检验右侧检验H0m=m0m

m0m

m0H1m≠m0m<m0m>m047中央财经大学统计学院471、零假设和备择假设的选择零假设和备择假设是互斥的,它们中仅单侧检验时零假设和备择假设的选择通常把研究者要证明的假设作为备择假设;将所作出的声明作为原假设;把现状(StatusQuo)作为原假设;把不能轻易否定的假设作为原假设;48中央财经大学统计学院48单侧检验时零假设和备择假设的选择通常把研究者要证明的假设作为零假设和备择假设:

把研究者要证明的假设作为备择假设某种汽车原来平均每加仑汽油可以行驶24英里。研究小组提出了一种新工艺来提高每加仑汽油的行驶里程。为了检验新的工艺是否有效需要生产了一些产品进行测试。该测试中的零假设和备择假设该如何选取?要证明的结论是>24,因此零假设和备择假设的选择为:

24>2449中央财经大学统计学院49零假设和备择假设:

把研究者要证明的假设作为备择假设某种汽车零假设和备择假设:检验一种声明是否正确某种减肥产品的广告中声称使用其产品平均每周可减轻体重8公斤以上。要检验这种声明是否正确你会如何设定零假设和备择假设?没有充分的证据不能轻易否定厂家的声明,因此一般将所作出的声明作为原假设。零假设和备择假设的一般选择为:

≥8<850中央财经大学统计学院50零假设和备择假设:检验一种声明是否正确某种减肥产品的广告中声2检验统计量和拒绝域检验统计量:我们用来决策(拒绝或不能拒绝零假设)时依据的样本统计量。不同的总体参数适用的检验统计量不同。

拒绝域:检验统计量取值的集合,当根据样本得到的检验统计量的值属于该集合时,拒绝零假设。不能拒绝零假设的检验统计量取值的集合称为接受域;划分拒绝域和接受域的数值称为临界值。51中央财经大学统计学院512检验统计量和拒绝域检验统计量:我们用来决策(拒绝或不能决策实际情况H0为真H0为假接受H0正确第二类错误(b)拒绝H0第一类错误(a)正确3、假设检验中的两类错误与显著性水平52中央财经大学统计学院52决策实际情况H0为真H0为假接受H0正确第二类错误(b)拒绝两类错误的概率两类错误不可避免;要减小其中的一种错误,通常只能通过增加另一种错误的方法做到。假设检验中通常首先控制控制第一类错误的概率不超过某个小概率水平,在满足该条件的要求下使犯第二类错误的概率尽量小。允许犯第一类错误的概率称为显著性水平。通常取为0.01,0.05,0.1。根据可以确定检验统计量的临界值,并根据统计量的样本观测值和临界值得出检验结论。53中央财经大学统计学院53两类错误的概率两类错误不可避免;要减小其中的一种错误,通常只假设检验的主要应用假设检验的方法可以用于检验:一个总体的均值、比例、方差或分布两个总体的均值、比例、方差或分布是否一致多个总体的均值、方差、分布等是否一致这一节要求掌握的内容:一个总体均值、比例的假设检验两个总体均值的比较54中央财经大学统计学院54假设检验的主要应用假设检验的方法可以用于检验:54中央财经大4.2.2单个总体的假设检验总体均值的假设检验总体比例的假设检验55中央财经大学统计学院554.2.2单个总体的假设检验总体均值的假设检验55中央财均值检验中检验统计量的选择总体正态?n≥30?σ2已知?否是是否否是实际中总体方差总是未知的,因而这是应用最多的公式。大样本时t值可以用z值来近似。根据中心极限定理得到的近似结果。

σ未知时用s来估计。增大n;数学变换等。56中央财经大学统计学院56均值检验中检验统计量的选择总体正态?n≥30?σ2已知?否是1、均值的双边检验问题双侧检验和单侧检验中决策规则的确定方法有一定差异,下面我们通过几个例子加以说明。

某厂生产的铁丝抗拉力服从正态分布,其平均抗拉力为570kg,标准差为8kg。由于更换原材料,标准差不会变,但不知其抗拉力是否不变,从中抽取10个样品,得平均抗拉力575kg,能否认为平均抗拉力无显著变化?(=0.05)57中央财经大学统计学院571、均值的双边检验问题双侧检验和单侧检验中决策规则的确定方例1、提出零假设和备择假设2、选择检验统计量:根据题意3、检验统计量的观测值4、显著性水平等于0.05。58中央财经大学统计学院58例1、提出零假设和备择假设58中央财经大学统计学院5(1)根据z值(或t值)进行双侧检验

0Za/2=1.96-Za/2=-1.96a/2/2

Z,t拒绝域拒绝域接受域1-置信水平决策规则:|Zobs|>

Z

/2时拒绝零假设,

否则不能拒绝零假设。本例中统计量的观测值等于1.976,因此结论

是拒绝零假设,认为平均抗拉力有显著变化。统计量的观测

值等于1.976H0m=

m0H1m≠m059中央财经大学统计学院59(1)根据z值(或t值)进行双侧检验0Za/2=1.9p值也称为观测到的显著性水平,

是能拒绝H0的的最小值,(2)根据p值进行假设检验:双侧检验

/2拒绝拒绝01.96-1.96Z1/2p-值1/2p-值1.976-1.976决策规则:p值<时拒绝H0。使用统计软件进行假设检验时通常会给出p值。本例中p值等于0.04815(Excel计算)。60中央财经大学统计学院60p值也称为观测到的显著性水平,是能拒绝H0的的最小值(3)利用置信区间进行双侧检验

求出双侧检验均值的置信区间若总体的假设值0在置信区间外,拒绝H0

或xm0置信区间m0本例中平均抗拉力95%的置信区间为(570.04,580.96)57061中央财经大学统计学院61(3)利用置信区间进行双侧检验求出双侧检验均值2、右侧检验问题平均说来,一个有丈夫和两个孩子的家庭主妇每周用于与家庭有关活动的时间不超过55h。抽取8个家庭主妇的每周工作时间作为样本,得到数据:58,52,64,63,59,62,62,55。有妇联组织认为每周平均工作时间超过55小时,你的结论是什么?(假设总体为正态分布)62中央财经大学统计学院622、右侧检验问题平均说来,一个有丈夫和两个孩子的家庭主妇每周右侧检验问题解:根据题意,观测到的t统计量的值等于63中央财经大学统计学院63右侧检验问题解:63中央财经大学统计学院630t

Z,t拒绝域接受域1-置信水平统计量的观测

值等于2.94决策规则:t

obs>t时拒绝零假设,否则不能拒绝零假设。本例中统计量的观测值等于2.94,拒绝零假设。H0m≤

m0H1m>m0(1)根据z值(或t值)进行右侧检验64中央财经大学统计学院640tZ,t拒绝域接受域1-置信水平(2)根据p值进行假设检验:右侧检验0t拒绝p-值2.94决策规则:p值<时拒绝H0。例中p值等于0.01083(Excel计算)。t

65中央财经大学统计学院65(2)根据p值进行假设检验:右侧检验0t拒绝p-值2.94左侧检验问题一家公司付给生产一线雇员的平均工资是每小时20.0元。公司最近准备选一个新的城市建子公司,备选的城市有几个,能获得每小时工资低于20.0元的劳动力是公司选择城市的主要因素。从备选的某城市抽取40名工人,样本数据的结果是:平均工资是每小时19.0元,样本标准差是2.4元。请在0.10的显著性水平下分析样本数据是否说明该城市工人的平均每小时工资显著低于20.0元。66中央财经大学统计学院66左侧检验问题一家公司付给生产一线雇员的平均工资是每小时20.3、左侧检验问题解:根据题意(由于是大样本,本题也可以用Z统计量

近似计算),观测到的t统计量的值等于67中央财经大学统计学院673、左侧检验问题解:67中央财经大学统计学院670-t

Z,t拒绝域接受域1-统计量的观测

值等于-2.64决策规则:t

obs<-t时拒绝零假设,否则不能拒绝零假设。本例中统计量的观测值等于-2.64。H0m≥

m0H1m<m0(1)根据z值(或t值)进行左侧检验68中央财经大学统计学院680-tZ,t拒绝域接受域1-统计量的观测

(2)根据p值进行左侧检验0t拒绝p-值-2.64决策规则:p值<时拒绝H0。本例中p值等于0.00593(Excel计算)。t

69中央财经大学统计学院69(2)根据p值进行左侧检验0t拒绝p-值-2.644总体比例的检验构造检验统计量(np0

5,n(1-p0)5)决策规则:同均值的决策规则,可以使用Z值、p值或置信区间进行双侧、左侧或右侧检验。70中央财经大学统计学院704总体比例的检验构造检验统计量(np05,n(1-案例澳大利亚统计局公布的2003年第一季度失业率为6.1%。而RoyMorgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为RoyMorgan的结果显著高于统计局的数字吗?a=0.01.71中央财经大学统计学院71案例澳大利亚统计局公布的2003年第一季度失业率为6.1%。右侧检验解:根据题意,显然有np0

5,n(1-p0)5.观测到的z统计量的值等于检验的结论是拒绝零假设。72中央财经大学统计学院72右侧检验解:72中央财经大学统计学院72案例美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进行的一项研究调查了50名失业者。根据调查结果能否认为费城的平均失业时间高于全国平均水平?=0.05。(用SPSSStatistics求解)【数据文件:失业时间.xls】73中央财经大学统计学院73案例美国劳工局公布的数字表明,1998年11月美国的平均失业描述统计结果(SPSSStatistics)74中央财经大学统计学院74描述统计结果(SPSSStatistics)74中央财经大假设检验结果(SPSSStatistics)单个样本检验

检验值=14.6

tdfSig.(双侧)均值差值差分的95%置信区间

下限上限weeks.67049.506.940-1.883.76双侧检验的p值。如果需要做单侧检验,相应的p值一般等这一数值除以2。这里做右侧检验,p值等于0.253,因而不能拒绝原假设。75中央财经大学统计学院75假设检验结果(SPSSStatistics)单个样本检验4.2.3两个总体均值差异的假设检验1、独立样本的假设检验2、两个匹配样本的假设检验76中央财经大学统计学院764.2.3两个总体均值差异的假设检验1、独立样本的假1、两个独立样本的假设检验与一个总体的情况类似,两个总体均值假设检验中的备择假设一般有以下三种情况:77中央财经大学统计学院771、两个独立样本的假设检验与一个总体的情况类似,两个总体均值两个总体均值的比较:检验统计量的选择总体正态?大样本?方差已知?否是是否否是增大n;数学变换等。方差相等?否是78中央财经大学统计学院78两个总体均值的比较:检验统计量的选择总体正态?大样本?方差已两个总体均值的比较在应用中可能需根据样本数据对总体的正态性进行检验。(非参数检验一章讲解)在实际应用中,总体方差一般是未知的,因而统计软件中普遍使用t检验。两个总体方差相等和不相等时,t统计量的计算公式不同。因此,检验两个总体的均值是否相等时,需要先检验两个总体的方差是否相等!79中央财经大学统计学院79两个总体均值的比较在应用中可能需根据样本数据对总体的正态性进(1)两个总体方差是否相等的检验在SPSSStatistics中,检验两个总体均值是否相等时,会同时检验两个总体的方差是否相等。SPSSStatistics使用的是Levene检验。根据F统计量相应的p值进行决策:p<a时拒绝零假设。(原假设为两个总体方差相等)80中央财经大学统计学院80(1)两个总体方差是否相等的检验在SPSSStatisti检验统计量:其中决策规则与单个总体t检验的决策规则相同,可以使用t值、p值或置信区间进行双侧、左侧或右侧检验。(2)两正态总体,方差未知但相等81中央财经大学统计学院81检验统计量:(2)两正态总体,方差未知但相等81中央财经大学检验统计量:自由度为决策规则与单个总体t检验的决策规则相同,可以使用t值、p值或置信区间进行双侧、左侧或右侧检验。(3)两正态总体,方差未知且不相等82中央财经大学统计学院82检验统计量:(3)两正态总体,方差未知且不相等82中央财经大实例某农业研究所研制出一种新的化肥,现要研究施肥土地的小麦产量是否比不施肥土地的小麦产量有显著提高,随机抽取几块土地进行试验。选10快试验田不施肥,结果最后的每亩产量数据为(单位:公斤):172、158、186、214、224、228、196、190、202、170。另选8块试验田施肥,结果最后的每亩产量数据为:252、204、234、246、222、210、244、212。试检验施肥和不施肥的平均亩产量有无显著差异(=0.05)。83中央财经大学统计学院83实例某农业研究所研制出一种新的化肥,现要研究施肥土地的小麦产解将整理好的数据输入SPSS。注意按两个变量输入,一个变量为亩产,一个变量为施肥情况(1=是,0=否),共有18个观测。在SPSSStatistics中选择两个独立样本的t检验,进行相应设定,结果如下。84中央财经大学统计学院84解将整理好的数据输入SPSS。84中央财经大学统计学院方差是否相等的检验p值=0.582,不能拒绝方差相等的原假设。在方差相等时下面一行的输出结果无效。在方差不相等时上面一行的输出结果无效。85中央财经大学统计学院85方差是否相等的检验p值=0.582,不能拒绝方差相等的原假设均值是否相等的检验p值=0.004,拒绝均值相等的原假设。86中央财经大学统计学院86均值是否相等的检验p值=0.004,拒绝均值相等的原假设。82、两个总体均值差异的检验(匹配样本)如果两个样本是非独立的匹配样本(paired-sample),即两个样本中的数据是一一对应的,这时对两个总体的均值的比较,就是对两个样本对应数据之差的检验。87中央财经大学统计学院872、两个总体均值差异的检验(匹配样本)如果两个样本是非独立一个例子某市场研究公司公司调查了10个人在广告播出前后的购买潜力等级分值,分数越高说明购买潜力越高。试检验广告是否有明显效果?显著性水平=0.05。

个体12345678910广告后6674397656广告前547358564688中央财经大学统计学院88一个例子某市场研究公司公司调查了10个人在广告播出前后的购买匹配样本用表示第i个匹配个体观测结果的差,i=1,,n记如果两种方法所需费用都服从正态分布,则可构造检验统计量如下:决策规则同一个总体的t检验。89中央财经大学统计学院89匹配样本用表示第i个匹配个体观测结果的差,i=1,,n记如案例个体广告后广告前d1651264237704431535-2698177528660954110660计算表明,均值=0.6,标准差=1.174。90中央财经大学统计学院90案例个体广告后广告前d16512642377044315SPSSStatistics输出结果右侧检验时相应的p值等于0.14/2=0.07>0.05,因此检验的结论是不能拒绝原假设。91中央财经大学统计学院91SPSSStatistics输出结果右侧检验时相应的p值小结(1)(1)根据总体是否正态、总体方差是否已知和样本容量的大小,计算总体均值的置信区间有不同的公式。最常用的公式为(2)在时总体比例的置信区间为(3)必要样本容量的计算公式:92中央财经大学统计学院92小结(1)(1)根据总体是否正态、总体方差是否已知和样本容量小结(2)理解假设检验的小概率原则掌握确定零假设的方法掌握一个总体均值和比例的检验方法掌握两个总体均值的检验方法(独立样本和匹配样本)理解假设检验中p值及计算方法了解用SPSSStatistics进行假设检验的操作方法,熟悉SPSS的输出结果。93中央财经大学统计学院93小结(2)理解假设检验的小概率原则93中央财经大学统计学院第4章参数估计和假设检验ppt课件第4章参数估计和假设检验ppt课件4.1参数估计4.1.1参数估计的基本概念4.1.2总体均值和比例的区间估计4.1.3必要样本容量的确定95中央财经大学统计学院222954.1参数估计4.1.1参数估计的基本概念2中央财经大学统4.1.1参数估计的基本概念总体样本算术平均数统计量用来推断总体参数的统计量称为估计量(estimator),其取值称为估计值(estimate)。同一个参数可以有多个不同的估计量。参数是唯一的,但估计量(统计量)是随机变量,取值是不确定的。

参数96中央财经大学统计学院34.1.1参数估计的基本概念总体样本算术平均数统计量用来推点估计点估计:用估计量的数值作为总体参数的估计值。一个总体参数的估计量可以有多个。例如,在估计总体方差时,和都可以作为估计量。97中央财经大学统计学院4点估计点估计:用估计量的数值作为总体参数的估计值。4中央点估计量的常用评价准则:无偏性无偏性:估计量的数学期望与总体待估参数的真值相等:P(

)BA无偏有偏98中央财经大学统计学院5点估计量的常用评价准则:无偏性无偏性:估计量的数学期望与总体点估计量的常用评价准则:有效性在两个无偏估计量中方差较小的估计量较为有效。AB的抽样分布的抽样分布P(

)99中央财经大学统计学院6点估计量的常用评价准则:有效性在两个无偏估计量中估计量的常用评价准则:一致性指随着样本容量的增大,估计量越来越接近被估计的总体参数。AB较小的样本容量较大的样本容量P(X)X100中央财经大学统计学院7估计量的常用评价准则:一致性指随着样本容量的增大,估计量越来第4章参数估计和假设检验课件第4章参数估计和假设检验课件抽样分布:几个要点抽样分布是统计量的分布而不是总体或样本的分布。在统计推断中总体的分布一般是未知的,不可观测的(常常被假设为正态分布)。样本数据的统计分布是可以直接观测的,最直观的方式是直方图,可以用来对总体分布进行检验。抽样分布一般利用概率统计的理论推导得出,在应用中也是不能直接观测的。其形状和参数可能完全不同于总体或样本数据的分布。103中央财经大学统计学院10抽样分布:几个要点抽样分布是统计量的分布而不是总体或样本的分抽样分布的一个演示:重复抽样时样本均值的抽样分布(1)设一个总体含有4个个体,分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差及分布如下。均值和方差总体的频数分布14230.1.2.3104中央财经大学统计学院11抽样分布的一个演示:重复抽样时样本均值的抽样分布(1)设一个抽样分布的一个演示:重复抽样时样本均值的抽样分布(2)

现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表.3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)105中央财经大学统计学院12抽样分布的一个演示:重复抽样时样本均值的抽样分布(2)现抽样分布的一个演示:重复抽样时样本均值的抽样分布(3)各样本的均值如下表,并给出样本均值的抽样分布x样本均值的抽样分布1.00.1.2.3P(x)1.53.04.03.52.02.53.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)106中央财经大学统计学院13抽样分布的一个演示:重复抽样时样本均值的抽样分布(3)各所有样本均值的均值和方差1.样本均值的均值(数学期望)等于总体均值2.样本均值的方差等于总体方差的1/nM为样本数目107中央财经大学统计学院14所有样本均值的均值和方差1.样本均值的均值(数学期望)等于第4章参数估计和假设检验课件第4章参数估计和假设检验课件f(X)X小样本中心极限定理从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。大样本(n

30)110中央财经大学统计学院17f(X)X小样本中心极限定理从均值为,方差为2的一个任标准误(StandardError)简单随机抽样、重复抽样时,样本均值抽样分布的标准差等于,这个指标在统计上称为标准误。统计软件在对变量进行描述统计时一般会输出这一结果。111中央财经大学统计学院18标准误(StandardError)简单随机抽样、重复抽样有限总体校正系数

FinitePopulationCorrectionFactor简单随机抽样、不重复抽样时,样本均值抽样分布的方差略小于重复抽样的方差,等于这一系数称为有限总体校正系数。当抽样比(n/N)<0.05时可以忽略有限总体校正系数。112中央财经大学统计学院19有限总体校正系数

FinitePopulationCor4.2总体均值和比例的区间估计113中央财经大学统计学院204.2总体均值和比例的区间估计20中央财经大学统计学院相关理论总体正态?n≥30?σ2已知?否是是否否是实际中总体方差总是未知的,因而这是应用最多的公式。在大样本时t值可以用z值来近似。根据中心极限定理得到的近似结果。

σ未知时用s来估计。增大n?数学变换?114中央财经大学统计学院21相关理论总体正态?n≥30?σ2已知?否是是否否是实际中总体当时总体比例的置信区间可以使用正态分布来进行区间估计。(样本比例记为,总体比例记为π)总体比例的置信区间115中央财经大学统计学院2222当关于置信区间的补充说明置信区间的推导:有限总体不重复抽样时,样本均值或比例的方差需要乘以“有限总体校正系数”(当抽样比f=n/N小于0.05时可以忽略不计),前面的公式需要进行相应的修改。116中央财经大学统计学院23关于置信区间的补充说明置信区间的推导:23中央财经大学统计学关于置信度含义的说明样本均值的抽样分布在所有的置信区间中,有(1-)*100%的区间包含总体真实值。对于计算得到的一个具体区间,“这个区间包含总体真实值”这一结论有(1-)*100%的可能是正确的。说“总体均值有95%的概率落入某一区间”是不严格的,因为总体均值是非随机的。=

1-/2/2X_σx_x117中央财经大学统计学院24关于置信度含义的说明样本均值的抽样分布在所有的置信区间中,Example:用SPSS进行区间估计例:儿童电视节目的赞助商希望了解儿童每周看电视的时间。下面是对100名儿童进行随机调查的结果(小时)。计算平均看电视时间95%的置信区间。39.719.534.727.041.315.120.531.318.317.021.529.915.016.436.823.424.128.923.424.440.646.423.639.435.519.529.331.220.634.915.531.638.938.727.226.514.715.628.424.043.920.629.19.521.042.413.932.829.832.933.038.028.720.619.738.637.117.015.123.421.021.829.321.322.823.432.511.343.830.815.823.220.333.530.037.824.426.929.027.727.122.036.123.022.126.522.926.930.225.223.835.321.635.730.822.724.521.926.550.3118中央财经大学统计学院25Example:用SPSS进行区间估计例:儿童电视节目的赞助SPSS输出结果(数据:tv.xls)

操作:分析->描述统计->探索

统计量标准误均值27.191.8373均值的95%置信区间下限25.530

上限28.852

5%修整均值26.977

中值26.500

方差70.104

标准差8.3728

极小值9.5

极大值50.3

119中央财经大学统计学院26SPSS输出结果(数据:tv.xls)

操作:分析->描述统总体比例的置信区间:例子解:显然有因此可以用正态分布进行估计。Z/2=1.645结论:我们有90%的把握认为悉尼青少年中每天都抽烟的青少年比例在19.55%~23.85%之间。1986年对悉尼995名青少年的随机调查发现,有216人每天都抽烟。试估计悉尼青少年中每天都抽烟的青少年比例的90%的置信区间。

120中央财经大学统计学院27总体比例的置信区间:例子解:显然有结论:我们有90%的把握认SPSS的计算结果在SPSS中将“是否吸烟”输入为取值为1和0的属性变量,权数分别为216和779。计算这一变量均值的置信区间即为比例的置信区间。

统计量标准误均值.2171.01308均值的90%置信区间下限.1956

上限.2386

5%修整均值.1857

中值.0000

方差.170

标准差.41247

极小值.00

极大值1.00

范围1.00

四分位距.00

121中央财经大学统计学院28SPSS的计算结果在SPSS中将“是否吸烟”输入为取值为1和4.3必要样本量的计算样本量越大抽样误差越小。由于调查成本方面的原因,在调查中我们总是希望抽取满足误差要求的最小的样本量。122中央财经大学统计学院294.3必要样本量的计算样本量越大抽样误差越关于抽样误差的几个概念实际抽样误差抽样平均误差最大允许误差123中央财经大学统计学院30关于抽样误差的几个概念实际抽样误差30中央财经大学统计学院实际抽样误差样本估计值与总体真实值之间的绝对离差称为实际抽样误差。由于在实践中总体参数的真实值是未知的,因此实际抽样误差是不可知的;由于样本估计值随样本而变化,因此实际抽样误差是一个随机变量。124中央财经大学统计学院31实际抽样误差样本估计值与总体真实值之间的绝对离差称为实际抽样抽样平均误差抽样平均误差:样本均值的标准差,也就是前面说的标准误。它反映样本均值(或比例)与总体均值(比例)的平均差异程度。例如对简单随机抽样中的样本均值有:

或(不重复抽样)我们通常说“抽样调查中可以对抽样误差进行控制”,就是指的抽样平均误差。由上面的公式可知影响抽样误差的因素包括:总体内部的差异程度;样本容量的大小;抽样的方式方法。125中央财经大学统计学院32抽样平均误差抽样平均误差:样本均值的标准差,也就是前面说的标最大允许误差最大允许误差(allowableerror):在确定置信区间时样本均值(或样本比例)加减的量,一般用E来表示,等于置信区间长度的一半。在英文文献中也称为marginoferror。置信区间=最大允许误差是人为确定的,是调查者在相应的置信度下可以容忍的误差水平。126中央财经大学统计学院33最大允许误差最大允许误差(allowableerror):如何确定必要样本量?必要样本量受以下几个因素的影响:1、总体标准差。总体的变异程度越大,必要样本量也就越大。2、最大允许误差。最大允许误差越大,需要的样本量越小。3、置信度1-

。要求的置信度越高,需要的样本量越大。4、抽样方式

。其它条件相同,在重复抽样、不重复抽样;简单随机抽样与分层抽样等不同抽样方式下要求的必要样本容量也不同。127中央财经大学统计学院34如何确定必要样本量?必要样本量受以下几个因素的影响:34中央简单随机抽样下估计总体均值时

样本容量的确定式中的总体方差可以通过以下方式估计:根据历史资料确定通过试验性调查估计128中央财经大学统计学院35简单随机抽样下估计总体均值时

样本容量的确定式中的总体方差可简单随机抽样下估计总体比例时

样本容量的确定式中的总体比例π可以通过以下方式估计:根据历史资料确定通过试验性调查估计取为0.5。129中央财经大学统计学院36简单随机抽样下估计总体比例时

样本容量的确定36中央财经大学不重复抽样时的必要样本量比重复抽样时的必要样本量要小。式中n0是重复抽样时的必要样本容量。130中央财经大学统计学院37不重复抽样时的必要样本量比重复抽样时的必要样本量要小。37中样本量的确定(实例1)需要多大规模的样本才能在90%的置信水平上保证均值的误差在±5

之内?前期研究表明总体标准差为45.nZE===≈222222(1645)(45)(5)219.2220.向上取整131中央财经大学统计学院38样本量的确定(实例1)需要多大规模的样本才能在90%的置样本量的确定(实例2)一家市场调研公司想估计某地区有电脑的家庭所占的比例。该公司希望对比例p的估计误差不超过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)?解:已知E=0.05,=0.05,Z/2=1.96,当π未知时取为0.5。132中央财经大学统计学院39样本量的确定(实例2)一家市场调研公司想估计某地区有电脑的家实例3 你在美林证券公司的人力资源部工作。你计划在员工中进行调查以求出他们的平均医疗支出。你希望有95%置信度使得样本均值的误差在$50以内。过去的研究表明约为$400。需要多大的样本容量?nZE===≈222222(196)(400)(50)24586246..133中央财经大学统计学院40实例3 你在美林证券公司的人力资源部工作。你计划在员工中进行4.2假设检验4.2.1假设检验的基本问题4.2.2单个总体参数的检验4.2.3两个总体参数的检验134中央财经大学统计学院4.2假设检验4.2.1假设检验的基本问题41中央财4.2.1假设检验的基本问题基本原理零假设和备择假设检验统计量和拒绝域两类错误与显著性水平135中央财经大学统计学院424.2.1假设检验的基本问题基本原理42中央财经大学统计实际中的假设检验问题假设检验:事先作出关于总体参数、分布形式、相互关系等的命题(假设),然后通过样本信息来判断该命题是否成立(检验)。产品自动生产线工作是否正常?某种新生产方法是否会降低产品成本?治疗某疾病的新药是否比旧药疗效更高?厂商声称产品质量符合标准,是否可信?……

136中央财经大学统计学院43实际中的假设检验问题假设检验:事先作出关于总体参数、分布形案例美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进行的一项研究调查了50名失业者,平均失业时间为15.54周。根据调查结果能否认为费城的平均失业时间高于全国平均水平?澳大利亚统计局公布的2003年第一季度失业率为6.1%。而RoyMorgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为RoyMorgan的结果显著高于统计局的数字吗?

137中央财经大学统计学院44案例美国劳工局公布的数字表明,1998年11月美国的平均失业假设检验的基本原理利用假设检验进行推断的基本原理是:小概率事件在一次试验中几乎不会发生。如果对总体的某种假设是真实的(例如学生上课平均出勤率≥95%),那么不利于或不能支持这一假设的事件A(小概率事件,例如样本出勤率=55%)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了(样本出勤率=55%),就有理由怀疑该假设的真实性,拒绝提出的假设。138中央财经大学统计学院45假设检验的基本原理利用假设检验进行推断的基本原理是:45中央假设检验的步骤根据实际问题提出一对假设(零假设和备择假设);构造某个适当的检验统计量,并确定其在零假设成立时的分布;根据观测的样本计算检验统计量的值;根据犯第一类错误的损失规定显著性水平;确定决策规则:根据确定检验统计量的临界值并进而给出拒绝域,或者计算p值等;下结论:根据决策规则得出拒绝或不能拒绝零假设的结论。注意“不能拒绝零假设”不同于“接受零假设”。139中央财经大学统计学院46假设检验的步骤根据实际问题提出一对假设(零假设和备择假设);1、零假设和备择假设的选择零假设和备择假设是互斥的,它们中仅有一个正确;等号必须出现在零假设中;最常用的有三种情况:双侧检验、左侧检验和右侧检验。检验以“假定零假设为真”开始,如果得到矛盾说明备择假设正确。双侧检验左侧检验右侧检验H0m=m0m

m0m

m0H1m≠m0m<m0m>m0140中央财经大学统计学院471、零假设和备择假设的选择零假设和备择假设是互斥的,它们中仅单侧检验时零假设和备择假设的选择通常把研究者要证明的假设作为备择假设;将所作出的声明作为原假设;把现状(StatusQuo)作为原假设;把不能轻易否定的假设作为原假设;141中央财经大学统计学院48单侧检验时零假设和备择假设的选择通常把研究者要证明的假设作为零假设和备择假设:

把研究者要证明的假设作为备择假设某种汽车原来平均每加仑汽油可以行驶24英里。研究小组提出了一种新工艺来提高每加仑汽油的行驶里程。为了检验新的工艺是否有效需要生产了一些产品进行测试。该测试中的零假设和备择假设该如何选取?要证明的结论是>24,因此零假设和备择假设的选择为:

24>24142中央财经大学统计学院49零假设和备择假设:

把研究者要证明的假设作为备择假设某种汽车零假设和备择假设:检验一种声明是否正确某种减肥产品的广告中声称使用其产品平均每周可减轻体重8公斤以上。要检验这种声明是否正确你会如何设定零假设和备择假设?没有充分的证据不能轻易否定厂家的声明,因此一般将所作出的声明作为原假设。零假设和备择假设的一般选择为:

≥8<8143中央财经大学统计学院50零假设和备择假设:检验一种声明是否正确某种减肥产品的广告中声2检验统计量和拒绝域检验统计量:我们用来决策(拒绝或不能拒绝零假设)时依据的样本统计量。不同的总体参数适用的检验统计量不同。

拒绝域:检验统计量取值的集合,当根据样本得到的检验统计量的值属于该集合时,拒绝零假设。不能拒绝零假设的检验统计量取值的集合称为接受域;划分拒绝域和接受域的数值称为临界值。144中央财经大学统计学院512检验统计量和拒绝域检验统计量:我们用来决策(拒绝或不能决策实际情况H0为真H0为假接受H0正确第二类错误(b)拒绝H0第一类错误(a)正确3、假设检验中的两类错误与显著性水平145中央财经大学统计学院52决策实际情况H0为真H0为假接受H0正确第二类错误(b)拒绝两类错误的概率两类错误不可避免;要减小其中的一种错误,通常只能通过增加另一种错误的方法做到。假设检验中通常首先控制控制第一类错误的概率不超过某个小概率水平,在满足该条件的要求下使犯第二类错误的概率尽量小。允许犯第一类错误的概率称为显著性水平。通常取为0.01,0.05,0.1。根据可以确定检验统计量的临界值,并根据统计量的样本观测值和临界值得出检验结论。146中央财经大学统计学院53两类错误的概率两类错误不可避免;要减小其中的一种错误,通常只假设检验的主要应用假设检验的方法可以用于检验:一个总体的均值、比例、方差或分布两个总体的均值、比例、方差或分布是否一致多个总体的均值、方差、分布等是否一致这一节要求掌握的内容:一个总体均值、比例的假设检验两个总体均值的比较147中央财经大学统计学院54假设检验的主要应用假设检验的方法可以用于检验:54中央财经大4.2.2单个总体的假设检验总体均值的假设检验总体比例的假设检验148中央财经大学统计学院554.2.2单个总体的假设检验总体均值的假设检验55中央财均值检验中检验统计量的选择总体正态?n≥30?σ2已知?否是是否否是实际中总体方差总是未知的,因而这是应用最多的公式。大样本时t值可以用z值来近似。根据中心极限定理得到的近似结果。

σ未知时用s来估计。增大n;数学变换等。149中央财经大学统计学院56均值检验中检验统计量的选择总体正态?n≥30?σ2已知?否是1、均值的双边检验问题双侧检验和单侧检验中决策规则的确定方法有一定差异,下面我们通过几个例子加以说明。

某厂生产的铁丝抗拉力服从正态分布,其平均抗拉力为570kg,标准差为8kg。由于更换原材料,标准差不会变,但不知其抗拉力是否不变,从中抽取10个样品,得平均抗拉力575kg,能否认为平均抗拉力无显著变化?(=0.05)150中央财经大学统计学院571、均值的双边检验问题双侧检验和单侧检验中决策规则的确定方例1、提出零假设和备择假设2、选择检验统计量:根据题意3、检验统计量的观测值4、显著性水平等于0.05。151中央财经大学统计学院58例1、提出零假设和备择假设58中央财经大学统计学院5(1)根据z值(或t值)进行双侧检验

0Za/2=1.96-Za/2=-1.96a/2/2

Z,t拒绝域拒绝域接受域1-置信水平决策规则:|Zobs|>

Z

/2时拒绝零假设,

否则不能拒绝零假设。本例中统计量的观测值等于1.976,因此结论

是拒绝零假设,认为平均抗拉力有显著变化。统计量的观测

值等于1.976H0m=

m0H1m≠m0152中央财经大学统计学院59(1)根据z值(或t值)进行双侧检验0Za/2=1.9p值也称为观测到的显著性水平,

是能拒绝H0的的最小值,(2)根据p值进行假设检验:双侧检验

/2拒绝拒绝01.96-1.96Z1/2p-值1/2p-值1.976-1.976决策规则:p值<时拒绝H0。使用统计软件进行假设检验时通常会给出p值。本例中p值等于0.04815(Excel计算)。153中央财经大学统计学院60p值也称为观测到的显著性水平,是能拒绝H0的的最小值(3)利用置信区间进行双侧检验

求出双侧检验均值的置信区间若总体的假设值0在置信区间外,拒绝H0

或xm0置信区间m0本例中平均抗拉力95%的置信区间为(570.04,580.96)570154中央财经大学统计学院61(3)利用置信区间进行双侧检验求出双侧检验均值2、右侧检验问题平均说来,一个有丈夫和两个孩子的家庭主妇每周用于与家庭有关活动的时间不超过55h。抽取8个家庭主妇的每周工作时间作为样本,得到数据:58,52,64,63,59,62,62,55。有妇联组织认为每周平均工作时间超过55小时,你的结论是什么?(假设总体为正态分布)155中央财经大学统计学院622、右侧检验问题平均说来,一个有丈夫和两个孩子的家庭主妇每周右侧检验问题解:根据题意,观测到的t统计量的值等于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论