版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、四川农业大学参数估计与假设检验参数估计与假设检验4.1参数估计4.2假设检验四川农业大学 24.1 参数估计参数估计l4.1.1 参数估计的基本概念l4.1.2 总体均值和比例的区间估计l4.1.3 必要样本容量的确定四川农业大学 34.1.1 参数估计的基本概念参数估计的基本概念总体算术平均数算术平均数x统计量统计量用来推断总体参数的统计量称为用来推断总体参数的统计量称为估计量估计量(estimator), 其取值称其取值称为为估计值估计值(estimate) 。 同一个参数可以有多个不同的估计量。同一个参数可以有多个不同的估计量。参数是唯一的,但估计量(统计量)是随机变量,取值是不确参数是
2、唯一的,但估计量(统计量)是随机变量,取值是不确定的。定的。 ?参数参数四川农业大学 4点估计l点估计: 用估计量的数值作为总体参数的估计值。l一个总体参数的估计量可以有多个 。例如,在估计总体方差时, 和 都可以作为估计量。nxxnii12)(1)(12nxxnii四川农业大学 5点估计量的常用评价准则:无偏性无偏性l无偏性:估计量的数学期望与总体待估参数的真值相等:( )E有偏有偏四川农业大学 6点估计量的常用评价准则: 有效性l 在两个无偏估计量中方差较小的估计量较为有效。 的抽样分布的抽样分布 的抽样分布的抽样分布12四川农业大学 7估计量的常用评价准则:一致性l指随着样本容量的增大,
3、估计量越来越接近被估计的总体参数。较小的样本容量较小的样本容量较大的样本容量较大的样本容量P(X )四川农业大学 8区间估计l根据事先确定的置信度1-给出总体参数的一个估计范围。l根据样本统计量的分布推断出总体参数的置信区间。估计值估计值(点估计点估计)置信下限置信下限置信上限置信上限置信区间置信区间抽样分布 Sampling Distributionl由于样本是随机变量,统计量是样本的函数,从而统计量也是随机变量。统计量的分布称为抽样分布。l在推断统计中,总体的分布一般是未知的,(常常被假设为正态分布)。l在假设总体服从某一分布的基础上,抽样分布(统计量的分布)一般可以利用概率统计的理论推导
4、得出。四川农业大学 10抽样分布的一个演示:重复抽样抽样分布的一个演示:重复抽样时样本均值的抽样分布(时样本均值的抽样分布(1)设一个总体含有设一个总体含有4个个体,分别为个个体,分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下。总体的均值、方差及分布如下。均值和方差均值和方差5 . 21NXNii25. 1)(122NXNii总体的频数分布总体的频数分布四川农业大学 11抽样分布的一个演示:重复抽样抽样分布的一个演示:重复抽样时样本均值的抽样分布(时样本均值的抽样分布(2)现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下
5、表.3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)四川农业大学 12抽样分布的一个演示:重复抽抽样分布的一个演示:重复抽样时样本均值的抽样分布(样时样本均值的抽样分布(3) 各样本的均值如下表,并给出样本均值的抽样分布各样本的均值如下表,并给出样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布P ( x )3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)
6、四川农业大学 13所有样本均值的均值和方差所有样本均值的均值和方差1. 样本均值的均值(数学期望)等于总体均值样本均值的均值(数学期望)等于总体均值2. 样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/nnMxnixix222122625. 016)5 . 20 . 4()5 . 20 . 1 ()(5 . 2160 . 45 . 10 . 11MxniixM为样本数目为样本数目四川农业大学 14样本均值的抽样分布与总体分布的比较 = 2.5 2 =1.25总体分布总体分布抽样分布抽样分布5.2x625.02x样本均值的抽样分布样本均值的抽样分布四川农业大学 15样本均值的抽样分布
7、样本均值的抽样分布总体分布总体分布n = 4抽样分布抽样分布X5x50 xn =165 . 2x一般的,当总体一般的,当总体X服从正态分布,服从正态分布,XN(,2),来自,来自该总体的容量为该总体的容量为n的样本的均值的样本的均值 X也服从正态分布也服从正态分布, XN(,2/n)。小样本小样本中心极限定理中心极限定理从均值为从均值为 ,方差为,方差为 2的一个任意总体中抽取容量为的一个任意总体中抽取容量为n的样本,当的样本,当n充分大时,样本均值的抽样分布近似充分大时,样本均值的抽样分布近似服从均值为服从均值为、方差为、方差为2/n的正态分布。的正态分布。 xn x 四川农业大学 174.
8、2 总体均值和比例的区间估计总体均值和比例的区间估计四川农业大学 18总体均值的置信区间总体正态总体正态?n30?2 2已已知知?否是是否否是实际中总体方差总是未知的,因实际中总体方差总是未知的,因而这是应用最多的公式。在大样而这是应用最多的公式。在大样本时本时t值可以用值可以用z值来近似。值来近似。根据中心极限定理得根据中心极限定理得到的近似结果。到的近似结果。 未知时用未知时用s来估计。来估计。nZx 2 nstx2 nZx 2 增大增大n?数学?数学变换变换?四川农业大学 19l当 时总体比例的置信区间可以使用正态分布来进行区间估计。(样本比例记为 ,总体比例记为)总体比例的置信区间)
9、1 , 0()1 (NnpznppZp) 1 ( 25)1(, 5 pnpnp四川农业大学 20有限总体校正系数Finite Population Correction Factorl简单随机抽样、不重复抽样时,样本均值抽样分布的方差略小于重复抽样的方差,等于l 这一系数称为有限总体校正系数。l当抽样比(n/N)描述统计描述统计-探索探索统计量标准误均值27.191.8373均值的 95% 置信区间 下限25.530上限28.8525% 修整均值26.977中值26.500方差70.104标准差8.3728极小值9.5极大值50.3四川农业大学 25总体比例的置信区间:例子总体比例的置信区间:
10、例子解:显然有解:显然有因此可以用正态分布进行估计。因此可以用正态分布进行估计。 /2=1.6450215. 0217. 0995)217. 01(217. 0645. 1217. 0)1(2 nppZp 结论:我们有90的把握认为悉尼青少年中每天都抽烟的青少年比例在19.55%23.85%之间。19861986年对悉尼年对悉尼995995名青少年的随机名青少年的随机调查发现,有调查发现,有216216人每天都抽烟。人每天都抽烟。试估计悉尼青少试估计悉尼青少年中每天都抽烟年中每天都抽烟的青少年比例的的青少年比例的90%90%的置信区间。的置信区间。5)1(, 5 pnpn四川农业大学 264.
11、3 必要样本量的计算 样本量越大抽样误差越小。由于调查成本方面的原因,在调查中我们总是希望抽取满足误差要求的最小的样本量。四川农业大学 27关于抽样误差的几个概念l实际抽样误差l抽样平均误差l最大允许误差四川农业大学 28实际抽样误差l样本估计值与总体真实值之间的绝对离差称为实际抽样误差。l由于在实践中总体参数的真实值是未知的,因此实际抽样误差是不可知的;l由于样本估计值随样本而变化,因此实际抽样误差是一个随机变量。| 抽样平均误差抽样平均误差l抽样平均误差:样本均值的标准差,也称为标准误。它反映样本均值(或比例)与总体均值(比例)的平均差异程度。l例如对简单随机抽样中的样本均值有: 或 (不
12、重复抽样)l我们通常说“抽样调查中可以对抽样误差进行控制”,就是指的抽样平均误差。由上面的公式可知影响抽样误差的因素包括:总体内部的差异程度;样本容量的大小;抽样的方式方法。nx1NnNnx2)(E四川农业大学 30最大允许误差l最大允许误差(allowable error):在确定置信区间时样本均值(或样本比例)加减的量,一般用E来表示,等于置信区间长度的一半。在英文文献中也称为margin of error。l置信区间=l最大允许误差是人为确定的,是调查者在相应的置信度下可以容忍的误差水平。Ex 四川农业大学 31简单随机抽样下估计总体均值时样本容量的确定2222/2/,EZnnZEl式中
13、的总体方差可以通过以下方式估计:l根据历史资料确定l通过试验性调查估计四川农业大学 32简单随机抽样下估计总体比例时样本容量的确定222/)1 (,)1 (2/EZnnZEl式中的总体比例可以通过以下方式估计:l根据历史资料确定l通过试验性调查估计l取为0.5。四川农业大学 33l可见,影响样本容量的因素:l1、总体标准差。总体的变异程度越大,必要样本量也就越大。l2、最大允许误差。最大允许误差越大,需要的样本量越小。l3、置信度1- 。要求的置信度越高,需要的样本量越大。l4、抽样方式 。其它条件相同,在重复抽样、不重复抽样;简单随机抽样与分层抽样等不同抽样方式下要求的必要样本容量也不同。四
14、川农业大学 34不重复抽样时的必要样本量l比重复抽样时的必要样本量要小。l 式中n0是重复抽样时的必要样本容量。Nnnn001四川农业大学 35样本量的确定(实例1)需要多大规模的样本才能在需要多大规模的样本才能在 90% 的置信的置信水平上保证均值的误差在水平上保证均值的误差在 5 之内之内? 前前期研究表明总体标准差为期研究表明总体标准差为 45.nZE=222222(1645) (45)(5)219.2 220.向上取整四川农业大学 36样本量的确定(实例2)一家市场调研公司一家市场调研公司想估计某地区有电想估计某地区有电脑的家庭所占的比脑的家庭所占的比例。该公司希望对例。该公司希望对比
15、例比例p的估计误差的估计误差不超过不超过0.05,要求,要求的可靠程度为的可靠程度为95%,应抽多大容量的样应抽多大容量的样本(没有可利用的本(没有可利用的p估计值)?估计值)?解: 已知E=0.05,=0.05,Z/2=1.96,当未知时取为0.5。385)5 . 0()5 . 01)(5 . 0()96. 1 ()1 (22222EZn四川农业大学 37实例3你在美林证券公司的人力资源部工作。你计划在员工中进行调查以求出他们的平均医疗支出。 你希望有 95% 置信度使得样本均值的误差在$50 以内。 过去的研究表明 约为 $400。需要多大的样本容量?nZE=222222(196) (40
16、0)(50)24586246.四川农业大学4.2 假设检验假设检验4.2.1 假设检验的基本问题4.2.2 单个总体参数的检验4.2.3 两个总体参数的检验四川农业大学 394.2.1 假设检验的基本问题假设检验的基本问题l基本原理l零假设和备择假设l检验统计量和拒绝域l两类错误与显著性水平四川农业大学 40实际中的假设检验问题实际中的假设检验问题l假设检验: 事先作出关于总体参数、分布形式、相互关系等的命题(假设),然后通过样本信息来判断该命题是否成立(检验) 。l产品自动生产线工作是否正常?l某种新生产方法是否会降低产品成本?l治疗某疾病的新药是否比旧药疗效更高?l厂商声称产品质量符合标准
17、,是否可信?l 四川农业大学 41案例案例l美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进行的一项研究调查了50名失业者,平均失业时间为15.54周。根据调查结果能否认为费城的平均失业时间高于全国平均水平?l澳大利亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为Roy Morgan的结果显著高于统计局的数字吗? 四川农业大学 42假设检验的基本原理假设检验的基本原理l利用假设检验进行推断的基本原理是: 小概率事件在一次试验中几乎不会发生。l如果对总
18、体的某种假设是真实的(例如学生上课平均出勤率95%),那么不利于或不能支持这一假设的事件A(小概率事件,例如样本出勤率=55% )在一次试验中几乎不可能发生的;l要是在一次试验中A竟然发生了(样本出勤率=55% ),就有理由怀疑该假设的真实性,拒绝提出的假设。四川农业大学 43假设检验的步骤假设检验的步骤l根据实际问题提出一对假设(零假设和备择假设);l构造某个适当的检验统计量,并确定其在零假设成立时的分布;l根据观测的样本计算检验统计量的值;l根据犯第一类错误的损失规定显著性水平;l确定决策规则:根据确定检验统计量的临界值并进而给出拒绝域,或者计算p值等;l下结论:根据决策规则得出拒绝或不能
19、拒绝零假设的结论。注意“不能拒绝零假设”不同于“接受零假设”。四川农业大学 441、零假设和备择假设的选择、零假设和备择假设的选择l零假设和备择假设是互斥的,它们中仅有一个正确;等号必须出现在零假设中;l最常用的有三种情况:双侧检验、左侧检验和右侧检验。l检验以“假定零假设为真”开始,如果得到矛盾(小概率事件发生了)说明备择假设正确。双侧检验 左侧检验 右侧检验H0 = 0 0 0H1 0 0四川农业大学 45单侧检验时零假设和备择假设的选择单侧检验时零假设和备择假设的选择l把现状(Status Quo)作为原假设;l将所作出的声明作为原假设;l把不能轻易否定的假设作为原假设;l把研究者要证明
20、的假设作为备择假设;四川农业大学 46零假设和备择假设:零假设和备择假设:把研究者要证明的假设作为备择假设把研究者要证明的假设作为备择假设l某种汽车原来平均每加仑汽油可以行驶24英里。研究小组提出了一种新工艺来提高每加仑汽油的行驶里程。为了检验新的工艺是否有效需要生产了一些产品进行测试。该测试中的零假设和备择假设该如何选取?l要证明的结论是24,因此零假设和备择假设的选择为: 24 24四川农业大学 47零假设和备择假设:检验一种声明是否正确零假设和备择假设:检验一种声明是否正确l某种减肥产品的广告中声称使用其产品平均每周可减轻体重8公斤以上。要检验这种声明是否正确你会如何设定零假设和备择假设
21、?l没有充分的证据不能轻易否定厂家的声明,因此一般将所作出的声明作为原假设。l零假设和备择假设的一般选择为: 8 Z /2时拒绝零假设,否则不能拒绝零假设。l本例中统计量的观测值等于1.976,因此结论是拒绝零假设,认为平均抗拉力有显著变化。统计量的观测值等于1.976H0 = 0 0H1 0 0四川农业大学 57p值也称为观测到的显著性水平, 是能拒绝H0 的的最小值,(2)根据)根据p值进行假设检验:双侧检验值进行假设检验:双侧检验 /2拒绝拒绝01.96-1.96Z1/2 p-值1/2 p-值1.976-1.976)|(|bs0oHZZPp值双侧检验中 决策规则: p值 t 时拒绝零假设
22、,否则不能拒绝零假设。l本例中统计量的观测值等于2.94,拒绝零假设。H0 0 0H1 0 0(1)根据)根据z值(或值(或t值)进行右侧检验值)进行右侧检验四川农业大学 62(2)根据)根据p值进行假设检验:右侧检验值进行假设检验:右侧检验0t拒绝p-值2.94)tt (bs0oHPp 值值右右侧侧检检验验中中 决策规则: p值 时 拒绝 H0。 例中p值等于0.01083 (Excel计算)。 t 89. 1)7(05. 0 t)zz(bs0oHP 或或四川农业大学 63左侧检验问题左侧检验问题l一家公司付给生产一线雇员的平均工资是每小时20.0元。公司最近准备选一个新的城市建子公司,备选
23、的城市有几个,能获得每小时工资低于20.0元的劳动力是公司选择城市的主要因素。从备选的某城市抽取40名工人,样本数据的结果是:平均工资是每小时19.0元,样本标准差是2.4元。请在0.10的显著性水平下分析样本数据是否说明该城市工人的平均每小时工资显著低于20.0元。四川农业大学 643、左侧检验问题、左侧检验问题l解:l根据题意(由于是大样本,本题也可以用Z统计量近似计算),l观测到的统计量的值等于) 1(/0ntnsxt64. 240/4 . 22019obst0 .20:0 .20:10HH四川农业大学 65-t 拒绝域接受域统计量的观测值等于-2.6430. 1)39(10. 0 tl
24、决策规则:t obs-t 时拒绝零假设,否则不能拒绝零假设。l本例中统计量的观测值等于-2.64。H0 0H1 0(1)根据)根据z值(或值(或t值)进行左侧检验值)进行左侧检验四川农业大学 66(2)根据)根据p值进行左侧检验值进行左侧检验拒绝p-值值)tt (0obsHPp 值值左左侧侧检检验验中中 决策规则: p值 时 拒绝 H0。 本例中p值等于0.00593 (Excel计算)。 t)zz(bs0oHP 或或30. 1)39(10. 0 t四川农业大学 674 总体比例的检验总体比例的检验 l构造检验统计量(np0 5,n(1-p0) 5)1 ,0()1(000NnppppZ l决策
25、规则:同均值的决策规则,可以使用Z值、p值或置信区间进行双侧、左侧或右侧检验。四川农业大学 68案例案例l澳大利亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为Roy Morgan的结果显著高于统计局的数字吗?=0.01.四川农业大学 69右侧检验右侧检验l解:l根据题意,显然有np0 5,n(1-p0) 5.l观测到的z统计量的值等于l检验的结论是拒绝零假设。061. 0:061. 0:10pHpH599. 814656/939. 0*061. 0061. 0078. 0obsz) 1 , 0(
26、)1 (000NnppppZ326. 201. 0 ZZ四川农业大学 70案例案例l美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进行的一项研究调查了50名失业者。根据调查结果能否认为费城的平均失业时间高于全国平均水平? =0.05。(用SPSS Statistics求解)【数据文件:失业时间.xls】四川农业大学 71描述统计结果描述统计结果(SPSS Statistics)四川农业大学 72假设检验结果假设检验结果(SPSS Statistics)6 .14:6 .14:10HH单个样本检验单个样本检验检验值 = 14.6 tdfSig.(双侧)均值差值差分的 95% 置信区间下限上限weeks.67049.506.940 -1.883.76双侧检验的p值。如果需要做单侧检验,相应的p值一般等这一数值除以2。这里做右侧检验,p值等于0.253,因而不能拒绝原假设。四川农业大学 734.2.3 两个总体均值差异的假设两个总体均值差异的假设检验检验 l1、独立样本的假设检验l2、两个匹配样本的假设检验四川农业大学 741、两个独立样本的假设检验、两个独立样本的假设检验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 通辽 耕地合同
- 天车工续签合同述职报告
- 2025年山东货运从业资格考试技巧和方法
- 2025年东营货运上岗证考试题库
- 《欣赏高山流水》课件
- 《高血压的诊治进展》课件
- 商业中心泳池翻新协议
- 合同执行监控工具
- 信息安全协议样本
- 污水处理厂扩建临时围墙施工协议
- 2023年注册城乡规划师考试:城乡规划相关知识历年真题汇编(共388题)
- 2024年小区居民活动中心建设实施方案
- 工地柴油供油三方合同范本
- (工作计划)非物质文化遗产保护方案
- 艺术概论智慧树知到答案2024年海南师范大学
- 中国蚕丝绸文化智慧树知到答案2024年浙江大学
- 2024年贵州事业单位真题
- 困难或解决坚持不懈的作文800字
- 人教版《劳动教育》五上 劳动项目五《设计制作海报》教学设计
- 七年级道法上册第一学期期末综合测试卷(人教版 2024年秋)
- 预应力混凝土管桩(L21G404)
评论
0/150
提交评论