




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章第五章 估计与假设检验估计与假设检验主要内容主要内容第一节第一节 总体参数估计总体参数估计第二节第二节 总体参数假设检验总体参数假设检验统计运用:多个例子统计运用:多个例子 估计新生儿的体重估计新生儿的体重 估计废品率估计废品率 估计降雨量估计降雨量 估计湖中鱼数估计湖中鱼数 估计学生月消费支出估计学生月消费支出这都是属于这都是属于估计的问题估计的问题统计运用:多个例子统计运用:多个例子n消费者协会接到消费者赞扬,指控品牌消费者协会接到消费者赞扬,指控品牌纸包装饮料存在容量缺乏,有欺骗消费者纸包装饮料存在容量缺乏,有欺骗消费者之嫌。包装上标明的容量为之嫌。包装上标明的容量为250毫升。消
2、毫升。消费者协会从市场上随机抽取费者协会从市场上随机抽取50盒该品牌纸盒该品牌纸包装饮品,测试发现平均含量为包装饮品,测试发现平均含量为248毫升,毫升,小于小于250毫升。这是消费中正常的动摇,毫升。这是消费中正常的动摇,还是厂商的有意行为?还是厂商的有意行为?n不同教学方法的教学效果评价。不同教学方法的教学效果评价。n不同饲料对被养殖动物体重变化效果评不同饲料对被养殖动物体重变化效果评价。价。这属于假设检验的问题第一节第一节 总体参数估计总体参数估计一、点估计一、点估计二、区间估计二、区间估计三、样本容量确实定三、样本容量确实定1、详细估计方法、详细估计方法在上一章例子:在上一章例子:25
3、00名中层干部中,假设随机抽取名中层干部中,假设随机抽取了一个容量为了一个容量为30的样本:的样本: Annual Salary Management Training Program? 49094.3 Yes 53263.9 Yes 49643.5 Yes 一、点估计一、点估计Point Estimation假设根据该样本求得的年薪样本平均数、规范差及假设根据该样本求得的年薪样本平均数、规范差及参与过培训方案人数比例分别为:参与过培训方案人数比例分别为: p=19/30=0.63那么可用它们分别代表那么可用它们分别代表2500名中层干部的平均年薪、名中层干部的平均年薪、年薪的规范差及受训比例
4、。年薪的规范差及受训比例。00.5181430/1554420nxxi72.334729325009260) 1(2nxxsi63. 030/19p 上述估计总体参数的过程被称为点估计point estimation,样本均值称为总体均值的点估计量point estimator, 样本均值的详细数值称为总体均值的点估计值point estimate,如此等等。2、点估计的优缺陷3、点估计的方法1矩估计2极大似然估计3稳健估计 科学的抽样估计方法要具备三个根本要素科学的抽样估计方法要具备三个根本要素首先是要有适宜的统计量作为估计量首先是要有适宜的统计量作为估计量其次要有合理的允许误差范围其次要有
5、合理的允许误差范围再次要有一个可接受的置信度再次要有一个可接受的置信度二、区间估计二、区间估计Interval Estimation) 点估计是经过样本估计量的某一次估计值来推断总体点估计是经过样本估计量的某一次估计值来推断总体参数的能够取值;参数的能够取值; 区间估计那么是根据样本估计量以一定可靠程度推断区间估计那么是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。总体参数所在的区间范围。 在点估计中,曾经知道抽样的点估计值与总体参在点估计中,曾经知道抽样的点估计值与总体参数的离差在某一给定范围内的概率大小,即以一定的数的离差在某一给定范围内的概率大小,即以一定的可靠程度知道以下抽样
6、极限误差:可靠程度知道以下抽样极限误差: 因此,容易得到:在抽样中,总体参数将以同样因此,容易得到:在抽样中,总体参数将以同样 的能够性概率存在于下面的区间内:的能够性概率存在于下面的区间内:即 某一概率值)(P一一般般地地,设总体参数为,L、U为由样本确定的两个统计量值,对于给定的)10(,有 1ULP则称(L,U)为参数的置置 信信度度为1的置置信信区区间间 。L、U分别称为置置信信下下限限与置置信信上上限限,为显显著著性性水水平平,1称为置信度。注注意意:1、置信区间的直观意义为:多次抽样形成的多个置信区间中,有%100)1(包含总体参数真值。2、1可 以认为 是用样本 估计值代替 总体
7、真值时误 差在某一范围内的“ 可能性” ,则可 认为是这 种替代产 生的抽样 极限误差超过这一范围的“可能性” 。 (一总体均值的区间估计一总体均值的区间估计 1、总体方差知,正态总体均值的区间估计、总体方差知,正态总体均值的区间估计 如前所述,对总体方差已知的正态总体,可以通过标准正态分布估计点估计的误差范围,即在给定置信度1,可由标准正态分布表查得临界值2Z,使得1|2ZxPx从而可得置信度为1时总体均值的置信区间:xZx2|或: xxZxZx22留意: 在大样本下=30,不论总体分布方式如何,均可用上述方法进展总体均值的区间估计,这时,假设总体方差未知,那么直接用样本方差替代。 在前面中
8、层干部平均年薪例中, 假设假设总体均值及方差未知,一次容量为30的抽样的样本均值及方差分别为51814与3347.72, 由于是大样本,那么可求置信度为95%的置信区间如下:97.1197518143072.334796. 1518142nsZx 2、小样本下总体方差未知时,正态分布总体均值的区间估计 假设是小样本,但总体为正态分布,在总体方差未知而需用样本方差替代时,那么下式留意:假设小样本下总体分布非正态,那么无法进展区间估计,独一的处理方法就是增大样本。nsx/服从自由度为n-1的t分布。于是在给定置信度为1,可由t分布表查得临界值)1(2nt,使得1)1(/|2ntnsxP从而可得置信
9、度为1时总体均值的置信区间:nstx2|或: nstxnstx22练习练习1、某工厂有、某工厂有1500个工人,用重置抽样的方个工人,用重置抽样的方法抽取法抽取50个工人作为样本,调查其任务程度如下个工人作为样本,调查其任务程度如下表:表:工资程度元 124 134 140 150 160 180 200 260 工人数人 4 6 9 10 8 6 4 3要求:1计算样本平均工资和抽样平均误差。2以95.45%的概率保证估计该工厂平均工资和工资总额的区间。 二总体比率的区间估计 在大样本下,样本比率的分布趋近于均值为总体比率P、方差为P(1-P)/n的正态分布,那么 nPPPp/ )1 ( N
10、(0,1)即服从标准正态分布。 因此,给定置信度1,查标准正态分布表找出临界值2Z,从而可得总体比例(率)的区间估计:ppZpPZp22练习练习2:1995.4.10对对369名有任务的父名有任务的父母的一项调查阐明,他们当中有母的一项调查阐明,他们当中有200名成认由于名成认由于任务有约而使得与其子女相处时间过少。任务有约而使得与其子女相处时间过少。A、求总体中由于任务有约而使得与其子女相处时间过少父母所占的比率的点估计。B、当置信程度为95时,边境误差为多大?C、求总体中由于任务有约而使得与其子女相处时间过少父母所占比率的95置信区间估计。 总体均值区间估计程序总体均值区间估计程序n=30
11、?知否?nzx2用s替代nszx2总体能否接近正态分布?知否?nzx2用s替代nstx2增大样本容量至n=30yesNoyesNoyesyesNoNo三、样本容量确实定样本容量对估计精度有较大的影响,从实际上说,样本容量越大,对总体特征的估计误差越小;但从实际角度看,抽样数目过大,那么会增大调查及相关的任务量。因此,样本容量确实定是至关重要的。1、 影响必要样本容量的要素 第一,总体各单位标志变异程度 第二,允许的极限误差的大小 第三,抽样的方法 第四,抽样方式 第五,抽样推断的可靠程度2、 计算公式1重置抽样必要样本容量确实定2不重置抽样必要样本容量确实定22Pp2222PQ , PQ ,
12、xxxxxxtnntttnntt得进行恒等变换对得进行恒等变换对PQtNPQN , )Nn-(1PQtNN , )Nn-(1222Pp222222xxxxxxtnntttnntt得进行恒等变换对得进行恒等变换对3、计算必要样本容量应留意的问题、计算必要样本容量应留意的问题1上面公式计算的样本容量是最低的,也是最必要的样本容量。2上面计算公式计算的样本容量时,普通总体方差时未知的,需求用前面实验总体数据、样本资料来替代,普通要选择大的方差,如是成数,可以用0.25来替代。3假设进展一次抽样调查,同时对总体平均数和总体方差进展区间估计,运用上式计算两个样本容量,普通情况下选择大的4计算结果如是小数
13、,不能采用四舍五入。练习练习:某药厂为了检查瓶装药品数量,从废品库随机抽某药厂为了检查瓶装药品数量,从废品库随机抽检检100瓶,结果平每瓶瓶,结果平每瓶101.5片,规范差为片,规范差为3片。是以片。是以Ft =99.73%的把握成都推断废品库该种药平均每瓶的把握成都推断废品库该种药平均每瓶数量的置信区间,假设允许误差减少到原来数量的置信区间,假设允许误差减少到原来12,其他,其他条件不变,问需求抽取多少瓶?条件不变,问需求抽取多少瓶?解:由知可得n=100 F(t)=99.73% t=33 5 .101sx之间。量在成品库该药平均每瓶数的概率保证下在即:)平均数置信区间为(片片4 .102-
14、6 .100,%73.999 . 05 .1019 . 05 .101x,x)(9 . 033 . 0)( 3 . 01003Xtnsnxxxxx接上页)(40045. 033tsnt45. 021222222瓶根据片,即来的如果允许误差减少到原xnstxxx练习:某冷库对贮藏一批禽蛋的蜕变率进展调查练习:某冷库对贮藏一批禽蛋的蜕变率进展调查,根据根据以往的资料以往的资料,禽蛋的蜕变率分别为禽蛋的蜕变率分别为53、49、48,如今允许误差不超越如今允许误差不超越5,推断的概率保证程度为,推断的概率保证程度为95,问至少要抽取多少禽蛋进展检查?,问至少要抽取多少禽蛋进展检查?个禽蛋。应抽取因此选
15、择,个值分别计算方差:成数有解:由已知得385006.38405. 051. 049. 096. 1n49. 0P2496. 052. 048. 0 2499. 051. 049. 02491. 047. 053. 0 3 05. 0 1.96t 95%F(t)2222ppPPQt第二节第二节 假设检验假设检验一、假设检验的普通问题二、总体均值、比例和方差的假设检验三、假设检验的其他问题一假设检验一假设检验(Hypothesis Testing)问题的提出问题的提出 有许多实践问题,经过部分信息量,对某种看法进展断定或有许多实践问题,经过部分信息量,对某种看法进展断定或估计。估计。 例例1、某
16、企业消费一种零件,以往的资料显示零件平均长度、某企业消费一种零件,以往的资料显示零件平均长度为为4cm,规范差为,规范差为0.1cm。工艺改革后,抽查。工艺改革后,抽查100个零件发现其个零件发现其平均长度为平均长度为3.94cm。问:工艺改革后零件长度能否发生了显著。问:工艺改革后零件长度能否发生了显著变化?变化? 例例2、某厂有一日共消费了、某厂有一日共消费了200件产品,按国家规范,次品率件产品,按国家规范,次品率不得超越不得超越3%才干出厂。现从该批产品中随机抽取才干出厂。现从该批产品中随机抽取10件,发现其件,发现其中有中有2件次品,问这批产品能否出厂。件次品,问这批产品能否出厂。
17、这两个例子中都是要对某种这两个例子中都是要对某种“陈说做出判别:陈说做出判别: 例例1要判明工艺改革后零件平均长度能否仍为要判明工艺改革后零件平均长度能否仍为4cm; 例例2要判明该批产品的次品率能否低于要判明该批产品的次品率能否低于3%。进展这种判别的信息来自所抽取的样本 一、 假设检验的普通问题 所谓假设检验,就是事先对总体参数或总体分布方式作出一个假设,然后利用样本信息来判别原假设能否合理,即判别样本信息与原假设能否有显著差别,从而决议能否接受或否认原假设。 假设检验分两类:1参数假设检验;2非参数检验或自在分布检验。二假设检验的根本思想 1、假设检验采用的逻辑推理方法是反证法。 为了检
18、某假设能否成立,先假定它正确,然后根据样本信息,察看由此假设而导致的结果能否合理,从而判别能否接受原假设; 2、判别结果合理与否,是基于“小概率事件不易发生这一原理的。 即在一次抽样中,小概率事件不能够发生。假设在原假设下发生了小概率事件,那么以为原假设是不合理的;反之,小概率事件没有发生,那么以为原假设是合理的。 3、假设检验是基于样本资料来推断总体特征的,而这种推断是在一定概率置信度下进展的,而非严厉的逻辑证明。 因此,置信度大小的不同,有能够做出不同的判别。 在例1中,要判别工艺改革后零件平均长度能否仍为4cm,可先假设仍为4cm,根据样本平均数的抽样分布实际,那么样本点应以较大的能够性
19、置信度落在以4为中心的某一范围内,或者说,在给定置信度 下: 120Znx其中,0为所要检验的假设(这里为4cm) , 为总体标准差(这里为0.1cm) , x为样本均值(这里为3.94cm) , n为样本容量(这里为100) , 2Z为置信度为1下,标准正态分布对应的右尾临界值。如 果 取 置 信 度 为0.99,即 显 著 性 水 平为 0.01, 此时 临 界 值 为58. 22Z,通过样本计算得:58. 25)100/1 . 0/(|494. 3|)(|nx,说明小小概概率率事事件件(标准化后的样本均值只有 1%的可能性落在 2.58右边)发发生生了了,这这是是不不合合理理的的,应应拒
20、拒绝绝原原假假设设。 三假设检验的步骤三假设检验的步骤 1、提出原假设、提出原假设(null hypothesis)和备择假设和备择假设(alternative hypothesis) 原假设为正待检验的假设:原假设为正待检验的假设:H0;备择假设为可供选择的假;备择假设为可供选择的假设:设:H1 普通地,假设有三种方式:普通地,假设有三种方式: 1双侧检验:双侧检验: 2左侧检验:左侧检验: 或或 3右侧检验:右侧检验: 或或 2、选择适当的统计量,并确定其分布方式、选择适当的统计量,并确定其分布方式 统计量是根据所涉及的问题而定的,如总体均值、比例统计量是根据所涉及的问题而定的,如总体均值
21、、比例率选取正态分布的率选取正态分布的Z统计量等。统计量等。0100:;:HH0100:;:HH0100:;:HH0100:;:HH0100:;:HH 3、选择显著性程度或置信度,确定临界值 显著性程度为原假设为真时,样本点落在临界值外的概率即抽样结果远离中心点的概率,它为小概率,也是原假设为真时,回绝原假设所冒的风险。临界值将样本点所落区域分为回绝域与接受域,临界值“外为回绝域,“内为接受域。 4、作出结论 经过样本计算统计量的详细值,与临界值比较,根据落入回绝域或接受域的情况来回绝或接受原假设。 /21/2-Z/2 Z/2 Z 0 0 Z双侧检验左侧检验右侧检验 四假设检验中的两类错误四假
22、设检验中的两类错误 由于假设检验是根据有限的样本信息来推断总体特征,由由于假设检验是根据有限的样本信息来推断总体特征,由样本的随机性能够致使判别出错。样本的随机性能够致使判别出错。 1.第一类错误第一类错误 当原假设为真时,而回绝原假设所犯的错误,称为第当原假设为真时,而回绝原假设所犯的错误,称为第I类错类错误或拒真错误。易知犯第误或拒真错误。易知犯第I类错误的概率就是显著性程度类错误的概率就是显著性程度 : 2.第二类错误第二类错误 当原假设为假时,而接受原假设所犯的错误,称为第当原假设为假时,而接受原假设所犯的错误,称为第II类错类错误或采伪错误。犯第误或采伪错误。犯第II类错误的概率常用
23、类错误的概率常用 表示表示: 假设检验中的四种能够情况假设检验中的四种能够情况 H0为真为真 H0不真不真 接受接受H0 Good Bad/Type II error 回绝回绝H0 Bad/Type I error Good)|(00trueisHHrejectP)|(00falseisHHrejectnotP 留意:留意: 1、犯第一类错误与犯第二类错误的概率存在此消彼长的、犯第一类错误与犯第二类错误的概率存在此消彼长的关系;关系; 2、假设要同时减少、假设要同时减少 与与 ,须增大样本容量,须增大样本容量n。 3、通常的作法是,取显著性程度较小,即控制犯第一类、通常的作法是,取显著性程度较
24、小,即控制犯第一类错误的概率在较小的范围内;错误的概率在较小的范围内; 4、在犯第二类错误的概率不好控制时,将、在犯第二类错误的概率不好控制时,将“接受原假设接受原假设更倾向于说成更倾向于说成“不回绝原假设。不回绝原假设。2202z0二、二、 总体均值、比例和方差的假设检验总体均值、比例和方差的假设检验一总体均值的假设检验一总体均值的假设检验 1、总体方差知,正态总体,样本大小不限、总体方差知,正态总体,样本大小不限 留意:留意: 假设总体方差未知,且总体分布未知,但假设是假设总体方差未知,且总体分布未知,但假设是大样本大样本n=30,仍可经过,仍可经过 Z 统计量进展检验,只统计量进展检验,
25、只不过总体方差需用样本方差不过总体方差需用样本方差 s 替代。替代。 如果总体2,NX,在方差已知的情况下,对总体均值进行假设检验。由于),(2nNx,因此,可通过构造 Z 统计量来进行假设检验:) 1 , 0(0NnxZ 例3:根据以往的资料,某厂消费的产品的运用寿命服从正态分布N(1020, 1002)。现从最近消费的一批产品中随机抽取16件,测得样本平均寿命为1080小时。问这批产品的运用寿命能否有显著提高显著性程度:5%? 提出假设:H0: ,H1: 检验统计量: 0.05 由 ,查表得临界值: 比较:计算的Z=2.4 =1.645 判别:回绝H0,接受H1,即这批产品的寿命确有提高。
26、102010204 . 216100102010800nxZ05. 0645. 105. 0 ZZZ1.645 2、总体方差未知,正态总体,小样本、总体方差未知,正态总体,小样本 这时只能用这时只能用 t 统计量进展假设检验:统计量进展假设检验:注:假设总体分布也未知,那么没有适当的统计量进展假设检验,注:假设总体分布也未知,那么没有适当的统计量进展假设检验,独一的处理方法是增大样本,以使样本均值趋向于正态分布,独一的处理方法是增大样本,以使样本均值趋向于正态分布,从而再采用从而再采用Z统计量。统计量。 二总体比例的假设检验二总体比例的假设检验 大样本下,样本比例趋向于正态分布,因此可经过构造
27、大样本下,样本比例趋向于正态分布,因此可经过构造Z统计量统计量的方法进展假设检验:的方法进展假设检验:注:注:1、假设总体比例、假设总体比例P未知,可用样本比例未知,可用样本比例p替代。替代。 2、Z统计量只适宜大样本情况下的总体比例检验。统计量只适宜大样本情况下的总体比例检验。)1 ,0()1 (0NnPPPpZ) 1(/0ntnsxt 在例2中,由于所抽样本只为10,为小样本,因此无法构造Z统 计量进展总体比例的假设检验。 但可以经过概率论的知识给予初步的判别: 在任抽10件产品中无次品的概率为: 在任抽10件产品中有一件次品的概率为: 那么在任抽10件产品,至少有2件次品的概率为: 阐明
28、: 1、假设该批产品满足不超越3%的次品率,那么从200件中随机抽取10件,至少有2件以上次品的概率不超越4%,这是一个很小的概率。 2、这一小概率事件在一次抽样中出现,因此原假设这批产品的次品率不超越3%的判别很能够有错误,而应回绝。 3、因此可以以为这批产品的次品率大于3%,所以该批产品不能出厂。031. 0110PPP237. 0102001691941CCCP732. 010200101940CCP三总体方差的假设检验 只讨论限于正态总体方差的检验。设所要检验的原假设为: H0:由于样本方差 是总体方差 的无偏估计量,可经过它们的对比来构造检验统计量。 假设H0为真,那么因此,可构造 统计量进展总体方差的假设检验。 当H0成立时, 接近于1, 的值在一个适当的范围内, 当H0不成立时, 远离1, 的值相当大或相当小。 2) 1() 1(22022nSn202202202(或或2S2202S2202S2)(2n三三 、 假设检验中的其他问题假设检验中的其他问题一区间估计与假设检验的关系 1、区别: 区间估计是根据样本资料估计总体的未知参数的能够范围; 假设检验是根据样本资料
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年邯郸货运资格证模拟考试题
- AI算法设计与应用操作手册
- 食品原料来源可追溯管理系统开发
- 品味古典诗词韵味之美-高三古诗文诵读与赏析教学教案
- 2025年新疆从业资格证500道题速记
- 江干区小学英语试卷
- 钨基高比重合金竞争策略分析报告
- 小学英语买试卷
- 公司承包转让合同范本
- 双方变更合同范本
- 校园欺凌谈心记录
- 2022年《国民经济行业分类》
- 公司企业生产安全事故应急预案演练计划
- 人教鄂教版科学六年级下册全册教案
- 铝合金铸造基础知识(课堂PPT)
- 诊断学课件:临床常用免疫学检测
- jw甲级设计院十六层医院综合楼全套电气施工图纸103张含多大样图
- 港股通开户测评答案
- 广东专插本高等数学真题
- 云南省普通初中学生成长记录
- 仿真技术在车架防腐性能开发中的应用
评论
0/150
提交评论