青岛大学概率论课件概率统计第七章_第1页
青岛大学概率论课件概率统计第七章_第2页
青岛大学概率论课件概率统计第七章_第3页
青岛大学概率论课件概率统计第七章_第4页
青岛大学概率论课件概率统计第七章_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章假设检验

假设检验是统计推断的另一种形式,根据样本所提供的信息,推断事先给出的关于未知的总体的一个假设是否合理,这就是假设检验。

§7·1假设检验的基本思想和概念

例1

工厂中自动打包机打包,每包重量每包重应为50kg,由于机器存在误差,打包重量并不50kg,现从中任取9包,测得问:打包机工作是否正常?

例2

某次学生的考试成绩是否服从正态分布?痊愈者未痊愈者

合计

未服药者

48

52100

服药者

56

44100

合计10496200是否痊愈

服何种药

例3

某研究所推出一种感冒特效药,为证明其疗效,选择200名患者为志愿者。将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据:问:新药是否有效?

例1例2例3

新药无效

新药有效

一基本概念

1统计假设假设检验参数的假设检验(总体分布已知,参数未知)非参数的假设检验(总体分布未知)2.原假设备择假设

原假设

要去检验是否为真的假设备择假设:与原假设相对应的假设

二假设检验的基本思想

小概率事件在一次试验中几乎是不可能发生的。

2.假设检验的基本思想

1.小概率原理若需检验某假设,首先假定正确,在此假设下,寻找一个小概率事件,进行一次试验,若发生了,否定,反之接受。样本值

三、接受域否定域检验函数

将样本空间分成两个不相交的集合检验函数

四、两类错误

第一类错误:“以真为假”的错误

犯第一类错误的概率:(第Ⅰ类风险)

第二类错误:

“以假为真”

犯第二类错误的概率:(第Ⅱ类风险)注:(3)Neyman—Person原则

在控制犯第一类错误的条件下,使犯第二类错误的概率尽量小。(4)显著性检验(1)当n增大时,可使犯两类错误的概率同时减小.(2)当n固定时,降低一种犯错误的概率,往往使另一种增大。

五、假设检验的基本步骤【

例】在例1中若假设,问打包机是否正常?

o拒绝域:

Step1º:根据问题提出原假设和备择假设

Step2º:选取检验统计量且其抽样分布中不含任何未知参数,可以查表或通过计算得其分位数(临界值)

Step3º:对于给定的显著性水平找临界值,从而确定拒绝域,使

Step4º:

判定。若§7·2参数的假设检验一、U检验法

例2在上节例1中,取=0.01检验打包机的工作是否正常?从而得拒绝域检验步骤与1相同(单尾检验)

例3假设某次考试数学分数~N(98.7,4),随机抽查市一中的16名学生其平均成绩为101.85分,试判断该校的数学成绩是否优于全市平均水平?(=0.05)o二、T检验法o例4从经验知,灯泡的寿命服从正态分布,现从一批灯泡中随机抽取20个,算得平均寿命,样本标准差,检验该批灯泡的平均寿命是否为2000h?()检验统计量T检验法

例6在漂白工艺中,要考察湿度对针织品断裂强度的影响,在70℃与80℃下分别作了八次实验,测得断裂强度数据如下:70℃:20.518.819.820.921.519.521.021.280℃:17.720.320.018.819.021.120.119.1据经验针织品地断裂强度服从正态分布,问:70℃下的断裂强度与80℃下的断裂强度有无显著性差异?例4(教材例7.4)拒绝域拒绝域例7某砖厂生产的红砖质量比较稳定,抗压强度的方差为64,今从一批新砖中任抽10块作抗压强度试验,得数据如下:

578572570568572570572596584570

问是否可相信这批砖的抗压强度的方差也为64?

四、F--检验法o拒绝域

例8在十块土地上,试种甲、乙两种作物,所得产量分别为,假设作物产量服从正态分布,并计算得样本均值

,若取=1%,问两个品种的产量有无显著性的差异?四、F--检验法

正态总体参数的假设检验表假设条件检验统计量分布拒绝域单个总体

正态总体参数的假设检验表假设条件检验统计量分布拒绝域两个总体课外练习某药厂生产一种新的止痛片,厂方希望验证服用新药片后只开始作用的时间间隔较原有止痛片至少缩短一半,为此厂方提出须检验的假设:

§7·3参数的区间估计

一置信区间的定义

定义:置信下限置信上限二置信区间的一般求法置信区间的观测值

例1设结论:求置信区间的一般步骤:

Step1º:寻找一个适合下列条件的样本函数(1)g中含有待估参数

,但不含有其它未知参数。(2)g的分布是已知的,且不依赖于任何未知参数。

(3)不等式:可等价变形为:

三、正态总体下的区间估计求的区间估计例2

假设初生婴儿的体重服从正态分布,随即抽取12名初生男婴,测得其体重

为(单位:g):3100252030003000

30003160356033202880260034002540试以95%的置信度求初生男婴的平均体重的置信区间。

例3

某厂生产的零件中来那个服从正态分布从该厂生产的零件中抽取9个,测得其质量为(单位:g)45.345.445.145.345.545.745.445.345.6

试求总体标准差的0.95置信区间.

例4

为了比较两个小麦品种的产量,选择18块条件相似的实验田,采用相同的耕作方法作实验,结果耕作甲品种的8块试验田的单位面积产量和播种乙品种的10块实验田的单位面积产量(单位:kg)分别为:

甲品种628583510554612523530615

乙品种535433398470567480498560503426假定每个品种的单位面积均服从正态分布,试求这两个品种平均单位面积产量差的置信区间。(=0.05)

四、假设检验与区间估计的关系

§7.5非参数的假设检验一、拟合检验问题:定理1(K.Person定理)P342

定理2(Fisher定理)P345拒绝域:例1为募集社会福利基金,某地方政府发行福利彩票,中彩者用摇大盘的方法确定中奖金额,大转盘均分为20

份,金额为5万、10万、20万、30万、50万、100万的分别占2份、4份、6份、4份、2份、2份。假定大转盘是均匀的。现20人参加摇奖,摇得各个奖项的人数依次为

2、6、6、3、3、0,由于没有100万,有人怀疑大转盘不均匀,问此怀疑是否成立?解:假设转盘是均匀的,即取检验统计量由题意:代入上式算得:拒绝域为没有理由认为转盘不均匀。例2教材例7.9痊愈者未痊愈者

合计

未服药者

48

52100

服药者

56

44100

合计10496200是否痊愈

服何种药

例3

某研究所推出一种感冒特效药,为证明其疗效,选择200名患者为志愿者。将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据:问:新药是否有效?二、列联表的独立性检验

列联表是将观测数据按两个或更多属性(定性变量)分类时所列出的频数表。

合计

合计

列联表的基本问题

是考察各属性之间有无关联,即判断两变量是否独立?

合计

合计此时检验变量A,B是否独立等价于检验假设上式中至少对某组i,j不成立。即有统计量令o拒绝域

例3设=0.01,检验新药是否有显著性疗效?

解:此为2×2列联表问题考察的两个指标为A--是否痊愈,B--是否服药,要研究的问题是A,B是否独立.假设A,B相互独立(是否痊愈与是否服药无关)取检验统计量由所给观测值代入上式得

对于检验水平=0.01,查表得故接受即有99%的把握认为这种感冒新药并无显著疗效。例4为研究儿童智力发展与营养的关系,某研究机构调查了1436名儿童,得到数据如表,试在显著性水平0.05下判断智力发展与营养有无关系?儿童智力与营养的调查数据表智商<8080~8990~99≥100营养良好3673422663291304营养不良56402016132

合计4233822863451436合计解:用A表示营养状况,它有两个水平:表示营养良好B表示儿童智商,它有四个水平分别表示表中的四种情况

假设营养状况与智商无关,即A,B相互独立。在原假设成立下,计算表示营养不良进而可算出对于检验水平=0.05,查表得故拒绝即以95%的把握认为营养状况对智商有影响。课外练习题在某医院,因为患心脏病而住院的6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论