统计学基础与数据分析之假设检验_第1页
统计学基础与数据分析之假设检验_第2页
统计学基础与数据分析之假设检验_第3页
统计学基础与数据分析之假设检验_第4页
统计学基础与数据分析之假设检验_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 假设检验假设检验基本原理假设检验步骤假设检验两类错误双尾检验和单侧检验一个总体样本假设检验两个总体样本假设检验统计学基础与数据分析之假设检验第1页假设检验在统计方法中地位统计方法描述统计推断统计参数预计假设检验统计学基础与数据分析之假设检验第2页什么是假设?(hypothesis) 对总体参数数值所作一个假设总体参数,如总体均值、百分比、方差等分析之前必需陈说1、假设检验概念及原理统计学基础与数据分析之假设检验第3页什么是假设检验? (hypothesis testing)事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立采取逻辑上反证法,依据统计上小概率原理有

2、参数假设检验和非参数假设检验统计学基础与数据分析之假设检验第4页在一次试验中,一个几乎不可能发生事件发生概率,P0.05 P0.01在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设小概率由研究者事先确定什么是小概率?(lowprobability)统计学基础与数据分析之假设检验第5页2、假设检验步骤提出假设确定适当检验统计量要求显著性水平计算检验统计量值作出统计决议统计学基础与数据分析之假设检验第6页提出原假设和备择假设 什么是原假设?(null hypothesis)待检验假设,又称“0假设”研究者想搜集证据给予反正确假设,或稳定、保守、受到保护经验看法3.总是有等号 , 或4.表示为

3、 H0H0: 某一数值 指定为 = 号,即 或 比如, H0: 3910(克)统计学基础与数据分析之假设检验第7页 什么是备择假设?(alternative hypothesis)与原假设对立假设,也称“研究假设”研究者想搜集证据给予支持假设总是有不等号: , 或 表示为 H1H1: 某一数值,或 某一数值比如, H1: 3910(克),或 3910(克)提出原假设和备择假设统计学基础与数据分析之假设检验第8页 什么是检验统计量?1.用于假设检验决议统计量2.选择统计量方法与参数预计相同,需考虑是大样本还是小样本总体方差已知还是未知检验统计量基本形式为:t 检验、F检验确定适当检验统计量地科1

4、6,1025统计学基础与数据分析之假设检验第9页要求显著性水平(significant level) 什么显著性水平?是一个概率值原假设为真时,统计检验要求小概率标准,被称为抽样分布拒绝域表示为 (alpha) 惯用 值有0.01, 0.05, 0.10由研究者事先确定统计学基础与数据分析之假设检验第10页计算检验统计量依据给定显著性水平,查表得出对应临界值 z或 z/2, t 或 t/2计算检验统计量值统计学基础与数据分析之假设检验第11页作出统计决议将检验统计量值与 水平临界值进行比较得出接收或拒绝原假设结论统计学基础与数据分析之假设检验第12页3、假设检验中两类错误(地科1020)1)第

5、一类错误(弃真错误)原假设为真时拒绝原假设第一类错误概率为2) 第二类错误(取伪错误)原假设为假时接收原假设第二类错误概率为(Beta)决议风险统计学基础与数据分析之假设检验第13页 错误和 错误关系你不能同时降低两类错误!和关系就像翘翘板,小就大, 大就小统计学基础与数据分析之假设检验第14页影响假设错误原因1.总体参数真值伴随假设总体参数降低而增大2.显著性水平 当 降低时增大3.总体标准差 当 增大时增大4.样本容量 n当 n 降低时增大统计学基础与数据分析之假设检验第15页4、双侧检验与单侧检验假设研究问题双侧检验左侧检验右侧检验H0m = m0m m0m m0H1m m0m m0 (

6、假设形式)统计学基础与数据分析之假设检验第16页双侧检验属于决议中假设检验不论是拒绝H0还是不能拒绝H0,都必需采取对应行动办法比如,某种零件尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格 我们想要证实(检验)大于或小于这两种可能性中任何一个是否成立建立原假设与备择假设应为 H0: = 10 H1: 10原假设与备择假设确定统计学基础与数据分析之假设检验第17页双侧检验抽样分布H0值临界值临界值a/2 a/2 样本统计量拒绝域拒绝域1 - 置信水平显著性水平与拒绝域 (反证法)统计学基础与数据分析之假设检验第18页H0值临界值临界值a/2 a/2 样本统计量拒绝域拒绝域抽样分布

7、1 - 置信水平双侧检验显著性水平与拒绝域 观察到样本统计量统计学基础与数据分析之假设检验第19页H0值临界值临界值 a/2 a/2 样本统计量拒绝域拒绝域抽样分布1 - 置信水平双侧检验显著性水平与拒绝域 观察到样本统计量统计学基础与数据分析之假设检验第20页H0值临界值临界值a/2 a/2 样本统计量拒绝域拒绝域抽样分布1 - 置信水平观察到样本统计量双侧检验显著性水平与拒绝域 统计学基础与数据分析之假设检验第21页单侧检验将研究者想搜集证据给予支持假设作为备择假设H1比如,一个研究者总是想证实自己研究结论是正确一个销售商总是想证实供货商说法是不正确备择假设方向与想要证实其正确性方向一致将

8、研究者想搜集证据证实其不正确假设作为原假设H0先确立备择假设H1原假设与备择假设确定统计学基础与数据分析之假设检验第22页 例题:一项研究表明,采取新技术生产后,将会使产品使用寿命显著延长到1500小时以上。检验这一结论是否成立。研究者总是想证实自己研究结论(寿命延长)是正确备择假设方向为“”(寿命延长)建立原假设与备择假设应为 H0: 1500 H1: 1500单侧检验原假设与备择假设确定统计学基础与数据分析之假设检验第23页例题:一项研究表明,改进生产工艺后,会使产品废品率降低到2%以下。检验这一结论是否成立。研究者总是想证实自己研究结论(废品率降低)是正确备择假设方向为“”(废品率降低)

9、建立原假设与备择假设应为 H0: 2% H1: 2%单侧检验原假设与备择假设确定统计学基础与数据分析之假设检验第24页例题:某灯泡制造商声称,该企业所生产灯泡平均使用寿命在1000小时以上。假如你准备进一批货,怎样进行检验?检验权在销售商一方作为销售商,你总是想搜集证据证实生产商说法(寿命在1000小时以上)是不是正确备择假设方向为“”(寿命不足1000小时)建立原假设与备择假设应为 H0: 1000 H1: 1020 = 0.05n = 16临界值(s):检验统计量: 在 = 0.05水平上拒绝H0有证据表明这批灯泡使用寿命有显著提升决议:结论:t0拒绝域0.051.64统计学基础与数据分析

10、之假设检验第36页2 未知大样本均值检验 (例题分析)【例】某电子元件批量生产质量标准为平均使用寿命1200小时。某厂宣称他们采取一个新工艺生产元件质量大大超出要求标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产电子元件质量显著地高于要求标准? (0.05)统计学基础与数据分析之假设检验第37页2 未知大样本均值检验 (例题分析)H0: 1200H1: 1200 = 0.05n = 100临界值(s):检验统计量: 在 = 0.05水平上不能拒绝H0不能认为该厂生产元件寿命显著地高于1200小时决议:结论:Z0拒绝域0.051.64

11、统计学基础与数据分析之假设检验第38页总体均值检验 (2未知小样本)1.假定条件总体为正态分布2未知,且小样本2.使用t 统计量统计学基础与数据分析之假设检验第39页2 已知均值检验 (小样本例题分析)【例】依据过去大量资料,某厂生产灯泡使用寿命服从正态分布N(1020,1002)。现从最近生产一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05显著性水平下判断这批产品使用寿命是否有显著提升?(0.05)统计学基础与数据分析之假设检验第40页2 已知均值检验 (小样本例题分析)H0: 1020H1: 1020 = 0.05n = 16临界值(s):检验统计量: 在 = 0.0

12、5水平上拒绝H0有证据表明这批灯泡使用寿命有显著提升决议:结论:t0拒绝域0.051.753统计学基础与数据分析之假设检验第41页2 未知小样本均值检验 (例题分析)【例】某机器制造出肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05显著性水平检验机器性能良好假设。 统计学基础与数据分析之假设检验第42页2 未知小样本均值检验 (例题分析)H0: = 5H1: 5 = 0.05df = 10 - 1 = 9临界值(s):检验统计量: 在 = 0.05水平上不能拒绝H0说明该机器性能好 决议:结论:t02.262-2.

13、262.025拒绝 H0拒绝 H0.025统计学基础与数据分析之假设检验第43页2 未知小样本均值检验 (例题分析)【例】一个汽车轮胎制造商声称,某一等级轮胎平均寿命在一定汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命公里数服从正态分布,我们能否依据这些数据作出结论,该制造商产品同他所说标准相符?( = 0.05)统计学基础与数据分析之假设检验第44页均值单尾 t 检验 (计算结果) H0: 40000H1: 40000 = 0.05df = 20 - 1 = 19临界值(s):检验统计量: 在

14、 = 0.05水平上不能拒绝H0有证据表明轮胎使用寿命显著地大于40000公里决议: 结论: -1.729t0拒绝域.05统计学基础与数据分析之假设检验第45页适用数据类型离散数据 连续数据数值型数据数 据质量数据5.2 总体百分比假设检验统计学基础与数据分析之假设检验第46页总体百分比检验假定条件有两类结果总体服从二项分布可用正态分布来近似百分比检验 Z 统计量0为假设总体百分比统计学基础与数据分析之假设检验第47页总体百分比检验 (例题分析)【例】一项统计结果声称,某市老年人口(年纪在65岁以上)比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发觉其中

15、有57人年纪在65岁以上。调查结果是否支持该市老年人口比重为14.7%看法?(= 0.05)双侧检验统计学基础与数据分析之假设检验第48页总体百分比检验 (例题分析)H0: = 14.7%H1: 14.7% = 0.05n = 400临界值(s):检验统计量:在 = 0.05水平上不能拒绝H0该市老年人口比重为14.7%决议:结论:Z01.96-1.96.025拒绝 H0拒绝 H0.025统计学基础与数据分析之假设检验第49页方差卡方 (2) 检验检验一个总体方差或标准差假设总体近似服从正态分布检验统计量样本方差假设总体方差5.3 总体方差检验(地信1109)统计学基础与数据分析之假设检验第5

16、0页方差卡方 (2) 检验(例题分析)【例】某厂商生产出一个新型饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)饮料误差上下不超出1cm3。假如到达设计要求,表明机器稳定性非常好。现从该机器装完产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到以下结果。检验该机器性能是否到达设计要求 (=0.05)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1双侧检验统计学基础与数据分析之假设检验第51页方差卡方 (2) 检验(例题分析)H0: 2 = 1H1:

17、 2 1 = 0.05df = 25 - 1 = 24临界值(s):统计量: 在 = 0.05水平上不能拒绝H0能够认为该机器性能到达设计要求 2039.3612.40 /2 =.025决议:结论:统计学基础与数据分析之假设检验第52页两个正态总体参数检验地科1101检验统计量确实定两个总体均值之差检验两个总体百分比之差检验两个总体方差比检验检验中匹配样本统计学基础与数据分析之假设检验第53页两个正态总体参数检验两个总体检验Z 检验(大样本)t 检验(小样本)t 检验(小样本)Z 检验F 检验独立样本配对样本均值百分比方差统计学基础与数据分析之假设检验第54页两个独立样本之差抽样分布 m1s1

18、总体1s2 m2总体2抽取简单随机样样本容量 n1计算X1抽取简单随机样样本容量 n2计算X2计算每一对样本X1-X2全部可能样本X1-X2m1- m2抽样分布6.1 两个总体均值之差检验统计学基础与数据分析之假设检验第55页两个总体均值之差检验 (12、 22 已知)1.假定条件两个样本是独立随机样本两个总体都是正态分布若不是正态分布, 能够用正态分布来近似(n130和 n230)检验统计量为统计学基础与数据分析之假设检验第56页两个总体均值之差检验 (假设形式)假设研究问题没有差异均值1 均值2均值1 均值2有差异均值1 均值2H0 1 2 = 0 1 2 0 1 2 0H1 1 20 1

19、 2 0统计学基础与数据分析之假设检验第57页两个总体均值之差检验 (例题分析) 【例】有两种方法可用于制造某种以抗拉强度为主要特征产品。依据以往资料得知,第一个方法生产出产品其抗拉强度标准差为8千克,第二种方法标准差为10千克。从两种方法生产产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2= 50千克,x1= 44千克。问这两种方法生产产品平均抗拉强度是否有显著差异? ( = 0.05)统计学基础与数据分析之假设检验第58页两个总体均值之差检验 (例题分析)H0: 1- 2 = 0H1: 1- 2 0 = 0.05n1 = 32,n2 = 40临界值(s):检验统计量

20、:决议:结论: 在 = 0.05水平上拒绝H0有证据表明两种方法生产产品其抗拉强度有显著差异Z01.96-1.96.025拒绝 H0拒绝 H0.025统计学基础与数据分析之假设检验第59页两个总体均值之差检验 (12、 22 未知且不相等,小样本)检验含有不等方差两个总体均值假定条件两个样本是独立随机样本两个总体都是正态分布两个总体方差未知且不相等12 22检验统计量统计学基础与数据分析之假设检验第60页两个总体均值之差检验 (12、 22 未知但相等,小样本)检验含有等方差两个总体均值假定条件两个样本是独立随机样本两个总体都是正态分布两个总体方差未知但相等12 = 22检验统计量统计学基础与数据分析之假设检验第61页两个总体均值之差检验 (例题分析) 【例】甲、乙两台机床同时加工某种类型零件分别服从正态分布N( 1,12 ),N( 2,22 ),而且有1222 ,为比较两台机床加工零件精度有没有显著差异,分别独立抽取了甲机床加工8个零件和乙机床加工7个零件,经过测量到以下数据:机床 零件直径(cm)甲20.519.819.720.420.1201919.9乙20.719.819.520.820.419.620.2统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论