第八章假设检验第1节假设检验的基本思想课件_第1页
第八章假设检验第1节假设检验的基本思想课件_第2页
第八章假设检验第1节假设检验的基本思想课件_第3页
第八章假设检验第1节假设检验的基本思想课件_第4页
第八章假设检验第1节假设检验的基本思想课件_第5页
已阅读5页,还剩193页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章假设检验

第1节假设检验的基本思想第八章假设检验2

例1.体重指数BMI是常用的衡量人体胖瘦程度的准.健康成年人的BMI取值应在18.55-24.99之间.某种减肥药广告宣称,连续使用该种减肥药一个星期便可达到减肥的效果.2例1.体重指数BMI是常用的衡量人体胖瘦程度的准.为了检验其说法是否可靠,随机抽取9位试验者(要求BMI指数超过25、年龄在20-25岁女生),先让每位女生记录没有服用减肥药前的体重,然后让每位女生服用该减肥药,连续服用该减肥药1周后,再次记录各自的体重.3为了检验其说法是否可靠,随机抽取9位试验者(要求BMI指数问题:根据目前的样本资料能否认为该减肥药广告中的宣称是可靠的?测得服减肥药前后的体重差值(服药前体重-服药后体重)(单位:kg):1.5,0.6,-0.3,1.1,-0.8,0,2.2,-1.0,1.44问题:根据目前的样本资料能否认为该减肥药广告中的宣称是可靠的假设检验的目的是通过收集到的数据,来验证某个想要得到的结论。过程类似于法官的审判过程。你偷东西了我从来不偷东西法官的立场基于“疑罪从无”:法官宣告被告“有罪”是需要充分的证据来推翻被告是“无罪”的假设;

而宣判“无罪”,是由于没有充分的证据支持被告“有罪”,并不是有充分的证据支持被告“无罪”.5假设检验的目的是通过收集到的数据,来验证某个想要得到的结论。第一步,建立两个完全对立的假设:原假设(零假设)H0,备择假设(对立假设)H1。原假设与备择假设是不对称的!

决定谁是原假设,依赖于立场、惯例、方便性.检验假设的过程是一个四步曲.6第一步,建立两个完全对立的假设:原假设与备择假设是不对称的!1.保护原假设.如果错误地拒绝假设A比错误地拒绝假设B带来更严重的后果——A选作原假设!7例如:假设A:新药有某种毒副作用,假设B:新药无某种毒副作用.——A选作原假设H0!“有毒副作用”错误地当成“无毒副作用”比“无毒副作用”错误地当成“有毒副作用”带来的后果更严重。1.保护原假设.如果错误地拒绝假设A比错误地拒绝假设B带来2.原假设为维持现状.为解释某些现象或效果的存在性,原假设常取为“无效果”、“无改进”、“无差异”等,拒绝原假设表示有较强的理由支持备择假设.8例1中原假设H0:药物没有减肥效果.备择假设H1:药物有减肥效果.2.原假设为维持现状.为解释某些现象或效果的存在性,原假设参数假设的形式设θ是反映总体指标某方面特征的量,是我们感兴趣的参数.一般参数θ的假设有三种情形:9参数假设的形式91010如何检验假设?根据收集的资料,针对假设,给出检验方法,然后对假设进行判断。判断方法有二种:临界值法.P_值法.以例1为例来说明减肥药有效?还是无效?11如何检验假设?以例1为例来说明减肥药有效?还是无效?111212原假设第二步:给出检验统计量,并确定拒绝域的形式.13原假设第二步:给出检验统计量,并确定拒绝域的形式.13

第I类错误:拒绝真实的原假设(弃真).第II类错误:接受错误的原假设(取伪).原假设为真原假设不真根据样本拒绝原假设第I类错误正确根据样本接受原假设正确第II类错误14由于样本的随机性,任一检验规则在应用时,都有可能发生错误的判断——两类错误.第I类错误:拒绝真实的原假设(弃真).第II类错误:接受犯两类错误的概率相互制约15犯两类错误的概率相互制约151616第三步,根据显著水平和统计量的分布确定临界值——临界值法17第三步,根据显著水平和统计量的分布确定临界值——临界值法17当原假设H0成立时,样本落在拒绝域的概率不超过0.05,是小概率事件。根据实际推断原理,有充分的理由拒绝原假设,认为厂家的宣传是可靠的.第四步:根据样本得出结论.18当原假设H0成立时,样本落在拒绝域的概率不超过0.05,是小概率这么小的事件!竟然发生了!!拒绝原假设!!!第三’步:计算最小显著水平——P_值法第四’步:比较P_值与显著水平,得出结论.19概率这么小的事件!竟然发生了!!第三’步:计算最小显著水平—2020临界值法处理假设检验问题的基本步骤21临界值法处理假设检验问题的基本步骤21P_值法处理假设检验问题的基本步骤22P_值法处理假设检验问题的基本步骤22第2节正态总体的均值假设检验一、标准差已知的单个正态总体

均值假设检验第2节正态总体的均值假设检验24242525P_值的计算26P_值的计算2627272828例1:为了了解A高校学生的消费水平,随机抽取225位学生调查其月消费(近6个月的消费平均值),得到该225位学生的平均月消费为1530元.假设学生月消费服从正态分布,标准差为σ=120.已知B高校学生的月平均消费为1550元,是否可以认为A高校学生的消费水平要低于B高校?29例1:为了了解A高校学生的消费水平,随机抽取225位学生调步骤1:提出检验假设步骤2:确定检验规则30步骤1:提出检验假设步骤2:确定检验规则30步骤3:计算检验统计量的值31步骤4:根据实际情况作出判断步骤3:计算检验统计量的值31步骤4:根据实际情况作出判断步骤3’:计算P_值利用P_值进行假设检验步骤4’:根据显著水平作出判断32步骤3’:计算P_值利用P_值进行假设检验步骤4’:根据显例2:据健康统计中心报告35至44岁的男子平均心脏收缩压为128,标准差为15.现根据某公司在35至44岁年龄段的72位员工的体检记录,计算得平均心脏收缩压为126.07(mm/hg).问该公司员工的心脏收缩压与一般人群是否存在差异呢?(假设该公司员工的心脏收缩压与一般中年男子的心脏收缩压具有相同的标准差)。(α=0.05)33例2:据健康统计中心报告35至44岁的男子平均心脏收缩压为1步骤1:提出检验假设步骤2:计算检验统计量的观测值.34步骤1:提出检验假设步骤2:计算检验统计量的观测值.34步骤3:计算P_值步骤4:根据实际情况作出判断P_=0.2758>0.05,因此,没有充分理由拒绝原假设。35步骤3:计算P_值步骤4:根据实际情况作出判断P_=0.2假设检验与区间估计作假设检验时,对参数有一个先验的认识(例如μ=μ0),但由于某种情形的出现(如工艺改良等),猜测真实参数值可能发生了变化,所以假设检验的目的是:根据样本确认参数是否真的发生了改变。作区间估计时,对参数是未知,并且没有先验的认识,但参数是固定不变的,所以区间估计的目的是:根据样本对参数进行估计;但置信区间与假设检验的拒绝域之间又有密切的关系。36假设检验与区间估计作假设检验时,对参数有一个先验的认识(例如37373838第2节正态总体的均值假设检验二、标准差未知的单个正态总体

均值假设检验第2节正态总体的均值假设检验

有些情况下,只有采集到的数据,并不知道总体的方差。如何根据这些数据得出所需要的结论呢?40有些情况下,只有采集到的数据,并不知道总体的方差。如41414242434344444545例1可乐制造商为了检验可乐在贮藏过程中其甜度是否有损失,请专业品尝师对可乐贮藏前后的甜度进行评分.10位品尝师对可乐贮藏前后甜度评分之差为2.0,0.4,0.7,2.0,-0.4,2.2,-1.3,1.2,1.1,2.3问:这些数据是否提供了足够的证据来说明可乐贮藏之后的甜度有损失呢?设总体服从正态分布,标准差未知.46例1可乐制造商为了检验可乐在贮藏过程中其甜度是否有损失,请例1的具体计算过程:步骤1:提出假设步骤2:计算检验统计量的值.47例1的具体计算过程:步骤1:提出假设步骤2:计算检验统计步骤3:计算P_值步骤4:根据实际情况作出判断查表得:P_=0.0122.如果显著水平取α=0.05,则有充分的理由拒绝原假设。如果显著水平取α=0.01,则还没有充分的理由拒绝原假设。48步骤3:计算P_值步骤4:根据实际情况作出判断查表得:P_例2

要求某种元件的平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其平均寿命为950小时,标准差为100小时。已知这批元件的寿命服从正态分布。试在显著性水平0.05下确定这批元件是否合格?49例2要求某种元件的平均使用寿命不得低于1000小时,生产者505051t0落在拒绝域内,故拒绝原假设,认为这批元件的平均寿命小于1000小时。结论:不合格。51t0落在拒绝域内,故拒绝原假设,5252第2节正态总体的均值假设检验三、比较两个正态总体均值的检验第2节正态总体的均值假设检验例1:通常认为男女的脉搏率是没有显著差异的.现在随机地抽取年龄都是25岁的16位男子和13位女子,测得他们的脉搏率如下:男:61,73,58,64,70,64,72,60,65,80,55,72,56,56,74,65,女:83,58,70,56,76,64,80,68,78,108,76,70,97.问题:假设男女脉搏率都是服从正态分布,这些数据能否认为男女脉搏率的均值相同?54例1:通常认为男女的脉搏率是没有显著差异的.现在随机地抽取5555565657575858——两样本精确t检验59——两样本精确t检验596060(1)当两个样本量都很大时,利用中心极限定理61(1)当两个样本量都很大时,利用中心极限定理61(2)当两个样本为小样本时都很大时,统计量近似服从t分布,自由度为62(2)当两个样本为小样本时都很大时,统计量近似服从t分布,自63636464结论:拒绝原假设,认为男女脉搏率的均值

不相同。65结论:拒绝原假设,认为男女脉搏率的均值656666第2节正态总体的均值假设检验四、成对数据t检验第2节正态总体的均值假设检验

配对研究的数据是一对一对地收集得到的,所以也称为成对数据的研究.由于配对研究采用了比较的思想,比通常的单个样本推断更让人信服.这种方法在医学和生物研究领域中广泛存在,成对数据检验的基本思想是将两样本问题转为单样本问题.1.成对数据t检验68配对研究的数据是一对一对地收集得到的,所以也称为成对数据为比较两总体均值是否有显著差异,可考虑如下的检验问题:假设成对数据设差值差值可以看成来自正态总体的样本69为比较两总体均值是否有显著差异,可考虑如下的检验问题:假设成7070例1:为了试验两种不同谷物种子的优劣,选取了十块土质不同的土地,并将每块土地分为面积相同的两部分,分别种植这两种种子。设在每块土地的两部分人工管理等条件完全一样。下面给出各块土地上的产量。种子A(xi)23352942392937343528种子B(yi)2639354038243627412771例1:为了试验两种不同谷物种子的优劣,选取了十块土质不同的土di=xi-yi-3-4-621517-61问:这两种种子种植的谷物产量是否有显著的差异(取显著性水平为0.05)?本例的Excel计算见实验20.72di=xi-yi-3-4-621查表得:73查表得:73计算得:结论:不能拒绝原假设,认为两种种子产量没有显著差异。74计算得:结论:不能拒绝原假设,认为两种种子产量没有显著差异。第3节正态总体的方差假设检验一、单个正态总体的方差检验第3节正态总体的方差假设检验7676777778787979808081818282希望从资料得出“支持的结论”即:新品种苹果的重量差异小。例2一个园艺科学家正在培养一个新品种苹果,这种苹果除了口感好和颜色鲜艳外,另一个重要特征是单个重量差异不大(对照品种的方差).为了评估新苹果,他随机挑选了25个测试重量(单位:克),其样本方差为.问新品种的方差是否比对照品种方差小?83希望从资料得出“支持的结论”即:新品种苹果的重量差异小。例284848585第3节正态总体的方差假设检验二、比较两个正态总体方差的检验第3节正态总体的方差假设检验8787检验假设88检验假设8889899090919192例1:两台机床生产同一个型号的滚珠,从甲机床生产的滚珠中抽取8个,从乙机床生产的滚珠中抽取9个,测得这些滚珠的直径(毫米)如下:甲机床15.014.815.215.414.915.115.214.8乙机床15.215.014.815.114.614.815.114.515.092例1:两台机床生产同一个型号的滚珠,从甲机床生产的滚珠中93本例的Excel计算见实验23.93本例的Excel计算见实验23.949495根据P_值,同样不拒绝假设.95根据P_值,同样不拒绝假设.96结论:接受原假设.96结论:接受原假设.问题:本例在第53讲中出现过,(1)在得到均值差的置信区间中,为什么置信区间包含0,可以认为两个均值没有显著差异呢?(2)方差比的置信区间中,为什么置信区间包含1,可以认为两个方差没有显著差异呢?97问题:本例在第53讲中出现过,9798989999第八章假设检验

第1节假设检验的基本思想第八章假设检验101

例1.体重指数BMI是常用的衡量人体胖瘦程度的准.健康成年人的BMI取值应在18.55-24.99之间.某种减肥药广告宣称,连续使用该种减肥药一个星期便可达到减肥的效果.2例1.体重指数BMI是常用的衡量人体胖瘦程度的准.为了检验其说法是否可靠,随机抽取9位试验者(要求BMI指数超过25、年龄在20-25岁女生),先让每位女生记录没有服用减肥药前的体重,然后让每位女生服用该减肥药,连续服用该减肥药1周后,再次记录各自的体重.102为了检验其说法是否可靠,随机抽取9位试验者(要求BMI指数问题:根据目前的样本资料能否认为该减肥药广告中的宣称是可靠的?测得服减肥药前后的体重差值(服药前体重-服药后体重)(单位:kg):1.5,0.6,-0.3,1.1,-0.8,0,2.2,-1.0,1.4103问题:根据目前的样本资料能否认为该减肥药广告中的宣称是可靠的假设检验的目的是通过收集到的数据,来验证某个想要得到的结论。过程类似于法官的审判过程。你偷东西了我从来不偷东西法官的立场基于“疑罪从无”:法官宣告被告“有罪”是需要充分的证据来推翻被告是“无罪”的假设;

而宣判“无罪”,是由于没有充分的证据支持被告“有罪”,并不是有充分的证据支持被告“无罪”.104假设检验的目的是通过收集到的数据,来验证某个想要得到的结论。第一步,建立两个完全对立的假设:原假设(零假设)H0,备择假设(对立假设)H1。原假设与备择假设是不对称的!

决定谁是原假设,依赖于立场、惯例、方便性.检验假设的过程是一个四步曲.105第一步,建立两个完全对立的假设:原假设与备择假设是不对称的!1.保护原假设.如果错误地拒绝假设A比错误地拒绝假设B带来更严重的后果——A选作原假设!106例如:假设A:新药有某种毒副作用,假设B:新药无某种毒副作用.——A选作原假设H0!“有毒副作用”错误地当成“无毒副作用”比“无毒副作用”错误地当成“有毒副作用”带来的后果更严重。1.保护原假设.如果错误地拒绝假设A比错误地拒绝假设B带来2.原假设为维持现状.为解释某些现象或效果的存在性,原假设常取为“无效果”、“无改进”、“无差异”等,拒绝原假设表示有较强的理由支持备择假设.107例1中原假设H0:药物没有减肥效果.备择假设H1:药物有减肥效果.2.原假设为维持现状.为解释某些现象或效果的存在性,原假设参数假设的形式设θ是反映总体指标某方面特征的量,是我们感兴趣的参数.一般参数θ的假设有三种情形:108参数假设的形式910910如何检验假设?根据收集的资料,针对假设,给出检验方法,然后对假设进行判断。判断方法有二种:临界值法.P_值法.以例1为例来说明减肥药有效?还是无效?110如何检验假设?以例1为例来说明减肥药有效?还是无效?1111112原假设第二步:给出检验统计量,并确定拒绝域的形式.112原假设第二步:给出检验统计量,并确定拒绝域的形式.13

第I类错误:拒绝真实的原假设(弃真).第II类错误:接受错误的原假设(取伪).原假设为真原假设不真根据样本拒绝原假设第I类错误正确根据样本接受原假设正确第II类错误113由于样本的随机性,任一检验规则在应用时,都有可能发生错误的判断——两类错误.第I类错误:拒绝真实的原假设(弃真).第II类错误:接受犯两类错误的概率相互制约114犯两类错误的概率相互制约1511516第三步,根据显著水平和统计量的分布确定临界值——临界值法116第三步,根据显著水平和统计量的分布确定临界值——临界值法17当原假设H0成立时,样本落在拒绝域的概率不超过0.05,是小概率事件。根据实际推断原理,有充分的理由拒绝原假设,认为厂家的宣传是可靠的.第四步:根据样本得出结论.117当原假设H0成立时,样本落在拒绝域的概率不超过0.05,是小概率这么小的事件!竟然发生了!!拒绝原假设!!!第三’步:计算最小显著水平——P_值法第四’步:比较P_值与显著水平,得出结论.118概率这么小的事件!竟然发生了!!第三’步:计算最小显著水平—11920临界值法处理假设检验问题的基本步骤120临界值法处理假设检验问题的基本步骤21P_值法处理假设检验问题的基本步骤121P_值法处理假设检验问题的基本步骤22第2节正态总体的均值假设检验一、标准差已知的单个正态总体

均值假设检验第2节正态总体的均值假设检验1232412425P_值的计算125P_值的计算261262712728例1:为了了解A高校学生的消费水平,随机抽取225位学生调查其月消费(近6个月的消费平均值),得到该225位学生的平均月消费为1530元.假设学生月消费服从正态分布,标准差为σ=120.已知B高校学生的月平均消费为1550元,是否可以认为A高校学生的消费水平要低于B高校?128例1:为了了解A高校学生的消费水平,随机抽取225位学生调步骤1:提出检验假设步骤2:确定检验规则129步骤1:提出检验假设步骤2:确定检验规则30步骤3:计算检验统计量的值130步骤4:根据实际情况作出判断步骤3:计算检验统计量的值31步骤4:根据实际情况作出判断步骤3’:计算P_值利用P_值进行假设检验步骤4’:根据显著水平作出判断131步骤3’:计算P_值利用P_值进行假设检验步骤4’:根据显例2:据健康统计中心报告35至44岁的男子平均心脏收缩压为128,标准差为15.现根据某公司在35至44岁年龄段的72位员工的体检记录,计算得平均心脏收缩压为126.07(mm/hg).问该公司员工的心脏收缩压与一般人群是否存在差异呢?(假设该公司员工的心脏收缩压与一般中年男子的心脏收缩压具有相同的标准差)。(α=0.05)132例2:据健康统计中心报告35至44岁的男子平均心脏收缩压为1步骤1:提出检验假设步骤2:计算检验统计量的观测值.133步骤1:提出检验假设步骤2:计算检验统计量的观测值.34步骤3:计算P_值步骤4:根据实际情况作出判断P_=0.2758>0.05,因此,没有充分理由拒绝原假设。134步骤3:计算P_值步骤4:根据实际情况作出判断P_=0.2假设检验与区间估计作假设检验时,对参数有一个先验的认识(例如μ=μ0),但由于某种情形的出现(如工艺改良等),猜测真实参数值可能发生了变化,所以假设检验的目的是:根据样本确认参数是否真的发生了改变。作区间估计时,对参数是未知,并且没有先验的认识,但参数是固定不变的,所以区间估计的目的是:根据样本对参数进行估计;但置信区间与假设检验的拒绝域之间又有密切的关系。135假设检验与区间估计作假设检验时,对参数有一个先验的认识(例如1363713738第2节正态总体的均值假设检验二、标准差未知的单个正态总体

均值假设检验第2节正态总体的均值假设检验

有些情况下,只有采集到的数据,并不知道总体的方差。如何根据这些数据得出所需要的结论呢?139有些情况下,只有采集到的数据,并不知道总体的方差。如1404114142142431434414445例1可乐制造商为了检验可乐在贮藏过程中其甜度是否有损失,请专业品尝师对可乐贮藏前后的甜度进行评分.10位品尝师对可乐贮藏前后甜度评分之差为2.0,0.4,0.7,2.0,-0.4,2.2,-1.3,1.2,1.1,2.3问:这些数据是否提供了足够的证据来说明可乐贮藏之后的甜度有损失呢?设总体服从正态分布,标准差未知.145例1可乐制造商为了检验可乐在贮藏过程中其甜度是否有损失,请例1的具体计算过程:步骤1:提出假设步骤2:计算检验统计量的值.146例1的具体计算过程:步骤1:提出假设步骤2:计算检验统计步骤3:计算P_值步骤4:根据实际情况作出判断查表得:P_=0.0122.如果显著水平取α=0.05,则有充分的理由拒绝原假设。如果显著水平取α=0.01,则还没有充分的理由拒绝原假设。147步骤3:计算P_值步骤4:根据实际情况作出判断查表得:P_例2

要求某种元件的平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其平均寿命为950小时,标准差为100小时。已知这批元件的寿命服从正态分布。试在显著性水平0.05下确定这批元件是否合格?148例2要求某种元件的平均使用寿命不得低于1000小时,生产者14950150t0落在拒绝域内,故拒绝原假设,认为这批元件的平均寿命小于1000小时。结论:不合格。51t0落在拒绝域内,故拒绝原假设,15152第2节正态总体的均值假设检验三、比较两个正态总体均值的检验第2节正态总体的均值假设检验例1:通常认为男女的脉搏率是没有显著差异的.现在随机地抽取年龄都是25岁的16位男子和13位女子,测得他们的脉搏率如下:男:61,73,58,64,70,64,72,60,65,80,55,72,56,56,74,65,女:83,58,70,56,76,64,80,68,78,108,76,70,97.问题:假设男女脉搏率都是服从正态分布,这些数据能否认为男女脉搏率的均值相同?153例1:通常认为男女的脉搏率是没有显著差异的.现在随机地抽取15455155561565715758——两样本精确t检验158——两样本精确t检验5915960(1)当两个样本量都很大时,利用中心极限定理160(1)当两个样本量都很大时,利用中心极限定理61(2)当两个样本为小样本时都很大时,统计量近似服从t分布,自由度为161(2)当两个样本为小样本时都很大时,统计量近似服从t分布,自1626316364结论:拒绝原假设,认为男女脉搏率的均值

不相同。164结论:拒绝原假设,认为男女脉搏率的均值6516566第2节正态总体的均值假设检验四、成对数据t检验第2节正态总体的均值假设检验

配对研究的数据是一对一对地收集得到的,所以也称为成对数据的研究.由于配对研究采用了比较的思想,比通常的单个样本推断更让人信服.这种方法在医学和生物研究领域中广泛存在,成对数据检验的基本思想是将两样本问题转为单样本问题.1.成对数据t检验167配对研究的数据是一对一对地收集得到的,所以也称为成对数据为比较两总体均值是否有显著差异,可考虑如下的检验问题:假设成对数据设差值差值可以看成来自正态总体的样本168为比较两总体均值是否有显著差异,可考虑如下的检验问题:假设成16970例1:为了试验两种不同谷物种子的优劣,选取了十块土质不同的土地,并将每块土地分为面积相同的两部分,分别种植这两种种子。设在每块土地的两部分人工管理等条件

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论