




已阅读5页,还剩90页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章第四章 假假 设设 检检 验验 统计推断研究的另一类基本问题是本章所讨论的统计假设检验问题 在数理统计中 通常称对有关总体分布所提出的某种推断为统计假设统计假设 称 根据所获得的样本 采用合理的方法来判断这个假设是否成立为统计假设检验统计假设检验 统计假设检验的基本任务是根据来自总体的样本所提供的信息 对未知总体分 布的某些概率特征 如总体数学期望 总体方差 总体分布 两个总体相互独 立等 的统计假设作出合理的判断 为行文简便 以下将统计检验假设简写成 假设检验 假设检验与参数估计一样 在数理统计的理论研究与实际应用中都 占有极其重要的地位 本章主要介绍假设检验的基本思想和有关概念 正态总体数学期望和方差 的显著性检验方法以及包括总体分布的拟合检验和两个总体独立性的检验在内 的非参数的假设检验方法 4 1 假设检验的基本思想和有关概念假设检验的基本思想和有关概念 1 假设检验的问题假设检验的问题 本节我们通过实例来阐明假设检验的基本思想和有关概念 例例 1 设某粮食加工厂用打包机包装大米 规定每袋净质量的标准为 50 kg 可以认为打包机所装大米的净质量服从正态分布 由已往的经验 2 N 知其标准差kg 且打包机工作的稳定性能较好 即保持不变 某日完4 0 工后 为了检验打包机工作是否正常 随机抽取该机所装的 16 袋大米 测得其 净质量 单位 kg 如下 50 5 48 8 49 4 50 3 51 5 49 5 51 2 49 6 48 4 50 2 50 8 48 6 49 0 50 4 48 5 50 1 问该天打包机的工作是否正常 分析分析 设为该粮食加工厂某日打包机所包装大米的净质量 由题意知 服从 其中 已知 问题可以归结为根据来自总体的样本 2 0 N 2 2 0 4 0 观测值 判断总体数学期望是否等于规定的标准 若 这就意 50 0 0 味着打包机工作正常 否则 就要对打包机进行调整 例例 2 某灯泡厂甲 乙两条流水线生产同一种灯泡 已知灯泡的使用寿命 均服从正态分布 由于生产设备 技术 管理基本相同 可以认为它们的方差 相同 现从甲 乙两条流水线生产的产品中分别随机抽取 40 知样品 50 知样 品 测得样品的使用寿命数据 并算得样品均值与样本方差的观测值为 甲流水线 h h 40 1 n1585 x70 1 s 乙流水线 h h 50 2 n1540 y80 2 s 问该厂这两条流水线生产的灯泡寿命是否相同 分析分析 设 分别表示该厂甲 乙两条流水线生产这种灯泡的使用寿命 由题意知服从 服从 其中未知 问题可以归结 2 1 N 2 2 N 2 为根据来自两个总体的样本观测值 判断总体的数学期望是否等于总体 1 的数学期望 若 这意味着甲 乙两条流水线生产的灯泡寿命相同 2 21 否则 就认为这两条流水线生产的灯泡寿命不同 例例 3 据对上海市气象台自 1875 年至 1955 年间其中 63 年的夏天 指 5 到 9 月 每年夏季共有 31 30 31 31 30 153 天 气象资料统计 上海市夏季共有 180 天出现过暴雨 现将这 63 年中一年有天发生过暴雨年数的数据列表于k k 下 满足 k k 63 k k k180 0 1 2 3 4 5 6 7 8 k9 4 8 14 19 10 4 2 1 1 0 k 试探索一年内夏季出现暴雨天数所服从的分布 分析分析 设为一年内夏季出现暴雨的天数 运用概率论中关于二项分布的 泊松逼近定理 可以定性地判断总体服从泊松分布 因此问题可以归结为根 据来自总体的样本观测值 判断总体的分布与泊松分布是否吻合 P 以上三个实验都是要根据来自总体的样本观测值判断关于一个总体或 者两个总体 的某些论断是否成立 由上面的分析可以看出 解决这类问 题的办法是 首先 对未知的或不完全知道的总体作出一些假设 通常称之为 原假设 例如在例 1 中为 在例 2 中为 在例 3 中为服从 50 21 P 然后 根据来自总体的样本观测值 运用抽样分布理论 按照一定的规则来看 是否会有不合理的现象发生 从而判断原假设的真伪 决定是否拒绝这个假设 一般地 在统计假设检验问题中 其出发点是对总体作一个假设 称之为 原假设原假设或零假设零假设 null hypothesis 记为 而与之对立的假设称为备择假设备择假设 0 H alternative hypothesis 记为 原假设和备择假设称为统计假设统计假设 而用来判 1 H 断统计假设真伪的规则为检验法检验法 必须强调指出 原假设通常是不轻易否定的一个被检验的假设 只有在 0 H 样本提供足够不利于它的证据时才能拒绝它 如果样本提供的信息没有充 分的理由否定原假设 则不能拒绝它 0 H 假设检验问题按照总体的状况通常分为参数假设检验与非参数假设检验 两类 1 若总体的分布函数或者总体在离散情形的概率质量函数或在连续情形 的概率密度函数的数学表达式为已知 只是分布中的参数有些是未知的 这时 统计假设是针对未知参数而提出并需要检验的 这样的问题称为参数假设检验 问题 例 1 中的备择假设为 它表示当备择设成立时 可能50 1 H 1 H 大于 50 也可能小于 50 通常称这种备择假设为双侧备择假设 two sided alter native hypothesis 与之相应的检验为双侧检验 two sided test 在实际问题中还会出现备择假设为 或 的情形 例如 某厂 01 H 01 H 生产的固体燃料推进器的燃烧率服从正态分布 现采用新 2 00 N 方法研究一批推进器 其目的是提高推进器的燃烧率 显然 越大效果越好 如果能判断新方法研制出推进器燃烧率的较以往正常生产的大 就考虑采用 新方法生产 因此这时我们应提出如下的统计假设 00 H 01 H 又如 在分析居民收入状况时 从共同富裕着眼 在普遍提高居民收入的同时 要不断缩小居民收入的差异 促进社会和谐 显然 居民收入的方差 越小越 2 好 因此这时我们应提出如下的统计假设 2 0 2 0 H 2 0 2 0 H 通常称形如 的备择假设为右侧假设 right sided hypothesis 与之相 01 H 应的检验为右侧检验 right sided test 称形如 的备择假设为左侧假设 2 0 2 1 H left sided hypothesis 与之相应的检验为左侧检验 left sided test 右侧假设和左侧 假设统称为单侧假设 one sided hypothesis 右侧检验和左侧 称为单侧检验 one sided test 一般地 当备择假设 具有一侧倾向性 1 H 时 就采用单侧检验 下面表 4 1 1 与表 4 1 2 分别是对一个总体单一的参数进行检验与对两个总 体相应参数进行比较的原假设与备择假设 0 H 1 H 表 4 1 1 一个总体单参数检验的统计假设 原假设 0 H备设假设备设假设 1 H 0 0 0 0 0 0 0 0 0 0 表 4 1 2 两个总体相应参数比较的统计假设 原假设 0 H备设假设备设假设 1 H 21 21 21 21 21 21 21 21 21 21 2 若总体的分布函数或者总体在离散型情形的概率质量函数或在连续型 情形的概率密度函数未知 这时统计假设 是针对总体的分布 包括分布中待 0 H 定的参数 而提出并需要检验的 这类问题称为非参数假设检验问题 对于上述介绍参数单侧检验的两个实例而言 所谓统计假设检验问题是两 个关于总体真值的相互对立判断 的鉴定问题 其中是参数 0 1 0 空间的一个真子集 为的余集 通常用 01 0 1100 HH 表示原假设对备择假设的假设检验问题 且问题一般是以 原假设是 0 H 1 H 0 H 否成立 的方式提出 若为单点集 则称为简单假设 simple hypothesis 否则称 i i H1 0 i 为复合假设 composite hypothesis i 约定上述记号 对其他参数假设检验问题以及非参数假设检验问题也 适用 引入上述这种形式记号之后 就有 上述右侧检验问题中的统计假设为 0100 HH 上述左侧检验问题中的统计假设为 2 0 2 1 2 0 2 0 HH 例 1 双侧检验问题中的统计假设为 50 50 10 HH 例 2 双侧检验问题中的统计假设为 211210 HH 例 3 分布检验问题中的统计假设为 不服从 0 H 1 HP P 二 假设检验的基本思想 下面我们结合例 1 来进一步说明构造检验法的基本思想 首先作统计假设 50 50 0100 HH 若 为取自总体 的样本 由 3 5 知 1 2 n 4 0 50 2 N 是的优效估计 由于随即因素的影响 样本均值的观测值与有一定的 x 0 差异是不可避免的 因此 如果原假设为真 则应该比较集中在的附 0 H x 0 近 即与的差异不显著 反映在样本 上 x 0 1 2 n 50 0 比较大 应该是一个小概率事件 衡量这个差异 比较大 的数值是一 个临界值 c 即是一个小概率事件 其中 c 是待定的正c 50 0 数 这个临界值由所服从的分布以及将多大的概率作为 小概率 这两个因素 所决定 事实上 如果取作为小概率事件的标准 当为真时 05 0 0 H 是小概率事件 此时有c 50 0 为真 00 HcP 05 0 50 0 为真 HP 当为真时 总体 所以 0 H 4 0 50 2 2 00 NN 2 2 1 lim k n PxFx xR 4 4 7 定理的证明参阅 2 7 4 定理 7 1 由该定理可知 当 n 充分大 或较大 时 由 4 4 6 所给出的统计量近似服从自 2 由度为的分布 即1fk 4 4 8 2 22 1 1 k ii i i nnp k np 至于运用这种检验法具体步骤中关于拒绝域的确定和最后作判断这两步 与上一小节 的情形完全一样 4 4 4 4 4 5 不再赘述 三 总体分布类型是已知的分布的假设检验三 总体分布类型是已知的分布的假设检验 在一些实际问题中 对于总体 服从什么具体分布是未知的 只知道总体 所服从 分布的类型 而且这种分布类型中含有的未知参数 即 12 m F x 01 F x 为在一定范围内变化的参数 其中 是分布类型已知且含 m 1 m 01 F x m 有 m 个未知参数的分布函数 大括号表示的集合为相应得分布函数族 如二项分布族 泊 松分布族 正态分布族 指数分布族等 对于这种情形分布的假设检验 按如下四步来进 行 1 确定统计假设 显然 首要的任务是设法具体确定未知参数 的估计 以 12 m 1 m 1 代替 从而使得分布函数 完全确定 为使得在确定假设统计 m 12 m 01 F x m 之后 理论上得到在原假设成立时所构造的统计量的渐近分布 通常用的最大似然 0 H i 估计量来代替 i 1 2 m 于是所考虑的统计假设为 i i 其中为的最大似然估计 i 1 2 m 00 HFxF x 1 m i i 其中为的最大似然估计 i 1 2 m 10 HF xF x 1 m i i 2 确定统计量及其渐近分布 此时 对样本观测值 进行分组而得到 k 个区 1 2 x x n x 间 的方法与第二小节的情形完全一样 而所构造的统计量 112 yy y 1 k y 则为 其中 2 2 1 k i i i i nn n p p 0101 11 mm i F yF y p 这里仍约定 0 k yy 在这种情形下 费希尔于 1924 年证明了如下的定理 3 定理 3 不论总体 服从什么分布 当原假设 其中 00 1 m HF xF x 为的最大似然估计 i 1 2 m 成立时 若对样本观测值如前分成 k 个组而得到 k i i 个区间 记 其中 1 y 121 k y yy 2 2 1 k def i i i i nn n p p 0101 11 mm i F yF y p 4 4 9 则 4 4 10 2 2 1 lim k m n pxFx xR 定理的证明参阅 13 6 7 定理 6 7 2 由该定理可知 当 n 充分大 或比较大 时 由 4 4 9 所给出的统计量近似服 2 从自由度为的分布 即1fkm 2 2 22 1 1 k i i i i nn km n p p 4 4 11 3 确定拒绝域 对于给定的显著性水平 由自由度以及1fkm 0 22 1 1 H Pkm 查分布分位数值表可定出临界值 从而得拒绝域 2 2 1 1 km 22 1 1 Ckm 4 4 12 4 下判断 拒绝实测的 0 H 2 2 1 k i i i i nn C n p p 4 4 13 例 4为研究某种新混凝土抗压强度的分布状况 试验人员随机测得 200 件混凝土制件的 抗压强度 单位 0 1MPa 如下所示 压强区间 190 200200 210210 220220 230230 240240 250 频数 10 26 56 64 30 14 i n 解 设 为该种新混凝土的抗压强度 1 作统计假设 或 不服从的分 0 H 2 N 2 2 2 1 1 2 t x F xedtH 0 H 布 其中 是的最大似然估计值 2 取统计量 n uu n u n u U 0 0 00 0 若原假设 成立 则 于是有 00 uuH 0 0 0 n uu 1 0 00 0 N n u n u U 2 1 u 2 1 u 图 4 1 1 U 检验法确定分位数 的示意图 2 1 u 若原假设 不成立 则 此时 U 的分布相对于 N 0 00 uuH 0 0 0 n uu 1 其峰值会有一个向左或向右的偏移 如图 4 1 1 设 u 为据样本观测值算得的统计量 U 的观测值 n xxx 21 a 2a 2 uu0 P x O 若 u 落在两边 绝对值偏大 则 H0不真的可能可性较大 为真的的可能性较 小 此时应拒绝 H0 若 u 落在中间 绝对值偏小 显然 H0为真的可能性较大 不真的的可能性较 小 此时应接受 H0 通常用分位数来区分上述分析中的两边和中间 它将 U 的取值范围 2 1 u 分成 拒绝域 与 接受域 2 1 uuuC 2 1 uuuC 如此便有 为真 0 2 1 HuUP 简记为 2 1 0 uUPH 注意到一般较小 因而据实际推断原理知 拒绝 2 1 0 0 0 u uC n ux uUH即值实测的 上述分析推理运用了反证法的思想 但与纯数学上的反证法有所不同 这 里的 不合理 不是形式逻辑上的绝对矛盾 而是基于 小概率事件在一次观测 中可以认为基本上不会发生 因此假设检验的基本思想可以概括成为是 概率性质的反证法概率性质的反证法 三三 可能出现的两类错误和检验法的功效可能出现的两类错误和检验法的功效 用抽取的样本来判断总体 实际上是用部分来推断整体 这本身就决定了 不能保证绝对不犯错误 在假设检验中 可能犯的错误不外是下面的两类 1 原假设 H0本来为正确 但我们却拒绝 H0 这就犯了错误 这类错误 称为拒真 弃真 错误拒真 弃真 错误 也称为第一类错误第一类错误 type I error 其发生的概率称为 拒真概率或犯第一类错误的概率 通常记为 即 为真拒绝 00 H HP 2 原假设 H0本来不正确 但我们却接受了 H0 这类错误称为受伪错误受伪错误 也称为第第 二类错误二类错误 type II error 其发生的概率称为受伪概率或犯第二类错误的概率 通常记为 即 不真接受 00 H HP 在实际应用中 显然太大 供方损失就大 生产者危险率 太大 用方损失就 大 消费者危险率 当然希望与越小越好 但是理论推导和实际检验表明 当样本容 量 n 固定时 要使与都很小是不可能的 实际情况表明 减小其中一个 另一个就会增 大 要使与都很小 只有通过将样本容量 n 增到很大时才能实现 但这在实际用用中 是不现实的 面对这种两难境地 这能采取折中方案 著名统计学家莱曼 J Neyman 1894 1981 和小皮尔逊 E S Pearson 1895 1980 对解决这个问题提出了一中 原则 限定犯第一类错误的最大概率 在这限制之下选取犯第二类错误的概率尽可能 小的拒绝域 不过实行这一原则还会有很多理论上和实际上的困难 有鉴于此 有时把这 原则简化成只对犯第一类错误的最大概率加以控制 这种统计假设检验方法称为显著性显著性 检验检验 significance tests 并将犯第一类错误的最大概率称为假设检验的显著性水平显著性水平 significance level 事实上 假设检验问题按照总体的性质通常分为显著性检验和决策性检验两类 在实 施检验时 对于显著性检验 如前所述 要明确给出犯犯第一类错误的最大概率的具体 数值 而要求犯第二类错误的概率尽可能小 至于小到什么程度并无具体要求 对于决 策性检验 在产品质量管理领域经常用到 则必须对犯两类错误的最大概率 分别 提出具体的数值要求 例如 而且从优良检验法的角度考虑 还得要10 0 05 0 求样本容量尽可能小 或检验时间尽可能短 许多国际 国内的质量标准都是针对 的一些给定值列出 优良的检验法 检验方案 供人们在产品是否通过验收的检验工作中使用 参阅 11 第九章 必须强调指出 就检验的结果来说 拒绝原假设的理由是充分的 而接受原假设 的理由是不充分的 我们之所以断言 拒绝原假设的理由是充分的 乃是因为上 述显著性检验对于犯第一类错误的概率作了控制 显著性水平一般很小 这就使得 在原假设时就有很大的把握 而且越小 说服力越强 另一方面 我们我们之所以 断言 拒绝原假设的理由是不充分的 乃是因为 接受 只表明未发现样本观测 值数据与相矛盾 况且上述显著性检验没有控制犯第二类错误的概率 这就使得在 备择假设为真时 错误地接受原假设 的可能性也许不小 因此严格地讲 应该说 不拒绝原假设 而不说接受原假设 通常教材中说接受原假设 只是沿用了习 惯上的说法而已 从以上的讨论可以看出 在假设检验中问题中 原假设与备择假设 所处的地位病不对等 还应该明确 在上述显著性检验中 对犯第一类错误的最大概率加以控制 体现了 保护原假设 的原则 由于在原假设为真时错误地拒绝的概率受到了控制 所以 如果没有充足的理由 原假设不能轻易被拒绝 根据 保护原假设 的原则 在进行 显著性检验时 应该有把握的 不能轻易否定的命题作为原假设 而将没有把握的 不能轻易肯定的命题作为备择假设 读者可以通过联系实际问题举例分析 来加深对 保护原假设这一原则的领会 确切地提出原假设与备择假设 在假设检验中 又称拒假 否定不真实的 概率 为检验的功效功效 power 它显示检验法拒绝不真实的原假设的能力 上述 与的概念见表 4 1 3 表 4 1 3 显著性检验中的 与 总体情况 假设 决策 原假设备择假设 犯第一类 拒真 错误 概率为 正确 其概率称为功 效 正确犯第二类 受伪 错误 概率为 下面举例说明计算 与的方法 例例 4 4 设总体 为起简单随机样本 作统 计假设 设已求得临界值 按如下原则判断假设的真伪 当时 拒绝 接受 当时 接受 拒绝 试用函数表示该检验法的拒真概率与受伪概率 并证明 解解 首先有 1 该检验法的拒真概率为 注意到当 成立时 于是得 进而有 注意到条件 2 该检验法的受伪概率为 注意到当时 于是得 进而知 故得 结果表明 为使得犯两类错误的概率同时小 要求样本的容量很大 例例 5 5 设总体 从中抽取样本 为检验 2 1 2 1 10 PP HH 构造检验法 C 0 C 1 4321 4321 432 1 当 当 其中 C 4 1 4321 2 k k 为拒绝域 1 求该检验法犯第一类错误的概率 2 求 4 3 解解 首先由条易知 4 1k k B p 4 1 检验法犯第一类错误的概率为 2 1 2 2 1 1 H H 00 ppppp 为真 拒绝 1 1 2 1 2 pp 2 1 1 2 1 0pppp 注意到 2 1 p 2 1 4 B 于是得 40 0 4 2 1 2 1 1C 16 11 2 1 2 1 3 1 4 C 2 检验法犯第二次错误的概率为 4 3 2 4 3 0 4 3 p 4 3 0 ppppHp 接受 4 3 1 4 3 0 pppp 注意到 4 3 p 4 3 4B 故得 256 13 4 1 4 3 4 1 4 3 4 3 3 1 4 40 0 4 CC 例例 6 设为取自正态总体的样本 为样本均值 对于 4321 2 3 aN 统计假设 100 100 10 aa HH 检验法中的拒绝域为 94 2 100 4321 C 1 求犯第一类错误的概率 2 求的功效 时 102 a 解解 首先有 5 1 4 3 2 2 aNaN 1 检验法犯第一类错误的概率为 100 94 2 100 00 aPHHP 为真拒绝 100 94 2 100 1 aP 1 100 94 2 10094 2 ap 由于当 成立时 故得100 0 aH 2 5 10 100 N 96 1 96 1 1 5 1 94 2 5 1 94 2 1 2 05 0 97500 0 1296 1 1 2 当的功效为拒假概率时 检验法 102 a 102 94 2 100 102 102 0 aPaHP 拒绝 1 102 94 2 10094 2 100 ap 注意到当 a 102 时 于是得 2 5 1 102 N 5 1 102 94 2 100 5 1 102 94 2 100 1102 5 1 102 94 2 100 5 1 102 94 2 100 1 2 0 7375 0 9995 0 263 四四 假设检验的一般步骤假设检验的一般步骤 通过前面几个例子可以看到 对通常的假设检验问题 首先要明确总体的分布函数或概 率函数的表达式是否为已知 为已知时进而还要明确哪些参数也是已知的 这是正确进行 假设检验的前提 假设检验的一般步骤是 1 根据问题的要求确切的提出原假设与 备择假设 关于参数假设检验问题中 0 H 1 H 与的各种形式 参见前面的表 4 1 1 与表 4 1 2 0 H 1 H 2 在总体分布的表达式为已知时 选取一个合适的检验统计量 并 n TT 21 在原假设成立的条件下确定统计量 T 的精确分布或渐进分布 0 H 3 由检测统计量 T 的分布及给定的显著性水平 以及 或 C 0 C 0 通过查有关分布的分位数值表得检验的临界值 从而确定出检验的拒绝域 C 4 将实测样本值代入统计量 T 中计算 得统计量的实测值 n 21 n t 21 5 根据统计量的实测值是否落入拒绝域 C 中而就拒绝或接受做出 n t 21 0 0 判断 进而结合专业分析 得出符合实际的结论 应该明确 在一个确定的检验法中 判断结果一是与显著性水平的选取有关 二是 与抽样的样本 包括样本观测值与样本容量 有关 n 21 有必要指出 本书介绍的各种显著性检验法都是优良的检验法 它们不仅使得犯第一类 拒真 错误的最大概率不超过 而且犯第二类 受伪 错误的概率在某种意义上最小 或接近最小 详细的论证可参阅 8 五 参数假设检验与区间估计的关系 进行参数假设检验是在取定统计量之后 利用样本确定检验的拒绝域 使得当原假设成 立时 统计量落入拒绝域是一个小概率事件 一旦抽样结果使得这一小概率事件发生 就 拒绝原假设 这里小概率为显著性水平 进行参数双侧区间估计则是在取定统计量之后 利用样本构造出一个随机区间 使得它 包含客观存在的参数值是一个大概率事件 这里大概率为置信水平或置信概率 上述两种统计方法进行统计推断的思想是一样的 其关键都是在取定一个合适的统计量 之后 利用简单随机样本 包括样本观测值与样本容量 作判断 对于连续性总体来说 进行参数区间估计的置信水平就是用 1 减去经行参数双侧假设的显著水平 进行参数假设检 测与进行参数区间估计两者是殊途同归 其中一个问题的解决将导致另一个问题相应解决 方案的形成 通常从参数假设检验中一个适合的检验统计量的确定 就能相应地构造出一个 合理的参数置信区间 进一步的深入讨论读者可参阅有关文献了解 58 2 995 0 u 当 0 05 时 由可查得 975 0 975 0 u96 1 975 0 u 4 将实测样本值代入统计量 U 中计算 得其实测值 u 于是 n 21 拒绝 即 4 2 4 C n u 0 0 0 2 1 uu 例 1 设一车床生产的纽扣直径服从正态分布 根据以往的经验 当车床工作正常时 生产的纽扣的平均直径方差某天开工一段时间后 为检验车 26 0 mm 2 5 22 mm 床生产是否正常 从刚生产的纽扣中随机抽检了 100 颗 测得其观测值 的样本均值 26 56mm 假定所生产的纽扣的精度保持不变 试分别在显 10021 著性水平 0 05 0 01 下检验这天该车床生产是否正常 1 2 解 设为该车床生产的纽扣的直径 由题意知 其中 5 2 2 0 N 2 0 1 作统计假设 26 26 100 2 选取统计量 U 1 0 0 0 N n 3 对于给定的显著性水平 0 05 0 01 由 1 2 i 1 2 iai uU 2 1 0 查标准正态分布函数数值表 得临界值 96 1 975 0 2 1 1 uu 58 2 995 0 2 1 2 uu 是在两种不同显著性水平下的拒绝域分别为是在两种不同显著性水平下的拒绝域分别为 96 1 1 uC 58 2 2 uC 4 4 将实测样本值 将实测样本值 代入统计量 代入统计量中中 1 x 2 x 100 xU 计算 得其实测值计算 得其实测值 4558 2 100 2 5 2656 26 0 0 n x u 由于由于 故在显著水平 故在显著水平下 拒绝下 拒绝 即认 即认 1 Cu 2 Cu 05 0 1 0 H 为这个天车床生产不正常 需对车床进行检测维修 而在为这个天车床生产不正常 需对车床进行检测维修 而在 显著水平显著水平下 不能拒绝下 不能拒绝 应接受 应接受 即可以认为 即可以认为01 0 2 0 H 0 H 这天车床生产正常这天车床生产正常 例例 1 1 说明 对于同一个问题说明 对于同一个问题 同一个样本 由于显著 同一个样本 由于显著 水平不同 可能得出完全相反的结论 事实上 在水平不同 可能得出完全相反的结论 事实上 在检验法检验法U 中 由于中 由于 所以若在 所以若在时被拒绝 则一定在时被拒绝 则一定在 2 1 0 2 5 0 11 uu01 0 时也被拒绝 而时也被拒绝 而若在若在时被拒绝 还有可能在时被拒绝 还有可能在05 0 0 H05 0 时被接受 不过这时犯时被接受 不过这时犯 受伪受伪 错误的概率增大了 错误的概率增大了 01 0 因此 在实际应用中 应该根据问题的性质和专业要求 因此 在实际应用中 应该根据问题的性质和专业要求 合理地选择显著性水平合理地选择显著性水平 对于某些重要场合 假如错判出现对于某些重要场合 假如错判出现 会产生严重后果 例如飞机失事 轮船遇难等 会产生严重后果 例如飞机失事 轮船遇难等 应选得应选得 小些 否则可以选得大些小些 否则可以选得大些 2 2 一个正态总体方差已知时数学期望的单侧显著性 一个正态总体方差已知时数学期望的单侧显著性 检验检验 设总体设总体 其中 其中已知已知 在实际问题中 还经常遇在实际问题中 还经常遇 2 00 N 2 0 到到 与已知的与已知的是否有显著差异的左侧检验和右侧检验问题是否有显著差异的左侧检验和右侧检验问题 0 1 1 左侧检验 统计假设为左侧检验 统计假设为 00 H 01 H 或或 00 H 01 H 其中的其中的为已知常数为已知常数 0 对于对于 的情形 当的情形 当为真时 为真时 1 00 H 01 H 0 H 的无偏估计量的无偏估计量 的观测值的观测值 应该比较集中地分布在应该比较集中地分布在的附近的附近 x 0 而偏右侧 若而偏右侧 若比较大 就应该认为当比较大 就应该认为当为真时小概率为真时小概率x 0 0 H 事件事件 比较大比较大 发生了 故拒绝发生了 故拒绝 注意到注意到 是假设检是假设检x 0 0 H 验犯第一类错误的最大概率 即验犯第一类错误的最大概率 即 拒绝 拒绝 为真 为真 P 0 H 0 H 于是取于是取 为真 为真 P 0 0 H 其中为其中为 为适当的正数为适当的正数 上式可改写为上式可改写为 00 0 0 nn PH 由于当由于当为真时 为真时 可取统计量可取统计量 0 H 2 00 N 1 0 0 0 N n U 5 2 4 于是上式又可呈现为于是上式又可呈现为 1 0 0 0 u n PH 6 2 4 因此得拒绝域因此得拒绝域 1 0 0 u n x C 7 2 4 对于对于 的情形 当的情形 当为真时 有为真时 有 2 00 H 01 H 0 H nn 0 0 0 0 于是于是 1 0 u n 1 0 0 u n 由于总体由于总体 因此 因此 故有 故有 2 00 N 1 0 0 N n U 1 0 uUPH 1 0 0 0 u n PH 8 2 4 这表明这表明更是一个当更是一个当为真时的小概率事件 所为真时的小概率事件 所 1 0 0 u n 0 H 以得拒绝域仍为以得拒绝域仍为 7 2 4 2 2 右侧检验 统计假设为右侧检验 统计假设为 00 H 01 H 或或 00 H 01 H 仿情形 仿情形 1 1 的讨论 可得此时的拒绝域为 的讨论 可得此时的拒绝域为 1 0 0 u n x C 9 2 4 例例 2 2 有一批枪弹 出厂时的初速度 单位 有一批枪弹 出厂时的初速度 单位 m sm s 服从正态 服从正态 分布分布 经过较长时间储存后 现取出经过较长时间储存后 现取出 9 9 发枪弹试射 发枪弹试射 10 950 2 N 测得其初速度如下 测得其初速度如下 914914 920920 910910 934934 953953 945945 912912 924924 940940 假定假定不变 试在显著性水平不变 试在显著性水平下检验这批枪弹的下检验这批枪弹的 22 0 10 05 0 初速度是否有变化初速度是否有变化 解解 设为经过较长时间储存后这批枪弹的初速度 设为经过较长时间储存后这批枪弹的初速度 由题意知由题意知 2 0 N 其中 要检验与是否有显著差异 由于枪弹经储存后 其初速 2 0 22 0 10 950 0 度不可能增加 所以这是一个左侧检验问题 1 作统计假设 950 950 0100 HH 2 选取统计量 1 0 0 0 N n U 3 对于给定的显著性水平由 05 0 1 0 uUPH 查标准正态分布函数值表 可确定于是拒绝域为 645 1 95 0 u 645 1 0 0 n x C 4 将实数样本值代入统计量 U 中计算 可算得于是 U 的实 921 xxx 928 x 测值 6 6 910 950928 0 0 C n u 故拒绝假设 而接受备择假设 即认为这批枪弹经过较长时间储存后 其初速度变 0 H 1 H 小了 3 任意非正态总体方差已知当样本容量充分大时数学期望的显著性检验 设为任意总体 已知 存在 为其样本 根据概 2 0 D E 21n 率论中林德贝尔格 莱维中心极限定理知 当样本容量 n 充分大时 有 1 2 0 1 n N n n i i 于是 4 2 10 1 0 0 N n U 因而可运用 U 检验法仿照情形 1 或情形 2 来对与已知的是否有显著性差异近似地进 0 行双侧显著性检验或单侧显著性检验 4 任意非正态总体方差未知当样本容量充分大时数学期望的显著性检验 设为任意总体 未知 存在 为其样本 可以证 2 0 D E 21n 明 若用样本方差代替总体方差则当样本容量时 有 2 1 2 1 n i in n S D n 4 2 11 1 0 N nS U L n 于是当充分大时 有n 4 2 12 1 0 N nS U n 因而可运用 U 检验法仿照情形 1 或情形 2 来对与已知的是否有显著性差异近似地进 0 行双侧显著性检验或单侧显著性检验 例例 3 某厂生产一种产品 其出厂质量分别为一级品 二级品 按规定一批产品中一 级品率至少为 90 才能认为这批产品合格 今在待出厂的一批这种产品中随机抽取 100 件 进行质量检查 发现有一级品 86 件 二极品 14 件 试在显著性水平下检验这批05 0 产品是否合格 解解 记 级品 随机抽取一件产品为二 级品 随机抽取一件产品为一 0 1 以 p 表示一级品率 则 1 1 ppDpEpB 1 作统计假设 90 0 90 0 0100 pHppH 2 记为取自总体的一个样本 由于很大 21n 100 n本例中 100 n 且此时未知 考虑用代替 又由 3 6 例 4 知 当时因 D 2 n S 1 pB 1 2 n S 此选取统计量 4 2 13 1 0 1 N n p U 3 对于给定的显著性水平 由 参照情形 2 中的 4 2 8 式 05 0 4 2 14 11 1 00 u n p PuUP HH 查标准正态分布函数值表 可确定于是拒绝域为 645 1 95 0 u 645 1 1 0 nxx px C 4 将实测样本值代入 C 中计算 由于 153 1 10014 086 0 90 0 86 0 1 0 C nxx px 故不能拒绝假设 即可以认为这批产品的一级品率而接受假设 因此可以 0 H 0 pp 0 H 认为这批产品合格 5 两个正态总体方差皆已知时数学期望比较的双显著性检验 设总体 其中已知 未知 其中也已知 2 11 N 2 1 1 2 22 N 2 2 未知 从总体中独立地分别抽取样本 要检验与 2 21n 21n 1 是否有显著差异 2 1 作 211210 HH 关于统计量的选定 将和分别用各自的样本均值与来估计 由于此时 1 2 1 1 1 1 n i i n 2 1 2 1 n i i n 1 2 1 1 n N 2 2 2 2 n N 2 2 2 1 2 1 21 nn N 故当原假设为真时 选取统计量 0 H 1 0 2 2 2 1 2 1 N nn U 15 余下的方法步骤同前 例例 4 设有甲 乙两台车床加工同样零件 其长度分别服从正态分布 12 0 2 1 N 现独立地分别实测两台各 10 个零件的长度 单位 为 16 0 2 2 N 甲台 8 1 7 9 8 2 8 0 8 2 7 8 7 9 8 2 8 1 8 0 乙台 8 3 8 0 7 9 7 9 7 5 8 4 8 2 7 6 7 9 7 8 试在显著性水平下检验与是否有显著差异 01 0 1 2 解解 设和分别为甲 乙两台车床加工的零件长度 由题意知 12 0 2 1 N 其中与皆未知 且从 中抽取的样本与 16 0 2 2 N 1 2 1 2 1021 独立 1021 作统计假设 211210 HH 选取统计量 1 0 2 2 2 1 2 1 N nn U 其中 10 1 n 22 1 12 0 10 2 n 22 2 16 0 对于给定的显著性水平 由01 0 2 1 0 uUPH 查标准正态分布函数数值表 得临界值 于是拒绝域为58 2 995 0 u 58 2 uC 将实测样本值代入统计量中计算 得其实测值U C nn yx 423 1 10 16 0 10 12 0 95 7 04 8 22 2 2 2 1 2 1 故不拒绝原假设 即可以认为甲 乙两台车床加工的零件平均长度无显著差 210 H 异 二 二 检验法检验法T 一个正态总体方差未知时数学期望的双侧显著性检验 设总体 其中未知 要检验统计假设 2 N 2 0100 HH 此时 用的无偏估计量修正的样本方差来代替 2 2 1 2 2 1 1 1 1 n n i in S nn S 由 费希尔定理推论 知 当原假设为真时 可选取统计量 2 0 H 16 1 1 0 nt nS T n 对于给定的显著性水平 由自由度以及 参见 14 1 nf 17 1 2 1 0 ntTPH 查 分布分位数值表可确定临界值 于是拒绝域为t 1 2 1 nt 18 1 2 1 nttC 然后 将实测样本值代入统计量中计算 得其实测值 于是 21n xxx Tt 拒绝 即 19 C ns x tH n 1 0 0 1 2 1 ntt 例例 一个矩形的宽与长之比为 0 618 黄金分割点的近似值 6180339 0 2 15 将给人们带来美的感受 某工艺品厂生产一种矩形工艺品框架的宽与长之比服从正态分布 现从一批产品中随机抽取 20 个 测得其比值如下 0 699 0 749 0 645 0 670 0 612 0 672 0 615 0 606 0 690 0 628 0 668 0 611 0 606 0 609 0 601 0 553 0 570 0 844 0 576 0 933 问在显著性水平下 能否认为其统计平均值为 0 618 05 0 解解 设为这种矩形工艺品框架的宽与长之比 由题意知 其中未 2 1 N 2 知 作统计假设 618 0 618 0 100 HH 选取统计量 1 1 0 nt nS T n 对于给定的显著性水平 由自由度以及05 0 191201 nf 1 2 1 0 ntTPH 查 t 分布数值表可确定临界值 于是拒绝域为 0930 2 19 975 0 t 0930 2 tC 4 将实测样本值带入统计量中 x1 x2 x20 T 中计算 可算得 于是 T 的实测值0909375 0 65785 0 n sx C n s ux t n 91 1 190909375 0 618 0 65785 0 1 0 故不拒绝 H0 即可认为这种矩形工艺品框架的宽与长之比的统计平 均值为 0 618 2 一个正态总体方差未知时数学期望的单侧显著性检验 设总体 其中 2 未知 在实际问题中 还经常遇到右 2 uN 侧检验和左侧检验问题 1 右侧检验 统计假设为 0100 uuHuuH 或 0100 uuHuuH 其中的 0 u 为已知常数 1 对于的情形 当为H0真时 u 的无偏估计量的观测值应 0100 uuHuuH 该比较集中的分布在 u0的附近而偏左侧 若比较大 就应该认为H0当为真时小概 0 ux 率事件发生了 故拒绝H0 注意到是假设检验犯第一类错误的最大概率 0比较大 u 即 为真拒绝 00 H HP 于是取 00 为真HuP 其中为适当大的正数 上式可改写为 11 0 0 nsns u P nn H 由 2 2 费希尔定理推论 1 知 当为真时 可取统计量 4 2 20 1 1 0 nt ns u T n 于是上式又可呈现为 1 1 1 0 0 nt ns u P n H 因此得拒绝域 4 2 21 1 1 1 0 nt ns ux C n 20 对于的情形 当为 H0真时 有 0100 uuHuuH 11 0 ns u ns u nn 于是 1 1 1 1 1 0 1 nt ns ux nt ns ux nn 由总体知 所以有 2 uN 1 1 0 nt ns u T n 4 2 22 1 1 1 1 0 1 00 nt ns u PntTP n HH 这表明更是一个当 H0为真时的小概率事件 因 1 1 1 0 nt ns u n 此得拒绝域仍为 4 2 21 2 左侧检验 统计假设为 0100 uuHuuH 或 0100 uuHuuH 防情形 1 的讨论 可得此时的拒绝域为 4 2 23 1 1 1 0 nt ns ux C n 例例 6 某课题胭脂出一中新安眠剂 经临床实验报告 在一定剂量 下能比某种旧安眠剂平均增加睡眠 3h 根据有关资料分析 用旧安 眠剂平均睡眠时间为 20 8h 均方差为 1 8h 为检验新安眠剂的报告 是否正确 从一批使用新安眠剂的人中随机抽取 7 人测的睡眠时间 单位 h 如下 26 7 22 0 24 1 21 0 27 2 25 0 23 4 试在显著性水平下检验新安眠剂是否达到规定疗效 10 0 解解 设 为服用新安眠剂的睡眠时间 由林的贝尔格中心极限定 理 可以认为 其中 2 未知 2 uN 1 作统计假设 8 23 8 233 8 20 100 uHuuH 2 选取统计量 1 1 1 0 nt ns u T n 3 给定显著性水平 由自由度 f 7 1 6 以及10 0 1 1 0 ntTPH 查 t 分布数值表可确定临界值 于是拒绝域为 4398 1 6 90 0 t 43981 tc 4 将实验样本值 代入统计量中计算 可算得于 721 xxx T 1254 2 2 24 n sx 是 T 的实验值 故不拒绝原假设 即可认c ns x t n 461 0 6 1254 2 8 23 2 24 1 0 o H 为新安眠剂已达到规定疗效 3 两个正态总体方差未知但相等时数学期望比较的双侧显著性检验 设总体 其中 服从 2 1 N 服从 2 2 N 由费希尔定理推论 3 210 2 21 均未知 为检验与 H 211 H 知当原假设为真时 可选取统计量 0 H 其中是取自总体 2 11 2n 21 21 1121 2 2 2 2 1 1 ss nnt nnn T nn 1 2 1 s n 与 是取自总体 2 s 2 2 n121 n 与 的均值与方差 的样本 的均值与方差 且样本 与 的样本 221 n 121 n 相互独立 与洗钱的方法步骤同前 221 n 例 7 4 1 例 2 给定显著性水平 05 0 解 设分别为某灯泡厂甲 乙两条流水线生产的同一种灯管的使用寿命 由题意知 其中未知 服从 2 1 N 服从 2 2 N 2 1 作统计假设 210 H 211 H 2 选取统计量 2 11 2n 21 21 1121 2 2n 2 2 1n 1 ss nnt nnn T 3 对于给定显著性水平 由自由度 f 05 0 以及882 50402 21 2 p 21 2 1 0 tT H 查 t 分布为数值表可确定临界值 正态分布 故分布的极限分布是标准实际上 88 975 0 ntt96 1 u 88 975 0 975 0 t 于是得拒绝域 96 1 tc 将实测样本值代入统计量 T 中计算 可得70 1 1585 40 1 1 s n xn 80 2 1540 50 2 2 s n yn t 1121 2 2n 2 2 1n 1 11 2n 21 ss nnn yx C 77 2 50 1 40 1 25040 80507040 15401585 22 故拒绝 H0 即认为甲 乙两条流水线生产的灯管寿命有显著差异 例 8 为了研究饮酒对工作能力的影响问题 一课题小组对某工厂任选 19 个工人分成两组 其中一组 10 人工作钱饮一杯酒 另一小组 9 人工作前不饮酒 让她们做一件同样的工作 测得所需时间如下 饮酒者 30 46 51 34 48 45 39 61 58 67 未饮酒者 28 22 55 45 39 35 42 38 20 设在显著性水平下检验饮酒对工作能力是否有显著影响 05 0 解 设分别为对饮酒者 未饮酒者做一件同样工
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024四川雅安市市属国有企业高级管理人员8人笔试参考题库附带答案详解
- 初中物理人教版(2024)八年级上册(2024)第3节 汽化和液化教案配套
- 发票勾选平台培训
- 2024华电江西发电有限公司所属企业面向系统内外公开招聘4人笔试参考题库附带答案详解
- 2024北京飞机维修工程有限公司市场化人才招聘笔试参考题库附带答案详解
- 人教部编版 (五四制)一年级下册13 荷叶圆圆教案设计
- 冀教版一年级下册五 100以内的加法和减法(一)教案设计
- 人音版八年级上册老鼠娶亲教学设计
- 服装入门培训课件
- 三年级英语上册 Unit 1 School and Numbers Lesson 2 Boy Girl and Teacher教学设计 冀教版(三起)
- 2023年-2024年电子物证专业考试复习题库(含答案)
- 新能源汽车发展现状参考文献
- 春季行车安全注意事项春季行车安全教育
- 焊接工序首件检验记录表
- 注塑工艺监控记录表
- WORD文档标题格式模板(五级标题)
- “四会”教学基本概述
- 延续证书承诺书格式
- 高金英讲座完整版
- 技术创新的内涵与核心
- 高考历史考点命题双向细目表(很实用)
评论
0/150
提交评论