版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、对比试验的重点培训资料 1. 统计基础知识 2. 参数估计 3. 假设检验 4. 对比实验报告编写和练习 课程进程 为什么要学习对比实验 许多的问题需要就某些参数作出接受 或拒绝的决定,这说明是一个假设。 它代表把一个实务的问题演绎成统计 学上的问题。而这个决策过程便称为: Hypothesis Testing 我们把实现假设检验的过程成为对比 实验。 统计学上的测试能为我们就问题作出 客观解说,相比较以前,我们只能作 出主观的解说。这是后续学习内容的 基础。 第一单元 总体(Population):在统计问题中,我们把研究对象的全 体成为总体 个体:构成总体的每个成员称为个体 样本(Samp
2、le):从总体中抽取部分个体所组成的集合称 为样本 样品:样本中的个体称为样品 样本容量:样品的个数称为样本容量,常用n表示 1.1总体和样本 样本 随机样本(Random sample):能够被推广应用于更大的 总体的样本。总体的每个个体有一个已知的(有时 是相等的)机会被包含在该样本中。 简单随机样本(Simple random sample): 1、同一性:样本与总体有同样的分布 2、独立性: 如果给定第一个事件,无论它的结果是什么,第二个 事件的机会都一样。 1.2统计量和抽样分 布 统计量:不含未知参数的样本函数称为统计量。 抽样分布:统计量的分布称为抽样分布。 有序样本: 是从总体
3、X中随机抽取的容量为n的样本,将它们的 观测值从小到大排序,这便是有序样本。 n xxxx,., 321 统计推断过程 统计学的主要任务: 1、研究总体是什么分布? 2、这个总体(即分布)的均值、方差是多少? 样本统计量 例如:样本均值 、方差 总体均值、方差总体均值、方差 抽样 1.2常用统计量 描述中心位置的统计量: 1、众数(mode):一个变量的众数是指出现次数最 多的值,不过它不一定唯一。 2、中位数: 3、均值(mean): n i i xx 1 n 1 为偶数 为奇数 nxxx nxx nn n )1 2 () 2 ( ) 2 1 ( 2 1 1.2常用统 计量 描述数据分散程度
4、的统计量: 1、极差(range): 2、方差(variance) 3、标准差(standard deviation): 4、标准误差(standard error ):是很多不同样本的 均值的标准差。 5、变异系数: )1()( xxR n 2 1 2 1 1 n i i xx n s 2 ss x s Cv 1.3正态分 布 正态分布: xexp x , 2 1 )( 2 2 2 -3-2-10123 ),( 2 N 1.3正态分 布 标准正态分布: 它是特殊的正态分布,服从标准的正态分布的 随机变量记为z,概率密度函数记为(z) 1)(2)( )()()( )(1)( )(1)( aaz
5、P abbzaP aa aazP -3-2-10123 2 2 2 1 )(_) 1 , 0( z ezN 1.3正态分 布 标准正态分布的变换: -3-2-10123 x z -3 -2 -1 0 1 2 3 -3-2-10123 1.3正态分 布 标准正态分布的分位数: 0.975是随机变量z不超过1.96的概率 1.96是标准正态分布N(0,1)的0.975的分位数, 记为z0.975 975. 0)96. 1(zP -3-2-10123 0.975 0.025 1.4常用的抽样分 布 正态样本均值的分布: n NX n X n i i 2 1 , 1 X X 5 x 5 . 2 x 5
6、0 X 50 X 总体分布总体分布 抽样分布抽样分布 1.4常用的抽样分布 t分布: t t 分布与正态分布的比较分布与正态分布的比较 不同自由度的不同自由度的t t分布分布 标准正态分布标准正态分布 1 nt n s X 1.4常用的抽 样分布 F分布:设X1,X2,Xn是来自正态总体N(1,12 ) 的一个样本, Y1,Y2,Yn是来自正态总体 N(2,22 )的一个样本,且相互独立,则: 将F(n-1 , m-1 )称为第一自由度为(n-1),第二自 由度为(m-1)的F分布 1, 1 2 1 2 2 2 2 2 1 2 2 2 1 2 2 2 1 mnF s s s s 1.4常用的抽
7、 样分布 F分布: 第二单元 2.1点估计 点估计的概念(point estimation): 用样本均值估计总体均值 用样本方差估计总体方差 用样本标准差估计总体标准差 ),.,( 321n xxxx X 22 s s 2.2区间估计 区间估计的概念(interval estimate): 置信区间(confidence interval): ,则称这种置信区间为 等尾置信区间。 ),.,( ),.,( 321 321 nUU nLL xxxx xxxx 1)( UL P 2 )()( UL PP 2.2区间估计 置信区间下限值 1 /2/2 x 置信区间上限值 点估计与区间估计的区别: 我
8、是意见是这个值是我是意见是这个值是10, 但误差在但误差在1之间。之间。 2.2区间估计 2.2区间估计 置信水平的概念: 是的置信水平为1-的置信区间。它的 含义是能盖住未知参数的概率为1-。 置信区间量化了数据的不定性。 , UL 2.2区间估计 总体均值置信区间的计算: 已知: 未知: n zx n zx n zx 2 1 2 1 2 1 n s tx n s tx n s tx n nn )1( 2 1 )1( 2 1)1( 2 1 2.2区间估计 2分布: 方差置信区间的计算: 1 1 2 2 2 1 2 2 n XX sn n i i 2 1 2 2 2 1 2 1 2 1 , 1
9、 nn snsn 2.2区间估计 置信区间的长度: 1、大的样本产生较短的区间,小的样本产生较长的 区间。 2、低的置信水平产生较短的区间,高的置信水平产 生较长的区间。 N=100 N=200 N=300 N=400 N=500 Exercise X= X n Distribution of Sampling Averages X X n 研究草莓酱的重量是多少?研究草莓酱的重量是多少? n 答案:答案: = = 9595的置信区间的置信区间 第三单元 3.1假设检验问题 例:草莓酱的净重服从正态分布N(,2), 6月 份从产品中随机抽取50瓶称重的平均重量为180.5克, 5月份从产品中随
10、机抽取50瓶称重的平均重量为179.6 克, ,问从总体上是否重量比原来少了? 1、这不是一个参数估计问题 2、要求对6-5=0作出回答:是与否 3、这类问题被称为统计假设检验问题 估计的主要任务是找参数值等于几; 假设检验的兴趣主要是看参数的值是否等于某个特 别感兴趣的值 3.2定义假设H0和Ha H0 要判断0.9克这个值是否超出了样本变换所能造成的差 异的范围,我们先要问一问在总体均值相等的情况下, 样本均值会发生什么情况,即是否两个均值的差等于 0,在统计学上被称为零假设(null hypothesis) 之所以用零来修饰假设,其原因是假设的内容总是没 有差异或没有改变 0: 560
11、H 3.2定义假设H0和Ha HA 零假设其逻辑上的反面假设是“两个参数有区别”。 这种反面假设称为备择假设(alternative hypothesis)。 当零假设所提问的问题被否定时,备择假设的答案就 是正确的。如果样本数据能证明对于零假设提出的问 题应该否定,那么我们就拒绝(reject)零假设而倾 向于备择假设。 0: 56 A H 3.3怎样回答零假设所提 出的问题 概率:p-值 p-值是当零假设正确时,得到所观测的数据或更极端 的数据的概率,这个概率称为p-值(p-value)。 当p-值小到以至于几乎不可能在零假设正确时出现目 前的观测数据时,我们就拒绝零假设。 p-值越小,拒
12、 绝零假设的理由就越充分。 注意: 有时错误以为p-值与零假设对错的概率有关, 但这是不可能的. p-值指的是关于数据的概率。 p-值告 诉我们在某总体的许多样本中,某一类数据出现的经 常程度。 3.3怎样回答零假设所提 出的问题 假设检验机制: 为了求p-值,统计理论指出要把观测到的0.9这个样本 均值之差变换成标准得分。 标准得分: 0.0 H0 0.0 0.510.9 观测到的差观测到的差 样本均值的差样本均值的差 标准得分标准得分 2.142 p-值0.0347 3.3怎样回答零假设所提 出的问题 假设检验机制: t值等于2.142的概率是0.0347,因此两个样本均值之差 等于0.9
13、的概率也是0.0347 ,换句话说就是如果两总体 均值相等的话,从均值相等的总体中抽取200个样本 两两相减所得之差只有3.47个样本的样本均值相差在 0.9,是小概率(0.05)事件,我们拒绝零假设。 H0 0.0 0.510.9 观测到的差观测到的差 样本均值的差样本均值的差 标准得分标准得分 2.142 p-值0.0347 3.4显著水平 显著水平:我们不是在数据收集完毕之后计算p-值, 而是在收集数据以前就已经确定好的小概率来构造一 个区间。当样本数据落入这个区间时就拒绝零假设。 这个小概率 称为检验的显著水平(significant level), 通常选0.05. 一个检验的显著水
14、平是抽样所得的数据拒绝了本来 是正确的零假设的概率。 拒绝域:当样本数据落入这个区间时就拒绝零假设, 那么这个区间就称为拒绝域。 临界值(critical values):拒绝域的边界所对应的标 准得分的值。对于双边检验,样本统计量的临界值是 两个值。 3.4显著水平 /2 3.5风险(和) True State H0 TrueH0 False Accept H0Correct Decision Type II Error () Decision Reject H0Type I Error () Correct Decision X= X n Distribution of Sampling
15、Averages X X 3.5和的关 系 X= X n Distribution of Sampling Averages X X 你不能同时减你不能同时减 少两类错误少两类错误! ! 3.6假设检验的步骤 1、建立假设 2、数据独立性检查 3、数据正态性检查 4、如为One to One问题进行方差的F检验 5、计算检验统计量 6、给出显著性水平 ,通常 =0.05 7、定出临界值,写出拒绝域 8、判断 案例1 例:草莓酱的净重服从正态分布N (180,22), 5月份随机抽取50罐称 重的平均重量为179.6克,问是否符 合标准? 平均净重: 179.6g 3.7One to Stand
16、ard 的问题 是假设检验的特例: 其中一个 已知 0180: 0180: 5 50 A H H 3.7One to Standard的问题 计算标准得分: 已知时,使用z统计量计算 未知时,使用t统计量计算 双侧问题 n s x t n x z n 1 /2 3.7One to Standard 的问题 单侧左检验 表格值表格值 (临界值临界值) 拒绝范围拒绝范围 无法拒绝无法拒绝HO Ha: (大于大于) 3.7One to Standard 的问题 单侧右检验 拒绝范围拒绝范围 无法拒绝无法拒绝HO 表格值表格值 (临界值临界值) Ha: (小于小于) 3.7One to Standar
17、d的问题 JMP中的操作 172 174 176 178 180 182 184 186 .01.05.10.25.50.75.90.95.99 -3-2-10123 Normal QuantileTest for Normality Shapiro-Wilk W Test W 0.987388 Prob |z| Prob z Prob |t| Prob t Prob t t Test -1.2213 0.2278 0.8861 0.1139 案例2 例:草莓酱的净重服从正态分布N(, 2), 6月份从产品中随机抽取50瓶称重 的平均重量为180.5克, 5月份从产品中随 机抽取50瓶称重的平
18、均重量为179.6克, , 问从总体上是否重量比原来少了? 假设检验的步骤 1、建立假设 2、数据独立性检查 3、数据正态性检查 4、如为One to One问题进行方差的F检验 5、计算检验统计量 6、给出显著性水平 ,通常 =0.05 7、定出临界值,写出拒绝域 8、判断 3.8One to One的问题 建立假设: 0: 0: 65 650 A H H 假设检验的步骤 1、建立假设 2、数据独立性检查 3、数据正态性检查 4、如为One to One问题进行方差的F检验 5、计算检验统计量 6、给出显著性水平 ,通常 =0.05 7、定出临界值,写出拒绝域 8、判断 假设检验的步骤 1、
19、建立假设 2、数据独立性检查 3、数据正态性检查 4、如为One to One问题进行方差的F检验 5、计算检验统计量 6、给出显著性水平 ,通常 =0.05 7、定出临界值,写出拒绝域 8、判断 3.8One to One的问题 Fcrit F检验:检验: 1, 1 2 1 2 2 2 2 2 1 2 2 2 1 2 2 2 1 mnF s s s s 假设检验的步骤 1、建立假设 2、数据独立性检查 3、数据正态性检查 4、如为One to One问题进行方差的F检验 5、计算检验统计量 6、给出显著性水平 ,通常 =0.05 7、定出临界值,写出拒绝域 8、判断 3.8One to On
20、e的问题 相等时t的计算:Sp为s1 ,s2的加权平 均,称为两个样本的联合方差。 2 11 11 21 2 22 2 11 21 21 2 21 nn snsn s nn s xx t p p nn 3.8One to One的问题 不等时t的计算: 1 2 2 2 2 2 1 1 2 1 2 1 2 2 2 2 1 2 1 2 2 2 1 2 1 21 n ns n ns n s n s f n s n s xx t f 3.8One to One的问 题 假设检验的步骤 1、建立假设 2、数据独立性检查 3、数据正态性检查 4、如为One to One问题进行方差的F检验 5、计算检验统计量 6、给出显著性水平 ,通常 =0.05 7、定出临界值,写出拒绝域 8、判断 3.8One to One的问题 /2 假设检验的步骤 1、建立假设 2、数据独立性检查 3、数据正态性检查 4、如为One to One问题进行方差的F检验 5、计算检验统计量 6、给出显著性水平 ,通常 =0.05 7、定出临界值,写出拒绝域 8、判断 3.8One to One的问题 因为因为Prob0.0347|t| 0.0347 Assuming equal variances
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度电梯安全知识竞赛组织与实施合同3篇
- 二零二五版矿山劳务合同范本:矿山安全生产监督协议3篇
- 基于2025年度财务软件系统的定制开发合同3篇
- 2025年度临时安保服务劳务合同实施细则4篇
- 2025年度光伏电站变压器供货与安装服务合同3篇
- 2025年度环保节能照明设备研发与推广合同3篇
- 2024-2025学年高中语文第一课走进汉语的世界3四方异声-普通话和方言练习含解析新人教版选修语言文字应用
- 2025年度水路货物运输货物保险理赔代理合同(GF定制版)
- 2025年校园食堂食品安全追溯原料采购管理服务合同3篇
- 二零二四年在建工业地产转让合同范本3篇
- 英语名著阅读老人与海教学课件(the-old-man-and-the-sea-)
- 学校食品安全知识培训课件
- 全国医学博士英语统一考试词汇表(10000词全) - 打印版
- 最新《会计职业道德》课件
- DB64∕T 1776-2021 水土保持生态监测站点建设与监测技术规范
- 中医院医院等级复评实施方案
- 数学-九宫数独100题(附答案)
- 理正深基坑之钢板桩受力计算
- 学校年级组管理经验
- 10KV高压环网柜(交接)试验
- 未来水电工程建设抽水蓄能电站BIM项目解决方案
评论
0/150
提交评论