t检验与均值比较_第1页
t检验与均值比较_第2页
t检验与均值比较_第3页
t检验与均值比较_第4页
t检验与均值比较_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

t检验与均值比较ProcessImprovementMethodology介绍t检验并演示其在比较样本均值中的作用介绍几种不同检验方法的均值/中位数检验的基本概念目标分析根源分析多级Pareto排列图

5Why图辨认浪费多变量研究

ANOVA相关性与回归

DMAIC流程 分析根源分析多级Pareto排列图

5Why图辨认浪费多变量研究

ANOVA相关性与回归控制错误防范及实施SPC更新控制计划更新所有文件交还给流程拥有者定义识别差异建立范围及边界指派黑带及项目团队建立项目定义表测量

0级及价值流图确定基线实施能力起始流程能力研究流程能力起始控制计划详细流程图测量系统分析(MSA)因果矩阵C&EMatrix失效模式分析FMEA

统计检验在假设检验部分,我们讨论了组间的比较我们想到看看是否有显著的统计证据来拒绝零假设因此我们采集数据,但我们如何检验数据呢?根据我们比较的要素和数据类型,有多种不同的检验方法这里我们着眼于输出变量为连续数据,输入变量为离散数据的检验

分析路线图:我们将讲授的是什么X数据单一X多个XY数据单一Y多个YX数据离散连续Y数据离散连续

t-检验/ANOVA均值中位数检验X数据e离散连续Y数据离散连续卡方检验回归多元回归中位数检验多元ANOVA你怎样做判别?样本#Bob Jane1 23.2 24.22 22.2 23.23 24.3 24.84 22.1 22.75 25.9 25.3数据主管希望知道两个操作员在喷漆过程中其喷射的油漆是否明显不一样T检验/ANOVA均值/中位数检验对2个层次的X进行比较对>=3个层次X进行比较对1个层次的X进行比较1个层次的样本实例有20个Bob喷漆样本2个层次的样本实例

有20个Bob&Jane喷漆样本3个层次的样本实例

有20个Bob,Jane,和Walt喷漆样本路线图中的分析步骤研究稳定性(若适用)研究形状研究离散研究集中研究稳定性(若适用)研究形状研究离散研究集中研究稳定性(若适用)研究形状研究离散研究集中或

路线图中的分析步骤我们将在ANOVA中覆盖它t-检验/ANOVA均值/中位数检验对1个层次的X进行比较对3个层次的X进行比较对1个层次的X进行比较注意:

只有1组(X有一个层次),我们讨论的是将我们的样本与某个目标值进行比较

(例:=25或可能=2)1个层次的例子有20个Bob喷漆样本他喷射的是特定层次的漆量吗?(假设值为密耳厚度)?

路线图中的分析步骤研究稳定性(若适用)研究形状研究离散研究集中或t-检验/ANOVA均值/中位数检验对1个层次的X进行比较但要先等等!!在我们比较事物之前,我们是否应该指出我们需要多少个用于确定是否真正存在差别的数据点?回忆一下我们对假设检验的讨论我们需要根据一些因子来确定判别统计差所需的测量数。样本均值样本标准差Delta(我们感兴趣的漂移或自由度)风险水平

样本量adsx

样本量计算回到Bob我们想要看看Bob的油漆厚度是目标值,因为我们怀疑它们超出了目标值。记住目标均值=25为了了解Bob的结果样本均值是否与目标值有明显的差别,我们需要一些额外的信息:

值(历史日常记录厚度数据的标准差为0.25)可接受的a风险即当它不同时,得出Bob的样本均值真的与不同这一结论的机率)。该风险还称为显著水平,它相当于1置信水平。让我们使用a=0.05可接受的b

风险(即当它真的相同时,得出不存在差别的机率).检验的权重为1-b。让我们使用b=0.201个样本t检验零假设(H0):Bob的厚度均值低于或等于目标值替代假设(Ha):Bob的厚度均值高于目标值

假设

所需的样本量需要什么样的样本量N用于区别两个假设?根据已知信息,我们有:显著水平,a=0.05指数Power=1-b=1-0.20=0.80可侦测的均值自由度

,

d=25.1-25.0=0.1测量厚度的标准差,

s=0.25

计算样本量假设测量厚度值是正态分布的,,,和N这5个变量间的关系可用下式表示:注意,若我们知道5个变量中任何4个,我们就能够计算出第5个变量。利用Minitab,我们就要说明怎样计算样本量和统计权重:样本量=N统计指数Power=1-

Minitab样本量计算利用Minitab

1.输入权重,1-b

2.输入增量,d

4.选择替代假设

3.输入sigma,5.输入显著水平,a指数Power和样本量1-样本t检验检验均值=null(versus>null)计算mean均值的权重=null+differenceAlpha=0.05假设的标准差=0.25差样本量Power目标指数Power实际指数0.1410.80.808582Minitab告诉我们,我们需要从Bob处测量的值的样本量为41(所需Power指数为0.80),以确保我们能够确定Bob的总体均值不会比目标值大0.1以上。(注意:N=41实际给出的权重为0.8086)Minitab输出打开Minitab项目文件

t-Test.mpj

和工作表

1Samplet.mtw

路线图中的分析步骤——1个样本研究稳定性(若适用)研究形状研究离散研究集中OR对1个层次X进行比较

1Samplet.mtw

Bob 25.2969 26.0578 24.0700 24.8199 25.9851 25.3572 ...

路线图中的分析步骤——1个样本对1个层次X进行比较研究稳定性(若适用)SPC表I-MR是否有任何明显的倾向或模式表明该数据并非来自一个总体/序列?Minitab寻找或寻问什么

路线图中的分析步骤——1个样本

Minitab命令:I-MR图是否有任何明显的倾向或模式表明该数据并非只来自一个总体/序列?

I-MR图对1个层次X进行比较研究稳定性(若适用)SPC表I-MR是否有任何明显的倾向或模式表明该数据并非只来自一个总体/序列?Minitab寻找或寻问什么研究形状描述统计图和标准检验数据是正态的吗?小P值(<0.5)表示数据是非正态的。注意样本量问题

路线图中的分析步骤——1个样本1) 直方图

数据分布是钟形的吗?2) 正态图

数据图是直线吗?3) 正态检验的值 p值>.05吗?

正态性3种检查它的方法

Minitab命令描述统计量数据是正态的吗?数据产生小p值(<0.5)表示是非正态的

注意样本量问题数据分布是钟形的吗?数据是正态的吗?

Minitab输出

Minitab命令正态检验数据图形是直线吗?数据是正态的吗?

Minitab输出P值是什么?它是假设检验的一部分。 Ho: 数据是正态的 Ha: 数据是非正态的P表示当Ho为真时获得此类数据的概率大多数情况下,当p低于.05时我们拒绝Ho

Minitab输出:p值发现p值的另一个地方

Minitab输出:p值SPCChartI-MR是否有任何明显的倾向或模式表明该数据并非只来自一个总体/序列?Minitab寻找或寻问什么描述统计图和正态检验数据是正态的吗?小P值(<0.5)表示数据是非正态的。注意样本量问题

路线图中的分析步骤——1个样本研究稳定性(若适用)研究形状研究离散研究集中或对1个层次X进行比较正态的非正态的均值检验1样本T检验1样本Z检验例:(Ho:均值=25.00)Z-或rt-检验(ifn>25)变成正态的或使用Z-检验非参数检验1-样本WilcoxonSigned-Rank例:(Ho:中值=25)P值<.05真正的均值(或中值)并不等于特定的值路线图中的分析步骤——1个样本研究稳定性(若适用)研究形状研究集中对1个层次X进行比较SPCChartI-MR是否有任何明显的倾向或模式表明该数据并非只来自一个总体/序列?Minitab寻找或寻问什么描述统计图和正态检验数据是正态的吗?小P值(<0.5)表示数据是非正态的。注意样本量问题

t检验当我们将样本均值与感兴趣特定值(目标值)或其它样本均值时,我们可使用t检验。这种检验通过利用两个样本均值或样本均值和目标值得出一个t值。通过计算确定t值后再与参照分布(t分布)进行比较,以确定所计算的t值落在该分布的何处。若计算的t值落在参照分布的尾部,这表示该样本结果不太可能是随机出现的,且零假设被拒绝。t检验:t值的计算将样本均值与特定的目标值进行比较该结果与自由度为n-1的t分布进行比较。若该结果高于t值(相当于为该检验所选的显示水平(α)),拒绝零假设。Minitab做计算并进行比较。之后给出相应的p值,我们可以根据它做判断。t检验——t值的计算:

(“为什么我们这么有幸拥有Minitab呀”)比较两个样本均值当两个总体标准差假设是相等时使用该方程。计算结果与自由度为n1+n2-2的t分布进行比较。当两个总体标准差假设是不相等时使用该方程。计算结果与t分布进行比较,其自由度由计算而得,如左图所示。在这两种情况下,若该结果高于t值(相当于为该检验所选的显示水平(α)),拒绝零假设。Minitab做计算并进行比较。之后给出相应的p值,我们可以根据它做判断。

t值和p值t分布实际上是一种分布族。该族中每种分布的形状由总体选出的样本量决定。对于大样本量,t分布和正态分布实际上是相同的。t值是一个从适当的t分布中得出的值,每个t值对应于一个相关的概率(p值)。该概率(p值)表示若零假设为真时获得t值的机会。例:

t值为-1.97的相关p值为.085表示若零假设为真,则你的数据可为你计算出-1.97的t值的概率为0.08(8.5%)。这是相当小的概率,因此肯定要怀疑零假设的真实性。临界p值(用于判定零假设是否可以确定为假且被拒绝)的范围通常为0.05-0.10。

t检验参照分布被分成一个接受区和一个或两个拒绝区。区域间边界的位置由t检验所选用的α值和样本量决定。

若值为0.05,样本量为30,则边界位于-2.045和+2.045处,如上图中所示标为“理论统计量”的地方。这些就是临界t值。

α=0.05n=30临界t值=+/-2.045

t=0

t=-2.045

t=+2.045若所计算的值落在拒绝区,则拒绝零假设。计算的值要落在拒绝区,则其值必须小于-2.045或大于+2.045。

若所计算的值落在接受区,则接受零假设。计算的值要落在接受区,则其值必须在-2.045和+2.045之间。

t=0

t=-2.045

t=+2.045

t检验

t检验的解释对t检验进行解释要以t值和p值为基础,而且通常是以下几种形式的一种:第一种情况:根据数据,我认为我的样本均值与零假设中的值差别太大而不会单独随机出现,因此应拒绝零假设。存在这样一个概率,即结论可能是错的。这种不正确结论的概率等于p值。第二种情况:根据数据,我认为我的样本均值会因单独随机出现而与零假设中的值有差别,因此不应拒绝零假设。这种情况下的p值大于0.05-0.10

两种类型的t检验双尾检验当同时研究样本均值与零假设中的值间的正负差时使用。例:比较一部焊接机器的两种支架。我们不知道哪个更好,但我们希望找出差别,如果真的存在的话。单尾检验当只研究样本均值与零假设中的值间单方面差时使用。例新的支架应提供比老支架焊接起来更坚固。单尾检验比双尾检验有效。双尾检验t=1.96t=-1.96对于=.05

双尾t检验双尾检验在分布中的两个尾部都存在拒绝区。零假设将只有一个等号(例如:μ=25)。替代假设应为μ=25。右尾(上尾)检验t=-1.645t=1.645左尾(下尾)检验对于=.05

单尾检验单尾检验只有一个拒绝工,不是在分布的上尾就是在其下尾。若我们对样本均值和一个特定值(如25)进行比较,则其零假设和替代假设将会如下图所示。

Bob25.296926.057824.070024.819925.985125.3572…. 回到我们的例子和Minitab一个实际的问题:Bob喷的漆满足特定的25密耳厚度吗,或是他超出25密耳了吗?

路线图的分析步骤对于单个样本

Minitab——1个样本t检验1个样本T:Bob检验mu=25vs>2595%

变量N均值标准差SE均值下限TPBob4124.79110.91070.142224.5516-1.470.925H0:Bob的均值</=25 我们做出的判断是什么?Ha:Bob的均值>25一个P值!

Minitab输出零假设值在这个范围内吗?

Minitab:回答该问题的另一方法Ho:Bob的中值</=25Ha:Bob的中值>25

若p小,拒绝Ho1个样本情况:中位数检验WilcoxonSignedRank检验中位数检验=25.00versus中值>25.00Wilcoxon

N检验的N统计量P估计的中值Bob4141347.00.86224.81另外一个P值!Minitab分析我们做的判断是什么?描术统计量假设S在区间内吗?只有当数据是正态的这种检验才是合法的。

路线图中的分析步骤——1个样本Minitab寻找或寻问什么研究离散趋势对1个层次X进行比较研究稳定性(若适用)研究形状研究集中趋势SPCChartI-MR是否有任何明显的倾向或模式表明该数据并非只来自一个总体/序列?描述统计图和正态检验数据是正态的吗?小P值(<0.5)表示数据是非正态的。注意样本量问题实际问题:Bob的离散趋势(标准差)小于1.0吗?它小于1.5吗?

路线图中的分析步骤——1个样本

Bob25.296926.057824.070024.819925.985125.3572….

Minitab输出我们做的判断是什么?

路线图中的分析步骤——2个样本研究稳定性(若适用)研究形状研究离散研究集中或对1个层次X进行比较研究稳定性(若适用)研究形状研究离散研究集中t-检验/ANOVA均值/中位数检验对2个层次X进行比较注意:

当X有2个层次时,我们要从一个层次到其它层次对X的某方面进行比较。2层次的例子 Bob和Jane喷漆的风格一样吗?

路线图中的分析步骤——2个样本研究稳定性(若适用)研究形状研究离散研究集中t-检验/ANOVA均值/中位数检验对2个层次X进行比较打开工作表2Samplet.mtw

路线图中的分析步骤——2个样本研究稳定性(若适用)研究形状研究离散研究集中对2个层次X进行比较

Bob Jane25.2969 26.005626.0578 25.940024.0700 26.006324.8199 26.435625.9851 25.992724.6902 23.696125.9337 25.676425.1005 24.5723 … ...实际问题:怎样比较Bob和Jane的喷漆能力呢?

路线图中的分析步骤——2个样本

先确定样本量!让我们假设由于日程和变动的问题我们只能获得Jane操作的30个数据。30个值够吗?用30个值进行检验的权数会是什么?我们能够研究其他的权数和样本量吗?我们将很快回答这些问题。零假设(Ho):Jane的厚度均值与Bob的均值相同替代假设(Ha):Jane的厚度均值与Bob的均值不同(或高或低)

假设

所需的样本量两个假设间需要选择的样本量是什么?为了回答这样问题,我们将使用以下值:显著水平,a=0.05指数Power=1-b=0.80所研究均值间的差,d=0.1标准差,s=0.25替代假设(Ha):Jane的厚度均值与Bob的均值不相等。

用于比较2个均值的样本量利用Minitab

1.输入权重,1-b

2.输入d

4.选择替代假设

3.输入5.输入a权重与样本量2-样本t检验检验

均值1=均值2(反之不=)计算均值1的权重=均值2+差Alpha=0.05假设的标准差=0.25

差样本量目标权重实际权重0.11000.80.803648该样本量用于所有的组。Minitab告诉我们,我们需要从Bob和Jane得到100个样本(所需权重为0.80),以保确保我们能够区分他们均值0.1密耳以内的差别。(注意:N=100实际给定的权重为0.8036)Minitab输出

样本量权重计算我们还可以利用Minitab中的样本量计算器确定从特定样本量中得出的权重。

Minitab输出这里我们看到,当样本量为30时我们检验的权重只有0.3315。这相当于0.6685的b值这还不足以用于可靠地区分两个操作员均值——需要更多的数据!权重与样本量2个样本t检验检验均值1=均值2(反之不=)计算均值1的权重=均值2+差Alpha=0.05假高的标准差=0.25差样本量权重0.1300.331522该样本量用于所有的组。

路线图中的分析步骤——2个样本研究稳定性(若适用)研究形状对2个层次X进行比较Minitab寻找或寻问什么SPC表I-MR是否有任何明显的倾向或模式表明该数据并非只来自一个总体/序列?描述统计图和正态检验数据是正态的吗?小P值(<0.5)表示数据是非正态的。注意样本量问题

对X的每个层次进行检验我们做的判断是什么?我们做的判断是什么?Bob的新数据对X的每个层次进行检验我们做的判断是什么?我们做的判断是什么?Jane的新数据

Minitab输出描述统计量:Bob,Jane变量N均值SE均值Tr均值标准差最小值Q1中值Q3Bob10024.8110.097724.8080.97721.85224.09924.86925.423Jane10025.4490.099025.4640.99022.29624.77425.54626.042变量最大值Bob27.826Jane27.677

对X的每个层次进行检验对X的每个层次进行检验

路线图中的分析步骤——2个样本叠加数据&对相同方差进行检验Levene’s检验

Ho:

2A=2BBartlett检验(F-检验)Ho:

2A=2B正态的非正态的小P值(<.05)表示方差不相等研究离散研究稳定性(若适用)研究形状对2个层次X进行比较Minitab寻找或寻问什么SPC表I-MR是否有任何明显的倾向或模式表明该数据并非只来自一个总体/序列?描述统计图和正态检验数据是正态的吗?小P值(<0.5)表示数据是非正态的。注意样本量问题

Minitab——叠加数据

Minitab——叠加数据

Minitab:相等方差检验Ho:(Bob)=(Jane)Ha:(Bob)=(Jane)

Minitab:相等方差检验我们做的判断是什么?P值方差相等方差不相等若N>25ANOVA若t(或变换)或Mann-Whitney(中值A=中值B)2个样本t检验,用

假设相等1-向ANOVA

Ho:A=BX若N>252个样本t(或变换)或Mann-Whitney(中值A=中值B)2样本t检验用

假设相等1-向ANOVA Ho:A=B小P值:2个总体的均值不相等小P值(<.05)表示方差不相等

路线图中的分析步骤——2个样本研究集中叠加数据&对相同方差进行检验Levene’s检验

Ho:

2A=2BBartlett检验(F-检验)Ho:

2A=2B正态的非正态的研究离散研究稳定性(若适用)研究形状对2个层次X进行比较Minitab寻找或寻问什么SPC表I-MR是否有任何明显的倾向或模式表明该数据并非只来自一个总体/序列?描述统计图和正态检验数据是正态的吗?小P值(<0.5)表示数据是非正态的。注意样本量问题两个均值的比较有两种方法对两个正态分布的样本数据均值进行比较:两样本t检验单向ANOVA我们将要讨论的是t检验,随后的部分再讨论单向ANOVA

比较两个独立样本的均值为了对Bob的样本均值厚度与Jane的样本均值厚度进行比较,下面一页将显示输入数据的两种方法在C1和C2中分别输入Bob和Jane的数据这被称为“非叠加方法”在C1中输入所有数据,在C2中输入员工姓名Minitab称C2为下标变量首选第二种方法;我们总希望所有输入变量用一列,所有输出变量也用一列让我们用非叠加方法开始吧,随后我们将研究Minitab中的叠加功能Ho:均值(Bob)=均值(Jane)Ha:均值(Bob)=均值(Jane)

Minitab:2样本t检验

两个样本T检验和CI:Bob,JaneBobvsJane的两个样本TN均值标准差SE均值Bob10024.8110.9770.098Jane10025.4490.9900.099差=mu(Bob)-mu(Jane)差的估计值:-0.637940差的95%CI:(-0.912220,-0.363661)差的T检验=0(vsnot=):T值=-4.59P值=0.000DF=198都用集中标准差=0.9835Minitab输出:2样本t检验

一个P值!我们做的判断是什么?Mann-Whitney检验Ho:Bob的中值=Jane的中值Ha:Bob的中值=Jane的中值若p小,拒绝HoMann-Whitney检验我们做的判断是什么?Mann-Whitney检验和CI:Bob,JaneN中值Bob10024.869Jane10025.546ETA1-ETA2的点估计为-0.662ETA1-ETA2的95%CI为(-0.927,-0.377)W=8195.0ETA1=ETA2vsETA1不=ETA2检验的显著水平为0.0000成对比较在一些情况下,观测资料可能是成对的一个普通的例子就是使用相同的样本将我们生产线进行的测量和在实验室的测量进行比较这种方法也可以用于测量系统,研究在一组相同样本设置下是否所有测量员得到的均值相同打开工作表SHOE.mtw,数据来源于鞋子原料检验作为样本的10个男孩儿,我们让每个男孩儿穿一双两只由不同原料做的鞋在此案例中男孩儿被叫做“区组Blocks”,概念将随后讨论

成对比较当我们利用相同的样本比较由在线系统获得的测量值和实验室中获得的测量值时可使用成对比较的方法成对比较用于确定在产品处于特定环境或压力下其性能是否会发生变化。这种方法还可用于测量系统研究,以了解操作员在同一批样本上获得的均值是否相等。UseStat>BasicStatistics>PairedtMinitab将计算MatA&MatB间的增量MATA MATB Delta 13.2 14.0 -0.80000 8.2 8.8 -0.60000 10.9 11.2 -0.30000 14.3 14.2 0.10000 10.7 11.8 -1.10000 6.6 6.4 0.20000 9.5 9.8 -0.30000 10.8 11.3 -0.50000 8.8 9.3 -0.50000 13.3 13.6 -0.30000我们将检验增量的样本均值以确定其是否与0明显不同

成对比较成对T检验和CI:MATA,MATBMATA-MATB的成对T检验N均值标准差SE均值MATA1010.63002.45130.7752MATB1011.04002.51850.7964差10-0.410000

0.3871550.122429均值差的95%CI为:(-0.686954,-0.133046)均值差的T检验=0(vsnot=0):T值=-3.35P值=0.009

成对比较43210-1-2-3-40.40.30.20.10.0T-ValueProbT-Distribution

for

9

Degrees

of

Freedom1%2.5%5%观测值该p值小于5%,因此我们可以说材料

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论