数据分析假设检验_第1页
数据分析假设检验_第2页
数据分析假设检验_第3页
数据分析假设检验_第4页
数据分析假设检验_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

以收集到的数据为根据,对要确认的事实进行判断的方法以及

找出作为判断基准的p-Value的方法。

000营业部的IQC小组每天都要检查合作公司的产品质量。

IQC小组根据产品有没有达到规定的质量要求,判断它是合格品还是不合格品。

即IQC小组必须对以下两个事实中的一个做出判断。

-产品的质量符合要求(是合格品)

-产品质量不符合要求(是不合格品)

还没有确认的两个事实称为假设,分别用0假设和对立假设表示。

(肯定的假设是0假设,否定0假设的是对立假设)

这种情况下,如果按照常理,应在合作公司交上来的部件中抽样本,并将其与预定的规格进行比较。规格和样本的差异大,则为对立假设;差异小,则为0假设。对这些数据进行整理……

换句话说,以样本为根据对0假设的概率进行计算,如果概率大则设定为0假设,概率小则设定为对立假设,这样的一系列判断方法称为假设检验。0假设的概率称为p-Value。

求出p-Value之后需要一个基准来判断它的大小。

这个基准称为显著性水平,一般会选择1%、5%、10%中的一个。

(通常使用5%)。显著性水平的选择跟分析者对0假设的确信程度有关。

如果对0假设很确信,为了尽量使0假设正确,应选择较低的显著性水平。

对0假设不是很确信的时候,为提高对立假设的正确率,应该选择较高的显著性水平。

1/15

对一个平均值的假设检验(已知某样本集合的标准误差率的时候)

确认一下身高的平均值是否为70。

(已知:某样本集合的标准偏差是12)

-0假设:平均身高是70-对立假设:平均身高不是70

Stat->BasicStatistics->1-SampleZ...

亲自操作一下,比较结果

2/15

对一个平均值的假设检验(未知某样本集合的标准偏差的时候)

确认一下身高的平均值是不是70

-0假设:平均身高是70;

-对立假设:平均身高不是70.

Stat->BasicStatistics->

1-Samplet...

亲自操作一下,比较结果

对一个平均值的假设检验(已知某样本集合的标准偏差的时候)

关于OptionMenu……(想更改可信度的时候)

亲自操作一下,比较结果

4/15

对一个平均值的假设检验(已知某样本集合的标准偏差的时候)

关于GraphsMenu……(要在分析同时画图像的时候)

亲自操作一下,比较结果

对两个平均值的假设检验(已知某样本集合的标准偏差的时候)

确认一下男、女的平均身高有没有差异。-0假设:男平均身高=女平均身高-对立假设:男平均身高≠女平均身高

Stat->BasicStatistics->

2-Samplet...

图像和可信度的调整参考前一页。

亲自操作一下,比较结果.

6/15

关于散布差异的假设检验...

确认一下男女的平均身高有没有差异

-0假设:男身高的分散程度=女身高的分散程度

-对立假设:男身高的分散程度≠女身高的分散程度

ANOVA->TestforEqualVariances...

关于男女身高的Boxplot,只能在比较对象是两个的时候得出,

有三个以上对象的时候则不能得出结论。

亲自操作一下,比较结果.

7/15

确认是不是正态分布

确认数据的正态分布

确认一下收集的Pulse是否属于正态分布。.

Stat->BasicStatistics->NormalityTest...

亲自操作一下,比较结果

8/15

非正态分布的正态化

通过确认可以知道练习3的数据不服从正态分布。

这时,适当改变变量可以转换成正态分布。

Stat->ControlCharts->Box-CoxTransformation...

亲自操作一下,比较结果

9/15

对一个比率差异的假设检验

000营业部为了确认A合作企业的6西格马计划的成果,检查了300个样品。结果发现了15个不合格品。

以前A合作公司生产的部件不合格率是15%。

-0假设:不合格率=15%

-对立假设:不合格率≠15%

Stat->BasicStatistics->

1-Proportion...

亲自操作一下,比较结果

10/15

对两个比率差异的假设检验

000营业部为了比较A、B两个生产线的不合格率,收集了相关数据。

结果,A生产线是1000个当中有75个不合格品,B生产线是1500个当中有120个不合格品。

-0假设:A的不合格率=B的不合格率

-对立假设:A的不合格率≠B的不合格率

Stat->BasicStatistics->

2-Proportion...

亲自操作一下,比较结果

11/15

对表(Table)的假设检验

这次说明一下以表的形式整理数据的时使用的分析方法。

检验三个以上比率之间的差异.

000营业部对A、B、C、D四种材料进行了作业性评价,结果如下:

-0假设:不同材料的不合格率一样

-对立假设:不同材料的不合格率不一样

A

B

C

D样本

不合格品

45

43

48

44

5

7

2

6

数据的输入:

把表里的数据如实输入到Worksheet.

Stat->Tables->

Chi-SquareTest...

亲自操作一下,比较结果

12/15

对表(Table)的假设检验

想确认两个变量的独立关系的时候...

000营业部调查了不同性别所喜欢的产品色彩,结果如下:

-0假设:性别与色彩是相互独立的(有关联)

-对立假设:不同材料的不合格率不是相互独立的(有关联)

白色紫色蓝色男

37

41

44

35

72

71

数据的输入:

把表里的数据如实输入到Worksheet

Stat->Tables->Chi-SquareTest...

亲自操作一下,比较结果

13/15

对表(Table)的假设检验

Chi-SquareTest结果的解释方法

假设有一个工厂生产娱乐场使用的骰子。

对完成品进行质量检查的时候,应该怎样检查出合格品和不合格品呢?(除了外观检查)

我们知道在抛掷合格的骰子时,各个数字有1/6的出现概率。

利用这一点判断出合格品和不合格品。

为此,我们掷6000个骰子,把结果记录了下来。

把实际值和预测值相减,如果得出的值大,是不合格品;

如果得出的值小,则可以判定为合格品。

和标准偏差一样,得出的值可能是0,为了避免这一情况,进行平方。

这时,有可能导致得出的值太大,因此可再除以期望值,然后对较实际值和预测值的大小进行比较。

即:根据(实际值-预测值)/预测值的大小做出判断。

预测值实际值实际值和

预测值的差12345610001010101000990-1010001050501000950-501000100111000999-1

14/15

3)对表(TABLE)的假设检验

Chi-SquareTest结果的解释方法

骰子的概率因我们事先已经了解了,

因而能通过简单的计算算出来。

在不知概率的情况下,

如果〈当想要确认两个变数的独立关系时〉,我们将怎么做?

Chi-SquareTest:白色,紫色,

首先考虑一下出现白色的概率。

全部人员数是300名,选择白色的人数72名,

选择白色的概率是72/300。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论