西格玛统计学()课件_第1页
西格玛统计学()课件_第2页
西格玛统计学()课件_第3页
西格玛统计学()课件_第4页
西格玛统计学()课件_第5页
已阅读5页,还剩291页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1武汉工程职业技术学院培训中心刘美Tel:86804651Mobile_mail:50421330@统计基础1武汉工程职业技术学院培训中心刘美统计基础2武汉工程职业技术学院一、基本概念二、描述性统计三、数据的图示方法四、统计量与抽样分布五、数据的收集与整理六、参数估计主要内容2武汉工程职业技术学院一、基本概念主要内容3武汉工程职业技术学院一、基本概念(一)基本概念1、统计学(statistics):收集、处理、分析、解释数据并从中得出结论的科学。2、描述统计(descriptivestatistics):研究数据收集、处理和描述的统计学分支。3、推断统计(inferentialstatistics):研究如何用样本数据来推断总体特征的统计学分支。4、总体(population):包含所研究的全部个体(数据)的集合,称为总体。根据所包含的单位数目是否可数可以分为有限总体和无限总体,区分有限总体和无限总体的目的是判别每次抽样是否独立3武汉工程职业技术学院一、基本概念(一)基本概念4武汉工程职业技术学院5、样本(sample):从总体中抽取的一部分元素的集合称为样本。6、样本量(samplesize):构成样本的元素的数目称为样本量或样本容量。7、参数(parameter):用来描述总体特征的概括性数字度量称为参数。参数包括均值、标准差、比例等。一般用希腊字母表示。8、统计量(statistics):用来描述样本特征的概括性数字度量称为统计量。通常用英文字母表示。一、基本概念4武汉工程职业技术学院一、基本概念5武汉工程职业技术学院

二、描述性统计5武汉工程职业技术学院

二、描述性统计6武汉工程职业技术学院二、描述性统计例题:13.计算下列数据的中位值:23,33,35,45,55,56,66,78a.50b.45c.55d.40(4)众数、中位数、均值三者之间的关系众数是一组数据分布的峰值,不受极端值的影响,但缺点是有可能不唯一,适合于分类数据的集中趋势测度值;中位数是一组数据中间位置上的代表值,在数据分布偏斜程度较大时适合作为数值型数据集中趋势的测度值;均值利用了数据的全部信息,当数据对称或接近对称时,应选择均值作为集中趋势的代表值。6武汉工程职业技术学院二、描述性统计例题:13.计算下列数7武汉工程职业技术学院(5)众数、中位数、均值三者之间的关系二、描述性统计对称分布:均值=中位数=众数右偏分布:均值>中位数>众数左偏分布:均值<中位数<众数7武汉工程职业技术学院(5)众数、中位数、均值三者之间的关系8武汉工程职业技术学院例题:一个真正的正态分布,中值,均值和众数之间的关系应该是:a.数值相同b.均值和众数相同,而中值不同c.每一个数值都和其他两个不同d.均值和中值相同,而众数不同二、描述性统计8武汉工程职业技术学院例题:一个真正的正态分布,中值,均值和9武汉工程职业技术学院例题:(CAQ07年考试样题)

28.下表是一个分组样本则其样本均值X近似为:A.50B.54C.62D.64分组区间(35,45](45,55](55,65](65,75]频数3872二、描述性统计9武汉工程职业技术学院例题:(CAQ07年考试样题)分组区间10武汉工程职业技术学院例题:(CAQ07年考试样题)

44.一批数据的描述性统计量计算结果显示,均值和中位数都是100。这时,在一般情况下可以得到的结论是:A.此分布为对称分布B.此分布为正态分布C.此分布为均匀分布D.以上各结论都不能肯定二、描述性统计10武汉工程职业技术学院例题:(CAQ07年考试样题)二、描11武汉工程职业技术学院2、描述波动情况(离散程度)的度量(1)样本标准差:样本方差的平方根,量纲与变量值相同。(2)样本方差:各变量与其平均值离差平方和的平均数(3)极差:一组数据的最大值与最小值之差二、描述性统计11武汉工程职业技术学院2、描述波动情况(离散程度)的度量二12武汉工程职业技术学院2、离散程度的度量(4)四分位间距IRQ=Q3-Q1标准差最常用,对离散状况有较好的代表性,与样本量关系不密切,但缺点是对异常值敏感;极差与样本量关系密切,对异常值敏感,但计算简单;四分位间距与样本量关系不密切,对异常值不敏感,是所有离散状况度量的统计量中最稳健的。二、描述性统计12武汉工程职业技术学院2、离散程度的度量二、描述性统计13武汉工程职业技术学院例题:(CAQ07年考试样题)26.容易看到,在一个城市中不同收入者的住房面积相差悬殊,分布一般会呈现出严重的右偏倾向。为了调查S市的住房状况,随机抽取了1000个住户,测量了他们的住房面积。在这种情况下,代表一般住房状况的最有代表性的指标应该是:A.样本平均值(Mean)B.去掉一个最高值,去掉一个最低值,然后求平均C.样本众数(Mode),即样本分布中概率最高者。D.样本中位数(Median)二、描述性统计13武汉工程职业技术学院例题:(CAQ07年考试样题)二、描14武汉工程职业技术学院例题:

33.近几年来居民之间收入的差距越来越大,为了解A市B区居民年收入状况,在公安部门户口册的记录中随机抽取了1.2万户居民,记录了他们在2008年的居民年收入数额,下列哪个统计量用于描述该地区居民年收入的差距状况,且受异常值影响最小?A.样本中位数B.样本极差C.样本四分位间距D.样本标准差二、描述性统计14武汉工程职业技术学院例题:二、描述性统计15武汉工程职业技术学院3、偏态与峰态的度量(样本数据)(1)偏态系数(偏度):数据分布不对称性的度量值正偏(右偏)偏态系数为正,负偏(左偏)偏态系数为负(2)峰态系数(峰度):对数据分布峰态的度量值。二、描述性统计15武汉工程职业技术学院3、偏态与峰态的度量(样本数据)二、16武汉工程职业技术学院1、三种不同性质的分布(1)总体分布:总体中各元素的观测值所形成的相对频数分布称为总体分布。(2)样本分布:从总体中抽取一个容量为n的样本,由这n个观测值形成的相对频数分布,称为样本分布。(3)抽样分布:某个样本统计量的抽样分布,从理论上说就是在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布。四、统计量与抽样分布16武汉工程职业技术学院1、三种不同性质的分布四、统计量与抽17武汉工程职业技术学院2、抽样分布的概念样本1样本2样本n新总体n

统计量原总体抽样分布示例三、统计量与抽样分布17武汉工程职业技术学院2、抽样分布的概念样本1样本2样本n18武汉工程职业技术学院3、样本均值的抽样分布定义:在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布称为样本均值的抽样分布。(1)总体服从正态分布时,样本均值服从正态分布,转换为标准正态分布,则:当总体标准差σ已知,样本均值进行标准化转换后,可以得到标准正态分布。三、统计量与抽样分布18武汉工程职业技术学院3、样本均值的抽样分布(1)总体服从19武汉工程职业技术学院(2)当总体标准差未知,用样本标准差S代替总体标准差,样本均值的抽样分布服从自由度为n-1的t分布。即:由于总体标准差σ常常是未知的,因此t统计量常被用来进行有关单个正态总体均值和两个正态总体均值之差等问题的参数估计和假设检验。三、统计量与抽样分布19武汉工程职业技术学院(2)当总体标准差未知,用样本标准差20武汉工程职业技术学院三、统计量与抽样分布20武汉工程职业技术学院三、统计量与抽样分布21武汉工程职业技术学院4、正态样本方差的S2的分布——卡方分布三、统计量与抽样分布21武汉工程职业技术学院4、正态样本方差的S2的分布——卡方22武汉工程职业技术学院卡方分布的概率密度函数在正半轴上呈正偏分布。三、统计量与抽样分布22武汉工程职业技术学院卡方分布的概率密度函数在正半轴上呈正23武汉工程职业技术学院卡方分布的性质:(1)卡方分布的变量值始终为正。(2)卡方分布的形状取决于其自由度n的大小,通常为不对称的右偏分布,但随着自由度的增大逐渐趋于对称。(3)卡方分布的可加性:设X和Y彼此独立,且都服从卡方分布,其自由度分别为n1、n2,若令Z=X+Y,则Z服从自由度n1+n2的卡方分布。(4)若三、统计量与抽样分布23武汉工程职业技术学院卡方分布的性质:三、统计量与抽样分布24武汉工程职业技术学院5、两个独立的正态样本方差之比的分布——F分布三、统计量与抽样分布24武汉工程职业技术学院5、两个独立的正态样本方差之比的分布25武汉工程职业技术学院三、统计量与抽样分布25武汉工程职业技术学院三、统计量与抽样分布26武汉工程职业技术学院(一)数据类型与测量尺度1、数据的类型分为连续型数据和离散型数据。连续性数据(也叫计量值数据),对测量手段要求较高(测量成本较高),但信息量比较丰富,可以比较敏感地反映过程的变化;离散型数据(也叫计数数据),在反映过程变化方面不如连续型数据敏感,往往需要较大的样本量或较长的测量周期才能得出结论。六西格玛项目在收集数据时,应尽量采用连续型数据。2、测量尺度数据包含多少信息取决于测量所使用的尺度。测量的尺度决定了研究这些数据时应使用什么类型的统计分析方法。选定了相应的测量尺度,便确定了所产生的数据类型,也就确定了在项目实施过程中可使用的统计分析方法。四、数据的收集与整理26武汉工程职业技术学院(一)数据类型与测量尺度四、数据的收27武汉工程职业技术学院测量尺度分为四类:定类、定序、定距、定比(1)定类(名义)测量尺度数据是数字形式的名义值。如0=白色,1=非白色。将事物分到唯一的类中,这些类必须是互斥的,而且是完备的。能识别的关系只有“=”和“≠”。(2)定序测量尺度定序变量对可能的取值进行排序。如以“好”、“更好”、“极好”来划分顾客对某种服务的偏好。对定序数据可以进行“计数”和“排序”运算,但不能进行算术平均。四、数据的收集与整理27武汉工程职业技术学院测量尺度分为四类:定类、定序、定距、28武汉工程职业技术学院

四、数据的收集与整理28武汉工程职业技术学院

四、数据的收集与整理29武汉工程职业技术学院(二)抽样方法1、简单随机抽样从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方法称为简单随机抽样。简单随机抽样要满足两个基本条件:等可能性和独立性。常用的随机抽样方法:抽签法、滚球法、计算机模拟、随机数表法四、数据的收集与整理29武汉工程职业技术学院(二)抽样方法四、数据的收集与整理30武汉工程职业技术学院四、数据的收集与整理2、分层抽样在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本,这样的抽样方法称为分层抽样,也称分类抽样。(1)比例分配法。(2)适度分配法。(3)经济分配法。

30武汉工程职业技术学院四、数据的收集与整理2、分层抽样

31武汉工程职业技术学院3、系统抽样先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本,这样的抽样方法称为系统抽样,也称等距抽样或机械抽样。4、整群抽样先将总体划分成若干群,然后在以群为抽样单位从中抽取部分群,在对抽中的各个群中所包含的所有元素进行观察,这样的抽样方法称为整群抽样。四、数据的收集与整理31武汉工程职业技术学院3、系统抽样四、数据的收集与整理32武汉工程职业技术学院1、直方图常用于了解数据的分布情况,容易从图形中看出数据的位置状况、离散程度和分布状况。直方图步骤:从n个样本数据中找出最大值和最小值,计算极差;对样本进行分组,决定组数k和组距d。k的取值范围在7-15之间,d由极差R和组数k来确定,通常d=R/k;确定各组的区间端点a0。a0+d=a1,a1+d=a2,a2+d=a3…形成半开半闭区间:[a0,a1),[a1,a2),[a2,a3)…计算样本落在每个区间的频数ni;绘制图形。练习:以“直方图.MPJ”为例练习绘制直方图。五、数据的图示方法32武汉工程职业技术学院1、直方图五、数据的图示方法33武汉工程职业技术学院五、数据的图示方法33武汉工程职业技术学院五、数据的图示方法34武汉工程职业技术学院2、茎叶图直方图的变种,全部或部分地保留了原始数据的信息。例:对某型号的20辆汽车记录了每加仑汽油各自行驶的里程数,绘制茎叶图。五、数据的图示方法34武汉工程职业技术学院2、茎叶图五、数据的图示方法35武汉工程职业技术学院上四分位数3、数据箱线图箱线图由箱体、上下须触线和星号三部分组成。*中位数下四分位数上限=min(Q3+1.5IRQ,最大值)下限=max(Q1-1.5IRQ,最小值)超过上限,用*表示*低于下限,用*表示五、数据的图示方法35武汉工程职业技术学院上四分位数3、数据箱线图*中位数下四36武汉工程职业技术学院例题:(CAQ07年样题)53.在箱线图(Box-Plot)分析中,已知最小值=-4;Q1=1;Q3=4;最大值=7;则正确的说法是:A.上须触线终点为:7;下须触线终点为:-3.5B.上须触线终点为:8.5;下须触线终点为:-3.5C.上须触线终点为:7;下须触线终点为:-4D.上须触线终点为:8.5;下须触线终点为:-4五、数据的图示方法36武汉工程职业技术学院例题:(CAQ07年样题)五、数据的37武汉工程职业技术学院4、链图也称趋势图。显示任何测量特性随时间变化的图表。分析链图的目的是为了确认所出现的波动模式是由普通因素引起的,还是有特殊因素引起的。链图可用于任何按时间序列组织的、连续尺度测量的数据的图形分析。绘制步骤:(1)依时间顺序画数据折线图;(2)画一条表示中位数的水平线。《六西格玛管理》P162五、数据的图示方法37武汉工程职业技术学院4、链图五、数据的图示方法38武汉工程职业技术学院4、链图可以用链图判断过程是否受到特殊因素的影响:(1)链的长度:指位于中位数同一侧的连续点数目(忽略落在中位数上的点)。(2)链的数目:位于中位线同一侧的连续的点的序列构成一个链。(3)趋势:链图中不应该存在任何异常的连续上升和连续下降的序列。《六西格玛管理》P162五、数据的图示方法38武汉工程职业技术学院4、链图五、数据的图示方法39武汉工程职业技术学院5.饼图饼图在显示属性统计资料的场合中使用最多。圆形中的各个不同大小和颜色的扇形代表不同的属性变量,它们的面积之和构成了一个完整的圆形,即代表所有属性变量的整体。这个特点非常适合体现某个整体的成分构成和各成分之间的对比关系。制作饼图时,首先要画一个圆,其次根据各属性变量出现的頻数占总观测值数n的比率,再计算出扇形度数,然后以扇形度数为依据将圆周分割成一个个扇形,并添加不同的颜色和图例加以区分,最终绘成简单易懂的饼图。五、数据的图示方法

39武汉工程职业技术学院5.饼图五、数据的图示方法

40武汉工程职业技术学院五、数据的图示方法

6.3D散点图散点图是研究成对出现的两组数据之间相关关系的简单图示,它的实现方式相对比较容易,在此介绍更进一步的3D散点图,即可以研究三组数据之间相关关系的三维立体图形。一个数据(X,Y,Z)就是三维空间中的一个点,很多个数据就构成了三维空间中的点集,观察点集的分布状态便可判别三组数据两两之间的相关程度,或是推断其中两组数据对另一组数据的影响程度。40武汉工程职业技术学院五、数据的图示方法

6.3D散点图41武汉工程职业技术学院7、正态概率图正态坐标纸横坐标等间隔,纵坐标按标准正态分布的累积概率标示。(《六西格玛管理》)P164绘图步骤:(1)样本排序;(2)绘制直线:在第k个数据处用修正频率去估计,画直线。(3)把n个点逐一画在正态概率纸上;不同类型数据的正态概率图五、数据的图示方法41武汉工程职业技术学院7、正态概率图五、数据的图示方法42武汉工程职业技术学院五、数据的图示方法(4)目测判断(生成数据检验)。若n个点近似在一直线上,则认为该样本来自某正态总体;若n个点明显有上凸状,则认为该样本呈右偏态分布;若n个点明显有下凸状,则认为该样本呈左偏态分布。42武汉工程职业技术学院五、数据的图示方法(4)目测判断(生43武汉工程职业技术学院五、数据的图示方法8.时间序列图时间序列图是显示观察值随时间变化而不断变化的图形。在自然界和社会领域,客观现象发展变化的差异及其规律性可以通过时间变量反映时,往往会借助时间序列图来展现。时间序列图有两个基本要素:时间要素和观察值要素。前者说明客观现象的观察值所属的时间类型及其长度,后者主要表明客观现象在某一时间点上发展变化的结果和状态。43武汉工程职业技术学院五、数据的图示方法8.时间序列图六、分析A阶段是DMAIC中最难以遇见的阶段。项目团队所使用的方法将在很大程度上取决于所涉及的问题与数据的特点。在这个阶段中,DMAIC团队应该详细研究资料,增强对过程和问题的理解,进而识别问题的原因,使用各分析步骤寻找“问题根源”。有许多调查缺陷原因的有力工具可以使用,有两类不同的分析方法可用于研究问题的真正原因:(1)探索性数据分析。(2)过程分析。44武汉工程职业技术学院六、分析A阶段是DMAIC中最难以遇见的阶段。项45武汉工程职业技术学院所谓参数估计,就是用样本统计量去估计总体参数。定义1:用来估计总体参数的统计量的名称,称为估计量,用符号表示。定义2:用来估计总体参数时计算出来的估计量的具体数值,称为估计值。六、参数估计45武汉工程职业技术学院所谓参数估计,就是用样本统计量去估计46武汉工程职业技术学院1、点估计六、参数估计点估计不能保证每次估计参数时都是无偏的,无法给出对于待估参数的估计的精度可可靠程度的度量。46武汉工程职业技术学院1、点估计六、参数估计点估计不能保证47武汉工程职业技术学院六、参数估计

N为奇数N为偶数

47武汉工程职业技术学院六、参数估计

N为奇数N为偶数

48武汉工程职业技术学院六、参数估计

48武汉工程职业技术学院六、参数估计

49武汉工程职业技术学院六、参数估计

49武汉工程职业技术学院六、参数估计

50武汉工程职业技术学院2、区间估计六、参数估计50武汉工程职业技术学院2、区间估计六、参数估计51武汉工程职业技术学院2、区间估计六、参数估计总体参数的估计区间通常是由样本统计量加减抽样误差而得到的。进行区间估计时,根据样本统计量的抽样分布可以对样本统计量与总体参数的接近程度给出一个概率度量。参数估计是已知样本均值

推断总体均值μ,由于

与μ的距离是对称的,如果某个样本的平均值落在μ的2个标准差范围内,反过来μ也被包括在

以为中心左右2个标准差范围内。也就是说,约有95%的样本均值所构造的2个标准差的区间会包括μ。51武汉工程职业技术学院2、区间估计六、参数估计总体参数的估52武汉工程职业技术学院区间估计68.27%的样本95.45%的样本99.73%的样本六、参数估计52武汉工程职业技术学院区间估计68.27%的样本95.4553武汉工程职业技术学院置信水平:如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率,称为置信水平,或称为置信系数。在构造置信区间时,比较常用的置信水平为90%、95%、99%三种,分别对应显著性水平α为0.1、0.05、0.01。置信区间的宽度随置信系数的增大而增大。参数估计示例(正态分布)参数估计示例(考试成绩)六、参数估计53武汉工程职业技术学院置信水平:如果将构造置信区间的步骤重54武汉工程职业技术学院对参数估计的理解要注意以下几点:(1)如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,那么用该方法构造的区间称为置信水平为95%的置信区间。(2)总体参数的真值是固定的、未知的,而用样本构造的区间则是不固定的。抽取不同样本,得到不同的区间,置信区间是一个随机区间,不是所有的区间都包含总体参数的真值。六、参数估计54武汉工程职业技术学院对参数估计的理解要注意以下几点:六、55武汉工程职业技术学院(3)在实际问题中,进行估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平下的置信区间,该区间是一个特定区间,无法知道是否包含总体参数的真值,只是希望这个区间是大量包含总体参数真值的一个。六、参数估计55武汉工程职业技术学院(3)在实际问题中,进行估计时往往只56武汉工程职业技术学院例题:(CAQ07年样题)94.M车间生产螺钉。为了估计螺钉的长度,从当日成品库中随机抽取25个螺钉,测量了它们的长度,样本均值为22.7mm。并且求出其长度总体均值的95%置信区间为(22.5,22.9)。下述哪些判断是不正确的:A.当日生产的螺钉中,有95%的螺钉之长度落入(22.5,22.9)之内。B.当日任取一个螺钉,其长度以95%的概率落入(22.5,22.9)之内。C.区间(22.5,22.9)覆盖总体均值的概率为95%。D.若再次抽取25个螺钉,样本均值以95%的概率落入(22.5,22.9)之内。六、参数估计56武汉工程职业技术学院例题:(CAQ07年样题)六、参数估57武汉工程职业技术学院3、单正态总体均值的置信区间六、参数估计例:某部门20个月运输费数据,假设数据服从正态分布,求运输费用均值的95%的置信区间。BS_运输费用.MTW(单t和图形化汇总)57武汉工程职业技术学院3、单正态总体均值的置信区间六、参数58武汉工程职业技术学院3、单正态总体均值的置信区间六、参数估计58武汉工程职业技术学院3、单正态总体均值的置信区间六、参数59武汉工程职业技术学院4、单正态总体方差和标准差的置信区间例:某部门20个月运输费数据,假设数据服从正态分布,求运输费用方差和标准差95%的置信区间。BS_运输费用.MTW六、参数估计59武汉工程职业技术学院4、单正态总体方差和标准差的置信区间60武汉工程职业技术学院4、正态样本方差的S2的分布——卡方分布四、统计量与抽样分布60武汉工程职业技术学院4、正态样本方差的S2的分布——卡方61武汉工程职业技术学院5、单正态总体比率的置信区间服从二项分布,当样本量足够大(np>5且np(1-p)>5),且p值适中(0.1<p<0.9),二项分布可用正态分布近似。例:电视台节目收视率调查。2000名调查者中1230名收看,求置信区间。六、参数估计61武汉工程职业技术学院5、单正态总体比率的置信区间服从二项62武汉工程职业技术学院6.2假设检验6.2.1假设检验的基本概念假设:对总体参数的具体数值所作的陈述,称为假设或称统计假设。假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程称为假设检验。备择假设:通常将研究者想收集证据予以支持的假设称为备择假设,或称研究假设,用H1或Ha表示。原假设:通常将研究者想收集证据予以反对的假设称为原假设,或称零假设,用H0表示。62武汉工程职业技术学院6.2假设检验6.2.1假设检验63武汉工程职业技术学院6.2假设检验6.2.1假设检验的基本概念(游戏)例:原来的热轧带肋钢筋生产线生产的钢筋平均抗拉强度为580MPa,标准差为9MPa。经过调整参数后,希望钢筋抗拉强度能有所提高。项目团队实施改进后抽取了25根钢筋,测得钢筋平均抗拉强度为605MPa。问:能否断言钢筋平均抗拉强度确有提高?从此例的问题可以看出,我们希望通过样本观测数据即“抽取了25根钢筋,测得钢筋平均抗拉强度为605MPa”去推断“整批钢筋平均抗拉强度确有提高”。这实际就是典型的假设检验问题:根据所获取的样本运用统计分析方法对总体X的一个假设做出判断。63武汉工程职业技术学院6.2假设检验6.2.1假设检验64武汉工程职业技术学院6.2假设检验统计分析方法运用过程中蕴含的两条基本原理:(1)带有概率性质的反证法原理在上例中,用μ代表总体的钢筋抗拉强度的平均值,是未知的。抽样中得到的是样本均值,目的就是要用样本去推断总体。若μ=580,则认为钢筋抗拉强度的平均值没有提高;若μ>580,则认为钢筋抗拉强度的平均值有提高。64武汉工程职业技术学院6.2假设检验统计分析方法运用过程65武汉工程职业技术学院6.2假设检验统计分析方法运用过程中蕴含的两条基本原理:(1)带有概率性质的反证法原理为此可以建立两个命题,在假设检验中称为假设:原假设(零假设):关于样本所属总体(指参数值)与假设总体(指参数值)之间无差异的假设,记为H0;备择假设(或对立假设):和原假设相反的假设。指的是关于当前样本所属的总体(指参数值)与假设总体(指参数值)有差异的假设,是根据样本信息期待证实的假设,是否定了原假设后应当采取的假设,记为H1。65武汉工程职业技术学院6.2假设检验统计分析方法运用过程66武汉工程职业技术学院6.2假设检验统计分析方法运用过程中蕴含的两条基本原理:(1)带有概率性质的反证法原理H0和H1地位是不对等的,不能随意交换。因而,在一般情况下,H0要取那个在实践中应该受到保护,有足够证据时才能否定的论断或“不证自明”的论断作为原假设。在对参数进行检验时,我们将把相等的、无差别的、等号成立的结论作为原假设,记为H0;将待判定、待证明的、不相等、有差别的结论作为备择假设,设为H1。对于参数检验的问题,原假设一定是“等于”某值,备择假设中永远只可能是“大于”、“小于”或“不等于”这三种情况。66武汉工程职业技术学院6.2假设检验统计分析方法运用过程67武汉工程职业技术学院6.2假设检验(2)小概率事件原理带有概率性质的反证法原理中,所谓的明显不合理情况指的就是竟然出现了小概率事件。按照常识,在假设H0成立的条件下,与大概率事件相比,小概率事件在一次试验中几乎不会发生,如果它发生了,说明最初的假设“H0是成立的”并不正确,因此应该拒绝H0。但与此同时,应该注意的是,在处理假设检验问题时,未考虑特殊情况,虽说小概率事件在一次试验中几乎不会发生,但不等于不会发生,它仍然有发生的可能性。所以,根据小概率事件发生而做出的拒绝H0的判断有犯错误的可能。67武汉工程职业技术学院6.2假设检验(2)小概率事件原理68武汉工程职业技术学院假设检验是先对总体参数提出一个假设值,然后利用样本信息推断这一假设是否成立。μ095%μ095%拒绝原假设不拒绝原假设小概率事件原理:小概率事件在一次试验中是几乎不会发生的。假设检验是利用小概率事件原理,进行反向推断(反证法)6.2假设检验68武汉工程职业技术学院假设检验是先对总体参数提出一个假设值69武汉工程职业技术学院联系假设检验与区间估计都属于推断统计的内容,都是根据样本信息推断总体信息。假设检验与区间估计的联系与区别:区别区间估计是利用大概率原理推断出总体参数的范围,输出是数值(一个区间)。假设检验是以小概率原理为基础,对总体的状况所做出的假设进行判断,输出的是结论(拒绝或不能拒绝)。6.2假设检验69武汉工程职业技术学院联系假设检验与区间估计的联系与区别:70武汉工程职业技术学院6.2.2假设的步骤(1)建立原假设和备择假设;(2)给出犯两类错误的概率α、β;(3)从实际出发确定什么样的差别是有意义的,即确定Δ。(4)根据检验参数的类型和已知条件,选择检验统计量。(5)计算样本量。(6)数据采集。(7)计算检验统计量。(8)使用以下三种方法之一做出是否拒绝原假设的判断。置信区间法:根据样本统计量计算总体参数的置信区间,原假设的参数值未落入置信区间,拒绝原假设,否则不能拒绝原假设。临界值法:将检验统计量的值与拒绝域的临界值相比较,落在拒绝域中拒绝原假设,否则不能拒绝原假设。p值法:由检验统计量计算p值,p值小于α拒绝原假设,否则不能拒绝原假设。6.2假设检验70武汉工程职业技术学院6.2.2假设的步骤6.2假设检71武汉工程职业技术学院(1)建立假设一对假设:原假设(H0

)和备择假设(H1

)H0与H1地位是不对等的假设检验使用了反证法原理——先假定H0是正确的,如果样本观测值出现了与应有的结果明显矛盾的情况,则说明“H0正确”这个假设是错误的,于是拒绝H0

,这是强结论;如果没有出现矛盾的情况,我们不能说接受H0

,只能说没有足够的证据拒绝H0

,这是弱结论。一般情况下,我们把相等的、无差别的的结论作为原假设,所以,等于一定包含在原假设中;备择假设只可能是“大于”、“小于”、“不等于”三种情况。6.2假设检验71武汉工程职业技术学院(1)建立假设一对假设:原假设(H072武汉工程职业技术学院假设检验的基本形式(以均值检验为例)假设双侧检验单侧检验左侧检验右侧检验原假设H0:μ=μ0H0:μ≥μ0H0:μ≤μ0备择假设H1:μ≠μ0H1:μ<μ0H1:μ>μ06.2假设检验72武汉工程职业技术学院假设检验的基本形式(以均值检验为例)73武汉工程职业技术学院6.2假设检验原假设与备择假设建立示例:例1:原来的热轧带肋钢筋生产线生产的钢筋平均抗拉强度为580MPa,标准差为9MPa。经过调整参数后,希望钢筋抗拉强度能有所提高。项目团队实施改进后抽取了25根钢筋,测得钢筋平均抗拉强度为605MPa。问:能否断言钢筋平均抗拉强度确有提高?试建立原假设和备择假设。73武汉工程职业技术学院6.2假设检验原假设与备择假设建立74武汉工程职业技术学院6.2假设检验例2:某厂规定产品必须经过检验合格后才能出厂,其不合格率p0不得超过5%。现从一批产品中随机抽取200个进行检验,发现16个不合格品,问该产批产品能否出厂?试建立原假设和备择假设。74武汉工程职业技术学院6.2假设检验例2:某厂规定产品必75武汉工程职业技术学院样题42.在2010年足球世界杯上,章鱼保罗大显身手,在8次重要的比赛中,它对于胜负的预测全部正确。统计学家怀疑究竟章鱼是偶然猜对还是章鱼真能神机妙算(或另有隐情),需要建立怎样的假设检验?A.进行“单比率”检验,H0:比率p=0.5vsH1:比率p≠0.5B.进行“单比率”检验,H0:比率p=0.5vsH1:比率p<0.5C.进行“单比率”检验,H0:比率p=0.5vsH1:比率p>0.5D.进行“单比率”检验,H0:比率p=0vsH1:比率=175武汉工程职业技术学院样题42.在2010年足球世界杯上,76武汉工程职业技术学院(2)给出犯两类错误的概率α,β假设检验是根据样本做出是否拒绝原假设的决策。我们希望:当原假设成立时,我们没有拒绝它;当原假设不成立时,我们拒绝它。而样本是随机的,我们有可能犯下面两类错误:决策结果实际情况H0正确H0不正确(H1正确)未拒绝H0正确决策,概率为1-α,1-α也称置信水平或置信度。第Ⅱ类错误,也称“取伪”错误,概率为β。拒绝H0第Ⅰ类错误,也称“弃真”错误,概率为α,α也称为显著性水平。正确决策,概率为1-β,1-β称检出力或检出功效。原假设被拒绝时,才可能会犯第Ⅰ类错误;原假设未被拒绝时,可能会犯第Ⅱ类错误。样本量n一定时,α减小,β会增大;α增大,β会减小,只有增大样本量才能同时减小α

和β。6.2假设检验76武汉工程职业技术学院(2)给出犯两类错误的概率α,β假设77武汉工程职业技术学院6.2假设检验(3)确定△要从实际出发确定什么样的差别是有意义的。Δμ0μ177武汉工程职业技术学院6.2假设检验(3)确定△Δμ0μ78武汉工程职业技术学院(4)选择检验统计量,确定统计工具检验统计量类型的选择实际上就是确定统计量抽样分布的形式。基于以下两点:要检验的参数已知条件如,方差已知的单正态总体的均值检验,选择Z统计量,使用“单样本Z”检验。6.2假设检验78武汉工程职业技术学院(4)选择检验统计量,确定统计工具检79武汉工程职业技术学院(5)计算样本量检验问题实际就是判断样本是来源于哪个总体。不同样本量样本均值分布对比图n=1n=256.2假设检验79武汉工程职业技术学院(5)计算样本量不同样本量样本均值分80武汉工程职业技术学院(5)计算样本量样本量的计算公式见蓝皮书P158,例总体标准差已知,单样本Z检验的样本量计算公式:结论:要同时降低犯两类错误的风险,必须增大样本量;总体方差变大,要保持原来的风险,必须增大样本量;拟检查差异变小,必须增大样本量。样本量的大小取决于决策错误的风险、总体标准差的大小、拟检查的差异大小这三个方面的因素。6.2假设检验80武汉工程职业技术学院(5)计算样本量样本量的计算公式见81武汉工程职业技术学院例:假设钢筋抗拉强度服从正态分布,原钢筋平均抗拉强度2000Kg,标准差300kg,调整参数后若平均抗拉强度2150Kg,就认为钢筋抗拉强度是否有所提高。问:判断钢筋抗拉强度是否有所提高需要多大的样本量?1、建立假设H0:μ≤2000H1:μ>20002、确定αβ

α=0.05β=0.13、确定Δ取Δ=2150-2000=150kg因为:Z0.95=1.645Z0.9=1.28,带入公式:4、手动计算样本量:Minitab计算样本量:统计>功效和样本数量>单样本Z6.2假设检验81武汉工程职业技术学院例:假设钢筋抗拉强度服从正态分布,82武汉工程职业技术学院(6)数据采集根据计算的样本量采集样本样本尽可能覆盖各种变异源的波动范围不同批次不同操作人员不同设备不同外部环境......6.2假设检验82武汉工程职业技术学院(6)数据采集根据计算的样本量采集样83武汉工程职业技术学院(7)计算检验统计量检验统计量是根据样本计算得到的,是对样本信息的概括。检验统计量是对总体参数的点估计值,但这个点估计值只有标准化后才能反映样本的点估计值与假设的总体参数相比差多少个抽样标准差。注:我们平时所说的检验统计量就是指标准化的检验统计量。如,方差已知的单正态均值检验,统计量Z的计算:6.2假设检验83武汉工程职业技术学院(7)计算检验统计量检验统计量是根据84武汉工程职业技术学院A:H1:

μ

>μ0B:H1:

μ

<μ0C:H1:μ≠μ0临界值Z0.95=1.645临界值Z0.05=-1.645临界值Z0.975=1.96临界值Z0.025=-1.96(8)判断方法一——临界值法

根据备择假设的类型和α给出临界值,确定拒绝域:6.2假设检验84武汉工程职业技术学院A:H1:μ>μ0B:H1:μ85武汉工程职业技术学院例:假设钢筋抗拉强度服从正态分布,原钢筋平均抗拉强度2000kg,标准差300kg,调整参数后抽取了25根,测得平均抗拉强度2150kg。问:能否断言钢筋平均抗拉强度有所提高?1、临界值Z0.95=1.6452、检验统计量3、Z>Z0.95=1.645

,落入拒绝域,所以拒绝原假设。4、钢筋平均抗拉强度确实有提高。临界值拒绝域H0:μ<=2000H1:μ>20006.2假设检验85武汉工程职业技术学院例:假设钢筋抗拉强度服从正态分布,原86武汉工程职业技术学院(8)判断方法二——置信区间法例:假设钢筋抗拉强度服从正态分布,原钢筋平均抗拉强度2000Kg,标准差300kg,调整参数后抽取了25根,测得平均抗拉强度2150。问:能否断言钢筋平均抗拉强度有所提高?α=0.05(1)求置信区间的下限(2)置信区间的下限2051.3>2000,置信区间中不包含原假设参数2000,所以拒绝原假设。(3)钢筋平均抗拉强度确实有提高。6.2假设检验86武汉工程职业技术学院(8)判断方法二——置信区间法例:假87武汉工程职业技术学院(8)判断方法三——P值p值是概率,是在原假设成立的前提下,出现目前样本状况或对原假设更为不利状况的概率。目前样本状况的信息通过检验统计量体现,对原假设更不利的状况与备择假设的类型有关。所以,P值与检验统计量和备择假设的类型有关。6.2假设检验87武汉工程职业技术学院(8)判断方法三——P值p值是概率,88武汉工程职业技术学院(8)判断方法三——P值法A:H1:

μ

>μ0B:H1:

μ

<μ0C:H1:μ≠μ0ppp/2p/26.2假设检验88武汉工程职业技术学院(8)判断方法三——P值法A:H1:89武汉工程职业技术学院例:假设钢筋抗拉强度服从正态分布,原钢筋平均抗拉强度2000Kg,标准差300kg,调整参数后抽取了25根,测得平均抗拉强度2150。问:能否断言钢筋平均抗拉强度有所提高?假定α=0.05,β=0.2。2、计算检验统计量4、p<α

,所以拒绝原假设。5、钢筋平均抗拉强度确实有提高。1、H0:μ<=2000H1:μ>2000

3、计算p值p6.2假设检验89武汉工程职业技术学院例:假设钢筋抗拉强度服从正态分布,90武汉工程职业技术学院p值与样本量n的关系当样本量n越大时,检验统计量的绝对值就越大,p值就越小,就越有可能拒绝原假设。p值与检验统计量、备择假设类型有关,而检验统计量与样本量n有关,所以p与样本量n有关。6.2假设检验90武汉工程职业技术学院p值与样本量n的关系当样本量n越大时91武汉工程职业技术学院例:某公司生产铝盘,铝盘上镀磁性材料厚度要求为50±5mm,从生产线取20万个数据,均值为50.3mm,标准差1mm,进行假设检验判断该生产线生产是否正常,结果p<0.05,我们能否认为该生产线生产不正常?样本量太小,不能发现差别。样本量太大,则太过灵敏,没有实际意义。样本量很重要的,报告p值的同时,也要报告样本量。6.2假设检验91武汉工程职业技术学院例:某公司生产铝盘,铝盘上镀磁性材料92武汉工程职业技术学院连续数据正态分布或大样本非正态分布小样本且非正态分布均值检验单样本Z单样本t双样本t配对t单因子方差分析方差检验单方差双方差等方差非参数检验离散数据比例检验单比率双比率卡方假设检验正态分布参数检验6.2.3假设检验的类型92武汉工程职业技术学院连续数据正态分布或大样本非正态分布小93武汉工程职业技术学院单总体均值检验(与某一具体值比较)双总体均值差检验配对检验多总体均值检验6.2.4均值检验93武汉工程职业技术学院单总体均值检验(与某一具体值比较)694武汉工程职业技术学院单总体独立性检验正态性检验(小样本)双总体或多总体独立性检验样本内数据独立样本间数据独立正态性检验(小样本)两组或多组数据都服从正态分布等方差检验对均值检验,样本量n≥30时,可以不进行正态性检验。6.2.4均值检验94武汉工程职业技术学院单总体对均值检验,样本量n≥30时,95武汉工程职业技术学院独立性检验样本内数据独立样本量<40统计>质量工具>运行图样本量>40统计>非参数统计>游程检验样本间数据独立统计>基本统计量>相关正态性检验统计>基本统计量>正态性检验等方差检验统计>方差分析>等方差检验6.2.4均值检验95武汉工程职业技术学院独立性检验6.2.4均值检验96武汉工程职业技术学院1.单总体均值检验流程大样本?n>=30总体方差是否已知总体是否服从正态分布总体方差是否已知将样本容量增加到30或非参数检验用样本方差代替用样本方差代替是否是否是否是否单样本Z单样本t或单样本z单样本Z单样本t96武汉工程职业技术学院1.单总体均值检验流程大样本?总体方97武汉工程职业技术学院1.单总体均值检验检验法条件H0H1检验统计量拒绝域Z检验σ已知大样本或正态小样本μ≤μ0μ≥μ0μ=μ0μ>μ0μ<μ0μ≠μ0{Z>Z1-α}{Z<Zα}{|Z|>Z1-α/2}Z检验σ未知大样本μ≤μ0μ≥μ0μ=μ0μ>μ0μ<μ0μ≠μ0{Z>Z1-α}{Z<Zα}{|Z|>Z1-α/2}t检验σ未知正态小样本μ≤μ0μ≥μ0μ=μ0μ>μ0μ<μ0μ≠μ0{t>t1-α(n-1)}{t<tα(n-1)}{|t|>t1-α/2(n-1)}97武汉工程职业技术学院1.单总体均值检验检验法条件H0H198武汉工程职业技术学院例(蓝书P115)抽查面粉的装包重量,其每包重量在正常生产条件下均值为20Kg,标准差为0.1Kg,某日在生产的产品中抽查16包。问当日生产的面粉均值是否正常?(BS_面粉重量.mtw)n<40,需要进行独立性检验。统计>质量工具>运行图正态性检验因为n<30,所以必须进行正态性检验建立假设:H0:μ=20H1:μ≠20σ已知,选用Z统计量:由于备择假设的类型为双边检验,所以拒绝域的形式为:{|Z|>Z1-α/2}因为α=0.05

所以临界值Z0.975=1.96

,拒绝域为:{|Z|>1.96}结论:拒绝原假设,该天面粉均值不正常。1.单总体均值检验98武汉工程职业技术学院例(蓝书P115)抽查面粉的装包重99武汉工程职业技术学院检验聚类性的近似P值<0.05:出现了差别细微的成堆数据。混合的近似P值<0.05:数据中有很多相同的值。检验趋势的近似P值<0.05:有连续上升或下降趋势。检验振动的近似P值<0.05:有在均值附近振动现象。1.单总体均值的检验运行图示例99武汉工程职业技术学院检验聚类性的近似P值<0.05:出现100武汉工程职业技术学院1.单总体均值的检验100武汉工程职业技术学院1.单总体均值的检验101武汉工程职业技术学院例:抽查面粉的装包重量,其每包重量在正常生产条件下均值为20Kg,某日在生产的产品中抽查16包,问当日生产的面粉均值是否正常?(BS_面粉重量.mtw)σ未知,选用t检验统计量,并可根据以下公式求出检验统计量:

由于备择假设的类型为双边检验,所以拒绝域的形式为:{|t|>t1-α/2(n-1)}。t0.975(15)=2.131

,拒绝域为:{|t|>2.131}结论:该天面粉均值不正常。1.单总体均值检验独立性检验(略)正态性检验(略)建立假设:H0:μ=20H1:μ≠20101武汉工程职业技术学院例:抽查面粉的装包重量,102武汉工程职业技术学院2.两总体均值检验流程均值检验独立样本配对样本大样本小样本、正态方差已知方差已知方差未知Z检验方差相等大样本或正态小样本配对T检验方差未知Z检验Z检验方差不等双T检验(勾选等方差)双T检验(不勾选等方差)注:minitab工具中无“双z检验”,所以用“双t检验”代替。102武汉工程职业技术学院2.两总体均值检验流程均值检验独立103武汉工程职业技术学院独立双总体与配对总体的区别两组数据针对两组个体数据无需对应样本观测值彼此不影响两组数据样本量可以不同两组数据是针对一组个体处理前后或两种不同处理的结果样本数据成对出现,一一对应样本数据组间不独立两组数据样本量一定相同独立双总体配对总体103武汉工程职业技术学院独立双总体与配对总体的区别两组数据104武汉工程职业技术学院3.两总体均值差检验检验法条件H0H1检验统计量拒绝域Z检验σ1,σ2已知μ1=μ2μ1=μ2μ1=μ2μ1>μ2μ1<μ2μ1≠μ2{z>z1-α}{z<-z1-α}{|z|>z1-α/2}t检验未知但相等μ1=μ2μ1=μ2μ1=μ2μ1>μ2μ1<μ2μ1≠μ2{t>t1-α(n+m-2)}{t<-t1-α(n+m-2)}{|t|>t1-α/2(n+m-2)}近似t检验σ1,σ2未知且不相等μ1=μ2μ1=μ2μ1=μ2μ1>μ2μ1<μ2μ1≠μ2{t>t1-α(ν)}{t<-t1-α(ν)}{|t|>t1-α/2(ν)}104武汉工程职业技术学院3.两总体均值差检验检验法条件H03.两总体均值差检验检验法条件H0H1检验统计量拒绝域Z检验σ1,σ2已知μ1=μ2μ1=μ2μ1=μ2μ1>μ2μ1<μ2μ1≠μ2{z>z1-α}{z<zα}{|z|>z1-α/2}105武汉工程职业技术学院3.两总体均值差检验检验法条件H0H1检验统计量拒绝域Z检验3.两总体均值差检验106武汉工程职业技术学院检验法条件H0H1检验统计量拒绝域t检验未知但相等μ1=μ2μ1=μ2μ1=μ2μ1>μ2μ1<μ2μ1≠μ2{t>t1-α(n+m-2)}{t<-t1-α(n+m-2)}{|t|>t1-α/2(n+m-2)}3.两总体均值差检验106武汉工程职业技术学院检验法条件H03.两总体均值差检验107武汉工程职业技术学院检验法条件H0H1检验统计量拒绝域近似z检验σ1,σ2未知m,n大样本μ1>μ2μ1<μ2μ1≠μ2{z>z1-α}{z<zα}{|z|>z1-α/2}F检验3.两总体均值差检验107武汉工程职业技术学院检验法条件H0108武汉工程职业技术学院例(蓝书P128)一家冶金公司用氧气取代空气吹入活化泥以改善BOD,在两种处理的废水中,分别抽取样品如下:(BS_生物氧需求量)问:改用氧气是否能显著降低BOD含量?统计>基本统计量>双样本t空气184194158218186218165172191179氧气163185178183171140155179175

p=0.029<0.05拒绝原假设。结论:改用氧气确实能显著减少BOD含量。验证使用双样本t的前提条件:独立,正态,等方差建立假设3.两总体均值差检验108武汉工程职业技术学院例(蓝书P128)一家冶金公司109武汉工程职业技术学院4.配对样本检验配对检验就是利用差值的均值与0进行单总体的假设检验。一般情况下,σ未知,使用单样本t检验。可以先求出差值d,使用“单样本t”检验,也可以直接利用两列原始数据,使用“配对t”检验。109武汉工程职业技术学院4.配对样本检验配对检验就是利用差110武汉工程职业技术学院(红书P240)例6-12:使用A、B两种方法针对同一批矿石中二氧化锰的含量进行测量,结果如下:问:两种分析方法在α=0.05的显著性水平上是否有显著性差异?序号A方法B方法17.26.622.62.439.49.6415.41556.7767.37.375.24.987.97.491.31109.79.61111.110.74.配对样本检验110武汉工程职业技术学院(红书P240)例6-12:使用A111武汉工程职业技术学院方法二:求出差值,使用双样本t检验统计>基本统计量>单样本tP=0.035方法一:使用原始列,使用配对t检验统计>基本统计量>配对tP=0.035

配对t检验注:如果将此问题误当作是普通的双样本均值检验,得到P=0.901,结论为两种分析方法无显著差异。这是因为不同矿物之间的差异(组内差异)很大,掩盖了两种测量方法间的差异(组间差异)。可见,如果将配对观测数据误作为普通两样本数据来分析,很容易犯第二类错误(纳伪)而得不到正确结论。4.配对样本检验111武汉工程职业技术学院方法二:求出差值,使用双样本t检验112武汉工程职业技术学院(1)方差检验的前提条件样本量一般在30以上正态性检验单总体方差检验总体服从正态分布:标准法总体为任何连续分布:调整法双总体方差检验两总体均服从正态分布:F检验总体为任何连续分布:Levene检验多总体等方差检验各总体均服从正态分布:Bartlett’s检验总体为任何连续分布:Levene检验5.方差检验112武汉工程职业技术学院(1)方差检验的前提条件5.方差检113武汉工程职业技术学院方差检验单总体双总体多总体正态?正态?正态?统计>基本统计量>单方差(标准法p值)统计>基本统计量>单方差(调整法p值)统计>基本统计量>双方差(F检验p值)统计>基本统计量>单方差(levene检验p值)统计>方差分析>等方差检验(Bartlett’s检验p值)统计>方差分析>等方差检验(levene检验p值)是是是否否否5.方差检验113武汉工程职业技术学院方差检验单总体双总体多总体正态?正114武汉工程职业技术学院5.方差检验114武汉工程职业技术学院5.方差检验115武汉工程职业技术学院根据备择假设的类型和α给出临界值,确定拒绝域:5.方差检验115武汉工程职业技术学院根据备择假设的类型和α给出临界值,116武汉工程职业技术学院H0H1拒绝域样本量应大于30,若总体服从正态分布,检验统计量5.方差检验116武汉工程职业技术学院H0H1拒绝域样本量应大于30,若117武汉工程职业技术学院例(蓝书P136例题5-12BS_轴杆长度.mtw)已知,轴杆长度原来的标准差σ0=0.1,随机抽取的30根轴杆测量长度,问:轴杆的标准差是否确实有降低?(α=0.05)(1)正态性检验p=0.511(2)建立假设:H0:σ≥0.1H1:σ<0.1

(3)计算检验统计量:(4)由于备择假设的类型为左侧检验,所以拒绝域的形式为:

(5)检验统计量16.45<临界值17.7,落入拒绝域,所以拒绝原假设。(6)结论:轴杆的标准差确实有降低。5.方差检验117武汉工程职业技术学院例(蓝书P136例题5-12118武汉工程职业技术学院如果两总体均服从正态分布,则其方差之比服从F分布:5.方差检验118武汉工程职业技术学院如果两总体均服从正态分布,则其方差119武汉工程职业技术学院根据备择假设的类型和α给出临界值,确定拒绝域:5.方差检验119武汉工程职业技术学院根据备择假设的类型和α给出临界值,120武汉工程职业技术学院H0H1拒绝域拒绝域5.方差检验120武汉工程职业技术学院H0H1拒绝域拒绝域5.方差检验121武汉工程职业技术学院(6)结论:两种不同的方法对BOD含量影响的方差是相等的。(4)由于备择假设的类型为双侧检验,拒绝域的形式为F≤Fα/2(n-1,m-1)或F≥F1-α/2(n-1,m-1)

α=0.05时,Fα/2(9,8)=0.244F1-α/2(9,8)=4.357例(蓝书P139例题5-13BS_生物氧需求量.mtw)已知,空气法抽取的10个样品和氧气法抽取的9个样品BOD含量,问:两种不同的方法对BOD含量影响的方差是否相等?(α=0.05)(1)正态性检验(2)建立假设:H0:σ12=σ22H1:σ12≠σ22

(3)计算检验统计量:(5)检验统计量未落入拒绝域,不能拒绝原假设。5.方差检验121武汉工程职业技术学院(6)结论:两种不同的方法对BOD122武汉工程职业技术学院前面讨论的均值检验和方差检验是针对连续数据,现在讨论的比率检验是针对离散数据。离散型随机变量通常服从二项或泊松分布总体服从二项分布的比率检验单总体比率检验双总体比率检验多总体比率检验总体服从泊松分布的比率检验单总体泊松率检验双总体泊松率检验6.比率检验122武汉工程职业技术学院前面讨论的均值检验和方差检验是针对123武汉工程职业技术学院二项分布的概率函数二项分布的期望及方差二项分布的正态近似假设我们独立地进行n次试验,每次试验的结果只有“成功”和“失败”两种结果,而且每次“试验”获得成功的概率都是固定的常数p,计成功的总次数为随机变量X,则X的分布称为二项分布。记作X~B(n,p)6.比率检验123武汉工程职业技术学院二项分布的概率函数二项分布的期望及124武汉工程职业技术学院6.比率检验124武汉工程职业技术学院6.比率检验125武汉工程职业技术学院这时就可以用近似Z检验对参数p进行检验,检验统计量为:6.比率检验125武汉工程职业技术学院这时就可以用近似Z检验对参数p进行126武汉工程职业技术学院右侧检验:H1:

p

>p

0左侧检验:H1:

p

<p

0双侧检验:H1:p≠p

0根据备择假设的类型和α给出临界值,确定拒绝域:临界值Z0.95=1.645临界值Z0.05=-1.645临界值Z0.975=1.96临界值Z0.025=-1.96临界值绝对值1.966.比率检验126武汉工程职业技术学院右侧检验:H1:p>p0左127武汉工程职业技术学院检验法H0H1检验统计量拒绝域Z检验6.比率检验127武汉工程职业技术学院检验法H0H1检验统计量拒绝域Z128武汉工程职业技术学院例(蓝书P163例题6-1)随机抽取500位小学生进行视力检测,其中310位近视。问:是否可以认为小学生近视比率超过6成?(α=0.05)(1)建立假设H0:π=0.6H1:π>0.6(2)计算检验统计量:因为,所以采用近似Z检验:(3)由于备择假设的类型为右侧检验,拒绝域的形式为Z≥Z1-α

α=0.05时,Z1-α=1.645(4)检验统计量Z=0.913<1.645,未落入拒绝域,不能拒绝原假设。(5)结论:小学生近视比率没有超过6成。6.比率检验128武汉工程职业技术学院例(蓝书P163例题6-1)随机129武汉工程职业技术学院例(蓝书P163例题6-1)随机抽取500位小学生进行视力检测,其中310位近视。问:是否可以认为小学生近视比率超过6成?(α=0.05)解:统计>基本统计量>单比率

P=0.193,不能拒绝原假设。不勾选此项,计算机自动按二项分布精确计算;勾选此项,按正态分布近似计算;一般情况下,不必选此项,除非样本量特别大。6.比率检验129武汉工程职业技术学院例(蓝书P163例题6-1)随机130武汉工程职业技术学院例(蓝书P163例题6-1修改)随机抽取5000位小学生进行视力检测,其中3100位近视。问:是否可以认为小学生近视比率超过6成?(α=0.05)(1)建立假设H0:π=0.6H1:π>0.6(2)计算检验统计量:因为,所以采用近似Z检验(3)由于备择假设的类型为右侧检验,拒绝域的形式为Z≥Z1-α

α=0.05时,Z1-α=1.645(4)检验统计量Z=2.88>1.645,落入拒绝域,拒绝原假设。(5)结论:小学生近视比率超过6成。6.比率检验130武汉工程职业技术学院例(蓝书P163例题6-1修改)随131武汉工程职业技术学院例(蓝书P167例题6-2)分别从两种工艺条件下抽取1500片及1800片芯片,A种工艺条件下有340片一等品,B种工艺条件下有350件一等品。问:A工艺条件下比B工艺条件下有较高的一等品率吗?(α=0.05)(1)建立假设H0:π1=π

2H1:π1>π

2(2)计算检验统计量:因为样本量较大,所以采用近似Z检验(3)由于备择假设的类型为右侧检验,拒绝域的形式为Z≥Z1-α

α=0.05时,Z1-α=1.645(4)检验统计量Z=2.267>1.645,落入拒绝域,拒绝原假设。(5)结论:A工艺条件下比B工艺条件下有较高的一等品率。6.比率检验131武汉工程职业技术学院例(蓝书P167例题6-2)分132武汉工程职业技术学院统计>基本统计量>双比率P=0.012,拒绝原假设。例(蓝书P167例题6-2)分别从两种工艺条件下抽取1500片及1800片芯片,A种工艺条件下有340片一等品,B种工艺条件下有350件一等品。问:A工艺条件下比B工艺条件下有较高的一等品率吗?(α=0.05)一般情况下,不必选此项,除非样本量特别大。6.比率检验132武汉工程职业技术学院统计>基本统计量>双比率133武汉工程职业技术学院例(蓝书P168例题6-3)甲乙两种品牌的手机,访问使用甲品牌的顾客800位,340位满意;访问使用乙

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论