版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章
质量控制的统计方法7.1概率及统计的基本知识
7.1.1概率与统计基本概念
1.随机现象:在一定的环境下进行实验往往会出现不同的结果,而且每一次实验结果都是无法提前预知的,即无法百分之百地确定最终的结果,这种现象就叫做随机现象。
随机现象反映了条件和结果之间的不确定关系,但在大量重复的实验中,却具有一定的统计规律性。随机事件的特征该事件或现象能够在相同的条件下重复进行该事件或现象带来的最终结果不止一个,同时能够事先确定最终结果的所有可能每一次重复发生该事件或现象时,都无法确切预知可能的结果。2.必然事件:在一定的条件下重复进行试验时,有的事件在每次试验中必然会发生,这样的事件叫必然发生的事件,简称必然事件。必然事件发生的概率是1,即P(必然事件)=1(
必然事件:体育运动时消耗卡路里不可能事件:1秒钟跑完100米随机事件:体育运动中肌肉拉伤
3.不可能事件:概率论中把在一定条件下不可能发生的事件叫不可能事件。人们通常用0来表示不可能事件发生的可能性。即:不可能事件的概率为0。但概率为0的事件不一定为不可能事件。例1.指出下列事件是必然事件、不可能事件还是随机事件:(1)某体操运动员将在某次运动会上获得全能冠军;(2)同一门炮向同一目标发射多发炮弹,其中50%的炮弹击中目标;(3)某人给朋友打电话,却忘记了朋友电话号码的最后一位数字,就随意地在键盘上按了一个数字,恰巧是朋友的电话号码;(4)技术非常发达后,不需要任何能量的“永动机”将会出现。解:根据必然事件、不可能事件及随机事件的定义,可知(1)、(2)、(3)是随机事件;(4)是不可能事件。例2指出下列事件是必然事件、不可能事件,还是随机事件。(1)在标准大气压下且温度低于0℃时,冰融化;(2)在常温下,焊锡熔化;(3)掷一枚硬币,出现正面;(4)某地12月12日下雨;(5)如果a>b,那么a-b>0;(6)导体通电后发热;(7)没有水分,种子发芽。解:(5)、(6)是必然事件;(1)、(2)、(7)是不可能事件;
(3)、(4)是随机事件。基本事件:在试验中不能再分的最简单的随机事件,其他事件可以用它们来表示,这样的事件称为基本事件。基本事件空间:所有基本事件构成的集合称为基本事件空间。基本事件空间常用大写希腊字母Ω表示。例如,掷一枚硬币,观察落地后哪一面向上,这个试验的基本事件空间就是集合{正面向上,反面向上}。即
Ω={正面向上,反面向上}。或简记为Ω={正,反}。掷一颗骰子,观察掷出的点数,这个事件的基本事件空间为
Ω={1,2,3,4,5,6}。1、概概率率概率率—又称称机机率率、、或或然然率率或或可可能能性性。。是是对对随随机机事事件件发发生生的的可可能能性性的的度度量量,,范范围围在在[0,1]内。。即即[0,1]内的的任任何何一一个个实实数数可可以以用用来来表表示示一一个个随随机机事事件件发发生生的的可可能能性性的的大大小小。。概率率的的公公理理化化定定义义为为::设设随随机机试试验验M的样样本本空空间间为为Ω,若若按按某某种种方方法法,,对对M的每每一一个个事事件件A赋予予一一个个实实数数P(A),,且且满满足足以以下下公公理理::非负负性性::P(A)≥≥0;规范范性性::P(Ω)=1;可列列((完完全全))可可加加性性::对对于于两两两两互互不不相相容容的的可可列列无无穷穷多多个个事事件件A1,A2,…,An,…有P(A1∪A2∪…∪An∪…)=P(A1)+P(A2)+…+P(An)+…,则则称称实实数数P(A)为为事事件件A的概概率率。。概率率小小案案例例DeweyG.统计计了了约约438,023个英语单单词中各各字母出出现的频频率,发发现各字字母出现现的频率率不同::A:0.0788B:0.0156C:0.0268D:0.0389E:0.1268F:0.0256G:0.0187H:0.0573I:0.0707J:0.0010K:0.0060L:0.0394M:0.0244N:0.0706O:0.0776P:0.0186Q:0.0009R:0.0594S:0.0634T:0.0987U:0.0280V:0.0102W:0.0214X:0.0016Y:0.0202Z:0.0006从中我们们看到字母E出现的频频率最大大而字母Z出现的频频率最小小等等结结果,而而且这些些字母的的频率可可以大致致看成它它们出现现的概率率。对于计算算机键盘盘的设计计和文字字的研究究,这些些结果都都有重要要意义。。概率小案案例投资总具具有一定定风险,,因此在在选择投投资方向向时,计计算其期期望收益益常是可可代考虑虑的决策策方法之之一。现现某人有有10万元现金金,想投投资于某某项目,,预估成成功的机机会为30%,可得利利润8万元,失失败的机机会为70%,将损失失2万元。若若存入银银行,同同期间的的利率为为5%,问是否否应作此此项投资资?以X记投资利利润,则则而存入银银行的利利息为10×5%=0.5(万元)),因此此从期望望收益的的角度看看,应选选择投资资,当然然这里要要冒一定定的风险险。2、统计计统计是指指对某一一现象有有关的数数据的搜搜集、整整理、计计算、分分析、解解释、表表述等活活动。有效的统统计分析析结果能能够反映映某个现现象的规规律,为为后续的的质量控控制活动动提供可可借鉴的的基础。。在数理统统计中,,研究对对象的全全体称为为总体或母体,组成总总体的每每一个元元素称为为个体。从总体中中抽出的的若干个个个体称称为样本,从总体体中抽取取若干样样本的过过程叫做做抽样。所有抽抽取的样样本集合合称为样本空间间。对各个个样本统统计规律律的研究究能够反反映总体体的分布布规律。。比如,我我国每10年会进行行一次全全国人后后普查,,像男女女比例、、各年龄龄段人口口比率、、就业率率、出生生率和死死亡率等等,这可可都是关关系到国国计民生生的大事事。学校要统统计升学学率,班班上要统统计成绩绩和名次次,你自自己爱也也要统计计自己的的总分或或平均成成绩的升升降。企业经营营也需要要进行统统计。没没准什么么时候你你在家里里会突然然接到一一个电话话,原来来是电视视台打来来的,他他们在统统计节目目的收视视率。收收视率越越高,他他们的广广告就卖卖的越贵贵。7.1.2统统计量量样本统计计量是由由样本数数据加工工出来的的,是对对样本数数据进行行分析、、检验的的变量,,反映样样本数量量特征的的函数,,不含任任何未知知数。常常见的样样本统计计量有平平均数、、中位数数、众数数、极差差等。在质量控控制中,,常见的的统计量量有如下下几种形形式:1、表示位位置的统统计量算术平均均数和中位数在质量控控制的过过程中常常常用来来反映产产品质量量特性的的位置效效应。(1)、平均均数数平均数的的几种计计算方法法:①简单的的算术平平均数计计算方法法为:②加权算术术平均数数计算方方法为::③调和平平均数的的计算方方法为::④几何平平均数的的计算方方法:(2)、中位位数数中位数是是数据位位置的代代表值,,不受极极端变量量的影响响。对于于有限个个数据的的中位数数,把所所有数据据按照大大小依次次排列,,就可以以确定中中位数。。中位数的的确定受受到数据据个数奇偶性的影响::数据数量量为奇数时,最中中间的那那个数即即为中位位数;数据数量量为偶数时,计算算最中间间两个数数值的平平均数,,该平均均数即为为中位数数。例1:一组数数据3、7、21、15、56、10,求该组组数据的的中位数数?首先,判判断该组组数据的的个数为为6,是偶数数。其次次,将该该组数据据按照从从小到大大的顺序序排列,,3、7、10、15、21、56.然后,找找到中间间的两个个数,求求均值,,(10+15)/2=12.5.所以,该该组数据据的中位位数为12.5.例2,一组数数据3、7、21、15、56、10、45,求该组组数据的的中位数数?首先,判判断该组组数据的的个数为为7,是奇数数。其次次,将该该组数据据按照从从小到大大的顺序序排列,,3、7、10、15、21、45、56.然后,找找到最中中间的那那个数,,为15.所以,15即为该组组数据的的中位数数。2、表示离离散程度度的统计计量(1)方差是各个数数据与该该组数据据平均数之之差的平方和的的平均数数,是度量量随机变变量与其其均值之之间的离离散程度度,通常常用符号号σ2表示。在数理统统计中,,方差用用来衡量量随机变变量与其其数学期期望值之之间的偏偏离程度度,也就就是随机机变量与与中心值值偏离的的程度。。如果方方差较小小,则整整体数据据的分布布比较集集中,反反之则整整体数据据的分布布比较分分散。(2)离散趋趋势1.平均差2.方差与标准差(2)总体方差与标准差未分组总体数据的方差已分组总体数据的方差:未分组总体数据的标准差:已分组总体数据的标准差(3)样本方差与标准差未分组总体数据的方差已分组总体数据的方差:未分组总体数据的标准差:已分组总体数据的标准差(2)标准准差方差σ2的二次开开方即为为标准差差,记为为σ。在质量量控制制的过过程中中,通通常用用标准准差衡衡量产产品性性能的的波动动。同同方差差一样样,标标准差差σ越小,,产品品性能能的波波动就就相对对较小小,比比较稳稳定。。反之之,产产品性性能的的波动动就相相对较较大,,表现现为不不稳定定状态态。例如,,两名名射击击运动动员,,在10次射击击中,,甲乙乙两名名运动动员射射击技技术的的平均均值都都为8.5环。经经过计计算,,甲的的标准准差为为0.4,乙的的标准准差为为0.7。此时时,应应该选选择甲甲运动动员参参加比比赛。。因为为甲运运动员员的标标准差差σ相对较较小,,就说说明甲甲比乙乙要稳稳定,,波动动较小小。(3)极差差极差是是数据据集合合中最最大值值减去去最小小值的的差值值,反反映了了数据据集合合中最最大值值和最最小值值的差差距。。极差差反映映了一一组数数据的的离散散程度度和数数据波波动的的范围围。极极差越越大,,数据据的离离散程程度越越大。。极差差越小小,数数据的的离散散程度度越小小。例如一一组数数据2、4、7、5、15、9,极差差为15-2=13.3、表示示分布布形状状的统统计量量(1)峰度度描述分分布形形态的的陡缓缓程度度。通通常正正态分分布的的峰度度为3,如果果一组组数据据计算算出来来的峰峰度为为3,则表表示整整体形形状与与正态态分布布相同同。峰峰度大大于3,表示比比正态态分布布陡峭峭,小小于3则表示示比正正态分分布平平坦。。(2)偏度度是统计计数据据分布布偏斜斜方向向和程程度的的度量量,是是统计计数据据分布布非对对称程程度的的数字字特征征。直直观看看来,,就是是密度度函数数曲线线尾部部的相相对长长度。。正态态分布布的偏偏度为为0,两侧侧尾部部长度度相等等。如果一一组数数据的的偏度度小于于0,则表表示左左偏态态。此此时数数据位位于均均值左左边的的比位位于均均值右右边的的少,,即分分布左左边的的尾部部相对对于右右边的的尾部部要长长。如如果偏偏度大大于0,称为为右偏偏态,,此时时数据据位于于均值值右边边的比比位于于均值值左边边的少少,即即分布布右边边的尾尾部相相对于于左边边的尾尾部要要长。。7.2数数据据的收收集和和整理理7.2.1数据的的收集集数据收收集就就是按按照统统计分分析的的目的的,运运用科科学有有效的的方法法,针针对性性地收收集反反映客客观现现实的的统计计数据据的活活动过过程。。(1)数据据的分分类按照获获取途途径不不同,,可分分为原始数数据:即第第一手手资料料,是是通过过原始始问卷卷调查查、原原始实实验、、实地地检测测等手手段收收集到到的数数据。。次级数数据:即为为第二二手资资料,,通常常是在在原始始资料料难以以收集集的情情况下下,直直接收收集报报纸、、期刊刊、因因特网网、统统计书书籍等等媒介介上的的资料料或政政府机机构公公布的的资料料(如如统计计局每每年公公布的的GDP、各行业生生产总值等等数据)。。原始数据的的真实性、、准确度相相对次级数数据要好。。因此为了了更加确切切地获得某某一现象或或某一事件件客观存在在的规律,,要尽可能能地使用原原始数据。数据定量数据定性数据离散型数据计数值数据连续型数据计量值数据数据分类情情况(2)数据据收集的方方式1)统计调调查①普查。普查查是根据一一定的统计计目的而进进行的一次次全面调查查,进而收收集能够反反映现象总总体的全面面资料。。所以,普普查是通过过调查总体体的方式来来收集数据据的。②抽样调查。。抽样调查查的范围是是总体的一一部分,是是一种非全全面性的调调查。其按按照一定的的统计方法法,从总体体中抽取样样本,进而而用样本数数据来判断断总体情况况的数据获获取方式。。因此抽样样调查是通通过调查样样本的方式式来进行数数据收集的的。只对一部分分客户进行行的调查叫叫抽样调查查。抽样调调查非常有有用,要知知道大片的的森林里有有多少棵树树,只需选选择几个小小块的区域域进行调查查,算出平平均密度再再乘上总面面积,而不不用去摸遍遍每一个山山头;要知知道灯泡的的平均使用用寿命,只只要拿少量量灯泡进行行试验,而而不用把所所有的灯都都用到坏;;要知道一一个大型养养鸡场里明明天有多少少母鸡会下下蛋,也只只用挑选几几十只验一一验就够了了,而不用用摸每只母母鸡的屁股股。抽样调调查能给我我们的生活活带来很大大的方便。。保险公司司也不必去去统计每个个人的真实实寿命,它它只要抽样样调查,一一样可以获获得满意的的数据。看看上去,抽抽样调查真真是个投机机取巧的好好办法。导致破产的的预言抽样调查的的结果不是是绝对的正正确的,即即使有99.9%的把握,仍仍然有0.1%的意外会超超出误差允允许的范围围,那是不不可避免的的,是可以以允许的正正常范围。。然而,有有些抽样调调查却会产产生非正常常的错误。。1936年美国总统统选举开始始了,大部部分人认为为现任总统统罗斯福—民主党的候候选人—将会胜利。。但是有个个杂志《文学文摘》却不以为然然,因为他他们邮寄出出1000万份调查问问卷,收回回了其中的的240万份,调查查结果显示示,共和党党人兰登将将会绝对优优势胜出。。1000万的调查样样本,这么么大规模的的问卷调查查足以让人人相信罗斯斯福的总统统政治生涯涯结束了。。但结果却却出乎杂志志社的预料料,罗斯福福顺利当选选美国总统统,后来成成为二次大大战时领导导世界人民民抗击法西西斯的三巨巨头之一。。由于错误误的预测,,读者对这这本杂志产产生了严重重的信任危危机,大选选结束后仅仅仅几个月月《文学文摘》就破产了。。《文学文摘》的问题出在在哪里呢??原来,他他们是按电电话薄上的的地址寄出出的调查问问卷。虽然然今天电话话早已经进进入了千家家万户,但但在20世纪30年代的美国国刚刚经历历了一场巨巨大的经济济危机,失失业人数高高达900万(而那时时美国总人人口还不足足1亿),大部部分人的工工资只有危危机以前的的1/3的水平,只只有一部分分相对富裕裕的家庭用用得起电话话这种“高高科技产品品”。电话话只有富人人才有,富人大多支持持共和党人人兰登,这这就是《文学文摘》调查结果的的来历。而而当时美国国穷人大多多支持罗斯斯福。在人人数上,穷穷人比富人多得多,,由于在选选举上每个个公民都有有1票,庞大的的穷人数量量造成了这这次抽样调调查结果的的巨大偏差差。这是历史上上非常有名名的抽样统统计失败的的案例。它说明抽样样调查的成成败有时不不在于调查查数据量的的多少,而而在于是否否能做到完完全随机地地抽取样本本。还是那次总总统选举,,另外有一一个人叫盖盖洛普,他他只是在大大街上随机机找了2万人进行调调查就获得得了正确的的结果—罗斯福获胜胜。2)实验调调查实验调查是是利用恰当当的科学实实验方法,,收集不同同实验条件件下的数据据,从而凭凭借这些数数据对目的的对象进行行研究的一一种数据收收集方式。。实验调查查法最常用用的方法是是实验设计计。在质量控制制过程中,,明确了目目的对象后后,需要根根据目的对对象的基本本特性选择择合适的数数据收集方方式。比如如,要了解解螺丝加工工车间螺丝丝的质量情情况,因数数目巨大且且成本较高高的限制,,可以选择择抽样调查查进行数据据收集。要要了解某种种真菌在一一定环境下下的存活情情况,可以以选择实验验调查的方方法进行数数据的收集集。7.2.2数据据的整理数据的整理理是为了达达到研究的的最终目的的,对收集集到的数据据进行加工工整理,使使之更加系系统化、条条理化的过过程。人口普查,,可以按照照年龄段进进行分组。。班级成绩调调查,可以以按照分数数进行分组组。为了使整理理后的数据据更加直观观,通常用用图表的形形式表示出出来。统计计表和统计计图中的数数据一般运运用的是统统计量,如如算术平均均数、百分分比、中位位数、极差差、标准差差等。1.统计计表统计表是原原始数据资资料经过整整理,并将将这些数据据按照一定定的顺序排排列起来的的一种表格格形式。统统计表能够够集中而有有序地体现现原始数据据资料。统统计表一般般由表标题题、横行标标题、纵列列标题、数数值等要素素组成。2.统计计图统计图是利利用几何图图形的形式式对原始数数据资料进进行整理、、排列,使使得数据整整齐有序、、形象生动动的一种图图形工具。。常见的统统计图有直直方图、排排列图和饼饼分图。(1)直方方图直方图是一一种可以清清晰地显示示出总体分分布趋势,,并且能够够表示不同同数据组频频数的分布布特征的统统计图。在质量控制制中,直方方图可以一一目了然地地判断出整整个生产过过程中产品品质量特性性的分布,,进而判断断产品的不不合格率。。作用在于于通过最终终绘制的直直方图形状状,可以判判断出总体体质量的分分布情况,,判断生产产过程的稳稳定性。当当了解总体体质量分布布的情况及及生产过程程的稳定性性状态后,,可以及时时查漏补缺缺,找出引引起总体质质量波动的的原因和位位置,并进进行改进。。直方方图图的的作作用用1.直观观地地看看出出产产品品质质量量特特性性值值的的分分布布状状态态((平平均均值值和和分分散散情情况况)),,便便于于掌掌握握产产品品质质量量分分布布情情况况。。2.显示示质质量量波波动动状状态态,,判判断断工工序序是是否否稳稳定定。。3.确定定改改进进方方向向。。通通过过直直方方图图研研究究分分析析质质量量数数据据波波动动状状况况之之后后,,就就可可确确定定怎怎样样进进行行质质量量改改进进。。4.用以以调调查查工工序序能能力力和和设设备备能能力力。。在在直直方方图图商商标标出出公公差差线线或或标标准准值值,,可可以以定定量量的的调调查查工工序序能能力力和和设设备备能能力力。。210-1-2121086420作直直方方图图的的步步骤骤1.收集集数数据据2.确定定极极差差R3.确定定分分组组的的组组数数和和组组距距4.确定定各各组组上上、、下下限限5.作频频数数分分布布表表6.求组组中中值值xi和变变换换组组中中值值ui7.求平平均均值值和和标标准准差差8.画直直方方图图,,如如图图所所示示9.直方方图图的的空空白白区区域域,,标标明明有有关关数数据据资资料料,,如如数数据据个个数数,,平平均均值值等等。。详见见[例9.3.1]直方方图图直方方图图的的观观察察分分析析(2))排排列列图图排列列图图是是为为了了找找到到影影响响质质量量的的主主要要原原因因或或探探索索主主要要问问题题的的一一种种统统计计图图。。作作用用在在于于能能够够清清楚楚地地识识别别出出主主要要问问题题,,帮帮助助我我们们抓抓住住有有用用的的多多数数和和关关键键的的少少数数。。在在排排列列图图中中,,通通过过累累积积百百分分比比将将影影响响因因素素分分为为了了三三大大类类::A类因因素素累累积积百百分分比比为为80%;B类因素累积百百分比占80%~90%;C类因素累积百百分比为90%~100%。完善了A类影响因素后后,就相当于于解决了80%的问题,即绝绝大部分质量量问题就解决决了。(3)饼分图图饼分图常常用用来表示各个个部分在总体体中所占的百百分比,是总总体及其组成成部分比例关关系的图示。。饼分图清楚楚地展示了总总体中各个组组成部分所占占比例的大小小,能够快速速判断总体中中的最大部分分和最小部分分。7.3几几种常见的概概率分布7.3.1二二项分布问题1姚明的罚球命命中率为0.8,假设他每次次命中率相同同,请问他某某次比赛中3罚2中的概率是多多少?问题2随机抛掷一枚枚均匀硬币100次,求恰好出出现50次正面的概率率?问题3随机抛掷一颗颗质地均匀的的色子n次,求恰好出出现k次5的概率?共同点:1)、每次试验验是在同样的的条件下进行行的;2)、各次试验验中的事件是是相互独立的的;3)、每次试验验都只有两种种结果:A与4)、每次试验验中事件A发生的概率相相同:P(A)=p。独立重复试验验—在同样条条件下重复的的,各次之间间相互独立地地进行的一种种试验:在这这种试验中,,每一次试验验只有两种结结果,即某事事或者发生,,或者不发生生,并且任意意一次试验中中发生的概率率都是一样的的。二二项分布主要要说明的是当当随机事件发发生的结果有有两种可能性性时,发生其其中一种结果果X的概率分分布。判断下列试验验是不是独立立重复试验::1、依次投掷四四枚质地不均均匀的硬币,,3次正面向上;;2、某人射击,,击中目标的的概率是稳定定的,他连续续射击了10次,其中6次击中;3、口袋装有5个白球,3个红球,2个黑球,从中中依次取出5个球,恰好取取出4个白球;7.3.2泊泊松分布7.3.3均均匀分布布在测量实践中中,均匀分布布是经常遇到到的一种分布布,其主要特特点是:测量量值在某一范范围中各处出出现的机会一一样,即均匀匀一致。故又又称为矩形分分布或等概率率分布。均匀分布是连连续型随机变变量的密度函函数。如果连续型随随机变量的概概率密度函数数为:那么就称服从从区间(a,b)上的均匀分分布,记为X~U(a,b)其概率分布函函数为:均匀分布U(a,b)的均值和方方差分别为::7.3.4正正态分布布正态分布的特特征标准正态分布布又称为u分布,是以0为均数、以1为标准差的正态分布,,记为N(0,1)。标准正态分布布曲线下面积积分布规律是是:在-1.96~+1.96范围内曲线下下的面积等于于0.9500,在-2.58~+2.58范围内曲线下下面积为0.9900。统计学家还还制定了一张张统计用表((自由度为∞∞时),借助助该表就可以以估计出某些些特殊u1和u2值范围内的曲曲线下面积。。(2)平均值与它的的众数以及中中位数同一数数值。(3)函数曲线下68.268949%的面积在平均均数左右的一一个标准差范范围内。95.449974%的面积在平均均数左右两个个标准差的范范围内。99.730020%的面积在平均均数左右三个个标准差的范范围内。99.993666%的面积在平均均数左右四个个标准差的范范围内。(4)函数曲线的反反曲点为离平平均数一个标标准差距离的的位置。7.4参参数估计与假假设检验7.4.1几个基本概念念统计量:来自自总体X的一个样本的的n元连续函数,,该函数中不不含任何未知知参数,是一一个随机变量量。估计量:用于于估计总体参参数的随机变变量。如样本均值,,样本比率、、样本方差等等样本均值x就是总体均值值的一个估计量量估计值:估计计参数时计算算出来的统计计量的具体值值如果样本均值值x=80,则80就是的估计值7.4.2参参数估计参数估计是从从样本出发构构造一个统计计量,作为总总体中某未知知参数的一个个估计量,并并用该样本统统计量估计总总体参数估计计量的一种方方法。参数估计分为为点估计和区区间估计。7.4.2.1点估估计点估计计就是是由样样本构构造的的一个个估计计量来来估估计总总体的的未知知参数数,并并用样样本估估计量量的的值值直接接作为为总体体参数数θ的估计计值。。假设总总体X的分布布函数数为F(X;θ),其中中θ为未知知参数数,X1,X2,…,Xn为总体体的一一个样样本。。构造造的样样本统统计量量(X1,X2,…,Xn)称为未未知参参数θ的一个个估计计量。。如果果(X1,X2,…,Xn)是样样本的的观测测值,,将其其代入入到统统计量量中中,,就能能够得得到未未知参参数θ的估计计值。。点估估计计(pointestimate)———用样本本的估估计量量直接接作为为总体体参数数的估估计值值。例如::用样样本均均值直直接作作为总总体均均值的的估计计例如::用两两个样样本均均值之之差直直接作作为总总体均均值之之差的的估计计比如估估计总总体均均值U,是选选择样样本均均值作作为统统计量量还是是选择择样本本中位位数作作为统统计量量进行行估计计合适适呢??合适适的统统计量量需要要具备备以下下几个个性质质:无偏性性:指指估计计量抽抽样分分布的的数学学期望望与被被估计计的总总体参参数相相等,,即如如果E()=θ,就称称为θ的无偏偏估计计量。。有效性性:对对于同同一个个总体体参数数的两两个无无偏点点估计计量,,标准准差越越小,,估计计量越越有效效。一致性性:随随着样样本容容量的的增大大,估估计值值越来来越接接近被被估计计的总总体参参数值值。即即容量量大的的样本本计算算出来来的估估计值值更接接近于于总体体参数数值。。7.4.2.2区区间估计以样本统计计量的概率率分布为理理论基础,,按一定的的概率要求求,由样本本统计量的的值估计总总体参数值值的所在范范围,就叫叫做总体参参数的区间间估计。在实际研究究过程中,,需要知道道参数估计计值落在其其真值附近近的一个范范围,这种种带有概率率的区间称称为置信区区间。通常构造一一个置信区区间对未知知参数进行行估计的方方法叫做区区间估计。。假设θ是总体的未未知参数,,θL、θU是由样本确确定的两个个统计量,,对于给定定的α,如果满足足P(θL﹤θ﹤θU)=1-α,则称(θL,θU)为参数θ的置信度为为1-α的置信区间间。其中α为置信水平平,1-α为置信度或或置信水平平,0﹤α﹤1,常用的置置信水平为为0.01,0.05,0.10,对应的置置信度为99%,95%,90%。θL为置信下限限,θU为置信上限限。置信水水平1.将构造置信信区间的步步骤重复很很多次,置置信区间包包含总体参参数真值的的次数所占占的比率称称为置信水水平2.表示为(1-为总体参数数未在区间间内的比率率3.常用的置信信水平值有有99%,95%,90%相应的为0.01,0.05,0.10置信区区间(confidenceinterval)1.由样本统计计量所构造造的总体参参数的估计计区间称为为置信区间间2.统计学家在在某种程度度上确信这这个区间会会包含真正正的总体参参数,所以以给它取名名为置信区区间3.用一个具体体的样本所所构造的区区间是一个个特定的区区间,我们们无法知道道这个样本本所产生的的区间是否否包含总体体参数的真真值,我们只能是是希望这个个区间是大大量包含总总体参数真真值的区间间中的一个个,但它也也可能是少少数几个不不包含参数数真值的区区间中的一一个总体均值的的区间估计计(大样本)1.假定条件总体服从正正态分布,且方差(2)未知如果不是正正态分布,,可由正态态分布来近近似(n30)2.使用正态分分布统计量量z3.总体均值在1-置信水平下下的置信区区间为总体均值的的区间估计计(例题分析)【例】】一家食品生生产企业以以生产袋装装食品为主主,为对产产量质量进进行监测,,企业质检检部门经常常要进行抽抽检,以分分析每袋重重量是否符符合要求。。现从某天天生产的一一批食品中中随机抽取取了25袋,测得每每袋重量如如下表所示示。已知产产品重量的的分布服从从正态分布布,且总体体标准差为为10g。试估计该该批产品平平均重量的的置信区间间,置信水水平为95%总体均值的的区间估计计(例题分析)解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根据样本本数据计算算总体均值值在1-置信水平下下的置信区区间为:25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3该食品平均均重量的置置信区间为为101.44g~109.28g概率很小的的事件,在在一次试验验中是不可可能发生的的,这一原原理称为小概率原理理。例如有人说说,我厂生产的的1000个产品中只只有1个是次品.即次品率为为1/1000,现从中随机机抽取一个个,结果恰是次次品,此时我们会会怀疑这人人的说法,,认为次品品率不是1/1000。所以假设检检验的基本本思想可以以概括成一一句话:““是某种带带有概率性性质的反证证法”。类类似于数学学中逻辑论论证的反证证法,但又又区别于纯纯数学中逻逻辑推理的的反证法。。因为我们们这里的所所谓不合理理,并不是是绝对矛盾盾,而是基基于小概率率原理。7.4.3假设检检验假设检验的的判断依据据是小概率率事件是否否会发生。。在假设检检验中,提提出原假设设的基本依依据是“小小概率事件件在一次实实验中不会会发生”。。备择假设设和原假设设对立,即即备择假设设提出的基基本依据是是“小概率率事件在一一次实验中中发生了””。如果样样本统计结结果显示小小概率事件件没有发生生,则接受受原假设,,原假设成成立;反之之,拒绝原原假设,备备择假设成成立。假设检验的的一般步骤骤例2安眠药睡眠眠时间服从从正态分布布,标准差为1.5小时,10人服用后,测得平均睡睡眠时间为为21.15小时,该批号安眠眠药睡眠时时间的总体体均数是否否高于20小时。α=0.01解:已知故故此题应采采用右侧检检验H0:μ=20,H1:μ>207.5方方差分析析7.5.1方差分析基基本概念方差(AnalysisofVariance,ANOVA)是英国统统计学家Fisher首先提出的的,为纪念念这位伟大大的科学家家,以F命名,将方方差分析又又称作F检验。在生产过程程或科学试试验中,影影响生产或或试验的因因素会有很很多,包括括显著性因因素和非显显著性因素素。方差分分析正是判判断显著性性影响因素素的有效方方法。总体标准差差的平方,,即称为方方差,用σ2表示,样本本标准差的的平方S2叫均方,用用MS或S2表示。方差差同标准差差一样,也也可用来表表示数据的的变异程度度,除此之之外,方差差还可以分分析数据的的变异原因因。方差分析是是以方差为为检验对象象的显著性性检验。7.5.2方差分分析计算方方法方差分析是是对两个及及以上样本本均值差别别的显著性性检验,造造成该差别别的原因有有两个:一一类是不可可控的随机机因素,由由此引起的的误差称为为随机误差差;另一类类是可控因因素,由此此引起的误误差叫系统统误差。所所以方差分分析的基本本思想为,,分析不同同差异来源源对总差异异的贡献大大小,进而而明确可控控因素对结结果的影响响力大小。。不同的置信水水平下,因素素的显著性程程度是不一样样的,具体情情况见表7-2.比较区间显著性F﹥F0.01***F0.05﹤F﹤F0.01**F0.25﹤F﹤F0.05*表7-2不同显著性水水平下的显著著性判断准则则表107总变异处理间变异+误差变异变异方方差平方和除以自自由度一、自由度和和平方和的分分解方差是平方和除以以自由度。要要将一个试验验资料的总变变异分解为各各个变异,首首先必须将总平方方和和总自由由度分解为各各个变异的相相应部分。因此,自由由度和平方和和的分解是方方差分析的第第一步。下面用一个例例子来说明这这一问题。108[例5.1]以A、B、C、D四种药剂处理理水稻种子,,每处理四个个重复,各得得4个苗高观察值值(cm),试分解其自自由度和平方方和。药剂苗高观察值总和Ti平均数A182120137218B202426229223C101517145614D2827293211629T=3361091、总变异把表中的全部部观察值作为为一个组,根根据前面讲过过的计算平方方和和自由度度的公式,,可以计算出出总变异的平平方和和与自自由度。其中:为矫正数,用用C表示。总平方和:110总自由度:DFT=nk-1=4×4-1=151112、处理效应如果没有处理理效应,表中中各个处理间间平均数来度量处理效效应。从理论上讲均应该相等,因此,可以用112处理间平方和和和自由度::1131143、误差表中重复间各各观察值间,,若不存在误误差,则各观观察值应该相相等,由于误误差是客观存存在的,因而而重复间各观观察值间必然然是有差异的的,因此,可可以用重复间间的差异度量量误差:115SSe=SST-SSt=602-504=98。DFe=(kn-1)-(k-1)=15-3=12116平方和与自由由度的分解表表变异来源DFSSS2处理间k-1误差kn-k总变
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年排水沟建造正规协议文件
- 2024年度城市污水处理设备供应协议
- 2024年度外资公司土地购置协议范本
- 2024年产新鲜水果购销协议模板
- 2024苗圃种植及销售协议
- 废料处理及销售协议2024
- 2024年期家禽买卖协议实例解析
- 2024年第三方代缴费用委托协议样本
- 2024年琉璃瓦施工服务协议模板
- 2024年汽车质押借款协议样本
- 罗马人的故事(全15册)(修订版)
- 单位无宿舍证明
- DB21-T3702-2023矿山废弃地植被自然恢复技术规程
- 吊索具检查记录表
- 商务接待申请表
- GB/T 13663.2-2005给水用聚乙烯(PE)管道系统第2部分:管件
- 上期开特下期必开特规律
- 基础生命科学导论:第七章-进化课件
- 鼻腔冲洗专业知识讲座课件
- 一年级《劳动实践指导手册》《学习用品我整理》教案
- NCCN癌痛指南更新解读专家讲座
评论
0/150
提交评论