版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计方法基础知识第一页,共五十二页,编辑于2023年,星期三第四部分QC小组统计技术应用第二页,共五十二页,编辑于2023年,星期三
QC小组活动为什么要应用统计技术1、证实活动的科学性,达到质量改进的目的2、运用统计方法——增强分析解决问题的能力3、用事实数据说话——提供活动的证据4、准确的统计分析——决策下一步行动5、提高活动效率——少走或不走弯路第三页,共五十二页,编辑于2023年,星期三(1)统计方法基础知识第四页,共五十二页,编辑于2023年,星期三
统计方法基础知识(P116)统计:收集和整理国情、资料的一种活动。◆统计方法:收集、整理、分析和解释统计数据,并对其所反映的问题做出一定结论的方法。目的:进行数据的整理、分析。方法:全数检验或随机抽取。工具:“老七种工具”、“新七种工具”等。一、什么是统计方法第五页,共五十二页,编辑于2023年,星期三一、什么是统计方法(P116)统计方法分类:一般分为描述性和推断性两类。
如老师由这个班级的数学平均成绩,去估计整个年级5个班的平均水平,这种统计估计就属于推断性统计方法。推断性统计方法要通过详细样本来达到了解、推断总体的目的。具有由局部推断整体的性质,如控制图、散布图、假设检验、抽样检查等。(2)推断性:在对统计数据进行描述的基础上,进一步分析、解释和作出推断性结论。展示出统计数据的规律,这就是统计方法的描述性,例:计算一个班级的数学平均成绩,最高最低分的差距,描述性统计方法常用曲线、表格、图形反映统计数据和描述观测结果,使数据更容易理解,如排列图、直方图、柱状图、折线图等。(1)描述性:对统计数据进行整理和描述第六页,共五十二页,编辑于2023年,星期三二、统计方法的性质:
描述性、推断性、风险性。(1)描述性:用统计方法对数据进行整理和描述,展示统计数据的规律,就是统计方法的描述性(2)推断性:统计方法通过详细研究样本,达到了解、推断总体的目的,具有由局部推断整体的性质。(3)风险性:部分推断全体,结论不可能全正确,可能有错误,有错误就要承担风险。正确运用统计方法,把风险降至最低。第七页,共五十二页,编辑于2023年,星期三1、提供特征数据;(平均值、中位数、标准偏差、方差、极差等)2、比较差异;(假设检验、显著性检验、水平对比)3、分析影响因素;(因果图、系统图、分层法等)4、分析相关关系;确定关系的性质和程度(散布图)5、确定试验方案;(抽样检验、单因素检验、正交试验、可靠性试验等)6、发现问题,分析动态变化情况(排列图、直方图、控制图、散布图等)7、描述质量形成过程(流程图、控制图等)三、统计方法的用途第八页,共五十二页,编辑于2023年,星期三1、QC小组活动要求用事实和数据说话,没有对事实的统计分析就不能提供活动的证据。2、没有准确的统计分析有可能发生错误的判断,导致下一步行动的决策错误。3、没有数据分析就不能充分体现科学性。4、不使用统计方法QC小组往往会走弯路,影响小组的活动效率及小组成员的积极性。5、学会和使用统计方法将提高QC小组成员分析问题和解决问题的能力。6、统计方法是科学管理的基础,正确、适宜地使用统计技术也是对QC小组的基本要求。四、QC小组为什么要用统计方法第九页,共五十二页,编辑于2023年,星期三统计数据及分类数据分类:计量数据、计数数据1、计量数据
服从于正态分布凡是可以连续取值的,或可以用测量工具测量出小数点以下数值的数据。如:用于计量的长度、重量、温度、时间、强度等数据。
长度1—2mm之间,可连续测出1.1、1.2….1.1—1.2之间还可测出1.11、1.12等数第十页,共五十二页,编辑于2023年,星期三统计数据及分类(P118)2、计数数据凡是不能连续取值的或用测量工具也得不到小数点以下的数据,而只能自然数的数据称为计数数据。计数数据分为:计件数据服从于二项分布
计点数据服从于泊松分布12345只能测得0或1、2、3、…等自然数,不合格品数、缺陷数,只能测得1件、2件第十一页,共五十二页,编辑于2023年,星期三
计件数据:
按件计数的数据,如不合格品数、不合格品率、彩色电视机数等。统计数据及分类计点数据:
指按缺陷点(项)计数的数据,不合格数、如疵点数、砂眼数、气泡数、产品缺陷数等。注意:
当数据以百分率表示时,判断它是计量数据还是计数数据,取决于给出数据的计算公式的分子,当分子是计量数据时、则求得的百分率数为计量数据,当分子是计数数据时,即使得到百分率不是整数、也属计数数据。12台1000台×100%=1.2%生产的1000台电动机中有12台不合格。从1.2%看虽有小数点以下数值,计算公式分子12台是计数数据,1.2%应为计数数据。第十二页,共五十二页,编辑于2023年,星期三产品质量的波动(P119)
过程中有许多导致波动的因素存在;每种因素的发生是随机的且无法预测,但都影响着过程的输出,即质量特性;波动具有随机性也有规律性;质量特性有波动是正常,无波动则属异常;彻底消灭波动是不可能的,但减少波动是可能的;
质量管理工作的一项重要工作,就是把正常波动控制在合理范围之内,消除异常波动。
一、波动理论第十三页,共五十二页,编辑于2023年,星期三1、正常波动:
随机原因引起的产品质量波动。特点:大量存在、影响很小、消除难度大、经济代价高。要求:一般情况下在生产过程中允许存在。控制状态:仅有正常波动的生产过程,简称为控制状态或稳定状态。
产品质量波动分为正常波动和异常波动两类。二、波动的分类第十四页,共五十二页,编辑于2023年,星期三特点:不经常发生,一旦发生影响较大,容易查明原因,容易预防和消除。要求:由于对生产影响大,生产过程中不允许存在。产品质量的波动
2、异常波动:由系统原因引起的产品质量波动。质量管理工作的一项重要工作,就是把正常波动控制在合理范围之内,消除异常波动。第十五页,共五十二页,编辑于2023年,星期三三、引起波动的因素引起产品质量波动六个方面,“5M1E”因素:人员(Man)操作者的意识、技术、素养及熟练程度等;机器(Machine)设备、工夹具精度、维护与保养等;材料(Material)化学成份、物理性能及外观质量等;方法(Method)加工工艺、操作规程的作业程度;测量(Measure)测量设备、试验手段和测试方法等;环境(Enviroment)工作场地的温、湿度,照明噪声等;正常波动—随机原因—随机特点—普遍存在异常波动—系统原因—系统特点—单一现象飞机晚点:空中管制、调配、天气变化、机械故障第十六页,共五十二页,编辑于2023年,星期三
当过程处于稳定状态时,产品质量特性数据,其波动服从于一定的分布规律。例如:长度尺寸必然形成右图的分布规律。
四、波动的规律性正态分布图分布有两种类型:一种是连续型分布常见的有:正态分布(计量数据)一种是离散型分布,常见的有:1、二项分布(计件数据)2、泊松分布(计点数据)第十七页,共五十二页,编辑于2023年,星期三关于正态分布正态分布受两个参数影响μ(总体平均值)——集中位置σ(总体标准偏差)——分散程度通常用样本平均值:X样本的标准偏差:S正态分布曲线,又称高斯曲线、钟型曲线。μσXS备注:高斯德国数学家第十八页,共五十二页,编辑于2023年,星期三正态分布特性区间内的概率0.68260.95450.9973XS±σ±2σ±3σ第十九页,共五十二页,编辑于2023年,星期三
如果你是某学校高一的班主任,当每次考试成绩公布前,你第一想知道的结果是什么?一、正态分布参数平均值
μ人口普查华东,人均收入、男女平均身高等第二十页,共五十二页,编辑于2023年,星期三1、一组数据向其中心值靠拢的倾向和程度2、测量集中位置就是寻找数据一般的代表值和中心值。3、平均值是正态分布曲线的位置参数,它只决定曲线出现频率最大数值,而不改变正态曲线的形状。4、平均值易受极端值的影响。
一、正态分布参数平均值
总体平均值μ(样本平均值X)第二十一页,共五十二页,编辑于2023年,星期三一、正态分布参数平均值
μμ1μ2σ相同
μ不同的正态分布曲线μ不同,最大值的位置不同μ是正态分布的中心607080三次考试的平均成绩第二十二页,共五十二页,编辑于2023年,星期三
如果你想过河,有人只告诉你河的平均深度是1.5米,你是否还想知道它的变化范围。二、正态分布参数标准偏差σ标准偏差说明数据的分散程度第二十三页,共五十二页,编辑于2023年,星期三二、正态分布参数标准偏差
1、数据分布的另一个重要特征2、离散程度的各测度值就是对数据分散程度所作的描述。3、反映一组数据各变量值远离其中心值的程度,因此也称为离中趋势总体标准偏差σ(样本标准偏差S)第二十四页,共五十二页,编辑于2023年,星期三二、正态分布参数标准偏差
标准偏差是正态分布曲线的形状参数,它决定了曲线的高、矮、胖、瘦。当σ较小时,数据较多集中于平均值附近,曲线形状就较高和瘦;当σ较大时,数据集中程度就差,曲线就矮和胖。第二十五页,共五十二页,编辑于2023年,星期三μ
相同
σ不同的正态分布曲线σ1=0.4σ2=1.0σ3=2.5问题:σ是多少考试分数较接近?σ不同曲线的高度不同σ决定曲线的形状二正态分布参数标准偏差第二十六页,共五十二页,编辑于2023年,星期三三、正态分布主要特点:1、集中性:正态曲线的高峰位于正中央,即均数所在的位置;2、对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交;(是否有零缺陷?)3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降,靠近μ的偏差出现概率较大,远离μ的偏差出现概率小,在远离一定的范围以外的偏差,其出现的概率是很小的如:(在±3σ以外的偏差,出现概率不到0.3%)。4、曲线与横坐标轴所围成的面积等于1;5、对μ的正偏差和负偏差概率相等。第二十七页,共五十二页,编辑于2023年,星期三正态分布特性μminmax—XXS±σ±2σ±3σ极差相当于6倍的标准偏差99.73%区间内的概率0.68260.95450.99730.999940.999994±σ±2σ±3σ±4σ±5σσ第二十八页,共五十二页,编辑于2023年,星期三总体:指某次统计分析中研究对象的全体又称母体。
总体是提供数据的大本营、数据库。如某专业同一年的考生、一条生产线的某个零件、所有中国工人、农民、18岁的人都可分别构成一个总体。我们为研究一道工序或一批产品质量的好坏、这道工序、这批产品就是总体。总体可以是有限的、也可是无限的。一批电子元件10万件,5万个电阻,数量大,但可以数清,为有限总体。总体也可以是一个过程。如生产线上的一道工序,自来水管中的水,煤气管道中的煤气等为无限总体。组成总体的每个单元(产品)叫做个体。总体中所含的个体数叫做总体含量(总体大小)。用符号N表示。总体与样本(P124)第二十九页,共五十二页,编辑于2023年,星期三
样本:从总体中随机抽取出来要对其进行分析的一部分个体,也称为子体。
样本中所含的样品数目、一般叫样本大小或样本容量、常用符号“n”表示。例:从1000件产品中随机抽取20件、对它进行检测,这20件产品组成一个样本即n=20、样本是由一个或若干个样品组成的。总体与样本抽样:从总体中随机抽取样品组成样本的活动过程。随机抽样:使总体中每一个个体都有同等的机会被抽取出来组成样本的活动过程。第三十页,共五十二页,编辑于2023年,星期三总体可以是一批产品,进行质量判断,确定是否合格(有限总体)。可以是一个过程对工序进行分析控制(无限总体)。
判断随机抽取测量总体样本数据总体与样本的关系(P124)
第三十一页,共五十二页,编辑于2023年,星期三用样本推断总体样本总体样本统计量如:样本均值方差、标准差总体均值、方差、标准偏差第三十二页,共五十二页,编辑于2023年,星期三SX计算时代表判断μσ数量:N集中位置(平均值):μ分散程度(标准偏差):σ总体数量:N数量:n样本X数量:n平均值:标准偏差:s如果产品特性值是计量数据,则总体与样本的关系:第三十三页,共五十二页,编辑于2023年,星期三
1、简单随机抽样从:抽样误差小。抽样手续比较繁杂。100件中抽10件组成样本,把100件从1至100编号,用抽签(抓阄)查数值表抽10张。例
2、系统抽样法(等距抽样)
例:100件从1至100编号,抽签或查随机数值表,确定那件产品入选,如5号、15、25、操作简便、不易出差错。易出现大的偏差,织布机恰好50米出现一段疵布
3、分层抽样法(类型抽样法)
甲、乙、丙三个工人同一台设备加工零件,放在三个地方,抽15个零件组成样本,随机在三个地方抽5个组成样本,代表性好、误差小。抽样手续繁杂。
4、整群抽样法(集团抽样)
将总体分成许多群,如每隔10小时抽30分钟的产量组成样本。实施方便抽样误差大。用于工序控制。
随机抽样方法第三十四页,共五十二页,编辑于2023年,星期三
某零件20箱,每箱50个,共1000个、要抽取100个进行测试研究,怎样用上述4种方法
1、20箱倒在一起混合,从1至1000编号,查随机数表或抽签,抽出毫无规律的100个样本,简单随机抽样。2、20箱混合,1至1000编号,查随机数表或抽签决定起始号,如6号,依次为16、26、916、100个样本,系统抽样。3、20箱中每箱随机抽取5个,100个样本,分层抽样。4、20箱随机抽出2箱,进行检验,整群抽样。随机抽样方法第三十五页,共五十二页,编辑于2023年,星期三
统计特征数是对样本来说的。常用的统计特征数可分为两类:一:表示数据的集中位置1、样本平均值2、样本中位数二:表示数据的离散程度1、样本方差
s2
2、样本标准偏差s
;3、样本极差R
统计特征数(P125)~
x第三十六页,共五十二页,编辑于2023年,星期三一、表示数据的集中位置1、样本的平均值2、样本的中位数中心位置—X~
xX~
x第三十七页,共五十二页,编辑于2023年,星期三
样本平均值(P126)—X式中样本的算术平均值;
n:样本大小。最常用的测度值,是集中趋势的测度值之一,易受极端值影响。计算公式:
=—X:第三十八页,共五十二页,编辑于2023年,星期三
样本平均值—X
原始数据: 10 5 9 13 6 85.868613951066543211=+++++=+++++==å=XXXXXXNXXNii计算算例:第三十九页,共五十二页,编辑于2023年,星期三
样本中位数(P126)将所收集的数按大小排序,在正中位置的数为中位数。集中趋势的测度值之一。不受极端值影响。50%50%~
x当N为畸数时,中位数为正中间位置的数。当N为偶数时,中位数为正中间两个数的算术平均值。~
x较样本平均值表示的集中位置粗略第四十页,共五十二页,编辑于2023年,星期三五个数据取中位数原始数据:105 91268排序: 5688.5
91012位置: 123 456原始数据: 2422212620排序: 2021222426位置: 12345六个数据取中位数中位数8+928.5中位数22第四十一页,共五十二页,编辑于2023年,星期三数据分布的另一个重要特征离散程度的各测度值就是对数据离散程度所作的描述它所反映的是各变量值远离其中心值的程度,因此也称为离中趋势从另一个侧面说明了集中趋势测度值的代表程度离散程度minmax—X离中趋势第四十二页,共五十二页,编辑于2023年,星期三二、表示数据的离散程度minmax—X离散程度1、样本的方差S22、样本的标准偏差S3、样本的极差R第四十三页,共五十二页,编辑于2023年,星期三方差和标准差(P126)离散程度的测度值之一最常用的测度值反映了数据的分布反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4681012X=8.3第四十四页,共五十二页,编辑于2023年,星期三1、样本方差的计算样本方差S2
:(xi-x):表示某一数据与样本平均值之间的偏差n:采集的样本数
n-1:样本方差的自由度第四十五页,共五十二页,编辑于2023年,星期三一组数据中可以自由取值的数据的个数当样本数据的个数为
n
时,若样本均值确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值;例如,样本有3个数值,即x1=2,x2=4,x3=9,则x
=5。当x=5确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2;样本方差用自由度去除,其原
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基建项目招投标监督与审查办法
- 热力供应空气净化协议
- 气象研究测绘设备租赁合同
- 智慧城市安防监控协议
- 度假村装修项目协议
- 模具合作目标合同
- 石油化工施工合同毛利评估
- 企业干部思想政研论文范文参考
- 社区体育公园建设维护协议
- 精细化工企业火灾防范指南
- 议论文写作技巧
- 教科版五年级科学上册(风的作用) 教学课件
- 二年级下册语文试题 -“诗词大会”题库二 (word版有答案) 人教部编版
- GB/T 7702.20-2008煤质颗粒活性炭试验方法孔容积和比表面积的测定
- 新历史主义文艺思潮
- GB/T 40120-2021农业灌溉设备灌溉用热塑性可折叠软管技术规范和试验方法
- GB/T 3903.2-1994鞋类通用检验方法耐磨试验方法
- GB/T 10801.2-2018绝热用挤塑聚苯乙烯泡沫塑料(XPS)
- 12J5-1 平屋面建筑标准设计图
- 中印边境争端
- 《墨梅》课件(省一等奖)
评论
0/150
提交评论