第2章 统计技术基础_第1页
第2章 统计技术基础_第2页
第2章 统计技术基础_第3页
第2章 统计技术基础_第4页
第2章 统计技术基础_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京铁路局第2章、统计技术基础

第一节统计数据及其分类1.1计量数据

凡是可以连续取值的,或可以用测量工具测量出小数点以下数值的数据。计量数据常服从正态分布:(例如:机器加工的同一规格零件的尺寸、衣服的使用寿命、纱样的干重、观测值的随机误差等)正态分布的参数

a)平均值(μ):此参数是正态分布曲线的位置参数,即它只决定曲线出现频率最大数值位置而不改变正态曲线的形状。

b)标准偏差(σ):此参数是正态分布曲线的形状参数,即它决定了曲线的“高”、“矮”、“胖”、“瘦”。北京铁路局第二节、统计技术基础

正态分布曲线集中位置变化影响图形变化分散程度变化影响图形变化北京铁路局1.2计数数据凡是不能连续取值的,或即使使用测量工具也得不到小数点以下的数据,而只能是自然数的数据称计数数据。计件数据计点数据计数数据北京铁路局1.2.1计件数据计件数据是指按件计数的数据。计件数据常服从二项分布(例如:n次的抽样检验中,抽得某类产品(合格品或不合格品)的次数就服从二项分布。二项分布的参数试验次数(n)“成功”的概率(ρ,)二项分布是离散分布北京铁路局1.2.2计点数据计点数据是指按缺陷点(项)计数的数据。计点数据常服从于泊松分布,例如:铸件上的气孔和砂眼数、布匹上的疵点数、纸张上的污点数等。泊松分布的参数只有一个λ。1.3百分率数据类型的判断当数据以百分率表示时,判断其是计量数据还是计数数据,应取决于给出数据的原始数据。北京铁路局公式中x为测量值,n为样本量。极差样本标准差样本方差离散程度Mod(出现频率最高的数值)众数=中位数出现频率最高的数值均值集中趋势说明符号/计算公式统计量为奇数为偶数2统计特征数:统计特征数是对样本说的。

见《全面质量管理》(2010年版)160页北京铁路局3统计方法分类:3.1描述性统计方法—为展示统计数据的规律对统计数据进行整理和描述。例:一个教师通过考试要表达这个班的成绩

最高分数:Xmax,最低分数:Xmin,平均分数:X,极差:R=Xmax-Xmin,标准偏差:S=说明分散的程度。描述性统计方法常用曲线、表格、图形来表述。常见到的描述性统计方法有:排列图、直方图、折线图、饼分图、柱状图、过程能力指数等。北京铁路局3.2推断性统计方法——通过详细研究样本,达到了解、推断总体状况的目的,及有由局部推断整体的性质。例:一个班成绩,去估计学习同样课程的整个年级五个班的学习水平。北京铁路局4统计方法的性质:4.1描述性:对统计数据进行整理和描述,展示统计数据的规律。统计数据可用数量值加以度量,如平均数、中位数、极差和标准偏差;也可用统计图表予以显示,如条形图、折线图、圆形图、频数直方图等。4.2推断性:由局部推断整体。北京铁路局第三节总体与样本1总体:是指在某次统计分析中研究对象的全体,又称母体。2样本:是从总体中随机抽取出来要对其进行分析的一部分个体,也称为子体。北京铁路局3抽样:从总体中随机抽取样品组成样本的活动过程。4随机抽样:使总体中的每一个个体都有同等的机会被抽取出来组成样本的活动过程。例:假设有某种成品零件分别装在20个零件箱中,每箱各装50个,总共是1000个,如果想从中取100个零件组成样本进行测试研究,那么,应该怎样进行抽样呢?北京铁路局随机抽样的方法:①简单随机抽样法将20箱零件混合均匀在一起,并将零件从1-1000编号,然后用查随机数表或抽签的办法从中抽出编号毫无规律的100个零件组成样本。②系统抽样法将20箱零件混合均匀在一起,并将零件从1-1000编号,然后用查随机数表或抽签的办法先决定起始编号,比如由16号开始,那么,后面入选的样本编号依次为26、36、46、56、66、76、86、96、06.于是就由这样100个零件组成样本。北京铁路局③分层抽样法对所有20箱零件,每箱都随机抽出5个零件,共100件组成样本。④整群抽样法先从20箱零件随机抽出2箱,然后对这2箱零件进行全数检查,即把这2箱零件看成是“整群”由它们组成样本。北京铁路局第四节总体和样本的关系北京铁路局总体和样本的关系北京铁路局

第五节两类错误和风险风险性:由于用局部去推断整体,这种结论就不能100%准确,即可能有错误、有风险。情况总体情况样本质量判断总体判断结果1√√√正确2√××第一类错误3×××正确4×√√第二类错误1第一类错误:“弃真”错误,α第一类错误的风险率。2第二类错误:“取伪”错误,β第二类错误的风险率。北京铁路局

假设检验是指应用有限的样本数据对总体未知的重要信息进行合理的判断。北京铁路局练习一、思考题:1、什么是计量数据和计数数据?怎样区分他们?2、什么是总体?样本和个体?3、假设检验的原理是什么?什么是假设检验的两类错误?二、判断题1、测得某产品的质量特性值数据如下:9、5、8、9、4,它们的标准偏差(S)为。()2、标准偏差是表示数据集中程度的统计特征数。()3、不合格品率由于是百分率,因此是计量数据。()4、从某工序抽取零件测量其重量时,抽取零件的工序是原来的总体、抽取的零件是样本。()7北京铁路局三、选择题1、电冰箱的()是计量数据。A、表面喷漆疵点B、噪音大小C、故障次数最多2、测得某项产品的质量特性值如下:95894它们的平均值为()。A6B7C7.5D83、运用统计方法,以样本判断总体,可能犯的第Ⅱ类错误是()。A取真B弃真C取伪D弃伪北京铁路局

4、某种产品的尺寸规格定为98-102mm,如果98-102mm的卡规逐个测量每个产品的尺寸,凡是超出98-102mm范围的产品可定为不合格品,得到的是(

)。A.计量值B.计数值5、某企业测量各车间缺勤率分别为1.2%,0.8%,2.1%,……,这些属于(

)数据?A.计量值B.计数值

北京铁路局四、填空题1、在18个玻璃杯上有8个气泡。“18”是()数据,“8”是()数据,他们都属于()数据。2、抽样,就是指从总体中()样品组成()的活动过程。3、用局部去推断整体容易犯的错误为()和()。五、计算分析题1、测定某产品的质量特性值数据为:10、11、12、14、13、15、15、19、17。求其平均值(X)、中位数(X)、方差(S2

)、标准差(S)和级差(R)值。~北京铁路局解:平均值

X==14

910+11+12+14+13+15+15+19+17~将数据按大小顺序排列,10、11、12、13、14、15、15、17、19则:中位数:

X=14标准差

S≈2.87或8.25极限

R=19-10=9方差S2=1/(9-1){(10-14)2+(11-14)2+(12-14)2+(14-14)2+(13-14)2+(15-14)2+(15-14)2+(19-14)2+(17-14)2]=0.125×[16+9+4+0+1+1+1+25+9]=8.25北京铁路局六、连线题

平均值表示一组数据中心趋向的特征值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论