统计学根本概念_第1页
统计学根本概念_第2页
统计学根本概念_第3页
统计学根本概念_第4页
统计学根本概念_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学根本概念6导论(GB103)6管理模式统计学根本概念主 要 内 容1. 波动(偏差)。2. 连续变量和逻辑变量。3. 均值,中位数,众数,极差,方差, 标准偏差。4. 正态曲线。5. 带正值的标准化数据。6. 中心极限定律。7. 过程能力一用Z值作为恒量尺度。波动的型式与原因 任何过程都包含随机波动(由于一般或普遍原因造成的)和非随机波动(由于特殊原因造成的)。 时 间不合格产品率特殊波动历史水平(0)最正确水平(1)在 0 (30) 范围内的随机波动在 1 (31) 范围内的随机波动普遍原因:过程波动随时间推移是稳定的,可预测的处于控制状态原因: 固有的或是自然的 例如: 垂直向上空先

2、把硬币夹垂直) 抛掷一枚硬币, 统计硬币落地后每一面向上的次数。当抛掷次数很多时,每面向上的次数大约各占一半,只有微小差异。 普遍原因:差异的原因:有风,每次抛掷动作有微小差异,地面不平整,等等。波动的型式与原因 特殊原因:过程波动无法预测 (按小时,按天或按周)处于失控状态原因: 机器调整不当,原材料不合格,操作者本身目标: 检测和消除特殊原因特殊原因:例如: 同样是抛硬币,抛1000次,AB两面 各自向上的次数却相差400屡次。原因: 操作者每次抛掷时,总时将硬币平放,且总是将正面朝上,然后抛出。波动的型式与原因 数据的两种类型连续(可变)数据:使用一种度量单位,比方英寸或小时。 连续(可

3、变)数据的例子:电压、电流、 功率、时间、距离、重量、速度。离散(逻辑)数据:是类别信息,比方“合格 或“不合格。连续数据离散数据统计领域用以下方法处理波动(偏差):描述型统计用图表或总结性的数字 ( 均值,方差, 标准偏差)来描述一系列数据。统 计 推 断当结果差异可能因为随机偏差或不能归 属为随机偏差时所作的决定(假设检验)。试 验 设 计收集并分析数据估计过程改变效果。数理统计的作用总体和样本总体(母体): 它是提供数据的原始集团,是所要研究分析的对象的全部。总体可以是一批产品由于一批产品的数量是有限的,故称为有限总体),也可以是一道工序所生产的所有产品由于其源源不断的运行,甚至也包含今

4、后的产品,故称为无限总体)样本(子样,抽样,试样): 从总体中抽出一局部个体,总体中的这一局部个体称之为样本。它是直接被检测并提供数据的诸个体。连续数据的测量如何描述数据的统计特性:measures of location (central tendency居中程度)measures of dispersion (variation离散程度)描述数据的居中程度Mean均值Median中位数Mode众数Quartiles四分位数 输出值 聚集在某个中心值附近居中趋势平均值,中位数,众数,四分位数是所有居中趋势的测量均 值 (中心值) 均值 总体或样本的平均值。 总体的中心值用 表示。 样本的中心

5、值用x 表示。 样本均值的计算公式如下:The mean is the most common measure of location or center of the data.中 位 数 中位数 反响样本数据中间50%的数值,一系列数据 由低到高排列后所得到的中间数。偶数奇数 众数-在一个数据集中最频繁出现的值。众 数The mode is the observation that occurs most frequently in the sample.The mode may be unique, or there may be more than 1 mode. Sometimes,

6、 the mode may not exist.Range极差Variance方差Standard Deviation标准偏差Inter Quartile Range内四分位极差描述数据的离散程度离散程度的测量用来判定一个数据 集合离散程度或宽度的恒量尺度极 差 - 在一个样本中最大值与最小值的差值。 极差 = 最大值 - 最小值 即:R= x(max) x(min)方 差 与中心值间距的平方和的平均值。 总体的方差用 表示 样本的方差用 s2 表示标准偏差 是方差的平方根。 总体标准偏差由 表示 样本标准偏差由 s 表示Units of Measure直方图块的中点中心光滑连接形成曲线大多数

7、但不是所有数据是正态分布或钟形曲线正 态 分 布 在许多实际问题中, 我们遇到的随机变量都受到为数众多的相互独立的随机因素的影响, 而每一个别因素的影响都是微小的, 且这些影响是可以叠加的. 例如, 电灯在指定条件下的耐用时间受到原料,工艺,保管等条件的影响,而且每一种因素在正常情形下都是均匀地微小且可以叠加的. 具有上述特点的随机变量一般都可以认为是具有正态分布的随机变量. 在现实生产生活中, 我们所遇到实际问题大多数都属于具有正态分布的随机变量, 因此在此我们重点讨论研究此类分布.正 态 分 布 简 介正态分布的特点: 1. 形态如钟; 2. 左右对称; 3. 于平均值处分布的频数最多。此

8、外,越远离平均值,分布的频 数也越少。正态分布的要素: 1.平 均 值:决定正态分布曲线的中心位置; 2.标准偏差:决定正态分布曲线的 “宽窄.为何要研究正态分布?1.它是自然界的一种最根本的最普遍的法那么,反响了事物内在的变化规律; 2.它使我们得以将许多复杂的事物简化处理; 3.它使我们得以通过少量抽样来把握全体,从而节省大量人力,物力,财 力和时间。正 态 分 布 简 介正态检验为什么有用?许多统计检验均值和方差的检验都假定数据是正态分布的,正态检验用来判定该假定是否有效。何时用正态检验? 当你分析数据并要计算根本统计值如Z值或假定正态性的统计检验如T-检验或方差分析(ANOVA)时。分

9、布的正态性检验如何做正态性检验?采用Minitab公司的专业统计软件MINITAB: 如何做正态性检验?方法1:从Minitab的菜单项选择项里, 选择: Stat Basic Statistics Normality Test翻开数据文件: DOT-BOX-HISTOGRAM . MTV如何做正态性检验?从Minitab的菜单项选择项里, 选择 Stat Basic Statistics Normality Test. 我们可以看到以下图的对话框。变量:选择一列数据用于X轴。 正态检验: 有3种类型,通常用Anderson-Darling test. 标题: 用你自拟的题目取代默认的。 单击

10、 OK. 图形输出如以下图。 正态概率图:如何做正态性检验?如何做正态性检验?方法2:从Minitab的菜单项选择项里, 选择: Stat Basic Statistics Display Descriptive Statistics 翻开数据文件: DOT-BOX-HISTOGRAM . MTV如何做正态性检验?从Minitab的菜单项选择项里, 选择: Stat Basic Statistics Display Descriptive Statistics我们可以看到以下图的对话框。 如何做正态性检验?结果显示:P-Value大于0.05,判定数据的分布为正态分布。 (冒险概率=0.05)

11、 如何做正态性检验? 显示在图上的总结包括添加了分布曲线的直方图和Anderson Darling正态检验的P值 显示在右上角。 正态检验的通常规那么当P值小于或等于0.05那么认为样本数据的分布不同于标准的正态分布。相反,当P值 大于0.05,那么认为样本数据的分布与正态没有显著差异。 进一步解释:正态性检验属于根据样本来检验关于总体分布的检验方法,属于数学中的非参数检验方法。对于正态检验,原 假 设 为: H0:总体的分布与正态分布无显著差异;对立假设为: H1:总体的分布与正态分布有显著差异。 其中P值代表判断总体数据分布和正态分布没有显著差异的可能性。上图表现了数据分布的直方图及分布曲

12、线,从图中我们可以看出此图不是正态分布。结果说明:Visual interpretation the data set.Common graphical tools to illustrate a data set:Dot Plot 散点图Box Plot 盒子图Histogram 直方图图形工具描述散点图 ( Dot Plot )The dot plot is useful for displaying a small body of data.散点图更易分析样本容量较少的参数特性。The location or central tendency in the data set and it

13、s spread or dispersion are easily identified.散点图对单个样本数据的居中程度和离散程度都很容易看出来。It can also be used in comparing two or more data sets.散点图还可用于定性地比较两组样本或多组样本的数据之间有无显著差异。案例:某器件AM5003特性参数电流增量( mA ):批次A:4.5,7.3,4.8,6.2,8.7,5.1,3.5,5.4,4.6,3.8批次B:4.5,7.3,4.8,6.2,8.7,5.1,11,13,9.7,10.5Minitab: Graph Dotplot 散点图

14、( Dot Plot )翻开数据文件: DOT-BOX-HISTOGRAM . MTV结论:散点图 结果显示:批次A的电流增量比较集中,均值小,因此批次A的 质量比较稳定;而批次B的电流增量比较分散,均值较大,性能较差。图形结果显示:散点图 ( Dot Plot )批次A批次B盒子图 ( Box Plot )Not to be used when sample size is less than 10 units.注意:当样本容量小于 10 时请勿采用! 盒子图是比较样本数据间的分布差异,中心位置和分散大小。 和散点图相近,都是用来分析样本数据的居中程度和离散程度,但比散点图更直观,更有效。*

15、异常点 75%数(3/4分位)Q3Q1MaxMinimum, Q1 - 1.5 IQRQ3 + MinMaximum, Q3 + 1.5 IQR 25%的数(1/4分位)Q1中位数(1/2分位)Q2注:盒子的高度内四分位极差(IQR) Inter Quartile Range Q3-Q1 盒子图 ( Box Plot )数据的中心50%(盒子的高度)Minitab: Graph Boxplot : 盒子图 ( Box Plot )翻开数据文件: DOT-BOX-HISTOGRAM . MTV单个样本数据分析:图形结果显示单个样本数据分析:盒子图 ( Box Plot )盒子图 ( Box Pl

16、ot )翻开数据文件: DOT-BOX-HISTOGRAM . MTV多个样本数据比较分析:盒子图 ( Box Plot )图形结果显示多个样本数据比较分析:直方图 ( Histogram )The histogram, a graphical presentation of the frequency distribution, provides a visual impression of the shape ofthe distribution of measurements.直方图表征数据的概率分布,主要应用在了解数据分布的形状 及形态。便于掌握数据的居中趋势,数据的分布等。X-axi

17、s:measurement scale 测量数据的区间划分,随着区间的调 整,数据的形状分布略有不同。Y-axis:frequency (or relative frequency) scale 事件发生的频数。Not to be used when sample size is less than 50 units.注意:当样本容量小于 50 时谨慎使用直方图!Minitab: Graph Histogram直方图 ( Histogram )翻开数据文件: DOT-BOX-HISTOGRAM . MTV图形结果显示:直方图 ( Histogram )中心极限定律概率论根本概念:1.随机变量根

18、据试验结果对随机试验取什么值的变量。2. 随机事件的频率 设随机事件A在n次试验中出现了r次,那么称比值r/n为这n次试验中事件A出现的频率,记作W(A)即: W(A)= r/n 3. 概率的统计定义随着试验次数n的增大,事件出现的频率r/n在区间0,1上的某个数字p附近摆动,那么定义事件的概率为: P(A)= p 根据贝努里大数定理,在实际应用中,当试验次数很大时,便可以用事件出现的频率来代替事件发生的概率。中心极限定律在实际问题中,有许多随机变量,它们是由大量的相互独立的随机因素的综合影响所形成的,即可以表示成独立随机变量之和,这种随机变量往往近似地服从正态分布,这就是中心极限定律地客观背

19、景。1. 独立同分布地中心极限定理指出:设独立随机变量序列X1, X2, , Xn,服从同一分布,并具有有限的数学期望和方差,那么只要n充分大,不管Xi 服从什么分布, 近似地服从正态分布德莫佛拉普拉斯定理指出:当n很大时,在n次独立重复试验中事件A发生地次数近似服从正态分布。从而服从二项分布的随机变量近似服从正态分布N(np, np(1-p)。在次品率为 p 的一大批产品中任取 n 件产品,那么取得次品的件数 服 从二项分布)。例1“总销售量是许多许多经销商销售的总和,一个销售商可能不是正态分布,但总的销售量大致是正态分布的。例2许多产品的堆积高度大致是正态分布,即使单一产品高度不是正态分布。注意:不是所有数据服从正

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论