版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基础统计学笔记统计学基础笔记整理一、统计学概论:分理论统计和应用统计:应用统计分为描述统计学和推断统计学。描述统计为一组数据的中(位置:均值、中位数)、散(极差、方差、标准差)、形|(偏度)描述。推断统计分为参数估计和假设检验。 技能:1、经验——数据收集加工——画成图形——数理(规律) (数据不等于数字)PPT 原则:用图不用表、用表不用栏、用栏不用字 实际问题:5M1E——组成过程——产品(结果)——属性(包括:几何(形位方尺)、物理、生化、人文)——集合统计问题:——(构成)总体——样本——数据——类型:分计数型(离散性)和计量型(连续性),即概率分布为计量型分布和技术型分布)——规律分描述和推断。1、总体与样本中间有一种学问: 抽样:验收抽样、统计抽样 样本量2、样本和数据中间有一门测量技术: MSA3、分布规律总体参数: 平均值() 标准差() 总位数() 比例(p)样本统计量的特点:随机变化,不要轻易用样本下结论。拉丁字母在数学上用于总体参数阿拉伯字母表示样本统计量希腊字母表示计算总体参数统计分参数统计和非参数统计。 推断统计分估计:总体总体某参数,用对应的样本统计量去猜测。检验:假设总体某参数已知,用对应的样本统计量去验证。二:统计数据收集与: 1、数据不等于数字、数据的两种类型:描述性分类——响应变量(因变量)和预报因子(独立变量)如性别叫因子,男女叫水平。四种尺度:定类、定序、定距、定比.数据管理的7个层次:无假不乱浅深系4.软件每一列表示一个变量,每一行表示一个样本鱼骨图只适用于一个为什么,变量程序图IPO适用于多个为什么。I (变量)PO水质烧开水 色香味 器皿材质 火燃料风压强目的要抓住关键的变量。2、统计数据的表现形式:绝对数——时期数和时点数相对数——比例:部分比总体比率:部分比部分统计的数据:直接和间接。、数据收集:分被动收集(利用历史和现场)和主动收集(DOE试验设计)现场收集数据是被动收集,分临时数据和常态数据。试验是临时数据。数据好的特征:。。。。数据不好的7个陷阱:缺少假混窄异病缺:缺失(数据表中类型有N(计数型)\T(文本类型)\D(时间类型)少:样本量少假:不真实混:混杂(没有可比性)窄:x的水平设计过窄。因子的范围过窄,没有相关性。异:夹杂异常数据。病:病态(变异系数太小),变异系数 :λ=σ/υ(注意:连续数据:非偶尔发生的问题的计数最好当作连续数据离散数据:包括百分数,技术, 数据分析的前提条件:、判测:MSA2、判异常、判独(效果独立性:标识该变量还受到其它原因的干扰)4、判量:求样本量。统计抽样(非验收抽样)。5、判形:分布的识别——正态性验证6、判散:黑带工具:MSACPKSPC假设检验 试验设计(DOE)(主动研究) (静态被动研究) (动态被动研究) (被动研究) (主动研究)MSA ——过程现状水平评估——统计分析——改善后的效果验证。QC 老7大工具:直排散分鱼查图 QC新7大工具:P箭双阵关系亲P:PDPC过程决策程序图、箭:箭条图(统筹法):计算关键路劲。阵:矩阵图:数字矩阵图、一半矩阵图关:关联图系:系统图(树图) 亲:亲和图:归纳、统计描述:、图示化:用图形(表)描述数据的分布规律。2、求统计量(数值量度:中(位置):均值:算数平均。缺点:对偏态分布没有代表性。中位数:具有稳健性、抗干扰性。众数:数量最多的一个数,一般用于计数型数据的平均值。但不一定唯一,不一定在中心。散:极差(R)=max-min,适合于两本量不多的情况下,一般NC10方差:标准差形偏度:分右偏分布(正偏)和左偏(负偏)峰度:尖峰>0、正态=0、平峰<0求统计量路径:1、一次求一个:计算——列统计量2、一次求多个:统计——基本统计量——显示描述性统计工具一、直方图、用途、目的:用来揭示一组数据的分布状态,并识别异常。2、条件:长用于计量型数据也可用于大概率计数型数据。3、统计路径:图形——直方图4、结构:图形由点、线、柱、框、轴组成。直方图为两轴多柱结构。5、解读:中散形异比(比:和规格比,和两两比。)6、拓展(注意事项):统计——基本统计——显示描述性统计。两图比较——选择右键选平铺和工具二:点图用途、目的:用来揭示一组数据的分布状态,并识别异常。条件:长用于计量型数据也可用于大概率计数型数据。适合于小样本。统计路径:图形——点图结构:两轴多点解读:中散形异比(比:和规格比,和两两比。)能够抓捕异常点——点右键——笔刷——框异常点。拓展(注意事项):统计——基本统计——显示描述性统计。两图比较——选择两个列三、箱线图:用途、目的:用来揭示一组数据的分布状态,并识别异常。条件:长用于计量型数据也可用于大概率计数型数据。 统计路径:图形——箱线图 结构:两轴一筐三线若干点解读:中散形异比(比:和规格比,和两两比。)中位线、上4分:Q3、下4分位Q1Max(minQ1-1.5(Q3-Q1))点:可等于最大点或小于做大点,如大于最大点则能够抓捕异常点——点右键——笔刷——框异常点。拓展(注意事项):了解变化的工具: ——时序图 ——控制图——频率:以上三种均属于 ——排列图工具四、柏拉图:、用途:用来识别关键少数,28原则。2、条件:XY都是计数型数据,常常用于分类的。 偶尔Y可以用于计量型3、路径:统计——质量工具—— pareto4、结构:三轴多柱一线5、解读:看高低,判主次。原始数据格式: 汇总格式 列联表 指示变量6、注意事项:——每一个柱子不能太相近,近乎等概率——其它不能太高,没有分解完。——排列图一定要有时效性——确保相对高度如果等概率:解决方法1、换一种分类方法2、调整Y轴分类方法3、把的同规格放大。(数据规范化)工具五:条形图(柱状图)1、用途:用来比较各自的权重2、条件:XY都是计数型数据3、路径:图形——条形图4、结构:两轴多柱5、解读:看到底 看轻重知识——学来的,搜索能力 (术:工具 技能——练来的 (法:观念——解放,靠修 悟(道:工具六:散点图、用途:揭示两个变量相互关系用的2、条件:XY两个计量3、路径:图形——散点图、解读:看分布,判相关:强正、强负、弱正、弱负、不相关、完全相关5、结构:6、扩展:两个X一个是计数、一个是计量截止上面的图均为静态图。 以下静态图:工具七:时间序列图(时序图)1、用途:按时间的顺序的数据图形2、条件:要求时间,时效型数据3、结购:两轴多点线、解读:看趋势判异常(聚类、混合等)或判独力性5、拓展:工具八:运行图(链条图)、用途:按时间的顺序的数据图形、条件:要求时间,时效型数据、路径:统计——质量工具——运行图3、结购:两轴多点一线、解读:看趋势判异常(聚类、混合等)或判独力性中位数的游程个数,如果少很多,为少聚多混。期望游程个数检验聚类性的近似 P值<0.5 混合近似P值<0.5,向上或向下的游程个数: 期望游程个数检验趋势性的近似 P值<0.5 检验振动性的近似 P值<0.5,5、拓展:总结:二、推断统计:概率与概率分布:当无限量由频率成概率。计量型数据没有点概率,有概率密度(即PDF)计数型数据有点概率随机变量及其分布: 离散:——二项分布 ——超几何分布 ——泊松分布 连续1、正态分布:用途:1、自然界中大部分现象服从正态分布,2、多次抽样的样本均值所构成的分布往往近似正态分布(即中心极限定理)3、其它分布在某种条件下可转化为正态分布。条件:1、计量型2、大概率计数型 3、决定参数:μ σ4
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年特色小镇开发建设合作合同
- 职业卫生课程设计崔晓红
- 统计学课程设计作业
- 化工安全生产管理制度
- 自动循环配料课程设计
- 照明课程设计日志模板
- 中国石化集团公司安全生产监督管理制度
- 电骰子 课程设计
- 硕士课程设计论文格式
- 自动大门plc组态课程设计
- 《建筑施工模板安全技术规范》(JGJ 162-2008)
- 菜品作业指导书-06
- 柴油发电机使用说明书
- 小学劳动教育调查报告
- 电动叉车控制系统详解带电路图
- JGJ-16--民用建筑电气设计规范
- 义务教育数学课程标准(2022年版)
- 仓央嘉措诗全集
- 海洛斯操作手册(说明书)
- 深基坑施工危险源辨识控制措施
- 文史资料选辑合订本(46卷本第1辑至第136辑)
评论
0/150
提交评论