相关性方法演示_第1页
相关性方法演示_第2页
相关性方法演示_第3页
相关性方法演示_第4页
相关性方法演示_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、现阶段数据处理方法共同探讨对现阶段燕化一厂裂解炉改造前后数据分析处理方法的尝试1函数关系与相关关系2函数关系是一一对应的确定关系设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量各观测点落在一条线上 xy3函数关系(几个例子)某种商品的销售额y与销售量x之间的关系可表示为 y = px (p 为单价)圆的面积S与半径R之间的关系可表示为S=R2 企业的原材料消耗额y与产量x1 、单位产量消耗x2 、原材料价格x3之间的关系

2、可表示为 y = x1 x2 x3 4相关关系(correlation)变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量 x 取某个值时,变量 y 的取值可能有几个各观测点分布在直线周围 xy5相关关系(几个例子)父亲身高y与子女身高x之间的关系收入水平y与受教育程度x之间的关系粮食单位面积产量y与施肥量x1 、降雨量x2 、温度x3之间的关系商品的消费量y与居民收入x之间的关系商品销售额y与广告费支出x之间的关系6相关关系(类型)7散点图(scatter diagram)不相关负线性相关正线性相关非线性相关完全负线性相关完全正线性相关8相关系数 相关系数又称线性相

3、关系数.它是衡量变量之间线性相关程度的指标。样本相关系数用r表示,总体相关系数用表示,相关系数的取值范围为-1,1。|r|值越大,误差Q越小,变量之间的线性相关程度越高;|r|值越接近0,Q越大,变量之间的线性相关程度越低。 如两者呈正相关,r呈正值,r=1时为完全正相关;如两者呈负相关则r呈负值,而r=-1时为完全负相关。完全正相关或负相关时,所有图点都在直线回归线上;点子的分布在直线回归线上下越离散,r的绝对值越小。当例数相等时,相关系数的绝对值越接近1,相关越密切;越接近于0,相关越不密切。当r=0时,说明X和Y两个变量之间无直线关系。通常|r|大于0.8时,认为两个变量有很强的线性相关

4、性。9 总体相关系数 对于所研究的总体,表示两个相互联系变量相关程度 的总体相关系数为: 总体相关系数反映总体两个变量X和Y的线性相关程度。 特点:对于特定的总体来说,X和Y的数值是既定的 总体相关系数是客观存在的特定数值。 10相关系数 (计算公式) 样本相关系数的计算公式或化简为11相关系数的经验解释 |r|0.8时,可视为两个变量之间高度相关0.5|r|0.8时,可视为中度相关0.3|r|0.5时,视为低度相关|r|0.3时,说明两个变量之间的相关程度极弱,可视为不相关上述解释必须建立在对相关系数的显著性进行检验的基础之上12标准偏差标准偏差(Std Dev,Standard Devia

5、tion) -统计学名词。一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。13算术平均值算术平均值是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。14残差15中位数将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为Md。 当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。(参考)16回归分析 reg

6、ression analysis 回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。实践中大多是非线性回归分析,其中一般遇到的问题基本是可以借助数学手段将其变为线性回归分析,基本方法是最小二乘法。17我们的数据处理特点数据分析对象数据采集工作数据简单分析方法18数据分析对象投料量燃料量蒸汽量热效率各部位温度氧含量风机转速等等19对我们现阶段的数据特征来看,结合我们现阶段的工作要求下面三个数据是我们关注的重点:投料量(M)燃料量(F)蒸汽量(S)对裂解炉来说,投料量是自变量,其他两个是因变量20数据的采集工作各个数据的意义数据采集的周期数据采集的数量(样本空间)21相关性R是否合理标准偏差S.D是否减小残差筛选数据22数据分析的前提条件很大的周期内肯定不是线性相关,但是在小的周期内可以近似看成线性相关介质组分相近或修正燃料组分相近或修正裂解深度相近或修正外部环境相近或修正(辅助设备,配套设备或天气时令)23实例炉数据分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论