苯甲酸工程项目数据分析与挖掘_第1页
苯甲酸工程项目数据分析与挖掘_第2页
苯甲酸工程项目数据分析与挖掘_第3页
苯甲酸工程项目数据分析与挖掘_第4页
苯甲酸工程项目数据分析与挖掘_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、苯甲酸工程项目数据分析与挖掘一、 大数据系统和数据挖掘技术(一)数据挖掘概述1大数据大数据是指超过既往数据库系统规模、传输速度和处理能力,或者既往数据库系统结构无法容纳的数据。大数据常以万亿或eb衡量,且种类多、实时性强,蕴藏的商业价值大。很多现有的新或旧的信息基础设施、工具和技术可用来开发和利用大数据中蕴藏的价值。大数据有各种各样的来源:传感器、气候信息、公开的信息、如杂志、报纸、文章、买卖记录、网络日志、病历、事监控、视频和图像档案,及大型电子商务。大数据是数据挖掘产生与生存发展的土壤。如今数据每五年翻一番,面对前所未有的海量数据,为了从中发现有用的信息必须进行数据挖掘。此外,计算机存储、

2、处理大量数据,以及运算的能力大为增强,为数据挖掘创造了条件,使其成为一门独特的学科和技术。2数据挖掘与数据分析的区别数据挖掘与数据分析的主要区别在于:(1)处理工作量。数据分析的数据量可能并不大,而数据挖掘的数据量极大。(2)制约条件。数据分析是从某些假设出发,建立方程或模型,而数据挖掘不作假设,可以自动建立方程。(3)处理对象。数据分析往往是针对数字型数据,而数据挖掘对象类型繁多,例如图像、声音、文本等。(4)处理结果。数据分析可以解释结果的含义;数据挖掘的结果不易解释,着眼于预测未来,并提出决策建议。想要从数据中发现规律(即认知),往往需将数据分析和数据挖掘结合起来。(二)数据挖掘步骤按挖

3、掘对象,数据挖掘分为数据库与数据仓库挖掘和网络挖掘两种,各自步骤分述如下。1数据库与数据仓库挖掘数据挖掘一般有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘、模式评估和知识表示8个步骤。(1)信息收集。从确定的挖掘对象中提取特征,然后选择合适的收集方法,将收集到的信息存入数据库。对于海量数据,必须选择合适的数据仓库。(2)数据集成。把来源、格式、特点、性质不同的数据按逻辑或物理属性加以编排,以便以后使用。(3)数据规约。多数数据挖掘算法耗时很长,商业数据往往较多,数据挖掘更耗时间。数据规约就是简化已有可用数据集的表示,规约后数量大减,但仍能保持原数据的完整性,对规约数据的挖掘结果,

4、与对规约前数据的挖掘结果相同或几乎相同。(4)数据清理。有些数据不完整(属性缺少属性值)、含噪声(属性值错误),不一致(同一信息有多种表示),需要清理,使其完整、正确、一致后存入数据仓库。(5)数据变换。将数据变换成适合数据挖掘的形式。实数型数据,可将其分层和离散化。(6)数据挖掘。根据数据格式、属性与特点,选择合适的处理工具,例如统计方法、事例推理、决策树、规则推理、模糊集,甚至神经网络,取得有用的信息。(7)模式评估。由行业专家核实数据挖掘结果是否合理、是否可用。(8)知识表示。将数据挖掘得到的信息以可视方式交给用户,或作为新的知识存人知识库,供其他应用程序使用。并非所有的数据挖掘都要走上

5、述的每一步。若只有一个数据源,则可以省略数据集成。数据规约、数据清理、数据变换合称数据预处理。数据挖掘至少60%的费用要花在信息收集阶段,而至少60%以上的精力和时间要花在数据预处理上。数据挖掘是一个反复多次的过程,若一次未满足要求或未得到有用结果,则需回到前面,经过调整后重新开始。2,网络挖掘网络挖掘可分为网络用户行为挖掘与网络信息挖掘。前者基本不在工程咨询人员关心之列。后者可理解为“从www中发现和分析有用的信息”。网络信息挖掘是在已知数据样本的基础上,通过归纳学习、机器学习、统计分析等发现挖掘对象间的内在关系与特性,进而在网络中提取用户感兴趣的信息,获得更高层次的知识和规律。网络信息挖掘

6、沿用了robot,全文检索、人工智能的模式识别、神经网络等技术。现在的搜索引擎使用了这些技术,能够在网页或网站数据库中为用户搜寻有用信息。网络信息挖掘具体步骤如下:(1)确立目标样本。由用户选择目标文本,提取特征信息。(2)提取特征信息。根据目标样本的词频分布,从统计词典中提取挖掘目标的特征向量并计算出相应的权值。(3)网络信息获取。先利用搜索引擎站点选择待采集站点,再利用robot程序采集静态web页面,最后获取被访问站点网络数据库中的动态信息,生成www资源索引库。(4)信息特征匹配。提取索引库中的源信息特征向量,并与目标样本的特征向量对照,将符合要求的信息交给用户。二、 时间数据分析方法

7、(一)时间数据时间数据也称时间序列(timeseries)或动态数据,是按时序排列的一组来自同一现象的观察值。时间序列可按日、月、季度、年等收集,有些呈现很强的季节性,建模时应给予反映。气象、水文、生态环境、经济及社会活动都能观察到周期性时间序列。实际观测并记录的时间序列,实际上是随机过程的样本,即,在产生时间序列的实际过程的每一时点上,人们看到的只是该时点随机变量的样本,并不能观察到母体。时间序列可分为平稳和非平稳序列,还可以分成线性和非线性时间序列。(二)时间序列分析1概述时间序列分析是根据随机过程理论,研究时间序列的统计规律。时间序列分析广泛应用于信息压缩、利用卫星照片识别地球资源、石油

8、勘探、经营管理、预测(气象、水文、地震、地下水位、农作物病虫灾害)、控制(环境污染、生态平衡)(天文学和海洋学)等方面。时间序列预测的基本依据是:(1)客观过程是连续的,有惯性,现在是过去的继续,过去的信息会传递到现在与未来,利用过去的数据或信息能推测未来。(2)偶然因素会影响到客观过程,使其行为与模式有随机性。预测要利用时间序列各时点随机量的相关关系。时间序列的趋势与波动称为“模式”,时间序列分析首要要识别其模式,然后用适当的曲线拟合。拟合模式的各种参数根据按“最优预测”原则估算出的时间序列数字特征(期望值、方差、协方差、自相关函数)等确定。2.时间序列成分时间序列常含有4种成分:趋势、季节

9、变动、规则波动和不规则波动。所谓趋势,是长期持续向上或持续向下的倾向。季节变动,是实际过程受气候、市场状况、节假日或风俗习惯等影响而呈现的周期性波动。规则波动,是周期不等的变动,呈涨落交替之状。波动的周期可能很长,但与趋势不同。不规则波动,是时间序列除去趋势、季节变动和周期波动之后的波动。不规则波动总是夹杂在时间序列中,致使时间序列产生一种波浪形或震荡式的变动。时间序列经常是各种周期成分的叠加,例如地震或人工地震波的记录。这样的序列要做频域分析。频域分析确定时间序列各周期成分称为“谱”或“功率谱”的能量分布形态。频域分析又称谱分析。谱分析的重要内容就是通过序列的周期图()的极值点寻找各种分量的

10、周期。3时间序列建模时间序列建模一般有如下几个步骤(1)取得时间序列样本。(2)将样本点画成图,进行相关分析。时间序列图形可显示出变化趋势和周期,并发现离群点和转折点。若离群点确实为观测值,建模时应加以考虑,若非,应加以调整。转折点指时间序列趋势突变的点。如果发现转折拐点,则在建模时须分段用不同的模型拟合时间序列,例如用门限回归模型。(3)模式识别与拟合。时间序列模式众多。小样本可用趋势模型、季节模型加上随机误差拟合。对于样本容量(即观测值个数)大于50的平稳时间序列,可用arma(自回归移动平均)模型拟合。非平稳时间序列可经差分化为平稳时间序列,再用arma模型拟合。(4)预测未来。利用建成

11、的模型预测时间序列未来值。4时间序列常用模型(1)arma模型(2)回归模型三、 现代工程咨询方法的特点现代工程咨询方法的特点是,定性分析和定量分析相结合,重视定量分析;静态分析与动态分析相结合,重视动态分析;统计分析与预测分析相结合,重视预测分析。定性分析与定量分析1定性分析定性分析是通过研究事物构成要素间的相互联系来揭示事物本质的方法,它是在逻辑分析、判断推理的基础上,对客观事物进行分析与综合,从而找出事物发展内在规律性,确定事物的本质。在工程咨询研究中,许多难以用计量表达的场合,定性分析方法可以发挥重要作用。2定量分析定量分析是依据统计数据,选择建立合适的数学模型,计算出分析对象的各项指

12、标及其数值的一种方法。它是通过反映一定质的事物量的关系来揭示事物内在规律的方法,在数学、统计学、运筹学、计量学、计算机等学科基础之上,通过方程、数学图表和模型等方式来研究事物的本质。在工程咨询工作中采用定量分析的方法,对复杂事物进行数据处理,进行比较分析,可以使问题更为清晰,解决方案更精确。静态分析与动态分析1静态分析静态分析是观测和评价事物某一时点状态的一种方法。如项目评价中通过计算静态投资回收期、总投资收益率、资本金净利润率等指标,可以对项目的财务效益得出初步的判断。2动态分析在工程咨询服务的各个阶段,特别是在项目决策评价阶段,要树立动态观念,如考虑资金时间价值、市场供求变化、技术发展变化

13、、社会经济环境的变化等。现代项目财务评价一般以动态分析为主,主要进行项目现金流量分析,计算财务净现值、内部收益率等指标,并进行风险概率分析等。统计分析与预测分析1统计分析统计分析是对分析对象过去和现在的信息进行收集、整理、统计和分析。在现代工程决策研究咨询中经常需要采取多种方法和渠道,收集大量的统计数据,包括行业、区域、市场、技术、企业等的统计资料和信息,从而分析、归纳和总结事物的发展规律,把握发展动向;在项目执行阶段,也需要对项目的执行情况进行监控,对投资、质量、进度等进行统计分析,并与计划进行比较,判断项目的进展情况,以便采取有针对性的应对措施,促进项目的顺利进行。2预测分析预测分析是依据

14、分析对象过去和现在的信息,采用一定的方法,对事物未来发展趋势进行分析、推测、判断的方法。预测分析是现代工程咨询的重要方法,尤其是在投资前期决策阶段,预测分析是项目咨询的重要工作。投资项目决策是建立在对未来预测的基础上的,需要对未来的社会经济环境、产业政策走向、技术发展趋势、市场需求变化、原材料供应、配套条件约束、资金市场等进行预测。四、 项目背景分析六氢苯甲酸(简称cca),即环己甲酸,使无色片状或柱状结晶。熔点28-30,沸点232.5,120-121(1.7kpa),相对密度1.0481(15/4),折射率1.4530。溶于多数有机溶剂,15时在水中溶解度为0.201g/100g。六氢苯甲

15、酸是生产己内酰胺最重要的中间产品之一。单独作为商业产品时可用作硫化橡胶的增溶剂、石油的澄清剂和医药中间体,用于药物抗孕392和治疗血吸虫新药吡喹酮的合成。中美贸易的摩擦,全球多边贸易格局变化以及紧密相关的石油价格波动频繁,有望在2019年上升,将会导致原材料价格相应产生波动,原材料价格的波动对行业利润产生影响;近年来行业内企业产能不断扩张,导致市场竞争加剧。六氢苯甲酸可用于合成光引发剂和吡喹,此外还可用作石油澄清剂、硫化橡胶增溶剂,应用范围广泛,具有良好市场发展前景,未来几年随着我国下游行业对六氢苯甲酸需求的不断增长,六氢苯甲酸行业市场规模还将进一步增长。2017年国内市场六氢苯甲酸产品需求总

16、量为2845吨,2018年我国六氢苯甲酸产品需求增长至3300吨,我国六氢苯甲酸产品市场规模从2014年的1.22亿元增长至2018年的2.23亿元。近年来,我国出台了一系列有关化工行业的规划和政策。工业和信息化部石化和化学工业十二五发展规划指出,重点发展国民经济建设急需的化工新材料及中间体、新型专用化学品等高端石化化工产品,科学技术部国家重点新产品计划支持领域(2012年)将环境友好型新涂料、新型精细化工中间体等列入支持领域。2016年工业和信息化部发布石化和化学工业十三五发展规划指出:深入实施创新驱动发展战略和绿色可持续发展战略,着力改造提升传统产业,加快培育化工新材料,突破一批具有自主知

17、识产权的关键核心技术,打造一批具有较强国际影响力的知名品牌,建设一批具有国际竞争力的大型企业、高水平化工园区和以石化化工为主导产业的新型工业化产业示范基地。国家政策的大力支持将在很大程度上促进六氢苯甲酸行业的发展。六氢苯甲酸是一种重要的有机合成中间体,可用于合成光引发剂184。六氢苯甲酸下游光引发剂行业的发展依赖光固化技术的发展。光固化技术的产业化最早在德国拜耳实现,随后在北美、欧洲和日本等地区和国家从事光固化生产的企业迅速发展。进入21世纪,我国的光固化产业获得快速发展,成为仅次于美国和日本的光固化原材料和配方产品的生产大国,特别是光引发剂已成为世界上最大的生产和出口国。近二十年,随着各国对

18、环境保护问题的日益重视,光固化技术的应用领域迅速扩展,其应用领域不断拓展,从印制线路板、微电子、光纤材料等迅速向医疗、3d打印等领域延伸。这些行业近几年发展速度比较快,市场需求持续稳定增加。并且国外相关印刷电路板、液晶显示器等产能也正逐渐向中国、印度等国家转移。这种下游产能不断扩大反过来对上游的六氢苯甲酸行业起到了推动作用。这种扩大的市场需求将推动对六氢苯甲酸的产品需求持续增长。五、 项目概述(一)项目基本情况1、项目名称:苯甲酸工程项目2、承办单位名称:xx有限公司3、项目性质:新建4、项目建设地点:xxx(以最终选址方案为准)5、项目联系人:杜xx(二)主办单位基本情况公司始终坚持“人本、

19、诚信、创新、共赢”的经营理念,以“市场为导向、顾客为中心”的企业服务宗旨,竭诚为国内外客户提供优质产品和一流服务,欢迎各界人士光临指导和洽谈业务。本公司秉承“顾客至上,锐意进取”的经营理念,坚持“客户第一”的原则为广大客户提供优质的服务。公司坚持“责任+爱心”的服务理念,将诚信经营、诚信服务作为企业立世之本,在服务社会、方便大众中赢得信誉、赢得市场。“满足社会和业主的需要,是我们不懈的追求”的企业观念,面对经济发展步入快车道的良好机遇,正以高昂的热情投身于建设宏伟大业。公司不断推动企业品牌建设,实施品牌战略,增强品牌意识,提升品牌管理能力,实现从产品服务经营向品牌经营转变。公司积极申报注册国家及本区域著名商标等,加强品牌策划与设计,丰富品牌内涵,不断提高自主品牌产品和服务市场份额。推进区域品牌建设,提高区域内企业影响力。公司自成立以来,坚持“品牌化、规模化、专业化”的发展道路。以人为本,强调服务,一直秉承“追求客户最大满意度”的原则。多年来公司坚持不懈推进战略转型和管理变革,实现了企业持续、健康、快速发

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论