票据打印机公司工程项目数据采集分析与知识管理(完整版)_第1页
票据打印机公司工程项目数据采集分析与知识管理(完整版)_第2页
票据打印机公司工程项目数据采集分析与知识管理(完整版)_第3页
票据打印机公司工程项目数据采集分析与知识管理(完整版)_第4页
票据打印机公司工程项目数据采集分析与知识管理(完整版)_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、泓域咨询/票据打印机公司工程项目数据采集分析与知识管理票据打印机公司工程项目数据采集分析与知识管理一、 大数据系统和数据挖掘技术(一)数据挖掘概述1大数据大数据是指超过既往数据库系统规模、传输速度和处理能力,或者既往数据库系统结构无法容纳的数据。大数据常以万亿或eb衡量,且种类多、实时性强,蕴藏的商业价值大。很多现有的新或旧的信息基础设施、工具和技术可用来开发和利用大数据中蕴藏的价值。大数据有各种各样的来源:传感器、气候信息、公开的信息、如杂志、报纸、文章、买卖记录、网络日志、病历、事监控、视频和图像档案,及大型电子商务。大数据是数据挖掘产生与生存发展的土壤。如今数据每五年翻一番,面对前所未有

2、的海量数据,为了从中发现有用的信息必须进行数据挖掘。此外,计算机存储、处理大量数据,以及运算的能力大为增强,为数据挖掘创造了条件,使其成为一门独特的学科和技术。2数据挖掘与数据分析的区别数据挖掘与数据分析的主要区别在于:(1)处理工作量。数据分析的数据量可能并不大,而数据挖掘的数据量极大。(2)制约条件。数据分析是从某些假设出发,建立方程或模型,而数据挖掘不作假设,可以自动建立方程。(3)处理对象。数据分析往往是针对数字型数据,而数据挖掘对象类型繁多,例如图像、声音、文本等。(4)处理结果。数据分析可以解释结果的含义;数据挖掘的结果不易解释,着眼于预测未来,并提出决策建议。想要从数据中发现规律

3、(即认知),往往需将数据分析和数据挖掘结合起来。(二)数据挖掘步骤按挖掘对象,数据挖掘分为数据库与数据仓库挖掘和网络挖掘两种,各自步骤分述如下。1数据库与数据仓库挖掘数据挖掘一般有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘、模式评估和知识表示8个步骤。(1)信息收集。从确定的挖掘对象中提取特征,然后选择合适的收集方法,将收集到的信息存入数据库。对于海量数据,必须选择合适的数据仓库。(2)数据集成。把来源、格式、特点、性质不同的数据按逻辑或物理属性加以编排,以便以后使用。(3)数据规约。多数数据挖掘算法耗时很长,商业数据往往较多,数据挖掘更耗时间。数据规约就是简化已有可用数据集的

4、表示,规约后数量大减,但仍能保持原数据的完整性,对规约数据的挖掘结果,与对规约前数据的挖掘结果相同或几乎相同。(4)数据清理。有些数据不完整(属性缺少属性值)、含噪声(属性值错误),不一致(同一信息有多种表示),需要清理,使其完整、正确、一致后存入数据仓库。(5)数据变换。将数据变换成适合数据挖掘的形式。实数型数据,可将其分层和离散化。(6)数据挖掘。根据数据格式、属性与特点,选择合适的处理工具,例如统计方法、事例推理、决策树、规则推理、模糊集,甚至神经网络,取得有用的信息。(7)模式评估。由行业专家核实数据挖掘结果是否合理、是否可用。(8)知识表示。将数据挖掘得到的信息以可视方式交给用户,或

5、作为新的知识存人知识库,供其他应用程序使用。并非所有的数据挖掘都要走上述的每一步。若只有一个数据源,则可以省略数据集成。数据规约、数据清理、数据变换合称数据预处理。数据挖掘至少60%的费用要花在信息收集阶段,而至少60%以上的精力和时间要花在数据预处理上。数据挖掘是一个反复多次的过程,若一次未满足要求或未得到有用结果,则需回到前面,经过调整后重新开始。2,网络挖掘网络挖掘可分为网络用户行为挖掘与网络信息挖掘。前者基本不在工程咨询人员关心之列。后者可理解为“从www中发现和分析有用的信息”。网络信息挖掘是在已知数据样本的基础上,通过归纳学习、机器学习、统计分析等发现挖掘对象间的内在关系与特性,进

6、而在网络中提取用户感兴趣的信息,获得更高层次的知识和规律。网络信息挖掘沿用了robot,全文检索、人工智能的模式识别、神经网络等技术。现在的搜索引擎使用了这些技术,能够在网页或网站数据库中为用户搜寻有用信息。网络信息挖掘具体步骤如下:(1)确立目标样本。由用户选择目标文本,提取特征信息。(2)提取特征信息。根据目标样本的词频分布,从统计词典中提取挖掘目标的特征向量并计算出相应的权值。(3)网络信息获取。先利用搜索引擎站点选择待采集站点,再利用robot程序采集静态web页面,最后获取被访问站点网络数据库中的动态信息,生成www资源索引库。(4)信息特征匹配。提取索引库中的源信息特征向量,并与目

7、标样本的特征向量对照,将符合要求的信息交给用户。二、 时间数据分析方法(一)时间数据时间数据也称时间序列(timeseries)或动态数据,是按时序排列的一组来自同一现象的观察值。时间序列可按日、月、季度、年等收集,有些呈现很强的季节性,建模时应给予反映。气象、水文、生态环境、经济及社会活动都能观察到周期性时间序列。实际观测并记录的时间序列,实际上是随机过程的样本,即,在产生时间序列的实际过程的每一时点上,人们看到的只是该时点随机变量的样本,并不能观察到母体。时间序列可分为平稳和非平稳序列,还可以分成线性和非线性时间序列。(二)时间序列分析1概述时间序列分析是根据随机过程理论,研究时间序列的统

8、计规律。时间序列分析广泛应用于信息压缩、利用卫星照片识别地球资源、石油勘探、经营管理、预测(气象、水文、地震、地下水位、农作物病虫灾害)、控制(环境污染、生态平衡)(天文学和海洋学)等方面。时间序列预测的基本依据是:(1)客观过程是连续的,有惯性,现在是过去的继续,过去的信息会传递到现在与未来,利用过去的数据或信息能推测未来。(2)偶然因素会影响到客观过程,使其行为与模式有随机性。预测要利用时间序列各时点随机量的相关关系。时间序列的趋势与波动称为“模式”,时间序列分析首要要识别其模式,然后用适当的曲线拟合。拟合模式的各种参数根据按“最优预测”原则估算出的时间序列数字特征(期望值、方差、协方差、

9、自相关函数)等确定。2.时间序列成分时间序列常含有4种成分:趋势、季节变动、规则波动和不规则波动。所谓趋势,是长期持续向上或持续向下的倾向。季节变动,是实际过程受气候、市场状况、节假日或风俗习惯等影响而呈现的周期性波动。规则波动,是周期不等的变动,呈涨落交替之状。波动的周期可能很长,但与趋势不同。不规则波动,是时间序列除去趋势、季节变动和周期波动之后的波动。不规则波动总是夹杂在时间序列中,致使时间序列产生一种波浪形或震荡式的变动。时间序列经常是各种周期成分的叠加,例如地震或人工地震波的记录。这样的序列要做频域分析。频域分析确定时间序列各周期成分称为“谱”或“功率谱”的能量分布形态。频域分析又称

10、谱分析。谱分析的重要内容就是通过序列的周期图()的极值点寻找各种分量的周期。3时间序列建模时间序列建模一般有如下几个步骤(1)取得时间序列样本。(2)将样本点画成图,进行相关分析。时间序列图形可显示出变化趋势和周期,并发现离群点和转折点。若离群点确实为观测值,建模时应加以考虑,若非,应加以调整。转折点指时间序列趋势突变的点。如果发现转折拐点,则在建模时须分段用不同的模型拟合时间序列,例如用门限回归模型。(3)模式识别与拟合。时间序列模式众多。小样本可用趋势模型、季节模型加上随机误差拟合。对于样本容量(即观测值个数)大于50的平稳时间序列,可用arma(自回归移动平均)模型拟合。非平稳时间序列可

11、经差分化为平稳时间序列,再用arma模型拟合。(4)预测未来。利用建成的模型预测时间序列未来值。4时间序列常用模型(1)arma模型(2)回归模型三、 信息鉴别及必要性(一)信息鉴别数据与信息鉴别,可称信息识别,就是将信息与具有特定属性的“模式”进行比较,进而判断信息的类别或属性。具体而言,就是信息收集或使用者运用已有的知识和经验,在对获取的信息进行初步分析之后,按照一定原则和目的,辨认与甄别信息的真伪、轻重主次、是否完整、是否有用,以及用途大小等。(二)信息鉴别的必要性互联网时代,信息极为丰富,大大开阔了人们的眼界。然而,蜂拥而至,难辨真假的信息掺杂在一起,常常使人们陷入另一种迷茫,甚至成了

12、海量信息的奴隶。过量的信息若不筛选,会使决策者无所适从。现在,互联网上充斥着伪造、篡改缺失、无代表性、误传、以及过时等信息。有些信息背后隐藏着各种政治、经济社会的利益团体正当或不正当的目的和企图。信息识别及时与否决定了决策是否正确而又及时,决定了企业、事业、项目和其他活动的命运。对于工程咨询,信息识别同样十分必要。信息识别并非简单工作,对从事者有很高的要求。决策者固然应高瞻远瞩,但决策的基础是真实、可靠的信息。决定信息识别成败的主要因素有:对服务目标的正确认识及其深刻程度;识别者实事求是的态度和已有的知识、推理与判断能力。四、 信息鉴别常用方法(一)溯源法对到手信息涉及的问题应追根溯源,及时核

13、对。例如,尽量找到现场和掌握第一手资料的人;核对原始资料,并查对主要参考文献;按其中叙述的方法、步骤,重做实验或演算,以便从来源上找到鉴别依据。鉴别和筛选在手信息,判断是否完整、适用与可靠,是咨询人员的重要工作。工程咨询所需信息十分广泛,不可能也不必均由咨询人员鉴别。为了确保信息可靠,应尽可能选用权威机构发布或已鉴定、批准的信息。例如,地质储量选用储量委员会批准的储量报告;地震带的分布用国家地震局的数据;历史数据用国家统计局的数据。一般来说,专业技术力量强的单位提供的信息较可靠。例如,国际金融组织的国际金融信息较可靠;来自从事钢铁、汽车行业研究的机构的钢铁、汽车业信息较可靠。(二)比较法有些信

14、息受主客观条件限制难以溯源,对此,可用比较法,即比较不同人、不同时间和其他方面的材料;对于某一事实,说法、结论是否一致。如果一致,则基本可辨真伪。若否,就需进一步核查。(三)佐证法任何事物都与其他事物有一定联系,并相互制约。找到这些联系和制约因素,便可判断事物的真伪。一般说来,口头材料不如文字材料可靠,文字不如实物可靠。分析信息产生的过程也是寻求信息佐证的办法。1普查数据一般比抽查数据全面、准确。2监测数据,长期比短期全面,监测范围大的数据比监测范围小的数据代表性强;勘探密度大的数据比勘探密度小的数据准确,科学实验和仿真模拟计算的数据比一般推理的数据准确。3核对来源不同,收集方法不同的数据。如

15、卫星图片、航测数据可用地面实测数据验证;了解来的市场需求量与行业协会、主要企业、国家统计局的数据对比。4对比不同时期、不同来源的数据,并适当修正其间的差距。同一对象的数据,在不同国家、不同历史时期,由于范围不同,计算的标准和口径可能有所不同,造成数据之间有很大的差异。在对比这些数据时,必须查明统计口径,否则就会出错。5由专家集体辨别信息是否准确,是否可靠。对于来自不同渠道的信息,可能因角度不同、口径不一、方法各异等而不一致,甚至矛盾。这时,可请专家集体讨论,弄清差异和矛盾的原因,去伪存真,取得一致意见。(四)逻辑法鉴别信息,逻辑判断必不可少。不经缜密的逻辑思考容易出错。有些基本差错,例如语言或

16、文字的前后矛盾,夸大其词,有悖情理,以及某些虚构,禁不起逻辑的推敲。当然,逻辑合理并不总能证明事物为真,从虚假的前提出发,经过合理的逻辑推断得出的结果不会真实。因此,鉴别信息,既要充分利用经验、认识和判断力,也要借助其他手段。五、 工程咨询信息类型及来源(一)信息类型工程咨询需要的信息,量大、面广。为了便于识别、分析、存储与保管,可从不同的角度将其分类。例如,从信息属性、来源、形态、用途、载体,是否随时而变或是否经过加工处理等角度划分。1不同属性的信息工程咨询中常用如下几种属性信息:(1)法律。国家、各级政府颁布的有关投资与工程建设的各种法律、法规、规章等。(2)规划与政策。国家和地方的各种规

17、划(战略、行业),以及财政、税收、货币、投资和产业等方面的政策。(3)标准与规范。国家各部门或专业协会发布的技术经济指标、定额、标准与规范等。(4)自然与资源。调查、统计或其他机构保存或取得的河流、湖泊、沼泽、山脉、森林、植被、矿藏、水文等地理资料,气象、气候等天文资料等。(5)行业统计。全国乃至全球各行业规模与产业动向、生产与销售、进出口、技术,以及主要企业、公司等的现状、竞争态势,以及发展趋势等。(6)投资与项目。全国乃至全球各种项目的实施过程与结果,包括投资、规模、技术来源、标准、设备、产品性能和目标市场等。(7)区域社会与经济状况。区域的社会、民族、文化、教育、宗教、习俗等人文状况,区

18、域经济发展、税收、财政、基础设施等。2来源不同的信息(1)内部信息。企业或项目已有或反映企业及项目状况,不希望外人获知的信息。(2)外部信息。诸如宏观政策的变动、市场动态、竞争情况、政策法规、技术发展等方面的信息。3媒介与形式不同的信息信息有多种形式,如数据、文字、图样、影像、录音。信息载体或媒介亦有多种,如书籍、文件、报告、会议、数据库和磁盘等。4原始信息与加工信息信息有原始和加工信息。原始信息,如人口普查记录;加工信息,利用某些方法,根据原始信息取得的判断、评价、预测及建议等,如对人口构成的分析。5用途不同的信息信息的用途五花八门,如标准、规范、手册等,通常用于技术方案设计;如生产资料价格

19、、概算定额等,通常用于投资估算;如税率、产品价格、影子价格等,通常用于项目财务分析或经济分析;行业基准收益率、市场竞争情况等,通常用于投资项目决策。6动态信息与静态信息信息可分为静态和动态两类,前者指不随时间变化或变化较小的信息,如道路、停车场、交通附属设施等;后者为随时变化的信息,如道路状况、交通事故、天气、车辆密度与流量等。7显性信息与隐性信息显性信息指以文字、图形或其他符号明显记载于书籍或其他介质的信息。隐性信息是须经过分析、联系与推断才能获得的信息。(二)工程咨询对信息的基本要求信息是咨询和决策的基础,至少应满足如下要求。1来源须可靠,必须来源于实际,不能含有虚假、伪造的成分。2必须全

20、面或较全面反映客观事物与过程,不得将片面、残缺的信息用于咨询。3必须适合或基本适合选用的咨询方法。不同的咨询方法需要不同范围和时间段的信息。如果不能适合选用的咨询方法,就应选择其他咨询方法。(三)信息来源信息来源很多,例如图书馆、档案馆、调查或咨询机构、学校、出版与研究机构、商场、国家与地方统计局及其他政府或新闻机构、国际组织与外国驻华机构、互联网等。1网络和出版物从互联网上能够快速检索到最新、非常有价值的信息。当然,对这些信息必须特别注意加以鉴别,去伪存真。公开出版物同样发布大量有用的信息,例如行业年鉴、调查与统计报告、专题研究报告等。2借阅与购买从合作单位、专门机构索取或购买资料是一种重要

21、的信息来源。如到各种图书馆借阅文献与资料,购买国家或地方统计局出版的综合与行业统计年鉴,向某些调查机构索取或购买调查报告,向测量部门购买卫星图片、航测或航拍图片,向地震部门购买地震分布资料,向水文、气象部门采购历年水文、气象资料,向城市主管部门采购地理信息资料,向地质勘探部门采购地质勘探资料等。3自有信息从事规划、勘察、设计、科研、监理等咨询活动的咨询企业,积累了大量宝贵信息,例如水文地质与地形勘察报告、图档、投资估算、设计概算、工程决算、可行性研究报告、监理报告、实验报告、总结报告、国内外工程招标信息、最新行业动态和资讯、竞争企业情报、国内外工程规范和标准惯例、公司资质和专业资质、人力资源、

22、公文公告、财务信息、企业管理制度和报表模板等,不少咨询企业还拥有专利。六、 工程咨询信息及其管理概述(一)工程咨询信息的内涵信息资源是工程咨询行业的核心资源,通过获取海量有效的信息,依靠信息、知识和智慧、先进科技手段进行服务。信息爆炸的社会要求工程咨询行业服务机构拥有获取信息、处理信息的能力和手段。工程咨询项目管理信息化是结合行业业务特点,以信息资源开发利用为核心,利用现代信息技术、网络技术等现代科技,强化信息技术在业务中的渗透,在工程咨询项目各环节中推广应用信息技术,以提高工程咨询机构管理决策能力,提升咨询工作效率,增强机构行业竞争力。工程咨询需要的信息,涉及自然、资源、气候、水文、地质、人

23、口、人文、项目投入产出、市场(商品、劳动力、金融)、财政及政策、货币政策、法规、标准与规范、发展规划等。(二)工程咨询信息管理的必要性我国经济进入新常态,全球化、绿色发展、结构调整、新技术应用等成为发展主基调,这不仅需要规模巨大的投资,而且更加注重发展质量,这就给工程咨询业带来了极大的发展机遇,也对工程咨询信息管理提出了新的需求。未来工程咨询将更多的应用建筑信息模型技术(bim)、大数据、物联网、地理信息系统(gis)无人机应用、ar仿真模拟、人工智能辅助查询与分析系统等,也迫切要求工程咨询业能够尽快改变传统咨询手段,必须针对新技术、新产业进行调整,建立完善的数据分析与知识管理方法。传统的信息

24、管理模式工作流程繁琐,耗费人力物力,亟待向智能管理模式迈进。工程咨询信息管理以丰富的信息资源为管理重点,利用“互联网+”、数据库管理系统等先进的信息管理手段,协助工程咨询人员能够从海量的业务数据中提供有用的信息,进而做出科学的判断以及正确的决策,从而实现为工程咨询的决策提供更加全面及时的信息支出,使工作更加便捷,回复也更加及时,大幅减少出现错误的概率,安全性更高。七、 项目名称及建设性质(一)项目名称票据打印机公司工程项目(二)项目建设性质本项目属于技术改造项目八、 项目承办单位(一)项目承办单位名称xxx(集团)有限公司(二)项目联系人万xx(三)项目建设单位概况公司依据公司法等法律法规、规

25、范性文件及公司章程的有关规定,制定并由股东大会审议通过了董事会议事规则,董事会议事规则对董事会的职权、召集、提案、出席、议事、表决、决议及会议记录等进行了规范。 公司将依法合规作为新形势下实现高质量发展的基本保障,坚持合规是底线、合规高于经济利益的理念,确立了合规管理的战略定位,进一步明确了全面合规管理责任。公司不断强化重大决策、重大事项的合规论证审查,加强合规风险防控,确保依法管理、合规经营。严格贯彻落实国家法律法规和政府监管要求,重点领域合规管理不断强化,各部门分工负责、齐抓共管、协同联动的大合规管理格局逐步建立,广大员工合规意识普遍增强,合规文化氛围更加浓厚。公司坚持提升企业素质,即“企

26、业管理水平进一步提高,人力资源结构进一步优化,人员素质进一步提升,安全生产意识和社会责任意识进一步增强,诚信经营水平进一步提高”,培育一批具有工匠精神的高素质企业员工,企业品牌影响力不断提升。公司秉承“以人为本、品质为本”的发展理念,倡导“诚信尊重”的企业情怀;坚持“品质营造未来,细节决定成败”为质量方针;以“真诚服务赢得市场,以优质品质谋求发展”的营销思路;以科学发展观纵观全局,争取实现行业领军、技术领先、产品领跑的发展目标。 九、 项目实施的可行性(一)符合我国相关产业政策和发展规划近年来,我国为推进产业结构转型升级,先后出台了多项发展规划或产业政策支持行业发展。政策的出台鼓励行业开展新材

27、料、新工艺、新产品的研发,促进行业加快结构调整和转型升级,有利于本行业健康快速发展。(二)项目产品市场前景广阔广阔的终端消费市场及逐步升级的消费需求都将促进行业持续增长。(三)公司具备成熟的生产技术及管理经验公司经过多年的技术改造和工艺研发,公司已经建立了丰富完整的产品生产线,配备了行业先进的染整设备,形成了门类齐全、品种丰富的工艺,可为客户提供一体化染整综合服务。公司通过自主培养和外部引进等方式,建立了一支团结进取的核心管理团队,形成了稳定高效的核心管理架构。公司管理团队对行业的品牌建设、营销网络管理、人才管理等均有深入的理解,能够及时根据客户需求和市场变化对公司战略和业务进行调整,为公司稳

28、健、快速发展提供了有力保障。(四)建设条件良好本项目主要基于公司现有研发条件与基础,根据公司发展战略的要求,通过对研发测试环境的提升改造,形成集科研、开发、检测试验、新产品测试于一体的研发中心,项目各项建设条件已落实,工程技术方案切实可行,本项目的实施有利于全面提高公司的技术研发能力,具备实施的可行性。十、 项目建设选址本期项目选址位于xxx,占地面积约51.00亩。项目拟定建设区域地理位置优越,交通便利,规划电力、给排水、通讯等公用设施条件完备,非常适宜本期项目建设。十一、 建筑物建设规模本期项目建筑面积54283.01,其中:主体工程41583.36,仓储工程4038.38,行政办公及生活

29、服务设施3996.47,公共工程4664.80。十二、 项目总投资及资金构成(一)项目总投资构成分析本期项目总投资包括建设投资、建设期利息和流动资金。根据谨慎财务估算,项目总投资17130.16万元,其中:建设投资13712.67万元,占项目总投资的80.05%;建设期利息180.26万元,占项目总投资的1.05%;流动资金3237.23万元,占项目总投资的18.90%。(二)建设投资构成本期项目建设投资13712.67万元,包括工程费用、工程建设其他费用和预备费,其中:工程费用12100.36万元,工程建设其他费用1232.99万元,预备费379.32万元。十三、 资金筹措方案本期项目总投资17130.16万元,其中申请银行长期贷款7357.70万元,其余部分由企业自筹。十四、 项目预期经济效益规划目标(一)经济效益目标值(正常经营年份)1、营业收入(sp):3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论