版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要目的:通过对电网信息管理系统所搜集的数据资料进行归纳、计算和研究,我们可以根据其分析结果来进行相关的事项的决策。而对于一个企业来说,充分的对电网信息管理系统中的数据进行处理能够帮助企业尽快的掌握客户需求以及市场发展动向。意义:在以往,企业的电网信息管理系统比较落后,对于其所获得的客户数据无法进行深层次的分析与研究,往往只是传统意义上的增减,因而整个系统没有充分发挥这些数据的价值,无法为企业的发展提供参考性建议。在此基础上,本文便设计了一个新型的专门用来为企业进行数据分析与研究的电网信息管理系统。通过这个系统,企业可以有效地发现各个数据之间的关系,并且据此推导出客户在用电的过程当中的一些现状,根据所统计以及研究的结果为企业下一步的发展计划提供参考,从而改善企业的服务质量。结果:本文所设计的新型信息管理系统能够有效地根据系统所采集的数据仔细进行分析与研究,从而找出不同的客户群体的不同需求,并且按照不同的标准进行客户细分。与此同时,本系统还可以根据客户在缴纳电费的过程当中是否欠费、欠费的额度以及还款的及时性对客户的信用进行详细的评估。此外,本系统的运行软件是采用就最新的SSH框架当中的MVC模式。通过此种模式的后台运行,使得系统运行起来更加的流畅,并且在后期若是相关功能需要完善也会变得更加方便。结论:本系统所使用的数据挖掘技术可以说在数据资料的处理过程当中发挥着巨大的优势。我们知道,在信息管理系统所采集到的数据当中,并不是所有的数据都是有用的,其中还存在着一些无用的,没有利用价值的数据。通过数据挖掘技术我们便可以把那些后期分析研究过程当中所需要的数据提取出来,从而使得整个的数据处理更加的科学和合理,同时也能够更好的为企业服务。由于数据挖掘技术能够快速的对数据进行筛选处理,并且其计算速度快,容量大,算法非常先进,因而在信息管理系统当中采用此技术无疑是锦上添花,使得数据处理结果更加科学合理。关键词:数据挖掘;电力用户;信息采集系统
AbstractObjective:Tomakeuseofthedataintheinformationmanagementsystemofthepowergridandadoptappropriatedataanalysisandprocessingtechnologytoanalyzeandexcavateit,makingitintodecision-makinginformationtoprovidethebasisfordecision-makingofenterprisedevelopment.Powergridenterprisemarketingandimprovethelevelofcustomerservicetoprovidedecisionsupport,asthecurrentissuetoberesolved.Meaning:theexistinginformationmanagementsystemcanonlybealotofthismassiveuserdataforsimpleadditionsanddeletionssearchoperation,cannottapandimplicitinthedatadeeprelationshipsandrules,butcannotbebasedontheserelationshipsandrulestopredictuserbehaviordevelopmenttrend.Inviewoftheabovesituation,thispaperconstructsauserbehavioranalysissystemforpowergridenterprisesandimplementssomeclassicdataminingalgorithms.Thesystemcananalyzethelargeamountofuserdataleftbytheexistinginformationmanagementsystem,anddigoutthedeepAssociationrules,andchangetodecision-makinginformation,thedecision-makinginformationtoassistthepowergridenterprisemarketingdecisionsandimprovetheircustomerservicelevels.Results:Thesystemisdesignedtomeettheneedsofthegridcompany'suserbehavior,inordertoachieveelectricitycustomersegmentation,customercreditratingandarrearshighriskcustomerforecastingthreemajorfunctions.Thissystemisdividedintofivemodules:dataacquisition,datapreprocessing,datamining,resultanalysisandsystemmanagement,whichcoversthefunctionsneededinthewholedataminingprocess,andadoptsMVCmodeofSSHframeworkSystemimplementation,tofacilitatefuturesystemmaintenanceandenhancements.ThesystemadoptsthethinclientmodeofB/Stocarryonthedevelopment,theenterprisemayregardtheconcreteresourcessituationconvenientandnimbletocarryonthedisposition,hastheverystrongactualusevalue.Conclusion:DataMining(DM)technologyhasshownunparalleledadvantages.Dataminingtechnologyistheprocessofidentifyingpotentiallyusefulknowledge(modelsorrules)fromalargenumberofrandomandnoisydata,whichimprovestheapplicationofdatafromlow-levelonlinequeryoperationstodecisionsupport,Suchashigher-levelapplications.Withtheadventoftheeraoflargedata,dataminingtechnologyisrapidlydevelopingandwidelyusedinvariousfields,dataminingtechnologyhasalargecomputingscale,advancedalgorithms,powerfulfeatures,sothatinthefieldofdatamininghasundergonealargenumberofTheactualprojecttest,thedataminingtechnologyappliedtothebehaviorofcustomersofelectricityanalysisandprocessingwithhighreliabilityandpracticality.Keywords:datamining;poweruser;informationcollectionsystem
目录摘要 1Abstract 2第1章绪论 61.1研究背景及意义 61.2国内外研究现状 71.3研究方法及研究内容 81.3.1研究方法 81.3.2研究内容 91.4论文创新点 9第2章理论概述 112.1数据挖掘的理论概述 112.1.1数据挖掘的概念和意义 112.1.2数据挖掘的基本过程 122.2SSH简介 132.2.1J2EE概述 132.2.2MVC模式 142.2.3SSH框架 16第3章系统需求分析 203.1用电客户细分 203.2客户信用等级评估 233.3欠费高风险客户预测 263.4本章小结 28第4章系统设计 294.1系统概述 294.2系统的体系结构 304.3系统的数据库设计 314.4系统模块详细设计 354.4.1数据采集模块 374.4.2数据预处理模块 374.4.3数据挖掘模块 394.4.4结果分析模块 404.4.5系统管理模块 414.5本章小结 41第五章系统实现 425.1数据采集模块 425.2数据预处理模块 435.3数据挖掘模块 455.3.1用电客户细分 455.3.2客户信用等级评估 495.3.3欠费高风险客户预测 525.4结果分析模块 525.5系统管理模块 535.6本章小结 54第六章系统部署与运行测试 546.1系统的软硬件开发及测试环境 546.2系统部署 546.3运行测试 556.4测试结果 606.4系统缺点 616.5本章小结 62参考文献 63致谢 67
第1章绪论1.1研究背景及意义随着社会信息技术的发展,许多的行业都开始通过对客户数据的分析与研究来为企业的下一步发展计划做参考。而本文所研究的内容就是针对电力行业的用户信息管理系统所采用的数据挖掘技术。通过对数据挖掘技术在这方面的使用情况的研究来充分发挥其效用,为企业谋求最大效益。在使用此项技术的过程当中,一般来说通常都会涉及到计算机以及统计学的相关知识,因此我们必须充分利用各学科知识来进行研究。我国各电力公司正逐步建设电能信息采集系统,经过几年的建设和发展,已经开发了一批典型的电力信息系统,实现了电力信息采集系统的各个方面的建设,主要体现在以下几个方面:在电表测量点校准级别的电能计量系统采集系统中,为了变电站监控和控制,公用配电变压器测量点电压检测和控制系统的运行,用作主要信息收集和集中处理数据系统。它致力于用户的关注,完成负载管理审查,电力管理和信息系统的控制,但同时,我国国家电网系统的每个部分也存在一些问题,如缺乏协调,整体系统调整,专业发展和系统建设部门。该系统主要基于业务流程,系统设计和单一操作,涉及单一类型的数据采集和数据采集频率,不能满足信息管理的要求。随着对使用手机和信息共享的限制,大量的信息不能完全集成系统,实现各种功能使用。随着全面推广系统的建设,电力用户中国智能电网和快速启动电力信息采集系统的市场营销作为智能电网和电力企业的一部分,是一个双向过程,提高客户服务质量用户要求智能电网建设满足各种需求,能力,提高客户服务质量的需求。为了更好地满足现代经济发展的需要,全面推进智能电网智能电力技术的建设,实力。在现代市场经济中,快速响应客户需求的营销,并提供强大的数据支持,将为电力市场的发展提供强有力的支撑,电力企业的发展是国家电网的密集发展,高素质的发展,规范管理水平。1.2国内外研究现状作为一种数据挖掘技术在国内外大数据时代的学术界和商界已经得到广泛认可,主要研究机构和研究部门都非常认真,取得了很多成就。近年来中国跟随国际趋势,国家研究机构和大学设立了一个研究基金支持该项目,但学术研究和实际应用的数据挖掘的研究和应用在进一步系统的开发,基本上仍处于初始阶段,数据挖掘技术在用户行为分析系统中的应用主要集中在金融行业和电信行业等领域,很少用于网格用户行为数据分析和数据挖掘结果。在电力系统领域,基于改进数据挖掘的数据关联规则,发电企业竞争差距逐渐拉开。王志勇,曹立等人在电力市场的综合评价方法方面,利用数据聚类方法提取客户负荷模型,然后用于分析负载电源客户模型。聚类分析法应用于电力营销分析领域,客户电力企业集群分为不同群体,不同群体具有不同的电力营销策略,电力系统的负荷特性提高了企业的经济效益,采用神经网络法根据气象历史对数据进行分类。孙云英,贺光宇,翟海青等人提出了基于时间序列的预测,电力系统负荷平滑负荷模型预测模型和时间序列组合计算。在电力系统领域,电力系统稳定。相关学者研究了软件安全开发的稳定性已投入商业使用,东北电网负荷预测系统使用各种功能可以完成负荷预测,发电规划系统包括CC-2000平台软件提供多种资源和服务,与此同时还可以实现数据和接口的统一管理,金蝶公司还推出了自己的集成电源自动决策支持系统。在用户行为分析中,Web挖掘的用户行为分析和图书馆书目数据库的建设,用户行为模型,从用户识别和用户损失警告两个方面提出了对电信行业数据挖掘用户行为模型的分析方面提供定量理论支持,应用算法基于决策树来有效提高图书馆个性化服务水平算法,分析当前网络时间序列VIP客户数据,数据电信运营商提供用户行为,VIP运营商营销策略的典型案例是南京电信网络业务集群技术为客户,完善办公活动和业务网络用户行为的分析和批准,完善分析自动处理系统的空白优势有利于经济企业。从上面可以看出,目前电力行业的用户行为分析可以应用于数据挖掘技术,而一些已经实现的结果基本上仍然处于初始阶段。1.3研究方法及研究内容1.3.1研究方法通过数据挖掘技术我们便可以把那些后期分析研究过程当中所需要的数据提取出来,从而使得整个的数据处理更加的科学和合理,同时也能够更好的为企业服务。由于数据挖掘技术能够快速的对数据进行筛选处理,并且其计算速度快,容量大,算法非常先进,因而在信息管理系统当中采用此技术无疑是锦上添花,使得数据处理结果更加科学合理。本文所设计的新型信息管理系统能够有效地根据系统所采集的数据仔细进行分析与研究,从而找出不同的客户群体的不同需求,并且按照不同的标准进行客户细分。与此同时,本系统还可以根据客户在缴纳电费的过程当中是否欠费、欠费的额度以及还款的及时性对客户的信用进行详细的评估。此外,本系统的运行软件是采用就最新的SSH框架当中的MVC模式。通过此种模式的后台运行,使得系统运行起来更加的流畅,并且在后期若是相关功能需要完善也会变得更加方便。本系统采用B/S架构,主要用于电网数据中心的电网营销行为分析,预测电力需求等方面内容,包括客户细分和客户信用评级以及客户信用评级和高风险。根据经典数据挖掘过程,系统分为数据采集,数据预处理,数据挖掘,数据分析和五个系统管理模块,涵盖了工作所需的挖掘数据的所有功能模块。在系统的预处理模块中,我们根据连续的数据和离散值进行统计,忽略丢失的数据,删除负数,常数值,整体平均填充回归,采取填充数据清理方法,进行删除处理,根据信息增益和信息增益方法来降低数据速率,并结合最大变焦十进制、最小值和Z-SCORE数据转换方法。数据挖掘模块的核心,实现了贝叶斯的KNN和K-means算法的数据挖掘,基于系统架构,根据功能和技术的情况进行特定网络用户行为的分析和预测。1.3.2研究内容本文共分7章,每章的主要内容如下:第一章:本文主要介绍研究背景和意义,国内外研究现状及研究的主要内容。第二章:主要相关技术。本文主要介绍数据挖掘的定义,架构,任务,方法和应用技术,并简要介绍SSH框架。第三章:系统需求分析。本文主要阐述了矿业用户行为的具体需求,包括能源客户细分,客户信用评级的三个方面以及高风险客户。第四章:系统设计。这部分主要介绍系统结构,数据库设计和每个模块的详细设计第五章:系统实现。根据数据收集,数据预处理,数据挖掘,分析结果,系统实现五个模块的系统管理系统第六章:系统部署和操作测试。本文主要介绍系统部署和测试操作过程中需要注意的事项,介绍测试过程的操作以及系统测试数据和结果的一些关键特性。第七章:总结与结论。系统总结和分析工作中的问题,并做下一步预设。1.4论文创新点(1)本系统可以根据客户在缴纳电费的过程当中是否欠费、欠费的额度以及还款的及时性对客户的信用进行详细的评估。(2)本系统的运行软件是采用就最新的SSH框架当中的MVC模式。通过此种模式的后台运行,使得系统运行起来更加的流畅,并且在后期若是相关功能需要完善也会变得更加方便。(3)本系统能够有效地根据系统所采集的数据仔细进行分析与研究,从而找出不同的客户群体的不同需求,并且按照不同的标准进行客户细分。
第2章理论概述2.1数据挖掘的理论概述随着信息技术的发展,人们对数据的收集和挖掘能力越来越强,在社会生活的各个角落中,包括政府办公、工程开发、商业运营、科研等均形成了海量的数据库。不过数据的激增也使得很多有价值的信息被埋没起来,人们希望将有价值的数据挖掘出来并进行深入分析。录入、汇总、查询、统计数据等方面的功能现有的数据库产品均已具备,不过对于海量数据中所隐藏的规则和关联性却难以识别出来,难以以现有的数据为依据对未来的发展情况做出预测,一方面存在数据大爆炸的现象,另一方面却存在知识匮乏的问题。人类社会毫无疑问已进入了信息大爆炸阶段,而现代人普遍需要面对的一个问题就是信息过量。全社会需要解决的共同问题就是,在海涵的信息海洋中,怎样将所需的知识在短时间内找出来,使信息利用率得到提高。2.1.1数据挖掘的概念和意义数据挖掘技术是指在分析研究过程当中把所需要的数据提取出来,从而使得整个的数据处理更加的科学和合理,数据挖掘技术能够快速的对数据进行筛选处理,并且具有计算速度快,容量大,算法非常先进等特点。第一届国际知识发现与数据挖掘大会于1995年召开,首次提出了数据挖掘(DataMining)的概念,一项基于人工智能的数据分析技术是该词的来源,具体而言,就是自动将潜藏在大量数据中的有用的知识,通过关键信息的搜索与筛选等方式找出来。这些模型通常分为两类:描述模型和基于历史数据的预测模型。通过构造预测模型可以判断一些行为的有效性,预测模型包括回归计算、决策和网络技术的运用。描述性模型主要用于理解和知识的现有数据,主要技术包括聚类和最近邻技术,规则诱导,分析分类和序列。在本研究中,限制分析的有限数据和工具只能描述使用聚类分析和模型相关分析的诱导技术,模型本身不能描述,但可以提供有价值的结论。因此,为了更好地了解数据挖掘这一技术的内涵,我们在不同的视角对其进行了详细的说明。具体如下:数据挖掘就技术角度而言,指的是将隐含在实际应用数据中的、之前人们不知道的,但却是有价值的知识与信息提取出来这样一个过程,实际应用数据往往具有量大、随机、模糊、有噪声、不完全等特点。数据分析、数据融合、决策支持等都属于数据挖掘的近义词,需要强调的是,数据挖掘必须依靠真实的数据源,从中找出用户感兴趣的、且能够被他们所理解、接受以及运用的知识。这是一门交叉性学科,面对数据,人们可以将其中有价值的信息挖掘出来,进而支持决策,而不再停留在简单查询的层次。在以往,企业的电网信息管理系统比较落后,对于其所获得的客户数据无法进行深层次的分析与研究,往往只是传统意义上的增减,因而整个系统没有充分发挥这些数据的价值,无法为企业的发展提供参考性建议。在此基础上,本文便设计了一个新型的专门用来为企业进行数据分析与研究的电网信息管理系统。通过这个系统,企业可以有效地发现各个数据之间的关系,并且据此推导出客户在用电的过程当中的一些现状,根据所统计以及研究的结果为企业下一步的发展计划提供参考,从而改善企业的服务质量。2.1.2数据挖掘的基本过程挖掘海量数据,将其中有价值的知识与信息找出来,这样一个过程即数据挖掘,其具体又包含以下几个环节:1.数据准备海量的业务数据即数据挖掘的对象,而且这些数据往往还是无序的,一般会在数据库中存储,清除无效数据是数据挖掘工作的首要步骤,合并的数据或减少不同标准的数据分类。基于数据之间的差异,确保数据挖掘的一致性,为数据挖掘铺平道路;还需要排除相关数据,避免多种数据造成的干扰,影响知识发现和结论的形成。此外我们还应该区分不同数据在不同的系统中的作用,不同的现场数据可以结合相关条件,然后根据数据转换,存储和编码,清楚数据挖掘的意义,数据准备是数据挖掘的第一步,虽然它看起来很简单,但它是这个过程中的一个重要步骤。这一步省略经常影响以下结论,因此需要重复计算,避免影响效率。2.数据挖掘数据挖掘是指在分析研究过程当中把所需要的数据提取出来,从而使得整个的数据处理更加的科学和合理,数据挖掘技术能够快速的对数据进行筛选处理。3.结果评价和表达首先,评价数据挖掘结果,结果可能有效或无效,无效内容被删除,进一步分析有效内容,但不是有效内容必须有意义或价值,还要与业务分析和实践,深入评价有意义的内容,从有效的法律知识发现研究。然后根据知识视图,进行挖掘知识和实践,并确保已知知识和内容挖掘之间没有矛盾,挖掘显然是荒谬的知识,抛弃了最后一步是最重要的是使用知识,知识将会应用于商业实践,深度商业服务,知识发现是使用真实知识的实践。知识是真正的价值。挖掘结果可以直接应用于营销决策的实践知识,引导企业加强生产过程的管理。2.2SSH简介2.2.1J2EE概述Java2平台由美国太阳微软系统公司于1998年发布,目前的平台有三个版本,即J2ME平台,J2SE平台和J2EE平台。其中,J2EE是企业开发的真正行业标准,目前使用的Java技术的优点是目前使用的J2EE平台具有易维护和高灵活性的优点,开发人员只需要简单的配置即可实现事务处理,并发控制和资源共享和服务系统,大大简化了系统架构和模块设计。系统开发人员可以更多地专注于业务设计,提高系统的质量,也大大缩短了项目开发时间。图2-1显示了J2EE的典型四层结构:图2‐1J2EE的体系结构
从上述J2EE系统结构看,J2EE的系统结构主要由客户层,Web层,业务逻辑层和企业信息系统层组成。客户层主要由图形用户界面和Java应用程序组成,用户可以通过图形用户界面或Java应用层和Web层是主要的交互式Web容器,主要是响应客户端请求级别,根据客户端的请求产生相应的响应给用户业务逻辑层主要负责应用的核心业务。逻辑层是J2EE系统的灵魂部分,包括会话交谈Bean和消息驱动Bean,企业信息系统层是存储业务数据,有时称为数据层,根据实际情况,可能包括数据库系统,事务系统,企业资源规划系统等传统系统。2.2.2MVC模式1.MVC设计思想MVC是模型-视图-控制器这个概念的英文简写,俗称模型视图控制器。MVC是由Xerox公司在20世纪80年代开发的软件设计模型,并已被广泛应用于Smalltalk语言。近年来,已经推荐作为SunJava平台的设计模式,并且越来越多的开发人员开始使用这款软件。应用MVC设计模式输入,处理,输出流按照Model,View,Controller隔离,应用分为三层:模型层,视图层,控制层。他们每个都处理自己的任务。(1)视图层代表:网络应用程序的用户界面,它是传统的应用程序软件,是一种新技术,如动画,视频,声音和网络服务等手语应用程序,如复杂性和规模,接口处理已经成为一个具有挑战性的应用程序可以有许多不同的视图,程序的设计模式的主要优点之一是许多不同的视图到处理应用程序,相同的数据可以有各种显示形式或不同的视图。鉴于治疗局限于收集用户数据和用户请求,不包括在业务流程视图中,业务流程模型考虑到实际事务没有发生,实际上它与输入和输出数据相同,允许用户操作的方式。例如,在移动电话销售系统中,订单视图仅从模型订单接收数据并将其显示给用户,并且请求控制层的输入数据和模型层以及用户界面。本系统的采用文本框和网络页面作为视图。(2)模型层(Model):包含了应用问题的核心数据、业务流程/状态的处理以及业务规则的制定和计算功能,它封闭了所需的数据,提供了完成问题处理的操作过程。在这一模块当中,系统会根据相关的操作要求进行数据处理。模型层有业务模型和数据模型,本系统业务模型对应服务资料文件夹下的各个业务处理类,进行相应的业务处理,数据模型对应操作程序包下的各个操作动作类和运行程序资料文件夹下的各个操作动作分类,数据模型主要用于打包对象数据和保存操作,如手机销售系统,一个订单将保存到数据库或从数据库获取订单,这些模型可以单独列出,例如数据包在所有操作数据库在模型中只有有限的。返回数据模型是独立的,即模型和数据格式此模型可以提供多个数据模型的视图,使用代码只写一次这样提高了代码的重用性。(3)控制层(Controller):接受用户的输入,并调用模型和查看模型和视图,一起连同用户请求控制层的完成是分布式的,它接收请求,不仅业务逻辑处理,传送请求信息给用户的模式,然后选择告诉什么模型来满足视图的要求,返回用户显示。比如在手机销售系统中,用Struts2框架中的Action类作为控制层,接收用户的请求,传递给模型层,由模型层返回处理结果,Action根据处理结果返回控制字符串,从而决定呈现哪种视图给用户。MVC设计模式的过程如下:首先,控制器接受用户请求,该模型应该调用决策模型,然后调用业务逻辑来处理用户请求并返回结果,最终选择用户显示相应的视图控制器。此过程如下图2-2所示:遵循MVC设计模式,Struts2框架按照这种设计思想把Web应用系统分低耦合度的三部分组件:模型组件、视图组件和控制器组件。Struts2与MVC对应关系如下:在Struts2框架中,模型组件由封装业务数据的JavaBean和实现业务逻辑的Service构成,完成具体的业务处理;视图组件由一组JSP文件或者其他视图技术(如FreeMarker、Velocity)构成,完成与Web页面表单元素的绑定;控制组件由FilterDispatcher、Action类以及Struts2框架的配置文件struts.xml构成,作为中间纽带将视图组件与模型组件联系在一起。2.2.3SSH框架1.Struts2开源框架简介(1)Struts2概述Struts2是Apache开源软件组织提供的开放源码工程,是MVC设计模式的典型实现,它为JavaWeb应用开发提供了现成的通用的MVC框架结构,把Servlet、JSP、JSTL和信息资源整合到统一的框架中,简单易用,加快了开发的速度。(2)Struts2框架的核心组件Struts2框架的核心组件是动作(Action),它是业务控制器,完成每一个请求的处理,因此在整个系统当中它是处理各种操作的基础。动作的作用主要有三个:①动作为请求封装工作单元,使用execute()方法控制业务逻辑。②动作为数据转移提供场所,将页面表单的请求数据自动转移到动作中名字匹配的属性上。③动作返回控制字符串,以便开发人员在后台系统配置文件中选择应该被呈现的结果页面。操作动作类是开发者自己编写实现的,一般有一个实现方法,也可以定义其他业务控制方法。执行返回一个设置类型值,写操作,还需要在配置文件中配置具体的操作过程,配置过程包含以下几个要素:(1)操作过程的逻辑名,即用户请求到对应于元素等级操作过程的位置(2)的信息对应操作的位置,(3)定位逻辑资源的指定名称和实际结果。另外,菜单框架提供了一个操作工具类,该类实现了操作过程接口和验证方法,一般开发人员可以写操作过程,可以直接运行它,它可以直接运行也可以不继承。(3)Struts2工作流程用户发起请求(HttpServletRequest请求),例如:login.action,然后请求经过一系列的过滤器,然后核心控制器被称为数据处理程序,决定是否调用操作来处理请求进程,如果进程决定调用动作,则程序有权请求操作服务代理,数据处理程序通过搜索配置文件需要调用操作,并创建一个新的操作示例,通过代理模式调用操作动作,但在调用之前,新的操作将全部与操作相关的操作和拦截器配置根据加载操作,这些应用程序请求的自动拦截链功能的一般功能,如工作流验证或文件上传等。一旦动作完成,控制字符串返回,并将新动作放在相应的查看页面上响应结果。2.Spring框架本框架是由罗德约翰逊设计的开源框架,主要是解决企业应用程序开发的复杂性,以前只有通过商业应用程序组件在应用程序中,设置基本程序才能完成,但不限于开发集为服务器。现在,任何应用程序都可以受益于焦点,这是由于测试集的简单性和偶合性。J2EE系统的应用程序被设置为提供一个程序化的解决方案,以解决基于J2EE的开发中的许多常见问题。它提供了一种一致的方法来管理业务对象和提倡面向接口的编程,但它也是基于编程类型编写的标准应用程序编程语言提供了一个编程框架,它提供了一个声明式事务管理和其他企业管理战略。复杂性的应用可以放弃后台应用程序服务技术,并且关键业务组件的应用类似,享受传统应用。另外,用丰富的后台服务帮助抽象操作技术,开发人员可以使用一致,并且同时减少应用程序中的代码量,仍然可以服务于最容易使用的程序操作模式。简单来说,集合是用于控制定向反演的轻量级容器框架所以我们可以编写更干净,更易于管理,更容易测试的代码框架的功能由7个定义良好的模块组成,如图2-3所示SpringSpringAOPSpringORMSpringWebSpringDAOSpringContextSpringMVCSpringCoreContainer图2-3Spring框架图3.Hibernate框架Hibernate是一个面向对象和对象关系映射框架的轻量级开源数据库连接,应用程序员可以使用数据库访问控制和面向对象编程,使用统计应用程序可以连接到任何数据库,可以使用客户端程序,也可以使用对于网络应用,计算革命过程由J2EE框架代替,完成数据统计组件技术的商业应用在应用程序的持久化任务。统计程序是一个简单的架构概述图。Hibernate接口的核心共有五个,五个核心接口将用于任何开发,通过这些接口,不仅可以完成对象的访问,还可以控制事务。ApplicationApplicationDatabaseHibernateHpertiesXMLMappingPersistentObjects图2-4Hibernate体系结构的概要简图
第3章系统需求分析客户关系管理是继续加强与客户的沟通,了解客户需求,不断为产品和服务满足客户需求,完善持续流程,其核心思想是以客户为企业管理的重要资源,发展战略和建立客户中心,实现营销目标。客户行为是从多个角度挖掘客户价值评估,探索客户的需求,为了实现个性化营销的目标,电力行业有自己的特殊性,而电力产品满足客户需求,企业网络服务水平和服务意识是关键,同时,电网企业还应注意其盈利能力。对于电网公司,将在下面更详细地讨论当前的用户行为挖掘,包括用于预测客户细分和客户对电力的需求以及高风险客户信用评级的低风险等三个方面内容。3.1用电客户细分电力客户分割是利用大类电力客户按照一定标准向不同客户群体,为了实现不同营销策略的目标,根据客户特定细分指标的不同类型可能不同于使用电力,用电习惯,或不同客户的需求。要使用正确的功率,客户细分是电网企业营销战略发展的起点,具体有以下好处。(1)为电网公司提供有针对性的服务和营销,提高市场竞争力;(2)客户对电网企业的变革需要适应快速跟踪,客户管理和服务战略,提高客户满意度。(3)能源的份额和客户持有的客户的发展趋势是好的,从而有效降低成本,增加市场份额。根据客户关系管理理论,企业所获得的利润只来自于发挥着重要作用的小部分客户。但是,成千上万的电网企业客户,以及电网客户的稳定性,获得单一产品服务,决策电力公司在关键客户,以及一般业务方法和不同型号。目前,电网企业主要通过一些关于客户分类的静态信息,如行业分类,使用电,电,电压等。然而,这些静态信息不能反映用户的行为和动态需求,开发营销策略不是很多使用,通过分析某个电网公司的数据仓库,非常注意和促进客户关税恢复,加上公司的利润来自客户,客户行为和动态需求的决策分析如下(1)忠诚情况。忠诚度主要体现在客户体验中,从系统数据到几个月的公式如下:客户保留时间=当前月份-开始日期(3-1)(2)成长的长短主要体现在改变报告公式(3-2)的年增长率和容量的能力:公式:(3)装载条件。在一定程度上,负载变化反映了客户的经济形势和经济前景,这有利于客户的动态跟踪发展,以便于营销和服务。此外,我们的长期超载电网负载效应,利率太低会影响企业的经济利润,因此必须控制在合理的空间内。实际计算方式为:(4)贡献度。在这个评价指标当中,我们注意考虑用户的实际用电情况以及结合市场的用电价格水平来进行综合预测。实际计算方式为:(5)信誉度。在这个评价指标当中,我们主要通过对用户是否及时按照规定的价格标准缴纳所用的电费来进行评判,以此来衡量客户的信誉情况如何。实际计算方式为:在计算过程当中,时间期限一般按照三个月、六个月以及十二个月这三个不同的时间期限进行统计,然后再把各个时期的计算结果综合起来进行评估。实际计算方式为:客户欠费次数和平均缴费时长从客户对缴费的重视程度方面衡量客户的欠费行为,实际计算方式为:客户的违规窃用电量和违规窃用电次数从客户诚信角度衡量客户行为,实际计算方式为:通过以上指标,结合数据挖掘技术中的集群分析,可以完成对电网公司的电力客户分段任务。经过进一步分析电网公司的数据仓库,可以发现主要用于数据挖掘涉及两个表,这是“营销帐户”和“费用和支付信息”,涉及以下两个字段。表3-1轻度汇总_营销账务_当月字段类型备注用电类别VARCHAR包括大工业用电、非普工业等类别报装容量NUMBER单位:kVA计量点状态VARCHAR包括运行、停用等计量点编号VARCHAR本月实收金额NUMBER应收电费NUMBER应收电费(含税)就缴电费NUMBER售电量NUMBER单位:kW.h发行日期DATE启用时间DATE公司代码VARCHAR供电单位机构欠费金额(本月前)NUMBER截止到目前所欠电费的总金额(含税)用电客户编号VARCHAR在同一用电地址与供电企业签订供电合同关系的同一法律主体的唯一编号在“应收账款”和“支付电费”和“用于计算一段时间的拖欠数量的欠款字段”的表中,类别字段主要用于区分客户的类型,字段用于计算电力负荷销售信息“和”信息容量“,”启用“字段用于计算用户”客户忠诚度,电量和测量点数主要用于标记。表3-2费用_实收信息字段类型备注用电客户编号VARCHAR在同一用电地址与供电企业签订供电合同关系的同一法律主体的唯一编号计量点编号VARCHAR收费日期DATE在“客户编号表”和“测量点”字段中,以及“轻度_营销帐户_每月摘要表格”与成本日期字段获取电力客户支付时间。3.2客户信用等级评估一般来说,信用评级是利用共识和规则(也称为信用价值)评估客户信用目标在国外,信用评级已广泛应用于商业银行个人信用卡贷款,商业贷款,商业风险评估,使用比较成熟,效果非常好。在当今市场经济环境下,电网公司建立的客户信用评级体系非常必要有效,可以有效提高运营效率,为企业带来巨大的经济和社会效益。具体来说,以下客户对电网企业系统的信用评级:(1)合理有效地为客户服务分配资源企业资源有限。同样,对于企业的网格资源客户服务不仅限于建立一个信用评级系统,可以帮助确定不同级别的客户获得更高的信用等级,网格可以更好地分配资源提供服务,更灵活,更方便,更优惠的价格,更高的质量和更高的服务,客户满意度更高,电网资源更合理有效。(2)识别客户,增加资产效率风险企业是一个非营利组织,特别是对于电网企业,电网预建发电厂扩建,大量投入生产需求,如果风险不认识客户,将在电力和有效信用等级上承担相当大的风险系统电网企业可以帮助确定信用等级,信用风险越来越高,客户可以及时采取有效的预防措施,以提高电网资产的效率。(3)安排企业项目客户评价合理有效的评价指标体系,有效的客户信用评级,不同客户的电网企业信用等级不同的灵活评价项目,有效提高用户的电气安全管理和监督整体设备,大大提高了网络安全性。作为传统商业银行业,经过多年的探索和实践,客户研究的评价机制已相当广泛,有很多经验公式和案例供参考。但对于电网企业来说,信用评价等级仍处于初步勘探阶段,通过数据挖掘大量客户信息,然后结合相关业务人员的评价和反馈,建立完整有效的信用评级体系一个非常有用的方法。对于电网公司,尚未形成完整的客户信用评级体系,信用评级指数和子公司不一致,通过对电网公司A数据仓库的分析和研究,发现现有企业整合客户信用和信誉,没有有效的数据可用,因此我们必须定义一个新的客户信用公式。与相关业务人员和技术专家沟通,决定使用电网公司的利润贡献,而不是更加注重客户信用。实际计算方式为:由于客户的信用评级和信用评级,公司现有的数据仓库数据收集不全面,可以根据基本信息和客户行为使用,客户信用分配,信用调查,客户评估,然后使用已知的新客户信。第一步,客户信用评价模型,在数据挖掘中使用聚类技术,对现有客户关系进行聚类分析,对每个客户的信用评级特征,并咨询相关业务人员和技术专家,针对每种类型的客户评级和手动标记。第二步,第一步通过聚类挖掘技术相关信息,使用分类方法构建数据挖掘的分类模型,从而实现新客户的信用评级。经过对电网公司数据仓库的进一步分析,数据挖掘涉及客户信用评级从“中性_营销帐户”和“客户_基本信息”两个表,具体字段如下。表3-3轻度汇总_营销账务_当月字段类型备注计量点编号VARCHAR用电客户编号VARCHAR在同一用电地址与供电企业签订供电合同关系的同一法律主体的唯一编号行业类别VARCHAR包括农业、林业、畜牧业等用电类别VARCHAR包括大工业用电、非普工业等类别客户用电方式VARCHAR包括公线专变客户、专线专变客户、公变客户等方式客户类别VARCHAR包括大客户、中客户、小客户三类客户所属供电区域VARCHAR供电区域代码是供电企业单位编码,到区县供电分公司一级,也是供电分公司代码电量NUMBER售电量,单位:kW.h应收电费应收电费(含税)实收金额NUMBER本月实收金额欠费金额NUMBER截止到目前所欠电费的总金额(含税)收费方式VARCHAR在“应收账款”,“客户利润贡献计算”和“债务”字段,“成本”,“类别”和“类别”客户“电力场初步估计和客户信用关联”,将成为企业的重点,以“能源乘客数量”形式“测量点”和“自然数量客户”领域主要用作为标志。表3-4客户_基本信息字段类型备注自然客户编号VARCHAR独立的法人和实体包括自然人的编号客户经济性质VARCHAR包括国有企业、集体企业、私营企业、个体户等用户所属行业VARCHAR包括农业、林业、畜牧业等在“客户经济”和“用户属于行业领域”的表中,客户的信用度初步估计相对较大,而轻度_营销会计表_关键领域月度抽象关键兼并。3.3欠费高风险客户预测目前,商业,金融,防灾,环境监测和预警管理产业已被广泛应用于电力行业作为企业的公共性质,主要集中在电力供需预警管理和网络安全监控两个方面随着市场经济的发展。中国电力公司作为经济损失的一部分逐渐从制造企业进入企业客户拖欠电力公司,如果客户可以很容易地导致电网企业长期拖欠,影响金融危机良好的电网条件。对于电网公司,尚未建立客户默认的高风险预警管理模式,通过对企业数据仓库的数据的研究和分析,在数据仓库中的高风险预测模型可以尝试通过使用现有数据建立客户默认,对于不同类型的客户在模型中分为两种类型,特别是在债务偿还方面。实际计算方式为:对于欠款预测,高风险客户可以通过进一步分析数据仓库来构建模型,解决数据挖掘中的分类问题,主要用于营销会计中等月收入和客户信息。表3-5轻度汇总_营销账务_当月字段类型备注公司代码VARCHAR供电单位机构行业类别VARCHAR包括农业、林业、畜牧业等供电方式VARCHAR包括公线专变供电、专线专变供电、公变客户等方式客户用电方式VARCHAR包括公线专变客户、专线专变客户、公变供电等方式包括I类计量装置、II类计量装置等等级客户类别VARCHAR包括大客户、中客户、小客户三类计量点等级VARCHAR电量NUMBER售电量,单位:kW.h电压等级VARCHAR作为直流和标准频率为50Hz交流标准电压的编码的代码采集方式VARCHAR包括现场单户、现场集抄、遥抄等方式报装容量NUMBER单位:kVA计费容量NUMBER计算基本电费的变压器容量,单位:kVA收费方式VARCHAR在“收款能力”,“安装”,“电力”和“成本”表中,结合“应收账款”和“支付”中的以及在一定时期内计算客户的金额客户类型和电力、电压等领域可能与高风险客户具有一定的相关性,并且客户默认金额和默认费率计算非常强烈,行业默认固有属性,并且“客户文件”中的信用评级结合开采。表3-6客户_客户档案月表字段类型备注信用度等级VARCHAR客户文件“信用评级表”在相关字段将为轻度_营销帐户_月摘要表,用于进一步开采。3.4本章小结本章主要阐述电网公司挖掘用户行为的具体需求,包括电力客户细分,客户信用评级和默认高风险客户,每个预测详细分析和计算公式涉及三个方面的要求,简要分析数据挖掘技术的使用。
第4章系统设计前面一章介绍了基于用户需求的网络用户行为数据挖掘分析系统,本章将对系统的一部分进行详细的设计,详细的设计分为系统概述,系统结构,数据库设计和模块系统。4.1系统概述数据挖掘系统分析基于互联网使用应用程序语言开发网络用户行为,具有后台应用程序设置系统的结构,经典数据挖掘过程进入数据采集,数据预处理,数据挖掘,五功能挖掘系统分析和系统管理模块,功能模块。图4-1系统功能模块图该图显示了系统的主要功能模块,每个子功能的设计和实现将在下面介绍。根据电网公司系统分析人员在各省,总体人员和管理体系的需要,他们扮演的不同角色和功能应该区分系统用例图。图4-2系统用例图系统显示一部分系统管理员可以使用数据来分析系统的所有功能模块,可以分析系统中涉及的所有功能使用包括系统中所有模块的大多数功能的数据,工作人员只能使用部分数据和查看相关功能,包括数据采集模块,系统管理模块和最小分析模块,下面详细介绍不同人员的使用。4.2系统的体系结构系统概述在介绍中,系统将用于设置轻量级应用程序框架组合实现后台组件层,根据用户的网络浏览器使用网页服务器程序接收用户请求和输入信息,然后输入信息发送到业务逻辑层,业务逻辑层,表示层数据展现给用户到业务逻辑程序里得到指令后负责具体的业务,系统负责数据采集,数据预处理,数据挖掘,分析层中的核心功能,用于解耦所述应用程序框架层和持久层,以便扩展系统和维护。持久层使用后台数据库框架设计模型,数据访问对象,从而实现在计算机应用程序中访问数据库中的特定业务逻辑,一部分代码包结构系统减少了主要编码的工作量。图4-3系统的包结构图从上面的系统文件夹的组合结构可以看出,每个后台程序的后台应用程序运行目录都负责每个功能模块代码,程序设置文件夹负责访问数据库包,其他后台应用程序的功能不再列出。4.3系统的数据库设计为了帮助网络营销系统的分析和建立,数据分析和数据挖掘系统将使用基于开源数据库的免费跨平台,系统主要涉及两个表,即“用户”和“数据文件夹列表”。“用户”主要用作表数据和权限管理系统以及数据文件夹。该表用于特定业务功能,用户行为在系统分析用户表的特定字段和字段以及下表中描述的数据文件夹。表4-1USER表名称字段类型备注userId用户编号INT本系统使用者的唯一编号userNumber登录账号VARCHAR登录系统时的账号userName用户名称VARCHAR本系统使用者的名称userPassword用户密码VARCHAR本系统使用者的密码userSex用户性别VARCHAR本系统使用者的性别userRight用户使用权限VARCHAR本系统使用者的所具有的权限,不同权限能使用的功能模块有所不同createDate账户创建日期DATE表的顶部用作系统用户数据和用户权限管理,数据库存储在每个字段中,如“类型”列显示,在各个字段中的数据库名称“名称”列显示,但使用每个字段在列表中的描述中。表4-2DATASET表名称字段类型备注datasetId数据集编号INTuserId用户编号INTydlbId用电类别VARCHAR包括大工业用电、非普工业等类别bzrl报装容量NUMBER单位:kVAjldztId计量点状态VARCHAR包括运行、停用等jldbh计量点编号VARCHARbyssje本月实收金额NUMBERysdf应收电费NUMBER应收电费(含税)dl售电量NUMBER单位:kW.hfxrqa发行日期DATEqysja启用时间DATEgsdm公司代码VARCHAR供电单位机构qfje欠费金额NUMBER截止到目前所欠电费的总金额(含税)ydkhbh用电客户编号VARCHAR在同一用电地址与供电企业签订供电合同关系的同一法律主体的唯一编号hylbId行业类别VARCHAR包括农业、林业、畜牧业等ydlbId用电类别VARCHAR包括大工业用电、非普工业等类别khydfsId客户用电方式VARCHAR包括公线专变客户、专线专变客户、公变客户等方式khlbId客户类别VARCHAR包括大客户、中客户、小客户三类sffsId收费方式VARCHARzrkhbh自然客户编号VARCHAR独立的法人和实体包括自然人的编号khxyddjId信用度等级VARCHARxyjf信誉积分NUMBER作为评价用电客户信誉的唯一标准dfyf电费月份DATEtqbh台区编号VARCHAR定义变压器台区编号代码xlbm线路编码VARCHAR引用功能位置编码数据元素khdygdfsId客户电源供电方式VARCHAR包括公线专变供电、专线专变供电、公变供电等方式fhlbId负荷类别VARCHAR包括一类、二类、三类、特级等类别fhtxId负荷特性VARCHAR包括一般、平稳、时段等特性jldmc计量点名称VARCHARjlddz计量点地址VARCHAR计量装置的安装地址gddydjId供电电压等级VARCHAR作为直流和标准频率为50Hz交流标准电压的编码的代码dnjlddjId电能计量点等级VARCHAR包括I类计量装置、II类计量装置等等级dnjldytlxId电能计量点用途类型VARCHAR包括终端售电计费表、关口表、考核表等用途fsbzId分时标志VARCHAR包括分时计算、不分时计算fksfbzId丰枯算费标志VARCHAR包括计算丰枯、不计算丰枯jfrl计费容量NUMBER计算基本电费的变压器容量,单位:kVAsfbzId收费标志VARCHAR是或否dnjlcjfsId电能计量采集方式VARCHAR包括现场单户、现场集抄、遥抄等方式ydkhmc用电客户名称VARCHAR泛指具有用电需求并且和电业局具有供求关系的用户,一般指一个合同户ghnydhyflID编码标号VARCHARjszh结算账号VARCHAR作为用电客户应收电费和实收电费统一管理的唯一标识jszq结算周期VARCHAR电量电费结算周期,单位:天khmc客户名称VARCHARkhdz客户地址VARCHARdfs电费税NUMBERyjdf已交电费tjyf统计月份NUMBERjsrq计算日期DATEsdsr售电收入NUMBER单位:元cbsj抄表时间DATEydsjq用电时间起DATEydsjz用电时间止DATEcbbh抄表本号VARCHAR由上可知,应用程序文档在所有项目的汇总中需要使用第三章是对数据库中每个项目的需求的分析,如“名称”列显示,每个项目的类型存储在数据库中列出在类型列中,但使用“说明”列中列出的每个项目,主表是动态数据挖掘任务的开始,通过使用集成所有需要使用的内存项目加载到系统中的表,因为挖掘系统工作防止大型多表设计到系统时结合动态计算,根据所有额外应力的数量。另外,数据库系统收集按需加载外部数据表函数,根据数据导入表中的数据网格,然后根据不同的数据分析数据,不同的数据集,动态加载,需求分析处理和挖掘,从而有效地降低运算量。4.4系统模块详细设计网格用户行为数据挖掘分析数据挖掘系统分为数据预处理,数据采集和分析五个功能模块管理系统,基于流程图是创建系统管理员角色并基于数据分析师。图4‐4
系统具体使用流程从上述系统的具体流程图可以看出,根据从登录系统数据古典挖掘系统的处理系统,该系统主要是通过数据采集,数据预处理,数据挖掘和分析模块,系统退出。当然,根据具体情况,在数据组中,只有数据清洗,数据比较,生成报告等。从该系统的流程图的选择中可以看出,数据采集,数据预处理,数据挖掘和分析业务处理模块作为一个整体,而系统管理模块主要负责与视图相关的工作,管理系统,执行职责。以下是在系统类图的核心部分,因为它涉及更多的,只画出类名的列表,属性和方法已被删去,核心类的一部分将在下面的部分介绍。图4‐5
系统核心部分类图
上面系统类图的核心部分我们可以看到系统设计的各种功能主要围绕用户级和后端应用程序数据文件,而这两个方面也在对应于数据库包的部分中进行了描述。因为系统涉及越来越方面中,其它方面的内容我们将不进行说明,设计程序的内容将在后文进行阐述。4.4.1数据采集模块在这一模块,主要是根据系统中用户使用本软件进行缴纳电费的具体情况所进行的数据搜集,因而用户在用电过程当中所涉及到的相关数据都可以在此进行归纳整理,从而为后面的研究与分析提供数据来源。具体情况如下。图4‐6
数据采集模块的用例图数据搜集是根据系统中用户使用本软件进行缴纳电费的具体情况所进行的数据搜集,因而用户在用电过程当中所涉及到的相关数据都可以在此进行归纳整理,从而为后面的研究与分析提供数据来源。由此可见,我们可以根据此项功能对相关的数据进行调取和查看。4.4.2数据预处理模块在信息管理系统所采集到的数据当中,并不是所有的数据都是有用的,其中还存在着一些无用的,没有利用价值的数据。通过数据挖掘技术我们便可以把那些后期分析研究过程当中所需要的数据提取出来,从而使得整个的数据处理更加的科学和合理。具体如下:数据预处理模块的用例图可以看出,系统管理员和数据分析者的所有功能可以由一般人员使用而不使用模块。数据预处理模块是系统中的一个重要模块,它基于不同的设计方法和数据处理两种不同属性的连续值和离散值,用于连续值数据清理方法,忽略丢失数据,删除负值,填充,整体平均值最有可能填充,填充回归方法;离散值忽略丢失的数据是数字填充方法删除最可能的平均整体。类似地,在基于十进制缩放方法和最大值和最小值方法的三个连续值数据转换的方法中,并且离散广义方法主要用于数据。相反,所需工作量的离散值远大于处理连续值所需的工作量。图4‐8
数据预处理模块的方法调用类图
在信息管理系统所采集到的数据当中,并不是所有的数据都是有用的,其中还存在着一些无用的,没有利用价值的数据。通过数据挖掘技术我们便可以把那些后期分析研究过程当中所需要的数据提取出来,从而使得整个的数据处理更加的科学和合理。4.4.3数据挖掘模块数据挖掘是指在分析研究过程当中把所需要的数据提取出来,从而使得整个的数据处理更加的科学和合理,数据挖掘技术能够快速的对数据进行筛选处理。通过此项功能我们可以查看用户在用电过程当中的各项情况的指标。图4-9数据挖掘模块的用例图从上面的例子我们可以看到系统管理员和数据分析师可以使用所有的功能,而一般人员不使用模块。客户分段功能,系统将使用分类方法和分析层次过程实现两种典型的聚类算法和客户信用评价功能,首先通过集群到个人信用评估和客户手工标记在这一步,使用分类方法和直接使用两种聚类分析的处理水平,分类方法和分析层次过程。然后使用分类技术来评估和预测客户信用评级系统,将使用决策树分类算法,典型的最近邻分类和三种类型的债券天真一些偏差较高的客户,功能和分类的客户信用评级也使用决策树在同一系统中,使用最近邻分类和朴素贝叶斯三种算法和不同的具体业务指标,利用数据仓库中现有的数据,对高风险客户的分类和预测,提醒业务人员相应的营销方法。图4‐10
数据挖掘模块的方法调用类图
本系统通过对所采集的数据仔细进行分析与研究,从而找出不同的客户群体的不同需求,并且按照不同的标准进行客户细分。与此同时,本系统还可以根据客户在缴纳电费的过程当中是否欠费、欠费的额度以及还款的及时性对客户的信用进行详细的评估。此外,本系统的运行软件是采用就最新的SSH框架当中的MVC模式。通过此种模式的后台运行,使得系统运行起来更加的流畅,并且在后期若是相关功能需要完善也会变得更加方便。4.4.4结果分析模块本模块根据所统计道德数据资料进行分析与研究后得出相应的结论,来具体评估用户的信用情况,查看用户是否按期缴纳相应的电费以及在各个时期用户的用电情况统计等。具体如下:图4-11结果分析模块的用例图本模块根据所统计道德数据资料进行分析与研究后得出相应的结论,来具体评估用户的信用情况,查看用户是否按期缴纳相应的电费以及在各个时期用户的用电情况统计等。4.4.5系统管理模块本模块主要是应用程序的管理人员在进行系统管理的过程当中,对于一些已经不再使用本软件的用户进行删除以及添加新增加的用户。图4-12系统管理模块的用例图在信息管理系统所采集到的数据当中,并不是所有的数据都是有用的,其中还存在着一些无用的,没有利用价值的数据。通过数据挖掘技术我们便可以把那些后期分析研究过程当中所需要的数据提取出来,从而使得整个的数据处理更加的科学和合理。4.5本章小结本章介绍了根据所统计道德数据资料进行分析与研究后得出相应的结论,来具体评估用户的信用情况,查看用户是否按期缴纳相应的电费以及在各个时期用户的用电情况统计等。第五章系统实现本章需要介绍了如何来使用本软件来进行相关功能的实现,并且如何来有效的利用所搜集的数据来进行统计从而得出我们所需要的相关内容。因此,在本章我们会看到相关程序的具体操作方法。5.1数据采集模块在这一模块,主要是根据系统中用户使用本软件进行缴纳电费的具体情况所进行的数据搜集,因而用户在用电过程当中所涉及到的相关数据都可以在此进行归纳整理,从而为后面的研究与分析提供数据来源。在第一种方法中,主要功能是将外部数据设置到系统数据库,用于进一步的数据处理和数据挖掘。公司代码数据的一些输入参数在数据开始之前,以及其他类型的字段和含义在系统中详细描述了第四章的设计部分,第二种方法没有进一步枚举是选择目标数据集在内存中,用于数据处理和数据挖掘系统。数据维护是主要变更数据集名称,首先需要修改输入数据集名称和新名称等信息,然后通过验证,如果合法,则允许修改并返回成功符号或错误消息,原始数据不再列出类型维护。第四章中的各种字段中的数据属性视图,其他字段,所选数据集和属性列和其他类似属性。5.2数据预处理模块数据预处理模块基于数据清理,数据简化,四种网络用户行为数据简化分析和数据转换功能数据挖掘。数据清洗的第一步,要进一步处理数据集,首先需要要求用户选择属性数据,清洗主要电气,行业分类,安装容量,充电能力,信用,价格和功耗,销售收入和客户供应模式属性。根据不同类别的属性值,它分为两类:离散和连续值。其中,包括装机容量,充电能力,信用,消耗,连续数据清理方法的价值,可以忽略丢失数据,删除负数,填充,整体平均值,填充最可能的值,填充回归。在连续值数据清理方法中,忽略丢失的数据,删除和填充负输入参数是可能的,四个方法是整个数据集和属性名称的平均值,如果值返回成功执行和识别,填充回归方法需要输入数据集和属性名称需要解决,而且还需要根据这种方法输入属性级别和垂直坐标,目的是提供一个相对统一的输入输出接口,这可以大大提高可读性和可维护性系统有利于未来的维护和扩展功能数据包括电力行业类别,类别,成本,离散功率客户数据清理方法和可用于常量值的值,忽略丢失数据填充的总平均值。输入参数为所有四种方法,离散数据清理方法,数据集和属性名称,返回值是成功的标志,做同样的输入和输出接口尽可能统一,这是企业系统编程模式的现实。数据被简化,包括数据的一个子集,根据月或数年的总结,未列出的具体方法。数据简化,包括一些从所选的数据显示,卡方检验,信息增益法直接减去不相关的属性。四种简化方法的数据,数据集和属性名称直接减去请求作为输入参数,冲刷删除方法,信息增益方法,信息增益和减少输入参数名称和数据集作为阈值比法,有四种方法成功标识了一个返回值。包括数据转换,数据标准化和数据泛化,主要数据集为连续和离散值,具有不同的数据处理连续值,主要作为数据转换方法使用标准,标准方法包括最大方法需要选择转换数据集和属性名称,然后验证信息,数据转换和输出方法三个原型连续值数据转换方法不重复,但对于离散数据集的值,主要方法的数据泛化,泛化方法根据不同条件的不同属性在不同的处理,如客户信用等级根据四个不同级别的推广,没有具体列表。另外,还有一种数值方法可以应用于将连续和离散值的属性值设置为常量输入参数,具体方法是将数据集名称,属性名称转换为处理参数并返回参数以实现成功的标记方法。5.3数据挖掘模块数据挖掘是指在分析研究过程当中把所需要的数据提取出来,从而使得整个的数据处理更加的科学和合理,数据挖掘技术能够快速的对数据进行筛选处理。通过此项功能我们可以查看用户在用电过程当中的各项情况的指标。5.3.1用电客户细分电力客户细分是利用一大类按照一定的标准,不同的客户群体电力客户的,为了实现根据需求分析指标不同的营销策略,通过聚类分析技术第三章的目标,按照对项目团队提出的想法,我尝试使用数据研究和分析层次化过程。研究方法是数据的十个经典的数据挖掘算法的一个,它是无监督学习算法样品之间的相似性测量,数点作为初始聚类中心,然后根据分类和聚类残余基于随机选择点相似性聚类中心,然后更新聚类中心和每次迭代直到收敛。在统计算法的框架中,没有设置数量和具体方式的收入列表用于传输输入数据集的数组,最终结果具体指标,具体属性为集群,集群中心具体参数由用户通过二维,二维数组坐标存储集群中心指定。与程序数据统计的帮助下门户的统计方法,以及需要提供的数据集,簇特定属性的数量和集群中心作为一个参数。图5-1K-means算法流程图分析层次过程最初是由着名的美国研究人员在美国国防部国防部的研究中提出的。相关的决定,并划分成的目标,指导方针和程序几个级别,并形成有序结构,然后因素使用索引的每一层的一个标准比较,最后根据特定比例值代比较判定矩阵。根据第三章的分析,它采用客户忠诚度,成长,负载条件下,贡献和公信力的指标等的需求。图5-2AHP算法流程图根据上面的AHP算法流程图,本系统实现的算法框架如下所示:在分析层次过程框架中,没有具体指标,设置方法,输入统计和具体列表存储统计,包括客户,应收账款必须支付电力行业报告,电力装机容量,分类,数据文件是用户输入数据集,后端应用程序文件用于存储在建筑过程中的比较矩阵使用背景数据集。方法两种算法在统计数据和后台应用程序的使用方法的框架,提供挖掘的结果与预测的路径,将保存数据的入口参数进行设置,方便的调用者,极大地提高了可读性和可维护性,以便根据需要添加新的功能和算法。5.3.2客户信用等级评估客户信用评级评估和目标客户规则使用一些信用价值共识,根据第三章的分析,首先通过集群人工信用评级评估和标注每个客户群组的后端应用和数据聚类方法可用于客户分割,然后使用分类和评估构建特定分类模型,以便根据我实现的项目团队的想法,决策树,朴素贝叶斯和最近的三个分类方法实现新的客户信用评级。决策树是一种典型的分类方法,它使用概率论的原理,结果表明树根据不同的规则,决策树从根节点开始,将数据集划分为不同大小的连续子集,然后继续进一步划分数据,通过决策树分类目标决策树预测算法是自动测量系统典型的决策树使用其他数据集的规则。图5-3ID3算法流程图按照图5-3所示的算法流程,本系统具体算法框架如下:在决策树算法框架中,后端应用和操作系统是挖掘数据集,训练集为用户输入相关信息熵的计算方法和构建方法,需要提供数据集,训练集为入口参数。这个内部类主要用于构造决策树结构。部分分类算法是基于统计知识引入的分类算法,简单的部分分类算法简单,高效,准确。在简单偏置分类算法的框架内,没有任何具体的数据的统计和设置方法,其需要提供数据集和训练设定为入口参数。最近邻分类算法在六十年代提出的,是一种更成熟的分类方法,该方法是基于以下想法:如果在几个在大多数样本的最相似的样本的样本属于样本的分类成类。决策树分类算法,朴素贝叶斯预测方法是使用结果生成参数集,入口挖掘结果,预测数据集的保存路径,调用应用方法和企业统一编程标准化。5.3.3欠费高风险客户预测本系统能够有效地根据系统所采集的数据仔细进行分析与研究,从而找出不同的客户群体的不同需求,并且按照不同的标准进行客户细分。与此同时,本系统还可以根据客户在缴纳电费的过程当中是否欠费、欠费的额度以及还款的及时性对客户的信用进行详细的评估。通过此种模式的后台运行,使得系统运行起来更加的流畅,并且在后期若是相关功能需要完善也会变得更加方便。5.4结果分析模块本模块根据所统计道德数据资料进行分析与研究后得出相应的结论,来具体评估用户的信用情况,查看用户是否按期缴纳相应的电费以及在各个时期用户的用电情况统计等。数据分布可以分别根据电力行业的电压水平,客户类别,类别,对应于客户信用评级分类的不同输出的统计信息,以及图或列的视觉形式在用户之前出现。方法名称集和属性数据作为输入数据,系统将生成相应的数据分布,并且方法调用图对应于打开的特定图。根据信用水平的数据,客户拖欠电力,与不同属性的相应直方图输出相比,方法和输出包括所需的输入数据集名称和属性数据,然后生成特定的数据分布,然后调用图形库,生成特定的直方图并发送到表示层进行用户查看。根据公司的行业分类代码,文件类型,输出功率性能报告和用户输入路径转换,将报告分为年度和月度,分别以年和月为单位的测量,并返回成功。然后用户可以存储在特定的目录中,如微软表格和其他图形软件打开文档。5.5系统管理模块网络用户行为数据挖掘系统基于分析系统添加用户,删除用户,修改用户数据,修改用户密码进入系统功能。增加用户,首先输入用户和密码,用户名,性别,用户信息,然后验证用户输入字段在该层是否为空,如果不为空,则确定数据库中信息的合法性,输入。如果是这样,将相应的用户信息更新到数据库,并将用户返回成功执行,或输出相应的错误消息。删除用户信息的第一输入,对应于与传输时间对应的打包方法的用户数据库信息,通过判断合法性,如果合法,删除数据库中相应的用户信息,并返回成功符号,或显示一个适当的错误消息。修改用户信息,请求用户和密码,用户名,性别,用户信息,合法性,合法性条件确定输入,修改数据库中的相应用户信息,并返回成功符号,或建议适当的错误消息。用户密码更改,用户他们需要在视图层中输入旧密码,新密码和确认新密码信息,使用应用程序验证新密码并确认新密码是否相同,并相应输出信息;如果新密码和确认码合法,将继续确定是否合法用户输入条件更新数据库中的密码成功,并返回符号或错误消息。系统主要使用输出功能,信息系统。5.6本章小结本章需要介绍了如何来使用本软件来进行相关功能的实现,并且如何来有效的利用所搜集的数据来进行统计从而得出我们所需要的相关内容。因此,在本章我们会看到相关程序的具体操作方法。第六章系统部署与运行测试本章将介绍网络用户行为数据挖掘技术基于部署和测试首先介绍的硬件和软件开发和测试环境,然后介绍防御系统部署,最后是一个具体的部署图,操作系统,并提出几个典型的测试运行数据挖掘接口测试数据和运行结果。6.1系统的软硬件开发
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小区后期物业合同范例
- 市政管网补充合同范例
- 广告租赁简约合同范例
- 塘渣供应合同范例
- 环保产业崛起助力美丽中国建设
- 合伙买车协议合同模板
- 广告物资购销合同范例
- 法学毕业答辩模板
- 商场店面房出租合同范例
- 乡村振兴:文旅融合兴产业
- GB/T 11270.2-2002超硬磨料制品金刚石圆锯片第2部分:烧结锯片
- 统编版高中语文选择性必修上册各课知识点梳理
- 物业装修管理(培训课件)
- 机器人创新性教学平台实践与探索报告
- 专题:普世价值思潮课件
- 销售目标的设定与管理培训课件
- 【期末复习】概括与评析标题及角度-部编版道德与法治九年级上册
- 医美加盟模板课件
- 部编三年级上语文《17 古诗三首》优质教学设计
- 甾体化合物的微生物转化课件
- 乒乓球一级裁判培训班规程讲座课件
评论
0/150
提交评论