OLAP和数据挖掘技术在QAD产品审计中的应用与研究_第1页
OLAP和数据挖掘技术在QAD产品审计中的应用与研究_第2页
OLAP和数据挖掘技术在QAD产品审计中的应用与研究_第3页
OLAP和数据挖掘技术在QAD产品审计中的应用与研究_第4页
OLAP和数据挖掘技术在QAD产品审计中的应用与研究_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 OLAP和数据挖掘技术在QAD产品审计中的应用与研究PAGE OLAP和数据挖掘技术在QAD产品审计中的应用与研究摘要随着时代代的发展展,如今今的企业业已大多多进入了了“无纸化化”的办公公时代。原有的的手工信信息输入入与分析析已无法法适应如如今日益益增多的的信息数数据。可可以说,企业每每天都面面临着大大量的商商业信息息,而如如何利用用、分析好好这些数数据从而而为企业业的发展展提供指指导就显显得尤其其重要。对于QQAD公公司而言言,它是是一家专专门为制制造业提提供企业业解决方方案的软软件供应应商,它它在全球球范围内内的九十十多个国国家拥有有超过六六千多个个客户。每一年年,它都都会对每每个客户户

2、使用公公司软件件产品的的情况进进行审计计。在每每个客户户审计的的过程中中,自然然会产生生大量的的数据。对于公公司而言言,所有有客户的的审计数数据将是是百万级级的。面面对如此此庞大的的数据,如何从从这些数数据中获获取公司司所需的的信息,分析出出审计的的结果,并得出出一定的的指导性性结论就就显得尤尤其重要要。为此,本本文提出出了一种种基于联联机分析析处理(OLAAP)和和数据挖挖掘技术术的审计计信息分分析的设设计。OLAAP和数数据挖掘掘技术是是近年来来数据库库领域和和人工智智能领域域研究的的热点,它通过过对大量量数据进进行分析析和处理理,得到到隐含在在这些数数据背后后有用的的信息和和知识。本项目

3、目实现了了基于SSQL Serrverr 20008分分析服务务(SSSAS)在审计计信息立立方体之之上的OOLAPP多维数数据分析析和MDDX多维维数据查查询,并并利用决决策树、神经网网络等数数据挖掘掘算法对对审计信信息数据据进行挖挖掘,得得出有用用的知识识。为实现上上述目标标,首先先需要决决定存储储分析后后的审计计信息的的数据库库版本与与类型以以及最终终生成审审计结果果报表所所需使用用的报表表生成工工具。为为此,针针对数据据库的选选择提出出了以下下几种可可行的解解决方案案:Prrogrresss数据库库、MyySQLL数据库库、Acccesss数据据库和SSQL Serrverr数据库库。

4、根据据实际需需求,分分别比较较了以上上四种数数据库的的优缺点点,最终终权衡之之后选择择了SQQL SServver数数据库作作为本项项目的关关系数据据库服务务器。同同样,针针对报表表生成工工具,也也提出了了以下几几种可行行的解决决方案:QADD公司自自己实现现的报表表生成框框架、微微软的AAcceess工工具和微微软的EExceel工具具。分析析了以上上几种工工具使用用的便捷捷性以及及代价考考虑,最最终选择择了大家家比较常常用且比比较轻量量型的EExceel作为为我们最最终的报报表生成成工具。在选定了了数据库库和报表表生成工工具的解解决方案案之后,便要对对历史审审计数据据进行一一定的整整理、分

5、分析以及及数据提提取和存存储工作作。审计计数据是是由公司司产品所所提供的的功能菜菜单运行行后自动动生成的的,客户户在对这这些多种种多样的的报表整整理时,可能根根据自身身的习惯惯进行不不同的打打包方式式。因此此公司从从客户手手上得到到的审计计数据结结构则是是复杂繁繁多的,没有一一定的规规律性可可循,这这对我们们进行历历史审计计信息的的提取造造成了一一定的困困难与阻阻碍。经经过对历历史审计计数据的的详细分分析之后后,找到到了所需需要的两两个审计计文件:应用使使用详细细报告和和许可权权使用情情况报告告。其他他诸如数数据库使使用报告告等日志志文件目目前对我我们来说说并没有有太大的的意义。因此我我们的目

6、目标只是是在每个个客户的的审计数数据文件件夹下找找到这两两个文件件,分析析提取数数据,并并存入数数据库中中。在实实践中,发现如如果不对对历史数数据进行行处理,直接运运行数据据分析提提取程序序,则效效率十分分低下。究其原原因是因因为程序序每次都都需要遍遍历每个个文件来来确认该该文件是是否为所所需的那那两个报报告文件件,因此此要花费费大量的的时间。为解决决这一问问题,就就需要在在程序之之上再加加上一层层数据预预处理的的程序,即将不不需要的的历史数数据文件件过滤,按照原原有的目目录结构构,只留留下所需需的那两两个文件件。这样样,在数数据预处处理的基基础上,程序运运行的效效率将大大大提高高。解决决了这

7、一一问题之之后,便便是要将将分析出出的数据据存入数数据库中中。根据据历史审审计数据据信息及及相关的的外部数数据信息息,按照照需求,共设计计了六张数据据表。该该数据库库将为后后面的OOLAPP提供高高效的数数据源。有了关系系数据库库源,便便可利用用SSAAS对审审计数据据进行维维度建模模。本文文重点论论述了审审计信息息数据的的概念模模型设计计和逻辑辑模型设设计,包包括度量量、维度度和粒度度的设计计,事实实表和维维表的设设计,同同时采用用了雪花花模型构构造了逻逻辑视图图,最终终生成了了审计信信息的多多维立方方体,供供最终生生成审计计结果报报表和数数据挖掘掘提供了了多维数数据源,完成了了OLAAP在

8、QQAD产产品审计计中的应应用。在在生成审审计结果果报表时时,使用用Exccel中中的透视视表,建建立数据据库连接接,选择择建立的的多维数数据源,便可读读取多维维数据中中的内容容。为了了方便客客户审阅阅,特别别定义了了十多个个报表模模板,可可供客户户选择,基本涵涵盖了所所有的审审计结果果,且客客户可以以自主选选择想要要查看的的内容,对数据据进行一一定的钻钻取等,十分方方便。最后,便便是使用用数据挖挖掘技术术对审计计数据进进行一定定的挖掘掘任务研研究。传传统的数数据挖掘掘过程往往往基于于关系数数据库。本文探探讨了基基于OLLAP的的数据挖挖掘技术术在产品品审计中中的应用用,分别别使用了了决策树树

9、算法和和神经网网络算法法对同一一个挖掘掘模型进进行了挖挖掘,并并利用提提升图比比较了两两个算法法的挖掘掘准确性性。本文文所建立立的挖掘掘模型为为分析客客户选择择QADD公司不不同产品品类型组组合的因因素,意意在发现现一个行行业领域域内使用用QADD公司产产品组合合的最佳佳实践,为不同同的客户户在选择择公司产产品组合合时提供供一定的的建议。由于时时间及精精力的有有限,只只是粗略略探索了了数据挖挖掘在公公司审计计中应用用的可能能性。相相信可以以利用该该技术挖挖掘出更更多对公公司经营营决策有有指导性性意义的的知识。本文的研研究和结结果表明明,OLLAP和和数据挖挖掘技术术在QAAD公司司产品审审计中

10、的的应用是是可行的的,而且且是便捷捷高效的的。它不不仅从企企业管理理的角度度为公司司决策层层与销售售人员提提供了更更为智能能的分析析方法和和途径,还为审审计分析析人员提提供了新新的手段段和视角角,来挖挖掘出更更多数据据背后隐隐藏的有有用的知知识。关键词:数据挖挖掘,OOLAPP,多维维数据分分析,SSQL Serrverr 20008分分析服务务,产品审审计THE APPPLICCATIION ANDD REESEAARCHH OFF OLAPP ANND DDATAA MIININNG TTECHHNOLLOGYY INNQAD PROODUCCT AAUDIITABSTTRACCTWith

11、h thhe ddeveeloppmennt oof tthe soccietty, sciiencce aand tecchnoologgy, mosst oof tthe entterpprisses havve nnow enttereed tthe papperllesss offficce ttimee. TThe oriiginnal mannuall innputt annd aanallysiis ccoulldnt ddeall wiith thee inncreeasiing infformmatiion andd daata anyy moore. Evveryy daa

12、y, entterpprisses aree faacedd wiith lotts oof bbusiinesss iinfoormaatioon, andd bee awwaree off knnow howw too usse tthesse ddataa too annalyysiss, tto pprovvidee guuidaancee foor ddeveeloppmennt oof tthe entterpprisse iis eespeeciaallyy immporrtannt.FFor QADD whhichh iss a sofftwaare supppliier co

13、mmpanny wwho prooviddes sollutiionss too sppeciialiizedd maanuffactturiing entterpprisses, haas mmoree thhan 6,0000 mulltipple cliientts wwithhin 90 couuntrriess woorlddwidde. Eveery yeaar, alll clliennts ussingg sooftwwaree prroduuctss coondiitioons willl bbe aaudiitedd byy thhe ccomppanyy. IIn eev

14、erry ccusttomeer aaudiit pproccesss, llargge aamouuntss off daata willl bbe pprodduceed. Forr QAAD, thee nuumbeer oof aall cusstommerss auuditt daata gattherred toggethher willl bbe mmilllionns. Faccingg suuch larrge nummberrs oof ddataa, iit iis eespeeciaallyy immporrtannt tto kknoww hoow tto gget

15、thee innforrmattionn thhe ccomppanyy neeed, too annalyysiss thhe aaudiit rresuultss, aand somme gguiddancce cconcclussionns ffromm thhis hugge aand messsy datta.Therrefoore, thhis papper proopossed a mmultti-ddimeensiionaal aanallysiis oof QQAD prooducct aaudiitinng ddesiign bassed on OLAAP aand dat

16、ta mminiing tecchnoologgy. OLAAP aand datta mminiing tecchnoologgy hhavee beecommingga reeseaarchh hoot sspott off daatabbasee annd tthe fieeld of arttifiiciaal iinteelliigennce durringg reecennt yyearrs. It thrrouggh tthe larrge datta aanallysiis aand proocesssinng, imppliccatees uusefful infformma

17、tiion andd knnowlledgge bbehiind theese datta. Thiis pprojjectt reealiizedd OLLAP mullti-dimmenssionnal datta aanallysiis aand MDXX muultii-diimennsioonall daata queery on thee baasiss off SQQL SServver Anaalyssis Serrvicce 220088 inn thhe aaudiit iinfoormaatioon ccubee, aand achhievved auddit inffo

18、rmmatiion datta mminiing usiing deccisiion treees andd thhe nneurral nettworrk ddataa miininng aalgooritthm forr auuditt innforrmattionn too drraw useefull knnowlledgge ffor thee coompaany.To aachiievee thhis goaal, we firrst neeed tto ddeciide thee daatabbasee veersiion andd tyype to chooosee, wwhi

19、cch iis uusedd too sttoree thhe aaudiit iinfoormaatioon aafteer tthe anaalyssis andd whhichh reeporrtinng fframmewoork toools to chooosee too geenerratee fiinall auuditt reesullt rrepoort. Thhereeforre, sevveraal ffeassiblle ssoluutioons of dattabaasess baasedd onn deemannd wweree puut fforwwardd. T

20、Theyy arre PProggresss ddataabasse, MySSQL dattabaase, Acccesss ddataabasse aand SQLL Seerveer ddataabasse. Acccorddingg too acctuaal nneedds, andd affterr coompaarinng eeachh addvanntagges andd diisaddvanntagges of thee abbovee foour dattabaase serrverrs, thee SQQL sservver dattabaase wass chhoseen

21、 aas tthe rellatiionaal ddataabasse sservver finnallly. Simmilaarlyy, ffor repporttingg tooolss, tthe folllowwingg feeasiiblee sooluttionns wweree allso putt foorwaard: QAAD rrepoortiing fraamewworkk reealiizedd byy thhe ccomppanyy, MMicrrosooft Acccesss toool andd Miicroosofft EExceel ttoolls. Excc

22、el wass chhoseen aas tthe repporttingg tooolffinaallyy beecauusemmostt off thhe uuserrs aare verry ffamiiliaar wwithh itt annd iit iis ppoweerfuul ffor genneraatinng vvariiouss reeporrts thooughh itt iss veery ligghtwweigght.Afteer ffiniisheed sseleectiion of dattabaase andd reeporrt ggeneerattionn

23、toool, thhe nnextt sttep wass too deeal witth tthe auddit datta. We neeed tto ssortt ouut, anaalyssis andd exxtraact datta aand finnallly mmakee thhese ussefuul iinfoormaatioon bbe sstorred in dattabaase corrrecctlyy. AAudiit ddataa iss auutommatiic ggeneeratted by usiing thee prroduuct funnctiion m

24、ennu. Cusstommer willl wworkk onn thhesee vaarioous repportts aaccoordiing to theeir ownn haabitt off diiffeerennt ppackkagiing. Soo thhe ccomppanyy obbtaiinedd frrom thee cuustoomerr onn thhe aaudiit ddataa sttruccturre iis ccompplexx raangee, nno ccerttainn reegullariity, thhis to ourr hiistooricc

25、al auddit infformmatiion exttracctioon hhas cauusedd soome diffficculttiess annd oobsttaclles. Thhrouugh anaalyzzingg thhe hhisttoriicall daata aftter dettailled anaalyssis of auddit, wee fooundd ouut tthatt onnly twoo kiindss off reeporrt aare neeededd, iinclludiing Apppliccatiion Dettaill Ussagee

26、Prrofiile Repportt annd LLiceenseed AAppllicaatioon RRepoort. Ottherr fiiless suuch as dattabaase logg fiiless arre nnot so impporttantt too uss foor nnow. Soo ouur ggoall iss too fiind outt thhesee twwo ffilees iin eeachh cuustoomerr auuditt daata follderr annd tto aanallysiis, exxtraact datta ffro

27、mm thhesee twwo ffilees aand stoore thee exxtraacteed iinfoormaatioon iin ddataabasse. In praactiice, wee fooundd thhat if we runn daata proocesssinng pprocceduure dirrecttly inssteaad oof ppre-proocesssinng tthe hisstorricaal ddataa fiirstt, tthenn thhe ddataa prroceessiing prooceddurees effficcien

28、ncy is verry llow. Thhe rreasson it thaat eeverry ttimee thhe pprocceduure is runn, iit nneedd too trraveersaal eeverry ffilee inn thhe aappoointted follderrs tto ssee wheetheer tthiss fiile is useefull foor uus oor nnot, thhat is to sayy thhe pprocceduure willl oopenn eaach fille tto ssee wheetheer

29、 tthiss fiile is thee Apppliicattionn Deetaiil UUsagge PProffilee Reeporrt aand Liccenssed Apppliccatiion Repportt orr noot, thuus aa loot oof ttimee iss sppentt. TTo ssolvve tthiss prrobllem, itt neeed to pluus aa laayerr off daata preetreeatmmentt prroceess befforee thhe aabovve pproccesssingg prr

30、oceedurres. Thhat is to sayy, aafteer rrunnningg thhe ddataa prretrreattmennt pproccesss, soome hisstorricaal aaudiit ffilees wwhicch aare nott neeedeed wwilll bee fiilteeredd, oonlyy twwo kkindds oof rrepoort menntioonedd abbovee wiill be remmainned acccorddingg too thhe oorigginaal ddireectoory st

31、rructturee. SSo, on thee baasiss off daata preetreeatmmentt, tthe proograam wwilll grreattly impprovve tthe effficiienccy oof tthe opeerattionn. AAfteer ssolvvingg thhis proobleem ssucccesssfullly, itt iss tiime to depposiit tthe anaalyzzed datta iintoo daatabbasee. AAccoordiing to thee hiistooricca

32、l datta iinfoormaatioon aand rellateed aaudiitinng ddataa innforrmattionn sttoreed iin eexteernaal ddataabasse, in acccorddancce wwithh thhe rrequuireemennt, andd siix ttablles werre ddesiigneed. Thiis ddataabasse ffilllingg wiith auddit infformmatiion datta wwilll prroviide effficiientt daata souur

33、cee foor OOLAPP meentiioneed bbeloow.Sincce wwe aalreeadyy haave a rrelaatioonall daatabbasee soourcce nnow, wee caan uuse SQLL Seerveer AAnallysiis SServvicee too buuildd diimennsioonall moodellingg foor aaudiit ddataa. TThiss paaperr deetaiiledd diiscuussees tthe connceppt oof aaudiit ddataa moode

34、ll deesiggn aand loggicaal mmodeel ddesiign, inncluudinng tthe meaasurre, dimmenssionn annd ggrannulaaritty ddesiign, faact tabble andd diimennsioon ttablles dessignn, aalsoo addoptted thee loogicc sttruccturre mmodeel oof ssnowwflaakess, ggeneerattingg a vieew oof tthe auddit infformmatiion andd ev

35、venttuallly genneraatedd muultiidimmenssionnal cubbe oof aaudiit iinfoormaatioon, whiich proovidde aa muultiidimmenssionnal datta ssourrce forr auuditt reesullts staatemmentts aand datta mminiing. Soo thhe aappllicaatioon oof OOLAPP inn QAAD pprodductt auuditt haas bbeenn brrougght intto eeffeect. I

36、nn orrderr too geenerratee auuditt reesullts repportt, wwe ccan usee Exxcell, eestaabliish thee piivott taablee, aand chooosee too buuildd daatabbasee coonneectiion of mulltiddimeensiionaal ddataa soourcce. Theen wwe ccan reaad tthe conntennts of thee muultiidimmenssionnal datta. In ordder to faccil

37、iitatte ccusttomeer rreviiew, moore thaan tten repportt teempllatees wweree deefinned, whhichh caan bbe pprovvideed ffor cusstommer to chooosee, bbasiicallly covverss thhe eentiire auddit ressultts, alsso ccusttomeers cann chhoosse tto hhavee a cheeck on thee coonteent andd thhe ddataa off drrilllin

38、gg, vveryy coonveenieent at alll.Finaallyy, tthe datta mminiing tecchnoologgy sshouuld be useed tto ddo ssomee miininng ttaskk sttudyy onn auuditt daata. Thhe ttradditiionaal ddataa miininng iis oofteen bbaseed oon rrelaatioonall daatabbasee. HHoweeverr, iin tthiss paaperr, iit ddetaailss thhe aappl

39、licaatioon oof ddataa miininng ttechhnollogyy baasedd onn OLLAP in prooducct aaudiit, usiing deccisiion treees alggoriithmm annd tthe neuurall neetwoork alggoriithmm reespeectiivelly ffor thee saame minningg moodell, aalsoo a lifft ccharrt wwas buiild to commparre tthe twoo allgorrithhms mminiing ac

40、ccuraacy. Thhis papper esttabllishhed a mminiing moddel to finnd oout thee keey ffacttorss whhichh innfluuencce tthe cusstommerss chhoicce oof ddifffereent typpes of QADD prroduuct commbinnatiion, inn orrderr too fiind a bbestt prractticee foor uusinng aa coombiinattionn off prroduuctss whhichh QAAD

41、 pprovvidees iin aa sppecuula inddusttry fieeld, whhichh caan bbe uusedd foor ddifffereent typpes of cusstommerss inn chhoossingg prroduuctss coombiinattionn prroviide somme ssugggesttionns. Duee too thhe llimiitedd tiime andd ennerggy oof mminee, II onnly makke aa rooughh exxploorattionn off thhe p

42、posssibiilitty oof tthe apppliccatiion of datta mminiing in commpanny pprodductt auuditt. AAccoordiing to thee exxisttingg reesullts, itt iss beelieevedd thhat thee daata minningg teechnnoloogy cann bee ussed to exccavaate morre gguiddingg siigniificcancce oof kknowwleddge forr opperaatioon ddeciisi

43、oons.Thiss reeseaarchh annd rresuultss shhow thaat tthe apppliccatiion of OLAAP aand datta mminiing tecchnoologgy iin QQAD prooducct aaudiit iis ffeassiblle aand it is higgh eeffiicieent andd moore connvenniennt aalsoo. IIt nnot onlly pprovvidee moore inttellligeent anaalyssis of thee waays andd mee

44、anss foorm thee peersppecttivee off buusinnesss maanaggemeent forr coompaany admminiistrratoors andd saaless peersoonneel, butt allso proovidded neww meeanss annd mmethhodss foorm thee peersppecttivee off auuditt reeseaarchh foor tthe commpanny aaudiit rreseearccherrs, to creeatee moore useefull knn

45、owlledggehiidinng bbehiind thee auuditt daata forr coompaany devveloopmeent.Key worrds:datta mminiing, Onnlinne AAnallytiicall Prroceessiing, muultii-diimennsioonall daata anaalyssis, SQQL SServver 20008 AAnallysiis SServvicees, prooducct aaudiit目 录录绪论11QAD产产品审计计问题简简述及分分析111.2研研究目的的与意义义11.3 国内外外研究现现

46、状221.4 论文研研究内容容22解决方案案比较与与选定42.1 数据库库的选择择42.1.1 PProggresss数据据库42.1.2 MMySQQL数据据库42.1.3 AAcceess数数据库442.1.4 SSQL Serrverr数据库库442.2 报表工工具的选选择552.2.1 QQAD报报表生成成框架52.2.2 微微软Acccesss报表表52.2.3 微微软Exxcell报表52.3 本章小小结55数据处理理与存储储63.1 数据的的分析与与处理63.1.1 历历史数据据结构与与内容概概述63.1.2 历历史数据据处理73.2 数据的的存储83.3 本章小小结11OLAP

47、P的应用用124.1 OLAAP技术术概述124.2 维度、度量及及立方体体的设计计1224.2.1 维维度的设设计1224.2.2 度度量的设设计134.2.3 事事实表和和维表的的设计144.3 建立审审计多维维数据模模型154.4 审计信信息MDDX多维维查询分分析1174.5 审计信信息统计计报表生生成184.6 本章小小结20数据挖掘掘的应用用215.1 数据挖挖掘技术术概述2115.2 基于决决策树算算法的数数据挖掘掘应用2225.2.1 决决策树算算法的基基本原理理2225.2.2 使使用决策策树算法法2335.3 基于神神经网络络算法的的数据挖挖掘应用用255.3.1 神神经网

48、络络算法的的基本原原理2555.3.2 使使用神经经网络算算法265.4 本章小小结27第六章 结论286.1 论文总总结286.2 展望288参考文献献300谢辞311第 PAGE 34 页 共 31 页第一章 绪论1.1 QADD产品审审计问题题简述及及分析QAD(企安达达)公司是是国际上上著名的的MRPP= 2 * ROMANII软件件公司,它于119799年在美美国加州州成立,是一家家专门为为制造业业提供企企业解决决方案的的供应商商。目前前在全球球范围内内,已有有遍布990个国国家的660000个制造造商企业业使用了了QADD的产品品。随着企业业规模的的扩大及及公司EERP软软件使用用

49、客户数数的增多多,每年年对产品品使用情情况作一一次审计计就显得得非常有有必要。其产品品审计的的作用主主要表现现在以下下两方面面:一方面,QADD的产品品是通过过软件许许可权(Liccensse)进进行收费费的,客客户根据据自身需需求可以以选择记记名和并并发两种种许可权权方式,通过购购买一定定数量的的许可权权,对软软件进行行使用。但在实实际使用用过程中中,为了了不影响响客户的的日常工工作,QQAD允允许客户户有违反反许可权权的行为为存在,比如同同时使用用软件的的人数超超过了所所购买的的许可权权数量。为此,就十分分有必要要通过每每年的产产品审计计,发现现那些有有违反许许可权使使用情况况的客户户,对

50、他他们进行行额外的的补收费费,以保保证公司司方面的的利益。另一方面面,由于于产品审审计的数数据是由由客户通通过产品品软件的的内置菜菜单自动动生成,再由客客户将这这些数据据打包给给公司,因此产产品审计计这一前前期的数数据搜集集过程是是需要客客户的支支持的。为了激激发客户户的积极极性使得得能更好好的配合合审计,公司认认为可以以对这些些产品使使用数据据进行一一定的分分析,生生成相应应的使用用情况分分析报表表提供给给客户,让他们们明白自自己在软软件的使使用过程程中,哪哪些模块块并未得得到充分分的利用用等。同同时公司司自身的的销售与与执行管管理层也也希望通通过审计计的结果果,了解解目前产产品和模模块在不

51、不同领域域、不同同区域的的客户处处的使用用频率与与使用量量,从而而能更好好的指导导新产品品的开发发方向,更是希希望能从从中得出出每个领领域的最最佳实践践,以此此来指导导公司的的客户更更好的使使用产品品,使他他们物尽尽其用,物更有有所值,最终达达到双赢赢的目的的。基于以上上两点,同时考考虑到历历史数据据量的巨巨大性,因此公公司特地地建立了了UCAA(Usser Couunt Auddit)forr Maasteer BBunddle这这个项目目,并希希望能通通过此来较好好的实现现这些目目标,并并且尽可可能的高高效、简简单,便便于操作作。1.2 研究目目的与意意义计算机科科学与信信息技术术的飞速速

52、发展,使得人人类可以以借助计计算机为为自己解解决许多多问题。但随之之而来,是我们们每天面面对的信信息量不不断增多多扩大。在这样样的大环环境下,对于一一个企业业而言,要想保保持自己己在行业业内的竞竞争优势势,没有有处理大大量数据据的能力力是不行行的,以以往的手手工数据据录入、分析在在海量的的数据面面前也是是无能为为力,更更是低效效,跟不不上时代代节奏的的表现。于是乎乎,人们们想到了了数据库库技术,它能对对现实世世界存在在的大量量数据进进行有效效的组织织与管理理。但是是随着数数据库应应用的规规模、范范围和深深度的不不断扩大大,随着着数据和和数据库库的急剧剧增长,仅仅依依靠数据据库管理理系统的的查询

53、检检索机制制和统计计学分析析方法已已远远不不能满足足现实需需要,它它迫切的的要求自自动、智智能地将将待处理理的数据据转化为为有用的的信息和和知识。就是在在这种背背景下,使得OOLAPP(Onnlinne AAnallytiicall Prroceessiing)和数据据挖掘(Datta MMiniing,简称DDM)为为了迎合合这种要要求而产产生并迅迅速发展展起来。使用OLLAP和和数据挖挖掘技术术,对产产品审计计数据进进行多方方面的综综合分析析,从中中可以发发现对公公司业务务决策所所需的知知识,并并以直观观易懂的的形式将将分析结结果展示示给客户户与公司司管理层层,为他他们的决决策提供供了客观

54、观依据。通过对对产品审审计信息息数据库库进行数数据联机机分析,更可以以方便的的生成多多种形式式的报表表,使软软件的开开发商与与使用商商都能快快速的了了解软件件使用的的各项统统计信息息。另外,通通过研究究本课题题,经过过最终结结论的证证明,更更可以将将OLAAP和数数据挖掘掘技术更更多更好好地应用用在相类类似的行行业中,使本课课题的研研究更具具有实用用价值和和广阔的的发展前前景。1.3国国内外研研究现状状OLAPP和数据据挖掘技技术是目目前国际际上数据据库、数数据仓库库和信息息决策系系统领域域最前沿沿的研究究方向之之一,引起了了国内外外众多领领域科学学家和工工商界的的广泛关关注。对对于这方方面的

55、应应用与研研究,国国外比国国内领先先许多,这里主主要以国国内现状状阐述为为主。国内对OOLAPP的研究究起步较较晚,主主要是对对数据立立方计算算、存储储,多维维数据查查询和物物化视图图等关键键技术的的研究,以及基基于国外外OLAAP服务务器产品品的OLLAP应应用。国国内企业业对于决决策分析析需求大大部分都都是通过过开发一一些功能能单一的的专用程程序来完完成11。近些年随随着国内内企业信信息系统统的不断断完善与与发展和和数据的的持续积积累,各各行各业业已经普普遍关心心数据挖挖掘技术术的应用用。国内内应用数数据挖掘掘的企业业还是以以通信企企业(移移动、联联通、电电信)为为首,应应用的深深度和广广

56、度都处处于领先先地位,原因主主要是行行业竞争争比较激激烈、直直接,另另外通信信业的数数据质量量和数量量都还不不错。除了通通信业,国内的的银行、保险、证券使使用数据据挖掘技技术的意意愿也比比较强烈烈,这跟跟国际趋趋势相吻吻合,未未来几年年金融领领域的数数据分析析应用一一定会从从传统的的统计分分析发展展到大规规模数据据挖掘应应用。但跟国外外相比,国内零零售业对对数据挖挖掘的应应用好像像并不太太热衷,这可能能与客户户信息的的完整性性有关,也就是是说“啤啤酒和尿尿片”的的故事需需要再过过几年才才能在国国内零售售业发生生。 我我国政府府部门中中使用数数据挖掘掘技术比比较领先先的是税税务系统统,国税税总局

57、对对信息系系统建设设及数据据分析应应用工作作也越来来越重视视。 随随着电子子商务的的普及,各大商商务网站站已经大大规模使使用数据据挖掘技技术,并并且迅速速从中取取得商业业价值。比如,国内好好多网上上商城已已经开始始使用数数据挖掘掘技术进进行客户户聚类或或者商品品关联推推广。 另外,个人认为为搜索引引擎企业业使用数数据挖掘掘技术的的需求也也非常迫迫切。从从技术角角度讲,他们需需要使用用数据挖挖掘算法法发现WWeb页页面之间间的关联联与结构构关系,更好的的进行网网页推送送;从商商务角度度讲,各各大搜索索引擎需需要取得得更多的的广告收收入,需需要对点点击流数数据进行行分析,以实现现最大的的商业利利润

58、。虽然数据据挖掘已已经在移移动通信信、保险险、证券券、银行行、电子子商务等等相关行行业进行行了较为为成功的的应用,但在企企业日常常业务信信息系统统中的应应用,如如产品审审计信息息等目前前还处于于起步阶阶段,需需要更多多的研究究与应用用。1.4 论文研研究内容容OLAPP和数据据挖掘各各有所长长,但是是也各有有缺陷,而若能能将二者者结合起起来使用用,发展展一种建建立在OOLAPP基础上上的,针针对多维维数据的的数据挖挖掘技术术,则更更能适合合实际的的需要。本课题题拟在探探讨一种种将OLLAP与与数据挖挖掘相结结合的方方法,使使之能运运用到QQAD公公司的产产品审计计分析中中。针对以上上的研究究内

59、容,本课题题将提出出一种基基于OLLAP和和数据挖挖掘技术术的软件件使用信信息数据据的多维维分析系系统的设设计,研研究使用用基于SSQL Serrverr 20008 分析服服务(SSSASS)在用用户审计计数据仓仓库之上上的OLLAP多多维数据据分析和和MDXX多维数数据查询询,并研研究使用用神经网网络规则则,决策策树等数数据挖掘掘算法及及改进算算法对模模块及程程序使用用情况进进行数据据挖掘,得出有有用的知知识,从从而帮助助指导客客户更好好更高效效的使用用公司产产品,也也可使公公司对现现有产品品有更好好的了解解与规划划。具体体的主要要研究内内容如下下:1利用用OLAAP技术术和数据据挖掘技技

60、术的基基本理论论知识、多维分分析方法法及数据据立方体体的存储储结构,分析其其在QAAD产品品审计中中的具体体运用。2. 对历史史数据进进行过滤滤、分析析、提取取并存入入预先定定义的数数据库表表中。3. 完成产产品审计计信息多多维立方方体的分分析、设设计,采采用维度度建模的的方法建建立了产产品使用用信息的的多维立立方体。4. 进行产产品审计计数据结结果的访访问设计计,定义义Exccel报报表模板板用于显显示数据据分析结结果、查查询等。5. 对数据据挖掘中中决策树树算法、神经网网络算法法等进行行分析,并进行行改进,利用这这些算法法对产品品审计信信息进行行数据挖挖掘,使使用SSSAS的的数据挖挖掘功

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论