




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于数据挖掘技术的保险行业决策分析研究摘要:本文针对目前保险行业信息管理的现状,提出数据挖掘技术对保险行业的重大影响,简要说明了“保险行业决策系统v1.0工程及其对挖掘算法的改良等。并通过实验论证了改良算法的优势,通过分析结果展示了数据挖掘技术能使保险行业有效地利用现有数据实现经营目的,预测保险业的开展趋势,进而在剧烈的竞争中赢得先机。关键词:数据挖掘;关联分析;apriri1引言随着数据库技术的迅速开展以及数据库管理系统的广泛应用,各行各业积累的数据越来越多。日益剧增的数据背后隐藏着许多重要的信息,人们希望可以对其进展更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数据
2、的录入、查询、统计等功能,但无法发现数据中存在的关系和规那么,无法根据现有的数据预测将来的开展趋势。缺乏挖掘数据背后隐藏的知识手段,导致了“数据爆炸但知识贫乏的现象。随着计算机及网络技术的开展,获得某一行业有关资料已实在可行。而对于数量大、涉及面广的数据,依靠传统的简单汇总、按指定形式去分析的统计方法无法完成对数据的分析。因此,一种智能化的信息分析技术“数据挖掘(dataining)应运而生。数据挖掘(dataining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。通过挖掘数据仓库中存储的大量数据,从中发现有意义的新
3、的关联形式和趋势的过程。数据挖掘是一种新的商业信息处理技术,是对商业数据库中的大量业务数据进展抽娶转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。从而使企业在剧烈的市场竞争中获得先机。就保险行业而言,目前具有广阔的市场需求。2工程说明本工程开发了“保险行业决策系统v1.0。本系统操作主界面利用asp编程实现:数据预处理、客户购置险种分析、客户购置习惯分析、分析结果输出等功能;后台数据库利用sqlserver2022网络数据库实现;挖掘工具采用spssleentine11.0;在研究实验阶段,针对apriri算法存在的“存储复杂度及“大量冗余规那么两大缺点进展了算法改良,通过利用一
4、个形式树构造来降低apriri算法的存储复杂度,并同时减少冗余规那么的出现。本系统共分:数据预处理、客户购置险种分析、客户购置习惯分析、分析结果输出等主要功能模块。(1)“数据预处理模块包括:上传、数据平台、数据处理、统计、生成数据集等功能。上传:可完成保险总公司下设所有分公司数据的上传。数据平台:在数据上传前允许对数据平台进展选择。数据处理:对数据进展清理、格式转换等操作。统计:对经过预处理的数据进展分析,提取有效性数据。生成数据集:将统计过程提取的有效数据生成数据集,为数据挖掘提供较高质量的数据源。(2)“客户购置险种分析模块包括:数据导入、参数设定、结果分析等功能。数据导入:在此操作界面
5、上,可通过选择不同数据平台将经过“数据预处理生成的数据集分别导入。参数设定:在此操作界面上设定“支持度“置信度等参数,对有效数据集中有分析价值的数据记录范围进展筛眩结果分析:在此操作界面上可将“客户购置险种分析的最终分析结果以“报表、“图表形式展示,此分析结果为行业提供了“同一客户购置本公司多种(次)保险的客户信息,进而为行业提供了“可争取客户的决策根据。(3)“客户购置习惯分析模块包括:数据导入、参数设定、结果分析等功能。数据导入:此操作同(2)“客户购置险种分析模块中的“数据导入。参数设定:在此分别设定“输入参数(包括:年龄、性别、职业等客户根本信息)及“输出参数(客户购置的险种信息)。结
6、果分析:通过此操作界面可展示出客户购置习惯的分析结果,进而为行业提供了“可保持客户的决策根据。(4)“分析结果输出模块包括:“客户购置险种分析“客户购置习惯分析等分析结果的打印输出功能。3工程中改良的快速算法由于apriri算法存在时间空间复杂度高及产生大量冗余规那么两大缺陷。因此本工程通过利用一个形式树构造来降低apriri算法的存储复杂度,并同时减少冗余规那么的出现。3.1一个形式树的构造rt是一个标为“null的根结点,rt以下是作为根结点的孩子的工程前缀子树集合,以及工程头表组成;树中的每一结点包含四个域user_id,unt,nde_link,nde_next。其中,user_id为
7、user的标记(唯一标识一个user),unt为该父结点到达该结点的途径的数目,nde_link指向树中具有一样的user_id的下一个结点的下一结点,当下一个结点不存在时,nde_link为null,nde_next指向树中其子结点;工程头表的每一表项包含三个域:user_id,unt,headfnde,user_id与树中的定义一样,unt为树中所有一样user_id之和,headfnde指向树中具有一样user_id值的首结点的指针。3.2建立形式树算法如下:设事务数据库为a,其中的一个项集为ai。算法:patterntree(tree,p),构造形式树输入:用户事务数据库a输出:用户形
8、式树predurepatterntree(t,p)reate_tree(t);/创立pattern-tree的根节点,以“null标记t=t;/t为当前结点hileanulld读入一个事务数据库项集aihilep!=nulldifp.user_id=t的祖先n.user_idthenn.unt=n.unt+l;t=n;elseifp.user_id=t的孩子.user_idthen.unt=.unt+l;t=;elseinsert_patterntree(t,p);/把p作为新结点插入树中,作为当前结点的孩子结点p=p.next;3.3对形式树进展剪枝形式树建立后,可能存在大量的冗余的分枝,为
9、了保证数据挖掘结果不被这些冗余分枝产生的噪声所影响,因此需要对树进展剪枝,剔除噪声信息。算法:spt(tree,a),通过调用此算法对形式树进展剪枝/spt为支持度形式树,即supprtedaesspatterntree;a为工程头表输入:形式树patterntree,in_sup(形式树的最小支持度)输出:经过修剪后的支持度形式树spt,形式b=bi|i=1,2,3nspt(tree,a)i=1;hile(ai!=null)/为工程头表的某一项if(ai.unt=in_sup)then形式bi=ai.headfnde;p=ai.headfnde;/p指向ai在形式树中的位置hile(p!=n
10、ullandai.unt=in_sup)查找p的前缀基,将p的前缀基和p连接,构成形式b;if(bi.unt=in_sup)then/bi.unt为形式b中p与p的前缀基中的最小计数在形式bi中保存p及其前缀基;bi=bi.nde_linkelse根据形式b中的p及其前缀基删除patterntree中的相应节点,重构子节点与父节点,同时修改工程头表中的ai;p=p.nde_next/p指向在形式树中的下一个位置;else修改工程头结点的ai值;删除形式树中相应的节点及其前缀基,重构父子节点;i+;通过形式树的建立可以防止屡次扫描事务数据库;同时利用unt域有效的保存了项集的数目,防止大量产生频
11、繁项集,对于减小空间时间复杂度起到了一定的作用。通过树形构造可以防止产生大量冗余规那么。通过对形式树的剪枝,可以减除在形式树产生过程中产生的大量冗余分枝,起到了减小空间复杂度的作用,同时可以利用输出形式b产生规那么,防止了多项集的频繁出现,减小了时间复杂度。4完毕语本工程中通过形式树构造改良了apriri算法,弥补了apriri算法存在的缺陷。此种方法既可以对apriri算法从时间复杂度和空间复杂度上进展改良,同时又防止了中间规那么的产生。本研究说明,通过利用一个形式树构造来降低apriri算法的存储复杂度,并同时减少冗余规那么的出现,这对于apriri算法的改良是一种有效的措施。参考文献1邓纳姆.数据挖掘教程.郭崇慧,田凤占,靳晓明,等译.北京:清华大学出版社,2022.2苏新宁,杨建林,江念南,等.数据仓库和数据挖掘.北京:清华大学出版社,2022.3gals,kantrpb,shapirab.seurityinfratisandterrris:p
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电气考试试题大题及答案
- 教师资格考试理论与实践结合的分析试题及答案
- 网络规划设计师必考知识点试题及答案
- 汽车电气考试题及答案
- 知识产权法庭审理实务试题及答案
- 卫生管理心理健康政策影响试题及答案
- 服务质量培训试题及答案
- 系统架构设计师考试中的知识综合能力考查问答试题及答案
- 研究2024年专利代理人资格证书的学习方法与方法试题及答案
- 安管班长转正试题及答案
- 旅行社企业章程范本
- 《预防未成年人犯罪》课件(图文)
- 煤矿岗位标准化作业流程
- 全国网信系统网络安全协调指挥技术系统建设指南
- ACLS-PC-SA课前自我测试试题及答案
- DB14∕T 2447-2022 建设项目环境影响后评价技术导则 生态影响类
- 冶金等工贸企业安全生产标准化达标信息管理系统[冶金等工贸企业安全生产标准化达标信息管理系统](-33)
- 英语话剧剧本<美女与野兽>
- 兰炭外热式回转炉低温干馏工艺及技术装备简介
- 拟投入本工程的主要施工设备表
- OSFPS7-120000,220电力变压器
评论
0/150
提交评论