数据挖掘在银行卡业务决策中的应用及数学教学难点处理点滴谈_第1页
数据挖掘在银行卡业务决策中的应用及数学教学难点处理点滴谈_第2页
数据挖掘在银行卡业务决策中的应用及数学教学难点处理点滴谈_第3页
数据挖掘在银行卡业务决策中的应用及数学教学难点处理点滴谈_第4页
数据挖掘在银行卡业务决策中的应用及数学教学难点处理点滴谈_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

毕业论文数据挖掘在银行卡业务决策中的应用学生姓名:学号:系别班级:信息管理与工程系专业(方向):信息管理与信息系统指导者:评阅者:毕业论文中文摘要数据挖掘在银行卡业务决策中的应用摘要:随着金融信息化发展趋势,银行卡已成为商业银行提供的一项重要的金融工具,国内的商业银行开展银行卡业务已有多年相关数据积累比较完善。目前,我国银行业面临的最大的压力是怎样提高自身的服务水平。如何利用积累的数据更好的了解客户,获得客户的行为模式,在有针对性地开展个性化服务的同时提高自身的竞争能力和盈利能力。在银行卡业务中,利润率是一个关键指标,而建立以客户为中心的管理信息系统,通过对大量信息的分析找出客户消费的行为和规律,进而预测客户的个性化需求、及时响应客户的需求、设计出更加符合客户需要的产品和服务,是赢得客户认可、提高利润率的有效办法。关键词:银行卡数据挖掘客户行为分析毕业论文外文摘要TitleDataminingintheapplicationofthebankcardbusinessdecisionsAbstractWiththefinancialinformationdevelopmenttrend,bankcardhasbecomeacommercialbankprovideoneofthemostimportantfinancialinstruments,domesticcommercialBanksbankcardbusinessformanyyearsrelateddataaccumulationisperfect.Atpresent,China'sbankingbiggestpressureishowtoimproveitsownservicelevel.Howtousetheaccumulationofdatatobetterunderstandcustomers,getcustomerbehaviorpatternsintargetedtodevelopingtheindividualizedservicesatthesametimetoimprovetheirowncompetitivenessandprofitability.InthebusinessofbankCARDS,profitabilityisakeytargets,andtoestablishthecustomerasthecenterofmanagementinformationsystem,throughtheanalysisofalargeamountofinformationtofindouttheconsumptionofthecustomerbehaviorandlaw,andforecastthepersonalizedneedsofcustomers,andrespondtotheneedsofcustomers,designtomeetcustomers'needtoproductsandservices,istowincustomerrecognition,theeffectivewaytoimproveprofitability.Keywords:BankcardDataminingThecustomerbehavioranalsis目录引言…………………11.1课题背景及意义………………11.2国内外研究现状………………21.3本文主要研究工作……………21.4本章小结………………………22相关技术分析…………………32.1概述…………32.2数据仓库………………………32.3联机分析处理…………………32.3.1OLAP的概念……………52.3.2OLAP的分类……………62.2.3OLAP的常用分析方法…………………62.4数据挖掘技术…………………72.4.1分类………………………72.4.2过程………………………82.4.3方法………………………92.5数据挖掘应用于银行卡业务的优势…………102.6数据挖掘应用于银行卡业务的领域…………102.7本章小结………………………123银行卡业务决策系统……………123.1系统总体设计………………123.1.1系统架构……………123.1.2系统总体设计………133.2系统数据库设计……………133.3银行卡管理系统的实现……………………143.3.1基于关联的挖掘模型……………………143.3.2应用效果分析…………163.4.3本章小结………………174总结与展望…………174.1研究工作总结………………174.2展望……………………17参考文献………………18致谢………………19PAGE第一章绪论1.1课题背景及意义随着中国金融体制改革的逐渐深入以及中国加入WTO,中国银行业面临着前所未有的竞争压力。各大银行既通过开发新的产品和服务,来提高自身的竞争力,也希望能够发挥自身的竞争优势满足客户需求,提高客户忠诚度、提高决策水平和效率。然而银行提供给用户的产品有一个显著的特点即为同质性。不同银行的产品之间几乎没有差别。另一方面银行又存有海量的用户信息数据。通过对这些海量的数据的挖掘分析,从中发现用户不同的消费偏好,开展有针对性的营销策略,保留优质客户的前提下发掘潜在客户,创造更多的利润,成为银行获取竞争优势的一个重要手段。数据挖掘技术的出现为银行实现这个目标提供了强有力的武器。货币的电子化发展趋势使银行卡成为商业银行所提供的重要金融工具,在银行业务量中占有越来越大的比重。银行卡业务的开发、应用、服务、管理的水准直接关系到银行的经济收益。多年来,大部分银行纷纷将其作为重点业务加以发展,在银行卡业务开展方面投入了大量的人力与财力。然而当前国内银行卡业务的服务水平还停留在比较落后的水平。中国银行业与外国银行最大的差距在于服务。在客户关系管理方面,国外已有将近二十年的历史。西方银行业一直处于比较激烈的竞争状态,在客户服务方面积累了相当的经验。而中国银行业刚从计划经济时期转变过来,对“以客户为中心”的理解一直处于表面状态,不能够深入的了解客户的需求,长期以来对客户实行无差别服务策略,不能够抓住真正的盈利客户,进行区别对待,为客户提供一对一的服务。银行的数据库中积累了大量的客户信息,但是缺乏一套行之有效的数据挖掘系统进行信息分析,甚至连同一客户的不同账户业无从辨别,更不用说我是客户提供一对一的服务。银行的各种数据不能有效的结合,形成很多的“信息孤岛”,使金融机构很难将各种各样的信息统一起来,领导决策层业很难搞清楚数据库系统的整体运作情况,不能有效的提供决策帮助。【1】而随着数据挖掘技术的不断成熟和完善,完全可以为国内银行开展个性化的信息卡营销提供强大的信息支持目前,在全国范围内无论从地域、发卡量、设备装机量方面都已构成相当大的规模,同时也积累了大量的业务数据。通过对银行卡业务数据的分析,可以有效地为银行进行银行卡业务的客户关系管理、风险管理、收益分析和绩效评估等服务。从而可以为银行识别不同的客户群体,按照收益和风险对客户分类,确定目标市场,实现差异化服务,并为银行卡经营管理决策分析提供准确的信息。1.2国内外研究现状数据挖掘技术在一些在国际化银行,如美国第一银行的实际业务运营中发挥了巨大的作用。根据美国META集团的调查,数据挖掘技术在美国金融业、制造业、商贸业以及社会服务等方面都得到广泛的应用,已经采用数据仓库数据挖掘的起因的投资回报率均在40%以上,部分企业高达每年60%。国外经验表明,数据挖掘对银行卡业务的发展有重大意义【2】。随着国内银行业务的快速发展、同业竞争的不断加剧以及信息技术在银行业的深入应用,银行业开始重视数据挖掘技术的应用,遵循“将合适的产品在合适的时间以合适的方式推荐给合适的客户”的经营理念。建行成功股改上市后,进一步强化了对管理的精细化要求,因而对现有数据挖掘的重要性已日益凸显。近年来,建行着力加强数据整合和数据挖掘,在客户关系管理方面已经达到国内银行业的先进水平,实现了跨系统的数据整合,进一步扩充现有数据源,解决了业务数据分散、跨业务部门的客户信息无法共享等问题,完善了包括客户、账户、产品、银行机构、交易、渠道等主题在内的数据仓库逻辑数据模型的设计,科学地建立了客户贡献度计算模型、客户评价模型、风险预警模型等,在支持全行客户经理市场营销、客户服务、客户管理和经营决策中起到了重要作用。1.3本文主要研究工作本文主要是根据银行卡交易的数据了解用户的用卡行为,从中发现对银行贡献度比较大的优质客户,并对不同的用卡习惯,制定不同的营销服务手段,以提高银行的服务质量和盈利水平。银行卡用卡行为的关联规则挖掘方法包括以下三方面用卡行为分析:根据持卡人以往用卡次数、交易金额、用卡交易类型(包括卡查询、取款、存款、转账、缴费、消费购物等交易)以及用卡交易方式(包括柜台、ATM、POS、电话和网上等)进行分析。持卡人基本情况分析:根据持卡人的年龄、性别、身份证号码、收入情况、受教育情况、服务单位、职务、职称以及家庭组成情况进行分析。结合以上持卡人用卡行为和基本情况两种分析结果,导出具有一定支持度和可信度的用卡习惯和人群组成之间的关联规则。1.4本章小结本章首先介绍了与论文有关的研究背景、银行卡管理的目的与意义:重点分析了银行卡管理系统的研究现状,并对银行卡信息管理系统和研究现状中存在的问题进行了分析。在此基础上,提出了本文的主要研究工作。第二章相关技术分析2.1概述银行卡业务是我国商业银行业务的一个重要组成部分。在银行卡业务中,利润率是一个关键指标,而建立以客户为中心的管理信息系统,通过对大量信息的分析找出客户消费的行为和规律,进而预测客户的个性化需求、及时响应客户的需求、设计出更加符合客户需要的产品和服务,是赢得客户认可、提高利润率的有效办法。然而,目前大多数银行卡业务缺乏真正面向市场、面向客户的决策支持系统,对客户的判别也只停留在静止、片面、主观的水平,不能对客户做出动态的、全面的、客观的评价。为了更好地细分市场、细分客户,提高业务管理水平和银行卡业务的获利能力,建立基于数据仓库、联机分析处理、数据挖掘的银行卡决策支持系统,成为银行提高综合竞争力的必然选择。2.2数据仓库数据仓库是支持管理决策过程的,面向主题的、集成的、随时间而变的、持久的数据集合,它具有以下4个特点:数据仓库是面向主题、面向分析的。数据仓库中的数据时按照一定的主题组织起来的。如一个银行的数据仓库的主题可以是客户、财务、结算等,这些主题基本与银行各职能划分相应。儿传统的数据库的数据是按照存款客户、贷款客户、年报月报等分类来组织。数据仓库是集成的。由于数据来源的异构性,所有历史数据在进入数据仓库之前,必须经过预处理,消除数据源中的不一致的数据,平滑噪声,以有效地支持后续的联机数据分析和数据挖掘等技术的应用。数据仓库是稳定的。某个数据一旦进入数据仓库,一般情况下将被长期保留,对数据仓库修改和删除操作很少,通常只进行定期的加载、刷新,不进行实时更新。数据仓库是随时间变化的。数据仓库中的数据都是历史数据,系统记录了企业从过去某一时点到目前的个股阶段的信息。数据的保存时限要能够满足决策分析的需要,一般为5~10年。数据仓库系统由三个部分组成,即建模系统、ETL系统、OLAP系统。建模系统主要用于辅助设计人员进行数据仓库设计;ETL系统辅助数据仓库实现人员设计和实现ETL过程,完成数据仓库加载和更新数据;OLAP系统为OLAP设计人员提供设计平台,为OLAP分析准备数据,同时为最终用户提供OLAP分析工具。各个系统之间通过元数据文件进行关联(如图2.2所示)。图2.2数据仓库系统的组成数据源:数据仓库系统的基础,是整个系统的数据源泉。通常包括内部信息和外部信息。内部信息包括存放于RDBMS中的各种业务处理数据和各种文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等。OLAP服务器:对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。其具体实习可以分为:ROLAP、MOLAP和HOLAP。ROLAP基本数据和聚合数据均存放在RDBMS之中;MOLAP基本数据和聚合数据均存放于多维数据库中;HOLAP基本数据存放于RDBMS之中,聚合数据存放于多维数据库中。前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程)作为BI/DW的核心和灵魂,能够按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。ETL是数据抽取(Extract)、转换(Transform)、清洗(Cleaning)、装载(Load)的过程,是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。数据质量是数据仓库的生命。为确保数据仓库的质量,ETL必须确保以下四个方面:第一将没用的数据彻底清洗掉;第二确保有用的数据能全进入数据仓库;第三尽可能减少仓库中的冗余数;第四确保新的业务熟据能源源不断的及时进入数据仓库。2.3联机分析处理2.3.1OLAP的概念联机分析处理(OLAP)指的是对存储在数据库或数据仓库中的数据提供分析的一种软件。OLAP工具能快速提供复杂数据库查询的答案,并帮助用户分析多维数据中的各维情况。通常OLAP应用于数据仓库中的数据处理过程,即所谓的“数据挖掘”(DataMining)。

2.3.2OLAP的分类OLAP系统按照其存储器的数据存储格式可以分为关系OLAP(RelationalOLAP,简称ROLAP)、多维OLAP(MultidimensionalOLAP,简称MOLAP)和混合型OLAP(HybridOLAP,简称HOLAP)三种类型。1.ROLAPROLAP将分析用的多维数据存储在关系数据库中并根据应用的需要有选择的定义一批实视图作为表也存储在关系数据库中。不必要将每一个SQL查询都作为实视图保存,只定义那些应用频率比较高、计算工作量比较大的查询作为实视图。对每个针对OLAP服务器的查询,优先利用已经计算好的实视图来生成查询结果以提高查询效率。同时用作ROLAP存储器的RDBMS也针对OLAP作相应的优化,比如并行存储、并行查询、并行数据管理、基于成本的查询优化、位图索引、SQL的OLAP扩展(cube,rollup)等等。2.MOLAPMOLAP将OLAP分析所用到的多维数据物理上存储为多维数组的形式,形成“立方体”的结构。维的属性值被映射成多维数组的下标值或下标的范围,而总结数据作为多维数组的值存储在数组的单元中。由于MOLAP采用了新的存储结构,从物理层实现起,因此又称为物理OLAP(PhysicalOLAP);而ROLAP主要通过一些软件工具或中间软件实现,物理层仍采用关系数据库的存储结构,因此称为虚拟OLAP(VirtualOLAP)。3.HOLAPHOLAP是一个新的OLAP结构——混合型OLAP(HOLAP),它能把MOLAP和ROLAP两种结构的优点结合起来。迄今为止,对HOLAP还没有一个正式的定义。但很明显,HOLAP结构不应该是MOLAP与ROLAP结构的简单组合,而是这两种结构技术优点的有机结合,能满足用户各种复杂的分析请求。2.2.3OLAP的常用分析方法对OLAP的分析操作主要有:切片(Slice)、切块(Dice)、下钻(Drill-down)、上翻(Roll-up)和旋转(Rotate)【6】。切片:是在多维数组中的某一维度上选定一个维度成员的操作,即在多维数组(D1,D2,…,Dn)中选一个维度Di,并取一维度成员Vi,所得多维数组的子集(D1,D2,…,{Vi},Dn)称为在维度i上的一个切片。切块:是在多维数组中的某一维度上选定某区间维成员的操作,即在多维数组(D1,D2,…,Dn)选中一个维度Di,并取一维度成员集合,所得多维数组的子集(D1,D2,…,{Vi,…,Vj},Dn)称为在维度i上的一个切块。上翻,下钻:它们是通过对维度的层次属性进行操作来获取数据的,钻取的深度与维度所包含的层次相对应。向维的高层次(粗粒度方向)的钻取称为上翻,相反向维度的低层次(细粒度方向)的钻取称为下钻。旋转:改变一个报告或页面显示的维度方式,例如,可能包含交换行和列或把某一行维移到列维去,或是把页面显示中的一个维和页面的维进行交换。2.4数据挖掘技术数据挖掘是商务智能(BusinessIntelligence,BI)产品系列中的关键成员,BI中的关键成员还有联机分析处理、企业报表和ETL。数据挖掘指的是分析数据,使用自动化或半自动化的工具来挖掘隐含的模式。它从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。它是一门涉及面很广的交叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。2.4.1分类数据挖掘可以解决大量的商业问题。基于这些商业问题的性质,把这些问题分成下面几种数据挖掘任务:概念描述。概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,只涉及该类对象中所有对象的共性;后者,则描述不同类对象之间的区别。关联分析。关联分析主要用于发现不同事件之间的关联性,即一个事件发生的同时,另一个事件也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事件,其主要依据是应该符合一定的统计意义的相关事件发生的概率和条件概率。分类和预测。分类分析就是通过分析样本数据库中的数据,为每个类别作出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其它数据进行分类。预测是使用历史资料去推测估计未来的数值以及趋势,根据样本的已知特征估算某个连续类型的变量的取值的过程。聚类分析。聚类分析是根据物以类聚的原理,分析数据对象,将本身没有类别的对象聚集成不同的类别,并且对每一个这样的类别进行描述的过程。分类是事先已经知道有哪些类别,而聚类则事先不知道数据对象到底有些什么样的类别,对象根据“最大化类内的相似性、最小化类间的相似性”的原则进行聚类或分组,使得在一个簇(聚类)中的对象具有很高的相似性,而与其他簇的对象很不相同。偏差检验。也常被称之为孤立点分析或异常检测。在数据库中可能存在这样一些数据对象,它们与数据的一般行为或模型存在较大偏差,称之为孤立点。孤立点可能是度量或执行错误所致,因此一般情况下孤立点数据作为杂质排除,但有些情况找出孤立点却是非常有用的,比如高额频繁的信用卡透支行为。这种现象相对于正常的信用卡使用来说是很少出现的,属于孤立点,找出这些孤立点,就可能预防或发现一些信用卡欺诈行为。演变分析。用于描述随时间变化的对象的变化规律或趋势,并对其建模。比如时间序列数据分析、序列或周期模式匹配和基于相似性的数据分析。如给定过去几年证券市场的历史数,通过演变分析识别某类证券的演变规律,从而预测证券的未来价格走势。2.4.2过程数据挖掘过程一般可以分为以下五个步骤:问题定义:了解相关领域的有关情况,熟悉背景知识,弄清用户要求,定义要挖掘的目标。数据提取:根据要求从数据库中提取相关的数据。数据预处理:主要对前一阶段产生的数据进行再加工,检查数据的完整性及数据的一致性,对其中的噪音数据进行处理,对丢失的数据进行填补。知识提取:运用选定的数据挖掘的算法,从数据中提取用户所需要的知识,这些知识可以用一种特定的方式表示或使用一些常用的表示方法。评估:将发现的知识以用户能理解的方式呈现,如某种规则,再根据实际执行情况对知识发现过程中的具体处理阶段进行优化,直到满足用户的要求为止。2.4.3方法数据挖掘主要有如下6种方法:关联分析:如果客户购买了产品A,在x%的情况下,他也可能购买产品B。P(B|A)=P(AB)/P(A)两个关键的阈值指标分别是支持度:P(AB)和置信度:P(B|A)。这种分析方法的不足:一、支持度仅以出现次数为评价对象,可能忽略销售额大二次数很少的项目。二、分析出来的关系可能是随机的。三、置信度低的数据可能反映很重要的市场信息。可能是替代品或竞争产品。分类分析:分类其目的是建立一个分类函数或分类模型(也称作分类器),该模型能把数据库的数据项映射到给定类别中的某一个。分类是有指导的学习。根据设定的分组,将不同的数据分配到不同的分组,然后研究每个组的特点。如客户跳槽分析。聚类分析:Clustering是将数据分为几组,其目的是将组与组之间的差异找出来,同时也要将一个组之中的成员的相似性找出来。Clustering与Classification不同的是,你不知道它会以何种方式或根据什么来分类。所以你必须要有一个分析师来解读这些分类的意义。聚类分析帮助我们决定将哪些组合更有意义。聚类是把一组个体按照相似性归成若干类别,即“物以类聚”。它的目的是使属于同一类别的个体之间的距离尽可能地小,而不同类别的个体间的距离尽可能地大。决策树:分析不同的影响因素对分析目标的影响,找到关键的影响因素。决策树法的优点是直观,但随着数据复杂性的提高,其分支树也会增多,管理困难。遗传算法:遗传算法是一种基于生物进化过程的组合优化方法。其基本思想是:随着时间的更替,只有适合的物种才得以进化。将这种思想用于数据挖掘就是根据遗传算法获得最适合的模型,并据此对数据模型进行优化。神经网络:神经网络从经验中学习,常用于发现一组输入数据和一个结果之间的未知联系。2.5数据挖掘应用于银行卡业务的优势数据挖掘技术的应用有效地解决了困扰我国银行卡产业发展的主要问题,即怎样发展和管理信用卡客户?怎样准确有效地营销?怎样控制风险?等问题。2.6数据挖掘应用于银行卡业务的领域数据挖掘在银行卡业务中的应用范围主要有:1.建立客户细分模型由于人口统计特征和心理特征的多样性,以及交易行为和利润水平的不同,客户交易据库中存在着不同的群体。发掘出不同群体的这些特征,才可能据此进行产品开发、个性化服务和目标定位。BFM方法是根据银行对于客户行为特征的关注点,而设计的一种客户细分方法,其含义如下:最近值B(Balance):账户日均余额频度值F(Frequency):一定时间段内交易次数币值M(Monetary):一定时间段内累计交易金额在银行所关心的这三个特征值中,账户日均余额是最重要的,因为它直接决定着银行可供利用资金的多少,进而影响银行的利润;交易频度标识着账户的活跃程度;交易金额则衡量着账户的资金流量,一定程度上反映着该账户拥有人的资金流动性。以一段时间内的账户日均余额、交易次数和累计交易金额为度量值,对所有的银行卡客户进行细分。细分完成后,通过对比分析,可以得出每一个客户划分的类型,从而为营销策略的制定提供有力的指导。2.建立余额流失模型客户流失对于任何企业的利润都会带来重大的影响。对于银行来说,关注的不单纯是客户数量的流失,更重要的是客户账户余额的流失。确定"真正的余额流失者"基于两个假设:一是账户余额的减少达到一定的绝对数量;二是流失余额的百分比达到某一较高的比例。两个假设同时满足该客户才有可能是"真正的余额流失者"。余额流失模型中,选取一个较长的时间段(比如一年)计算出每个银行卡账户的"日均余额1",再取接下来的一个较短的时间段(比如三个月)计算每个银行卡账户的"日均余额2",利用两个日均余额值来确定账户余额的变化值和变化百分比。以余额的变化值和变化百分比为度量值,对所有存在余额减少的银行卡账户采用聚集技术进行划分。通过对各个划分进行对比分析,结合银行卡业务周期的特点,可以得到余额流失的量化标准,从而确定"真正的余额流失者",并采取针对性的弥补措施。3.建立客户价值模型在直接营销的初期,收入的大部分增长来源于新客户的获得。然而在今天,市场已经越来越趋于饱和,使得获取新客户越来越困难并且花费也更加昂贵。为了弥补这一不足,很多的公司正在把现有的客户作为公司的利润主体,它们更多的是通过把重点放在为现有的客户开发新的产品和提供新的服务上来保持竞争力。商业银行也开始向吸引和保留高价值客户投入更多的资金。然而谁是高价值客户,很多的商业银行的经营管理者没有理性的认识、量化的标准和有效识别的手段,借助数据挖掘技术可以解决这个问题。计算客户的价值要考虑历史价值和未来价值,直接贡献和间接贡献,除此之外还要考虑这些价值的净现值,根据现有的数情况确定计算公式。通过调研,可以确定公式中的各个参数,这样就可以计算每个银行卡账户对于银行来说的收入和支出,得出该账户的价值。利用一些挖掘软件中的自定义公式的功能,将客户价值计算公式定义好,就可以批量的计算出所有客户的价值。4客户信用模型银行卡中的贷记卡,也就是通常所说的信用卡,在开展业务的过程中往往会遇到客户恶意透支的情况,产生了信用风险,为银行的资金安全带来一定的危害。利用数据挖掘技术建立客户信用模型,可以对贷记卡客户进行信用等级评定、透支行为分析和信用欺诈发现。这个模型首先在对信用卡历史记录进行分析的基础上,确定每个人口统计学特征在初始信用等级评价时所占的权重,并对初始信用等级进行分类。以后随着业务交易的增加,根据客户的信用状况对该客户的信用等级进行动态的调整。用模型还对客户的信用透支进行分析,获取客户透支的具体特征。客户的信用等级和透支具体特征两方面结合作为基础,应用孤点分析和聚类分析,监测信用卡的异常业务。根据对历史数据的挖掘,获取造成信用风险的客户的特征和背景,防范有可能造成风险损失的客户。在对客户透支行为分析的基础上,用系统的方法对信用风险的类型和原因进行识别、评估,发现引起信用风险的诱导因素,有效的控制和降低信用风险的发生。通过建立客户信用模型,能够帮助银行发现具有潜在欺诈性的事件,预防和控制资金的非法流失。2.7本章小结本章介绍了与银行卡业务决策相关的技术,描述数据挖掘技术在银行卡业务决策中的优势并论述了数据挖掘技术主要的应用领域。第三章银行卡业务决策系统3.1系统总体设计3.1.1系统架构银行卡管理系统结构如图3.3.1所示。图3.1.1银行卡管理信息系统结构银行卡管理系统结构分为:金融渠道、业务系统及其它数据源系统、决策支持信息平台、分析系统四个层次。金融渠道为业务系统提供了数据源,业务系统及其它数据源系统为决策支持信息平台提供了数据源,而决策支持信息平台则为该系统提供了数据源【5】。3.1.2系统总体设计银行卡管理信息系统的功能模块包括两方面:一、客户端对银行卡的应用二、银行方面基于客户用卡行为的分析进行决策和管理的应用。系统总体设计结构如下图3.1.2所示。图3.1.2银行卡信息管理系统3.2系统数据库设计讨论的原始数据来自以下几个表:持卡人基本信息表(CardFlolder):主要字段包括卡号、交易时间、交易类型、服务单位、职业、职务、学历、年收入、婚姻状况、配偶姓名、住址以及联系方式等。持卡人历史交易表(HisTransLog):主要字段包括卡号、交易时间、交易类型、交易金额、交易方式和交易流水号等。代发工资表(Sarlary)考虑到收入是较为敏感的因素,虽然在持卡人基本信息表中有“年收入”字段,但为更精确分析收入状况,我们引入了一些单位在银行的代发工资,主要引用字段是卡号和实发金额字段。卡类表(CardList):主要字段有发卡行行号、卡类型(借记卡、贷记卡)、所属组织(VISA\MASTER\JCB等)、卡特征值、卡号长度和卡种名称等。3.3银行卡管理系统的实现3.3.1基于关联的挖掘模型数据预处理包括对部分空缺数据字段通过经验填充;对部分属性进行离散和概化;删除无关或冗余属性等。具体实现内容如下:空缺数据字段填充:主要是通过经验值或其他相关字段推到进行填充,如性别字段、年龄字段等可通过身份证号码字段推导出来。数值属性离散化和归约处理:部分数值属性需要离散或归约并概念分层,以便于分析和统计。如:年龄属性:{young,middle_aged,senior}{20……39}young{40……59}middle_aged{59……89}senior年收入属性:根据本地情况{low,middle_low,middle,middle_high,high}{5000……11999}low{12000……23999}middle_low{24000……59999}middle{60000……99999}middle_high{100000……600000}high交易金额属性可按四舍五入的原则之精确到百元。如交易金额为1283.56源,则经过处理后为1300元。分类属性概化和维归约化处理:对于交易方式、交易类型、服务单位、职业和职务等分类属性字段进行概化处理和维归约。如交易类型可向上增加两个概念层:金融类交易和非金融类交易,金融类交易又分为现金交易和非现金交易;交易方式也可以向上增加一个概念层:自主交易方式和非自主交易方式;同样,受教育程度也可向上增加一个概念层:高等教育、中等教育和初等教育;服务单位可概化到行业划分、如行政事业单位、金融保险业、私营企业等等。删除无关或冗余属性处理:如卡消费地点、时间、卡磁条信息、住址和联系方式等字段与挖掘内容关系不大,为避免干扰和影响挖掘,应删除该类字段。通过分析,最终建立了10个维表和2个事实表(持卡人基本信息表和交易信息表)。10个维表为:·性别维表:Sex(sex_key,sex_name)·年龄维表:Age(age_key,age_rang)·年收入维表:Ysalary(ysalary_key,ysalary_level)·职业维表:Occup(occup_key,occup_type,occup_name)·行业维表:Employer(emp_key,emp_type,emp_name)·职务维表:Headship(headship_key,headship_level,headship_name)·受教育程度维表:Edu(edu_key,edu_level,edu_name)·交易类型维表:TransType(transtype_key,transtype_level,transtype_ID)·交易方式维表:TransMode(transmode_key,transmode_level,transmode_ID,transmode_name)·卡类维表:CardType(cardtype_key,cardtype_type,cardtype_inst,cardtype_name)两个事实维表为:持卡人基本信息表(事实表):HolderMsg(sex_key,age_key,ysalary_key,occup_key,emp_key,edu_key,cardnum,cardholder)交易信息表(事实表):TransMsg(transtype_key,transmode_key,cardtype_key,amount,count,cardnum,trans_seqnum)结合背景知识,对挖掘过程做如下约束。用卡次数必须大于5次的用户。用卡次数可以说明用户是否喜欢用卡,如果用卡次数过少说明该客户不太习惯用卡年收入必须大于10000元的客户。因为收入水平是判断该客户是否有经济实力的重要指标20%<收支比<80%。其中,收支比=一段时间内总支出/一段时间内总收入,收支比过低,说明消费欲望过低或不习惯用卡;收支比过高,对银行来说存在风险3.3.2应用效果分析采用维关联规则的目的很明确,就是要发掘能给银行带来比较大利益的客户。以下是产生并经过筛选后的部分具体挖掘内容及结果:网上购物习惯挖掘网上购物与年龄结构的3维关联规则:Transtype_key(X,shoping)^transmode_key(X,internet)=>age_key(X,young):[1.5%,60%]网上购物与性别的3维关联规则:Transtype_key(X,shoping)^transmode_key(X,internet)=>sex_key(X,male):[1.5%,60%]年龄结果与受教育程度与网上购物的4维关联规则:Transtype_key(X,shoping)^edu_key(X,hight)^age_key(X,young)=>transmode_key(X,internet):[1.5%,50%](2)使用自助方式(self_mode:ATM、POS、PHONE、INTERNET)交易习惯挖掘5000元以下在ATM取款机上取款习惯的关联规则:Transtype_key(X,withdraw)^amount(X”50…5000”)=>transmode_key(X,ATM):[5%,58%]查询交易大部分使用自助方式Transtype_key(X,inquire)=>transmode_key(X,self_mode):[5%,70%](3)不同年龄段的交易习惯挖掘中青年喜欢采用自助方式交易:age_key(X,in(young,middle_aged))=>transmode_key(X,self_mode)[5%,55%]老年及收入较低的持卡人往往采取柜台交易方式:age_key(X,senior)^Ysalary(X,low)=>transmode_key(X,counter)[3%,60%](4)单笔交易金额和交易笔数与持卡人收入的3维量化关联规则amount(X,”50…200”)^count(X,”5…15”)=>Ysalary(X,middlelow)[4%,55%]amount(X,”50…1000”)^count(X,”10..30”)=>Ysalary(X,middle)[4%,55%]amount(X,”50…3000”)^count(X,”10…150”)=>Ysalary(X,in(middlehigh,hight))[4%,55%]3.3.3本章小结以往银行划分优质持卡客户的标准只是卡存款数额,“发卡不存”或“存而不用”不能给银行带来高效益,“用而适度”却能在规避风险的前提下,给银行带来最大效益。以上的关联规则挖掘经过多方面的分析,可以帮助银行为客户提供更好的个性化服务并提供更多的金融产品。第四章总结与展望4.1研究工作总结本文在研究客户细分与关联分类算法等相关理论的基础上,针对现存的大量数据采用关联分类算法对银行卡客户进行细分,构建一套基于商业智能解决方案的银行卡业务分析系统,以帮助银行卡业务部门实现全面的绩效关联,通过全面理解机构经营情况、整体收益结构。通过使用该系统银行管理者可深入了解客户、业务状况,合理预测、制定商业计划,从而提高客户满意度和自身的竞争价值,赢取更大的市场份额。4.2展望本文对关联分类算法,及其在信用卡客户细分中的应用进行了深入的研究,提出了一些创新性的研究成果,但是还有许多问题有待进一步研究和改进。进一步的研究工作包括以下几个方面的内容:(l)所建立的客户细分的指标体系还不完善,每个银行对客户的着眼点和关注重点不同,因此,还需进一步细化、全面化。(2)本论文所提出的算法主要是对现有关联分类算法采用支持度一置信度框架的改进,通过加入相关度概念,对规则的产生更具科学性。但本文只实现了算法的可行性和准备性,没有考虑到增量数据的情况,下一步的工作将探讨如何有效地使用增量算法对数据库中的客户资料进行更有效的细分。(3)将模糊集概念引入到分类关联规则挖掘中。关联分类的数据对象须是离散型数值,对于连续属性值需要首先离散化。这就会带来一个不可避免的问题:离散区间的边界划分过硬。模糊概念的加入不仅可以达到软化边界的目的,同时还可以提升挖掘出规则的可解释性。模糊分类关联规则的挖掘也成为提高关联分类算法的一个重要方面。参考文献1陈燕,杨德礼著,一个数据仓库的设计和实现[J],大连理工大学学报,2000,40(2):249-252.孔学峰著,数据挖掘及其在信用卡风险控制中的应用[J],中国金融电脑杂志,2003,10.张阿兰,谢邦昌.数据挖掘在信用卡管理中的应用,《计算机工程与应用》,2002.10李建平.信用卡客户数据库营销,《中国信用卡》,2000.2王珊.数据仓库技术与联机分析处理.北京:科学出版社,1999钟晓.分类与聚类挖掘的研究[博士论文].杭州:浙江大学,2000孙中东,乔梁.信用卡的高技术之战.计算机世界,2002-07IBM商业智能解决方案在银行业中的应用。2007王广宇,基于决策支持的银行数据挖掘应用.计算机世界,2003,33-36刘明德,陈湘.数据挖掘与OLAP理论与务实.北京:清华大学出版社,2002.178-203王景聪.运用资料挖掘技术与信用卡顾客关系管理之研究[D].硕士学位论文,元智大学江明华,任晓炜.信用卡持卡者人口统计特征及透支行为关系的实证研究[J].金融研究,2004刘如兴.信用卡数据库营销之顾客价值分析与促销成效之研究[D].台湾:台湾大学,2002马超群,兰秋军,陈为民著金融数据挖掘.北京:科学出版社,2007栾勇,李宏.银行卡用卡行为关联规则挖掘。华南金融电脑.200513(10):82-8416车敦仁,周立柱著,OALP及多维数据库技术〔D],第十四届全国数据库回忆论文集1999.致谢大学生活一晃而过,回首走过的岁月,心中倍感充实,当我写完这篇毕业论文的时候,有一种如释重负的感觉,感慨良多。

首先诚挚的感谢我的论文指导老师张教授。她在忙碌的教学工作中挤出时间来审查、修改我的论文。还有教过我的所有老师们,你们严谨细致、一丝不苟的作风一直是我学习的榜样;你们循循善诱的教导和不拘一格的思路给予我无尽的启迪。

感谢三年中陪伴在我身边的同学、朋友,感谢他们为我提出的有益的建议和意见,有了他们的支持、鼓励和帮助,我才能充实的度过了四年的学习生活。数学教学难点处理点滴谈【内容摘要】突出重点、突破难点是教学活动的永恒主题,两者都十分重要。在某种意义上讲,突破教学难点更为重要,因为教师只有在课堂教学中突破了教学上的难点,才能帮助学生扫除学习的障碍,解除学生心理上的困惑,增强学好本学科的坚定信念,从而达到提高教学质量的目的。教学中的难点是多种多样的,选择恰当的教学方法加以突破,是提高教学质量的重要方面,也是广大教师必须掌握的教学基本功之一。本文结合自己的教学实践,谈谈在数学课堂教学中如何处理教学难点问题。【关键词】数学难点处理

教学难点是指学生不易理解的知识,或者是指学生不易掌握的技能技巧。教学难点不一定是教学重点。也有些教学内容既是教学重点又是教学难点,例如函数的概念、圆锥曲线的性质、立体几何中的距离和角等。教师应该着力想出各种有效办法加以突破,否则不但这部分内容学生听不懂、学不会,还会为理解以后的新知识和掌握新技能造成困难。教学中选择恰当的教学方法突破教学难点,是提高教学质量的重要方面,也是广大教师必须掌握的教学基本功之一。教师在教学中要突破教学难点,首先要认真研究和分析教学难点。要弄清学生为什么会感到困难?难在哪里?然后再根据难点所在,有针对性地去加以解决。以下结合自己的教学实践,谈谈在课堂教学中如何处理教学难点问题。一、运用形象直观法突破教学难点很多数学知识因为抽象而成为难点,可以形象、直观、实践的教学加以突破。如“的图象”的教学,这一节要通过说明当A、、三参数同时对函数图象的影响时,将y=sinx的图象进行怎样的振幅变换、周期变换、相位变换三种变换得到y=Asin(ωx十φ)的图象,使学生理解函数图象是怎样随着函数解析式的变化而进行平移、伸缩、周期变换的。这是教学的难点。在以往教学中往往都是教师引导学生利用描点作图法作出大量的图象,然后教师用准确、精练的语言来讲解、描述,把变换的结果灌输给学生,学生只有机械地去认同、记忆所得的结论,而无法观察到变换的一种动态过程,这样难以激起学习兴趣,引起认知需要和深刻理解知识。我在这一节的教学中,用几何画板把课本的4个例题制作成动态变化图象,把由的图象变换得到y=Asin(ωx十φ)的图象的过程在课堂教学中演示给学生看,解决了以上的不足。通过对变换过程的动态演示让学生观察,给学生一种真实的感受,易于学生去理解、掌握函数y=sinx图象是怎样随着函数解析式的变化而进行平移、伸缩、周期变换的。从而使学生愉快地掌握了知识,提高了课堂教学的效率。二、运用类比、探究的的方法突破教学难点类比,是指根据两种事物在某些特征的相似,做出它们在其它特征上也可能相似的结论。在教学中,对某些难以掌握的知识,可与学生熟悉的知识类比,力求将新的知识在学生脑子里实现由“难”到“易”的迁移。例如:二面角的概念与二面角的求法是立体几何教学的一大难点。原因在于二面角不能直接度量,而需要借助于它的平面角来度量。而平面角既是“定”的又是“变”的,所为“定”,是指必须符合三个条件:①顶点在棱上;②边分别在两个“半平面”内;③两边分别与“棱”垂直,三者缺一不可。尤其是空间的两线垂直不直观,难以把握。所为“变”,是指它的顶点在“棱”上没有固定的位置,具有开放性。为了突破这一教学难点,我在教学二面角的概念时先列举实际生活中学生熟悉的一些二面角的例子,创设情境,从两个平面的位置关系复习开始,当两个平面不平行时,它们的位置关系是相交,相交的度量是研究成角的大小、平面几何中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论