最新基于数据挖掘的网上银行交易安全问题_第1页
最新基于数据挖掘的网上银行交易安全问题_第2页
最新基于数据挖掘的网上银行交易安全问题_第3页
最新基于数据挖掘的网上银行交易安全问题_第4页
最新基于数据挖掘的网上银行交易安全问题_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、logo基于数据挖掘的网上银行交易安全问题基于数据挖掘的网上银行交易安全问题背景知识背景知识网上银行网上银行 当前,电子商务网站迅猛发展,在电子商当前,电子商务网站迅猛发展,在电子商务交易过程中,网上银行使整个过程方便务交易过程中,网上银行使整个过程方便快捷。快捷。 网上银行是以计算机银行交易系统为主体网上银行是以计算机银行交易系统为主体,以互联网传输为介质,以客户(企业或,以互联网传输为介质,以客户(企业或个人)计算机为终端的三位一体的新型银个人)计算机为终端的三位一体的新型银行,它是随着互联网的发展而兴起的银行行,它是随着互联网的发展而兴起的银行业务形式。业务形式。u我国网上银行的起步我国

2、网上银行的起步 1996年中国银行发布的有关中银的广告信息和年中国银行发布的有关中银的广告信息和业务信息,此后,中国建设银行、中国银行、中业务信息,此后,中国建设银行、中国银行、中国工商银行等各大银行也开始向客户提供网上银国工商银行等各大银行也开始向客户提供网上银行服务。行服务。 图图 网上网上银行运作的基本流程银行运作的基本流程 网上银行的特点:网上银行的特点: 1.全面实现无纸化交易全面实现无纸化交易 2.服务方便、快捷、高效、可靠服务方便、快捷、高效、可靠 3.经营成本低廉经营成本低廉 4.简单易用简单易用与传统银行相比网上银行的优势:与传统银行相比网上银行的优势: 1.大大降低了银行的

3、经营成本,有效的提高大大降低了银行的经营成本,有效的提高了银行盈利的能力。了银行盈利的能力。 2.无时空的限制,有利于扩大客户群体。无时空的限制,有利于扩大客户群体。 3.有利于服务的创新,向客户提供多种类、有利于服务的创新,向客户提供多种类、个性化的服务。个性化的服务。数据挖掘(数据挖掘(data mining.dm)技术是上世纪)技术是上世纪90年代中期兴起的一种新的数据处理技术。数年代中期兴起的一种新的数据处理技术。数据挖掘是通过分析每个数据,从大量数据中寻据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找找其规律的技术,主要有数据准备、规律寻找和规律表示和

4、规律表示3个步骤。个步骤。数据挖掘的简介数据挖掘的简介数据挖掘的功能数据挖掘的功能 分类分类 (classification) 估计(估计(estimation) 预测(预测(prediction) 相关性分组或关联规则(相关性分组或关联规则(affinity grouping or association rules) 聚类(聚类(clustering) 描述和可视化(描述和可视化(description and visualization) 复杂数据类型挖掘复杂数据类型挖掘 分类分类 首先从数据中选出已经分好类的训练集,首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术

5、,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行建立分类模型,对于没有分类的数据进行分类。分类。 例子:例子: 信用卡申请者,分类为低、中、高风险信用卡申请者,分类为低、中、高风险 注意:注意: 类的个数是确定的,预先定义好的类的个数是确定的,预先定义好的 u 估计估计 估计与分类类似,不同之处在于,分类描述的是离散估计与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出;分类型变量的输出,而估值处理连续值的输出;分类 数数据挖掘的类别是确定数目的,估值的量是不确定的。据挖掘的类别是确定数目的,估值的量是不确定的。 例子:例子: a. 根据购

6、买模式,估计一个家庭的孩子个数根据购买模式,估计一个家庭的孩子个数 b. 根据购买模式,估计一个家庭的收入根据购买模式,估计一个家庭的收入 一般来说,估值可以作为分类的前一步工作。给定一一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的连续变量的值,些输入数据,通过估值,得到未知的连续变量的值,然后,根据预先设定的阈值,进行分类。然后,根据预先设定的阈值,进行分类。u预测(预测(prediction) 通常,预测是通过分类或估值起作用的,也就是通常,预测是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未说,通过分类或估值得出模型,该模型用于对

7、未知变量的预言。从这种意义上说,预言其实没有知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。预言其目的是对未来未必要分为一个单独的类。预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多即必须经过一定时间后,才知道预言准确性是多少。少。 相关性分组或关联规则(相关性分组或关联规则(affinity grouping or association rules) 决定哪些事情将一起发生。决定哪些事情将一起发生。 例子:例子: a. 超市中客户在购买超市中客户在购买a的同时,经常会购的同时,

8、经常会购买买b,即,即a = b(关联规则关联规则) b. 客户在购买客户在购买a后,隔一段时间,会购买后,隔一段时间,会购买b(序列分析)(序列分析) u聚类聚类 聚类聚类是对记录分组,把相似的记录在一个聚集里是对记录分组,把相似的记录在一个聚集里。聚类和分类的区别是聚集不依赖于预先定义好。聚类和分类的区别是聚集不依赖于预先定义好的类,不需要训练集。的类,不需要训练集。 例子:例子: a. 一些一些特定症状的聚集可能预示了一个特定的疾病特定症状的聚集可能预示了一个特定的疾病 b. 租租vcd类型不相似的客户聚集,可能暗示成类型不相似的客户聚集,可能暗示成员属于不同的亚文化群员属于不同的亚文化

9、群 聚集通常作为数据挖聚集通常作为数据挖掘的第一步。例如,掘的第一步。例如,哪一种类的促销对客户响哪一种类的促销对客户响应最好?应最好?,对于这一,对于这一 类问题,首先对整个客户类问题,首先对整个客户做聚集,将客户分组在各自的聚集里,然后对每做聚集,将客户分组在各自的聚集里,然后对每个不同的聚集,回答问题,可能效果更好。个不同的聚集,回答问题,可能效果更好。 u描述和可视化是对对数据挖掘结果的展示描述和可视化是对对数据挖掘结果的展示u复杂数据类型挖掘是指对复杂数据类型挖掘是指对web ,图形图像图形图像,视频,音频等对象进行数据挖掘处理。,视频,音频等对象进行数据挖掘处理。数据挖掘的完整步骤

10、数据挖掘的完整步骤u 理解数据和数据的来源(理解数据和数据的来源(understanding)。)。 u 获取相关知识与技术(获取相关知识与技术(acquisition)。)。 u 整合与检查数据(整合与检查数据(integration and checking)。)。 u 去除错误或不一致的数据(去除错误或不一致的数据(data cleaning)。)。 u 建立模型和假设(建立模型和假设(model and hypothesis development)。)。 u 实际数据挖掘工作(实际数据挖掘工作(data mining)。)。 u 测试和验证挖掘结果(测试和验证挖掘结果(testing

11、 and verification)。)。 u 解释和应用(解释和应用(interpretation and use)。)。 u网上银行风险研究的背景和意义网上银行风险研究的背景和意义 网上银行以其方便、便捷、跨时空、低成本、全网上银行以其方便、便捷、跨时空、低成本、全能化经营等特点,极大地提高了银行业的服务效能化经营等特点,极大地提高了银行业的服务效率和服务质量。网上银行正在成为金融机构拓宽率和服务质量。网上银行正在成为金融机构拓宽服务领域、实现业务增长、调整经营战略、促进服务领域、实现业务增长、调整经营战略、促进金融发展的重要手段。然而,网上银行也由于其金融发展的重要手段。然而,网上银行也

12、由于其基础环境的开放性、技术的复杂性、交易的虚拟基础环境的开放性、技术的复杂性、交易的虚拟性、跨国界性、法律法规的不健全性等因素,使性、跨国界性、法律法规的不健全性等因素,使其既面临着传统银行所具有的许多业务风险,同其既面临着传统银行所具有的许多业务风险,同时也面临了比传统银行更加复杂的技术风险,增时也面临了比传统银行更加复杂的技术风险,增加了防范难度。加了防范难度。u数据挖掘在个人网上银行中的必要性数据挖掘在个人网上银行中的必要性 网上银行作为银行功能的网上实现,必然接网上银行作为银行功能的网上实现,必然接受大量的用户数据,比如用户的登录信息、用受大量的用户数据,比如用户的登录信息、用户的各

13、类账户信息以及转账信息等等。如何有户的各类账户信息以及转账信息等等。如何有效的利用这些信息来促进银行的效的利用这些信息来促进银行的 发展和发现发展和发现异常,是一个很重要的问题。数据挖掘满足了异常,是一个很重要的问题。数据挖掘满足了银行的这一需求。银行的这一需求。u以个人网上银行为例,很多功能可以用数据挖掘以个人网上银行为例,很多功能可以用数据挖掘实现。实现。 比如:比如: 1.分析注册登录表中的用户兴趣、年龄,作为挖分析注册登录表中的用户兴趣、年龄,作为挖掘的数据源。掘的数据源。 2.使用数据挖掘技术,通过对孤立点的分析,可使用数据挖掘技术,通过对孤立点的分析,可以减少银行的损失,提高银行的

14、抵御风险能力。以减少银行的损失,提高银行的抵御风险能力。 3.面对账户信息表的数据挖掘,可以找出相似的面对账户信息表的数据挖掘,可以找出相似的账户类型,银行可以据此把账户归类,便于银行账户类型,银行可以据此把账户归类,便于银行的账户管理。的账户管理。u网上银行风险客户网上银行风险客户 网银风险客户是指在网银交易过程中,存在欺诈、洗黑钱网银风险客户是指在网银交易过程中,存在欺诈、洗黑钱、盗取网银交易信息倾向或被欺诈可能性的客户,主要包括、盗取网银交易信息倾向或被欺诈可能性的客户,主要包括两类:两类: 1.主动性风险客户主动性风险客户 这类客户是网银风险的主体,以谋取非法财产、破坏网这类客户是网银

15、风险的主体,以谋取非法财产、破坏网银交易秩序、威胁国家银行信息安全为动机,并采用多种复银交易秩序、威胁国家银行信息安全为动机,并采用多种复杂手段达到目的。杂手段达到目的。 2.被动型风险客户被动型风险客户 这类客户是网银安全中的受害人,需要银行及早发现问题这类客户是网银安全中的受害人,需要银行及早发现问题,并提醒,进而采取保护措施。,并提醒,进而采取保护措施。u解决方案解决方案 如何挖掘风险客户是研究重点。基于数据如何挖掘风险客户是研究重点。基于数据挖掘的方法,利用网银数据信息挖掘的方法,利用网银数据信息 ,获取客,获取客户分类的规范,从而确定网银风险客户模户分类的规范,从而确定网银风险客户模

16、式,为网银客户安全提供保障。式,为网银客户安全提供保障。u网银客户分类模型网银客户分类模型 分类任务是通过训练样本数据集进行学习分类任务是通过训练样本数据集进行学习,获得一个目标函数,获得一个目标函数f,讲每个属性集,讲每个属性集x映映射到一个预先定好的类别表示符号射到一个预先定好的类别表示符号y。用。用元组(元组(x,y)标识,)标识,x是属性集合,是属性集合,y是一是一个特殊的属性,本文个特殊的属性,本文y包括包括安全型客户,安全型客户,主动型风险客户,被动型风险客户主动型风险客户,被动型风险客户,其,其中主动型风险客户和被动型风险客户统一中主动型风险客户和被动型风险客户统一归纳为风险客户

17、。归纳为风险客户。u网银客户分类模型网银客户分类模型 抽取部分历史数据作为训练集合,通过归抽取部分历史数据作为训练集合,通过归纳,建立分类模型,挖掘确立分类函数,纳,建立分类模型,挖掘确立分类函数,并利用新的客户信息进行检验规则的准确并利用新的客户信息进行检验规则的准确性,然后使用准确度较高的规则对以后的性,然后使用准确度较高的规则对以后的数据进行分析。决策树算法主要用于发现数据进行分析。决策树算法主要用于发现数据模式和规则。数据模式和规则。u网银客户分类模型网银客户分类模型 分层决策树算法,利用基本信息和历史信分层决策树算法,利用基本信息和历史信息计算,进而初步确定客户类别属性,分层息计算,

18、进而初步确定客户类别属性,分层对客户进行分类,以客户为研究主体,以交对客户进行分类,以客户为研究主体,以交易行为主要研究属性,进而规划用户。易行为主要研究属性,进而规划用户。 网上银行客户分类过程网上银行客户分类过程u举例:举例: 如表中所示,其中次现金流为实时交易数据,日如表中所示,其中次现金流为实时交易数据,日交易流为每日交易流为每日0点至点至24点用户已完成交易额求和点用户已完成交易额求和。然后结合网银用户历史信誉,实时交易额,日。然后结合网银用户历史信誉,实时交易额,日均交易额对客户进行进一步细分,采用分层决策均交易额对客户进行进一步细分,采用分层决策树算法,对网银客户进行分层细分。树

19、算法,对网银客户进行分层细分。 如果铜牌客户在一年内信誉良好,平均月如果铜牌客户在一年内信誉良好,平均月交易额超过交易额超过5000元,则经过合理的流程元,则经过合理的流程将客户晋升到银牌客户类别;若金牌客户将客户晋升到银牌客户类别;若金牌客户欠款次数超过欠款次数超过3次,且消费额较低,则根次,且消费额较低,则根据审核将客户级别降为银牌类别。据审核将客户级别降为银牌类别。u进过第一层的决策树分类,以第一层的分类结果进过第一层的决策树分类,以第一层的分类结果为基础进行第二层决策树分类。为基础进行第二层决策树分类。 以铁牌客户为例,危险客户决策树分类流程如下以铁牌客户为例,危险客户决策树分类流程如

20、下 case:客户类别:客户类别=“铁牌客户铁牌客户” if 次现金交易额次现金交易额500元元 else if日现金交易额日现金交易额1000元元 then 该客户被标示为危险。该客户被标示为危险。 带有危险标记的客户需要对其交易对象、带有危险标记的客户需要对其交易对象、网银系统操作记录以及历史信誉进行综合网银系统操作记录以及历史信誉进行综合判断。比如分析交易对象是否与案例库中判断。比如分析交易对象是否与案例库中存在的钓鱼网站进行交易,分析客户的存在的钓鱼网站进行交易,分析客户的ip地址是否是常用地址是否是常用ip等等手段来防止不等等手段来防止不安全或者不正当的交易发生。安全或者不正当的交易

21、发生。u分层决策树方案优势分层决策树方案优势 1.该模型在使用过程中较灵活,阀值可根据区域该模型在使用过程中较灵活,阀值可根据区域及客户特例进行修正,进而具有普遍性也具有独及客户特例进行修正,进而具有普遍性也具有独特性。特性。 2.分层决策树的上层分类结果作为下一层分类决分层决策树的上层分类结果作为下一层分类决策树的属性,对系统并发性要求低,因而降低对策树的属性,对系统并发性要求低,因而降低对应用环境硬件的要求。应用环境硬件的要求。 3.随着用户在行交易记录增多,案例不断完善,随着用户在行交易记录增多,案例不断完善,改模型的阀值和精确度不断提高。改模型的阀值和精确度不断提高。 4.在银行后台使

22、用该方法,根据实时挖掘结果,在银行后台使用该方法,根据实时挖掘结果,有效保障网银合法客户安全。有效保障网银合法客户安全。 银行风险银行风险 银行风险是指会对银行的资本、收益、信银行风险是指会对银行的资本、收益、信誉、业务操作、系统安全等产生负面影响誉、业务操作、系统安全等产生负面影响的预期或不可预期的潜在事项。的预期或不可预期的潜在事项。 一般而言,银行的风险包括信用风险、流一般而言,银行的风险包括信用风险、流动性风险、市场风险、操作风险、法律风动性风险、市场风险、操作风险、法律风险、声誉风险等。险、声誉风险等。u网上银行风险成因网上银行风险成因 1.安全保障体系的不完善安全保障体系的不完善

23、2.网络的开放性网络的开放性 3.计算机病毒计算机病毒 4.网络污染网络污染 5.运行模式的原因运行模式的原因u网上银行风险特点网上银行风险特点 1.风险的扩散快、破坏力强风险的扩散快、破坏力强 2.风险交叉传染强风险交叉传染强 3.风险的责任难以区分风险的责任难以区分u实例:建设银行网上银行风险辨识的程序和方法实例:建设银行网上银行风险辨识的程序和方法u德尔菲法对网上银行的风险进行识别德尔菲法对网上银行的风险进行识别 德尔菲法是管理人员先把设计好的问卷发德尔菲法是管理人员先把设计好的问卷发给有关专家,然后由这些专家进行专业的给有关专家,然后由这些专家进行专业的评价。这些问卷汇总到管理人员后,

24、管理评价。这些问卷汇总到管理人员后,管理人员进行统计分析处理和问卷内容调整,人员进行统计分析处理和问卷内容调整,之后再反馈给那些专家。如此反复直到取之后再反馈给那些专家。如此反复直到取得满意结果。得满意结果。u建设银行网上银行风险识别建设银行网上银行风险识别 采用德尔菲法识别建设银行网上风险时,专家组采用德尔菲法识别建设银行网上风险时,专家组按照技术层面风险和业务层面风险对网上银行的按照技术层面风险和业务层面风险对网上银行的风险进行识别。风险进行识别。 专家组由专家组由9人组成,其中银行内部技术和业务专人组成,其中银行内部技术和业务专家家4人,计算机设计人员人,计算机设计人员1人,信息技术安全领域人,信息技术安全领域公司专家公司专家2人,大学教授人,大学教授2人。通过收集专家对建人。通过收集专家对建设银行网上风险的认识和预测,经过设银行网上风险的认识和预测,经过3轮的比较轮的比较,得到了大家集中认可的,得到了大家集中认可的8类风险。类风险。u与数据挖掘有关的建设银行网上风险分析与数据挖掘有关的建设银行网上风险分析 定期对信息科技风险进行评估定期对信息科技风险进行评估 1.网上银行渠道的风险防范评估网上银行渠道的风险防范评估 包括:系统宕机次数、黑客攻击和入侵次数、病毒感染次包括:系统宕机次数、黑客攻击和入侵次数、病毒感染次数、虚

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论