基于神经网络的欺诈检测课件_第1页
基于神经网络的欺诈检测课件_第2页
基于神经网络的欺诈检测课件_第3页
基于神经网络的欺诈检测课件_第4页
基于神经网络的欺诈检测课件_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于神经网络的欺诈检测1神经网络的欺诈检测的意义2本课题研究的内容3BP算法以及MATLAB实现

4欺诈检测的JAVA实现5课题研究的结果6课题研究的提示欺诈在电子世界里非常普遍,从保险欺诈到互联网拍卖欺诈,从虚假的救济金申请表到电信欺诈。如果你在互联网上从事一些吸引了众多用户与法人实体的业务,当有人不遵守游戏规则时,能够把它们识别出来,这样的能力是非常有价值的。本课题以欺诈性购买交易作为例子,通过引入分类算法把欺诈交易从正常购买中找出来。1神经网络的欺诈检测的意义神经细胞由一个细胞体(soma)、一些树突(dendrite)、和一根可以很长的轴突组成。神经细胞体是一颗星状球形物,里面有一个核(nucleus)。树突由细胞体向各个方向长出,本身可有分支,是用来接收信号的。轴突也有许多的分支。轴突通过分支的末梢(terminal)和其他神经细胞的树突相接触,形成所谓的突触(Synapse),一个神经细胞通过轴突和突触把产生的信号送到其他的神经细胞。每个神经细胞通过它的树突和大约10,000个其他的神经细胞相连。神经细胞相连组成了神经网络。2.1生物神经网络概述神经细胞利用电-化学过程交换信号。输入信号来自另一些神经细胞。这些神经细胞的轴突末梢(也就是终端)和本神经细胞的树突相遇形成突触(synapse),信号就从树突上的突触进入本细胞。信号在大脑中实际怎样传输是一个相当复杂的过程,但就我们而言,重要的是把它看成和现代的计算机一样,利用一系列的0和1来进行操作。就是说,大脑的神经细胞也只有两种状态:兴奋(fire)和不兴奋(即抑制)。发射信号的强度不变,变化的仅仅是频率。神经细胞利用一种我们还不知道的方法,把所有从树突突触上进来的信号进行相加,如果全部信号的总和超过某个阀值,就会激发神经细胞进入兴奋(fire)状态,这时就会有一个电信号通过轴突发送出去给其他神经细胞。如果信号总和没有达到阀值,神经细胞就不会兴奋起来。2.2生物神经网络处理过程人工神经网络(Artificialneuralnetwork,简称ANN)就是要在当代数字计算机现有规模的约束下,来模拟这种大量的并行性,并在实现这一工作时,使它能显示许多和人或动物大脑相类似的特性。模拟大脑的人工神经网络ANN是由许多叫做人工神经细胞(Artificialneuron,也称人工神经原,或人工神经元)的细小结构模块组成。人工神经细胞就像真实神经细胞的一个简化版,但采用了电子方式来模拟实现。2.3人工神经网络概述2.4人工神经网络处理过程

自己创建了一个正常交易的数据集合,训练集大约包含10000条交易记录,测试集有1000条,每条交易记录由如下属性值所确定。用户ID交易ID交易描述交易金额交易x坐标交易y坐标一个用于确认交易是(true)否(false)属于欺诈的二值变量2.5基于神经网络的欺诈检测3.1.数据预处理3.2使用Matlab实现神经网络3.3MatlabBP网络实例3.4结果分析3BP算法以及MATLAB实现

<3>由于神经网络输出层的激活函数的值域是有限制的,因此需要将网络训练的目标数据映射到激活函数的值域。例如神经网络的输出层若采用S形激活函数,由于S形函数的值域限制在(0,1),也就是说神经网络的输出只能限制在(0,1),所以训练数据的输出就要归一化到[0,1]区间。<4>S形激活函数在(0,1)区间以外区域很平缓,区分度太小。例如S形函数f(X)在参数a=1时,f(100)与f(5)只相差0.0067。Matlab中归一化处理数据可以采用premnmx,postmnmx,tramnmx这3个函数。使用Matlab建立前馈神经网络主要会使用到下面3个函数:newff:前馈网络创建函数train:训练一个神经网络sim:使用网络进行仿真3.2使用Matlab实现神经网络本课题的目的主要是做欺诈检测,将数据集分为2组,每组各75个样本,分别对应着欺诈和正常消费。其中一组作为以上程序的训练样本,另外一组作为检验样本。为了方便训练,将欺诈和正常消费分别编号为1,2。使用这些数据训练一个3个输入(分别对应3个特征:位置,花费,描述),2个输出(分别对欺诈消费和正常消费)的网络。3.3MatlabBP网络实例3.4结果分析4.1神经网络欺诈检测器整体步骤4.2输入节点的选择及初始化4.3神经网络欺诈检测器剖析4课题研究的方案/方法//决定数据会在网络中传播的次数,在本例子中10次就很好了nnFraudClassifier.setNTrainingIterations(10);//配置好参数,开始训练nnFraudClassifier.train();//把训练好的分类器实例存放到磁盘里nnFraudClassifier.save();//通过分类器的文件名,加载已训练好的分类器NNFraudClassifiernnClone=NNFraudClassifier.load(nnFraudClassifier.getName());金额:(amt-min)/(max-min)地点:距离描述:相似度4.2输入节点的选择及初始化输入计算输出误差期望值权值调整1.对权系数w置初值

对权系数w=(W1

.W2

,…,Wn

,Wn+1

)的各个分量置一个较小的零随机值

2.输入一样本X=(X1

,X2

,…,Xn+1

)以及它的期望输出d。期望输出值d在样本的类属不同时取值不同。如果x是A类,则取d=1,如果x是B类,则取03.计算实际输出值YY=∑Wi

Xi根据实际输出求误差ee=(d-y)*激活函数的导数4.用误差e去修改权系数Wi(t+1)=Wi(t)+ή*e*Xiή为学习率,不能太大,也不能太小。下图是引入噪音的运行结果:神经网络实质上实现了一个从输入到输

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论