已阅读5页,还剩62页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江大学硕士学位论文 v7 0 0 5 4 8 摘要 近几年,信贷风险已渗透到银行的每一信贷经营之中,严重影响 到银行的生存和发展。出于控制信贷风险等业务上的紧迫需求,建设 银行开发出了信贷管理信息系统用于建行的信贷管理。 本文在对数据仓库技术、o l a p 进行研究的基础上,分析了建行信 贷管理信息系统的系统结构,着重阐述了数据仓库应用方案。同时, 也研究了数据挖掘技术在信贷管理信息系统中的应用,以达到改进系 统的信贷管理效能的目的。具体地,完成了如下实例研究:利用 判定树算法对信用度好的个人信贷客户进行归纳分类模型的建立。 将两种不同的聚类算法用于信贷风险评价指标权重分析,使得信贷风 险评价能做到更加合理有效。另外,在自己多年的实践过程中,发现 建行现用的这套系统在数据分布模型上存在问题,因而提出了一种两 层数据分布的改进模型,让数据适度集中,从而有效解决现有系统所 存在的安全方面等的问题。并在最后一章对前面的工作做了一个总 结,提出进一步展望。 关键词:信贷管理信息系统数据仓库联机分析处理数据挖掘 数据抽取 塑垩查兰型兰些堡塞 a b s t r a c t d u r i n gt h ep a s ts e v e r a ly e a r s ,c r e d i tr i s k sh a v ep e n e t r a t e d i n t oe v e r yc o r n e ro ft h ec r e d i tb u s i n e s s e s ,t h u ss e r i o u s l y i m p a c t s t h ee x i s t e n c ea n d d e v e l o p m e n t o fb a n k s f o rt h e u r g e n tp u r p o s eo ft h ec r e d i tb u s i n e s s e s ,s u c ha sc r e d i tr i s k m a n a g e m e n t ,c h i n ac o n s t r u c t i o nb a n kh a sd e v e l o p e dt h ec r e d i t m a n a g e m e n t i n f o r m a t i o ns y s t e m t h isd o c u m e n td is c u s s e sn o to n l yt h es t r u c t u r eo ft h es y s t e m a n dt h o s et e c h n o l o g i e st h a ti tu s e si nd e t a i l ,b u ta l s oh o wt h e d a t as t a t i s t i c a la n a l y s i si sr e a l i z e d a n d ,i ta l s os t u d i e st h e p o s s i b i l i t yo fu s i n gd a t am i n i n gt e c h n 0 1 0 9 i e si nt h es y s t e m , j u s tt oi m p r o v et h es y s t e m sc a p a b i 、1 i t yo fm a n a g e m e n t t h e n i t c o m p l e t e s t h ec a s er e s e a r c h e sb e l o ww i t hd a t a m i n i n g t e c h n 0 1 0 9 i e s : w i t hd e c i s i o n t r e ea l g o r i t h m ,i tc r e a t e sam o d e lw h i c h c l a s s i f i e st h ec r e d i td e g r e e so fp e r s o n a ll o a nc u s t o m e r s w i t ht w od i f f e r e n tc l u s t e ra l g o r i t h m s i th a s a n a l y z e d t h e i n d e xw e i g h to fc r e d i tr i s ka s s e s s m e n t ,w h i c hc a nl e a dc r e d i t r i s ka s s e s s m e n tt ob e c o m em o r er e a s o n a b l ea n de f f e c ti v e f u r t h e r m o r e ,w i t hm ys e v e r a le x p e r i e n c eo fm a n a g i n gt h es y s t e m , ih a v ed i s c o v e r e dt h ed a t al o c a t i o nm o d e ld o e se x i s ts o m ev e r y o b v i o u s s h o r t c o m i n g s s o ,t h i sd o c u m e n tp r o p o s e s an e w t w o 一1 e v e ld a t al o c a t i o nm o d e lt h a t r e q u i r e s t h ed a t at ob e c o n v e r g e dr e l a ti v e l yt os o l v et h ep r o b l e m ss u c ha ss e c u r i t y t h a te x i s t si nt h e s y s t e me f f e c t i v e l y t h e1 a s tc h a p t e r s u m m a r i z e st h ec h a p t e r sd i s c u s s e db e f o r e k e y w o r d s :c r e d i tm a n a g e m e n ti n f o r m a t i o ns y s t e m ;d a t aw a r e h o u s e o l a p :d a t am i n i n g :d a t ae x t r a c t 第2 页共6 8 页 浙江大学硕士学位论文 第一章绪论 1 1 信贷管理现状及建行信贷管理系统的背景情况 近几年,信贷风险已渗透到银行的每一信贷经营之中,严重影响到银行的生 存和发展。特别是在我国加入w t 0 后,银行和企业面l 临的竞争) j n n ,信贷风险会 越来越大,风险的种类将越来越多,表现形式也越来越隐蔽复杂,这些对信贷风 险管理工作提出了严峻的挑战,因此,信贷风险管理在商业银行的各种经营管理 中越来越显示出其重要性。 正是出于这些业务上的紧迫需求,同时考虑到计算机在软硬件方面迅猛发展 使得技术上实现这些业务需求成为了可能。建设银行开发出了信贷管理信息系统 用于建行的信贷管理。 信贷管理信息系统是中国建设银行企业网建设的起点。通过建立基本的管理 信息系统,较完整地记录业务事实,实现初步的业务处理自动化,提供基本的管 理信息。根据建设银行信贷管理的多级模式,本着“以客户为中心,以业务处理 流程为主线,以风险管理为核心”的设计思想,基于标淮和开放的网络平台、硬 件平台、系统平台和开发平台,采用多级客户服务器模式,全面实现建设银行 信贷业务的电子化。该系统将为客户提供快捷、优质的服务,进一4 步强化系统内 部管理,并对业务抉择起到一定的辅助作用。 我从1 9 9 8 年就参与了建行的信贷管理信息系统的建设项目当中,并曾由于 自己在此项目中的出色工作而获得总行的“先进个人”称号。在我2 0 0 2 年入学 浙大之前,我都一直在从事这方面的工作。由于这套系统的复杂性,我一直有愿 望想要把整套系统的体系结构及其他搞清楚明白,并在此基础上做些研究。 2 0 0 4 年5 月,得悉建行在进行信贷管理信息系统的规范化工程,在得到省 建行领导及导师的同意,我参与到其中。也就在此时,同时也是由于得到了省行 科技处同事在技术上的一些支持,我决定自己的毕业论文选定在这一方向,在王 泽兵老师的悉心帮助下,也就得以完成此文。 第4 页共6 8 页 浙江大学硕士学位论文 1 2 本文研究内容与目标 本文目标是在对数据仓库技术、o l a p 进行研究的基础上,分析建行信贷管理 信息系统的体系结构,着重阐述了数据仓库应用方案。并且,在分析过程中,结 合自己多年的实践经验,发现建行现用的这套系统在数据分布模型上存在问题, 因而提出了两层数据分布的改进模型,让数据适度集中,从而有效解决现有系统 所存在的安全方面等的问题。这主要不是出于理论上的考量,而是考虑到其具有 很强的实用价值,并能作为以后其他银行的借鉴。同时,也研究了数据挖掘技术 在信贷管理信息系统中的应用,以达到改进系统信贷管理效能的目的。具体地, 完成了如下实例研究:利用判定树算法对信用度好的个人信贷客户进行归纳分 类模型的建立。将两种不同的聚类算法用于信贷风险评价指标权重分析,使得 信贷风险评价能做到更加合理有效。通过这两个实例研究,我们就能很清楚地看 到,如能在银行信贷管理系统中成功应用适当的数据挖掘技术,必能极大地改进 系统对信贷业务的管理效果。本文的研究虽然是基于建行信贷管理系统的,但研 究结果对于其他商业银行的信贷管理系统也是适用的。 全文的内容作如下的安排: 第一章叙述了信贷管理现状及建行信贷管理系统的背景情况。 第二章介绍建立信贷管理信息系统的关键技术。 第三章建行信贷管理信息系统的体系结构 第四章信贷管理信息系统在数据分布上的改进研究 第五章数据挖掘在银行信贷管理系统中的应用研究 最后一章对前面的工作做一个总结,并提出迸一步展望。 第5 页共6 8 页 浙江大学硕士学位论文 第二章建立信贷管理信息系统的关键技术 2 1 数据仓库介绍 美国著名信息工程学家b i l li n m o n 在他的专著 b u i l d i n gt h ed a t a w a r e h o u s e 提出数据仓库的概念:面向主题的、完整的、非易失的、不同时间 的、用于支持决策管理的数据集合。它有如下特征: 它是面向分析,面向主题的一所谓面向分析,是指用户使用数据仓 库进行决策时所关心的重点方面,如银行存贷款、人事方面、利润情况等。所谓 面向主题,是指数据仓库内的信息是按主题进行组织的,为按主题进行决策的过 程提供信息。 d a t aw a r e h o u s e 是完整的是指数据仓库中的信息不是从各个业务 处理系统中简单抽取出来的,是经过系统加工、汇总和整理,按分析主题进行集 成和再生的,保证了经过数据仓库内的信息是经过关于整个企业的一致的全局信 息。 非易失的一一旦某个数据进入数据仓库以后,一般情况下将被长期 保留,也就是数据仓库中一般有大量的插入和查询操作,但修改和删除操作很少。 不同时间的数据仓库内的信息并不是关于企业当时或某一时点的 信息,而是记录了企业从过去某一时点( 如开始使用数据仓库的时点) 到目前的 各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势作出定量分 析和预测。 管理大量信息大多数数据仓库包含历史数据,这些数据在动作的 系统中通常被删除,因为应用程序已不再需要了。由于数据仓库必须管理大量信 息,因而它就要提供概括和聚集机制来对巨大数据容量进行分类,简而言之,数 据仓库可以使用户在“森林中找到树木”。因此数据仓库要在层次上管理信息。 由于需要管理所有的历史数据和当前数据,所以数据仓库的容量远远大于一般的 数据库,一般系统都要达到g 级甚至t 级,这是由于保存数据时间较长的缘故。 对比传统的操作型数据,我们可知,仓库数据与传统操作型系统数据有较 大的区别。操作型数据库的系统数据具有基本相反的特性:短时间框架,迅速变 化的,记录级存取,标准的事务,实时更新,事件驱动。 第6 页共6 8 贾 浙江大学硕士学位论文 从上面的概念看,数据仓库似乎是一个静态的概念,因此有人可能会把数 据仓库简单地理解为仅仅是一个大型的数据存储机制,这种理解是不对的,事实 上,只有把信息及时交给需要这些信息的使用者,供他们作出改善其业务经营的 决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳,并及时提供 给相应的管理决策人员是数据仓库的根本任务。因此数据仓库是一个工程的要领 是一个动态概念。 c o d d 博士和其他的数据库理论家提出数据库规范化的概念,一般情况下操 作型系统数据库设计是基于某一范式的,而数据仓库为了更有效地进行信息检 索,通常会被逆规范化。通过对数据仓库所包含结构的逆规范化,提高了性能和 信息可用性。建立数据仓库后能够支持以下功能:导出数据至数据集市:报表生 成工具;o l a p 和分析工具;数据挖掘工具;定制代码的执行信息系统( e i s ) 工具; 地理信息系统( g i s ) 工具:许多其他查询技术。 在数据仓库集成结构中,来自几个数据源的数据被抽取出来,合成一个全 局模式。然后,数据存储在数据仓库中,这在用户来看与普通数据库无异。组织 方式如图1 卜3 所示,尽管数据源可能多于图中所示的两个。 图2 1 数据仓库存储独立数据库的集成信息 第7 贞 共6 8 页 浙江大学硕士学位论文 一旦数据存储在数据仓库中,用户就可以提出查询,正如他们向任何数据 库提出查询一样。另一方面,通常不允许用户对数据仓库进行更新,因为这些更 新不能反映在基本数据源中,并且可以导致数据仓库与数据源不一致。 数据仓库中数据的构造方法至少有三种: 数据仓库根据数据源中的当前数据进行周期性地重建。这种方法是最常 用的,数据重建每夜进行一次( 当系统可以关闭时进行,所以在数据仓库重建时 不能再查询) ,或间隔时间更长一些。这种方法的主要缺点在于需要关闭数据仓 库,而且重建数据仓库需要的时间可能长于一“夜”。对某些应用来说,另一个 缺点是数据仓库中的数据可能会非常过时。 根据自上次数据仓库被更新以后对数据源所做的更新,对数据仓库中的 数据进行周期性更新( 例如每个晚上) 。这种方法可能只与少量数据有关,当数 据仓库需要在很短时间内进行更新,而数据仓库很大时( 使用多个g b 或t b 的数据 仓库) ,这很重要。缺点是计算数据仓库中的变化,即一种被称为“增量更新” 的过程,与简单地重新构造数据仓库的算法相比,前者较复杂。 对一个或多个数据源中的每一次变化或一组变化,数据仓库立即做出相 应变化。这种方法需要太多的通信和处理,只适用于小的且底层数据源变化缓慢 的数据仓库。但是这是一个研究课题,而且如果这种数据仓库实现方法能成功, 则将会有很多重要应用,例如,在数据仓库中进行自动股票交易。 2 2 联机分析处理( o l a p ) 技术介绍 联机分析处理( o l a p ;o n 一1 i n ea n a l y t i c a lp r o c e s s i n g ) 专门设计用于支 持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持。o l a p 委员会提 出了一个o l a p 的定义是:联机分析处理( o l a p ) 是一种软件技术,它使分析人员、 经理、管理人员通过快速、一致的和交互式的访问来获取并理解各种可能的信息 视的数据,这些信息由原始数据转换而来,用来反映一个企业实际的维度。 在一篇题为为分析员用户提供联机处理的论文中,关系数据库模型之 父d r e f c o d d 于1 9 9 3 年首先由提出7 o l a p 或联机分析处理这个术语,他同时提 出了关于o l a p 的1 2 条规则,即:( 1 ) 多维概念视图;( 2 ) 透明性;( 3 ) 可访问性 : 第8 页共6 8 页 浙江大学硕士学位论文 ( 4 ) 一致的报表操作性能:( 5 ) c s 体系结构;( 6 ) 等价的维度:( 7 ) 动态稀疏矩 阵处理;( 8 ) 多用户支持;( g ) 非限定的交叉维操作;直接数据操作;a d 灵活的报表;无限的的维度和聚集层次。之后的1 9 9 5 年,作者又为o l a p 系统 添加了6 条规则,除了这1 2 条基本的原则外,用户也应考虑下的这些需求。d r t o d d 并没有把所有的下列要求都明确列出。它们是:( 1 ) 下钻到细节层次。允许多维 的预聚集的数据库平滑地转换到源数据仓库存储库的细节纪录。( 2 ) o l a p 分析 模型。支持d r c o d d 的4 个分析模型:注释的( 或叙述的) 、分类的( 或说明的) 、 计划的和公式的。( 3 ) 非标准化数据的处理。禁止在一个o l a p 系统内的运行的计 算影响到外部源数据。( 4 ) 存储o l a p 结果。不要将具有写操作的o l a p _ 3 z 具配置在交 易系统的顶端。( 5 ) 遗失值。可以忽略遗失值,无论它们是什么来源。 ( 6 ) 数 据库增量更新。对抽取来的、聚集的o l a p 数据进行增量刷新操作。( 7 ) s q l 接口。 使o l a p 系统无缝地融入到现有的企业环境中。目前,业界基本达成共识,o l a p 是对数据一系列交互的查询过程,这些查询过程要求对数据进行多层次、多阶段 的分析处理。获得高度归纳的信息是一个典型的o l a p 过程的例子,因为归纳信息 要从最底层的明细数据开始,经过多个层次、多个阶段的数据处理,包括数据汇 总、整理、归纳、支队奇异数据样本等环节,最终得到用户所需要的经过归纳抽 象的信息。o l a p 过程通常被认为是“启发式的”,这是因为一个分析过程总是以 用户提出的关于业务、信息的一个问题而开始,随着这个问题的解决,又引发用 户提出新的问题,一个接一个用户的分析工作不断深入,o l a p 过程的这些特点与 传统的联机业务处理系统中联机事物处理( o l t p ) 有着很大的区别,o l a p 也就具 有与之相应的三大特点: 多维性:o l a p 能提供数据的多维概念视图。如图2 1 所示,在o l a p 数据 模型中,多维信息被抽象为一个立方体( c u b e ) ,它包括维( d i m e n s i o n ) 和度量 ( m e a s u r e ) 。维即所谓观察角度,而度量则为指标值。多维结构是o l a p 的核心, o l a p 展现在用户面前的多维视图能使最终用户从多角度、多侧面、多层次直观地 考察数据仓库中的数据,从而深入地理解包含在数据中的信息及其内涵。事实上, 多维分析是分析企业数据最有效的方法,是o l a p 的灵魂。 第9 页共6 8 页 浙江大学硕士学位论文 赞救溅 万j 讲 2 0 0 22 0 0 4 时瓣1 l 三 图2 1 三维银行贷款立方体 快速性:o l a p 的特性之二是它能快速响应用户的分析需求。由于数据仓 库与数据库的数据存储方式不同,一般情况下,o l a p 系统可在几秒内对用户的分 析请求作出响应,从而减少失去分析主线索影响分析质量的可能性。要达到这 个要求,就必须需要一些技术上的支持,如专门的数据存储格式,大量的事先运 算,特别的硬件设计。 可分析性:o l a p 可以提供给用户强大的统计、分析及报表处理功能。此 外,o l a p 系统还具有进行趋势预测分析的能力。用户可以在o l a p 平台上进行数据 分析,也可以在o l a p 平台上进行数据分析,还可以连接到其他外簿分析工具上, 如时间序列分析工具、成本分配工具、意外报警、数据开采等。 联机分析处理有两种类型:多维联机分析处理( m o l a p ) 及关系型联机分析 处理( r o l a p ) 。m o l a p 依赖于独立的多维数据库,该数据库从数据仓库中获得数 据。r o l a p 直接依赖数据仓库的关系数据库本身,提供联机分析处理能力。 2 4 系统开发与运行所用到的平台及相关技术的介绍 2 4 1 后台服务器所用的平台及相关技术 ( 1 ) l j n i x 系统简介 u n i x 操作系统自1 9 6 9 年诞生以来,它已被移植到数十种硬件平台上,并成 为商业公司、大学、研究机构各种不同环境的首选操作系统。它最初是仅由若干 程序组成的一个小系统,现在己成长为应用领域广泛、功能丰富的操作系统。今 第1 0 页共6 8 页 浙江大学硕士学位论文 天,各种版本的u n i x 已应用于从嵌入式处理器到工作站、桌面系统,乃至服务 于大群用户的高性能多处理机系统。 u n i x 系统包括运行在u n i x 操作系统之上的用户程序集、库,以及其它使用 工具,而u n i x 操作系统本身则为这些应用提供运行环境和各种各样的系统服务。 u n i x 系统小巧而简单,并且有一组基本抽象概念。基本的模式就是系统提供简 单的工具而用户可以灵活地将它们组合起来。u n i x 系统的优点大致如下所述: u n i x 总是在一种极为开放的过程中不断发展。即使在u n i x 商业化以后,人 们仍然认识到开放系统的价值,将成果公布于众,制定了许多开放规范。 u n i x 系统非常精湛,小巧而简单; u n i x 中,大多数应用都使用文本文件,用户可以不必使用特殊的工具就可 访问这些文件,从而设置、修改各种配置; u n i x 又是一个简单而统一的 o 设备接口。u n i x 系统中所有的设备都是 以文件的形式来表示,用户处理设备就如同处理文件一样,使用命令或者系 统调用。这也为程序开发者提供了很大的方便; c 语言写成的u n i x 系统内核,使得它可移植性非常好。 由于u n i x 的各种特点,现在的银行业务系统几乎都是采用它为操作系统。 ( 2 ) i n f o r m i x o n l i n e 数据库服务器体系结构 ( 1 ) i n f o r m i x o n l i n e 数据库服务器系统体系结构 i n f o r m i x o n l i n e 动态服务器采用多线索体系结构实现,这意味着只需较少 的进程完成数据库活动,同时也意味着一个数据库进程可以通过线索形式为多于 一个的应用服务。通常称这样一组进程为数据库服务器。根据需要,可以为数据 库服务器动态分配一个进程,故称之为动态服务器。 多线索体系结构还可以有更好的可伸缩性。这意味着,当增加更多用户时,数据 库服务器只需要少量额外资源,这得益于多线索服务器实现本质上的可伸缩性的 效率 一、进程结构 进程结构形成数据库服务器。 虚拟处理器:组成数据库服务器的进程称之为虚拟处理器( v p ) 。在u n i x 系统中,这些进程叫o n i n i t 。 第1 1 贞共6 8 页 浙江大学硕士学位论文 虚拟处理器类:每个虚拟处理器数据某个虚拟处理器类。所谓虚拟处理器 类时一组进程,完成特定的任务。 二、共享内存 驻留部分:包括缓冲池和其它系统信息。可以配置该部分常驻物理内存。用 途是缓冲区缓冲数据库表的数据。 一一缓冲池:用于缓冲磁盘上的数据 一一日志缓冲区:为了减少维护日志的物理i o ,在写同志时首先写在日 志缓冲区,过一段时间再刷新到磁盘上 l r u s :o n l i n e 通过一些连接在一起的指针来跟踪每个页的情况,称之 为l u n 队列。其功能是把数据页从磁盘度大共享内存中时,用来找到缓冲区存放 该页。 虚拟部分 跟踪会话数据:每个会话都在自己的内存池存放其私有数据,会话池 的名字就是该用户的会话号,当用户与o n l i n e 连接时,o n l i n e 为它分配唯一的 会话号,而当用户退出o n l i n e 系统时,其会话池页会被释放 缓冲数据字典信息:数据字典池缓冲系统目录表信息。当数据服务器 读包含系统目录的数据页时,为使访问表的信息更加有效,数据库服务器将他们 存放在共享内存的一个结构中。该结构是共享内存字典缓冲池的部分。随后所有 用户都可直接在共享内存中访问该结构,得到表的有关信息,从而接生了时间和 内存。 一存储过程缓冲区:用于缓冲存储过程。当一个会话第一次需要使用存 储过程时,数据库服务器读取系统目录检索存储过程代码,然后,将这些代码转 换成可执行的形式,并存放在虚拟部分中,存储过程一旦缓冲存放,其检索和执 行比存放在磁盘上系统目录表中有效得多。 线索信息:m t 池包含线索堆栈,以及一些控制线索使用的结构。 排序:为排序而分配的临时空间组成排序池。 一大缓冲区:o n l i n e 的a i ov p 利用大缓冲区来一次向磁盘写更大的页 块。 第1 2 页共6 8 贞 浙江大学硕士学位论文 一全局信息:不属于会话的一些其它信息存放在全局池中。 消息部分 包括一些消息缓冲区,主要用于本机客户通过共享内存方式与o n l i n e 系统 进行通讯。客户程序把自己的请求消息放在消息部分,同时从该部分取走o n l i n e 系统的处理结果。每个以共享内存方式访问o n l i n e 系统的用户,大约需要1 2 k 的消息部分。 三、磁盘部分 c h u n k s :是磁盘上的一块连续的物理空间,o n l i n e 数据最终存放于此, 我们可设置c h u n k 的个数和大小。因此,c h u n k 是o n l i n e 的物理存储实体。 页:i n f o i 训i x o n l i n e 使用的基本i o 单位是页。所有的数据都存储在页 中。页的尺寸随计算机的不同而不同,并且是不可更改的。 e x t e n t :是磁盘上一组物理连续的页,表的空间是按e x t e n t 为单位分配 的,某个表的e x t e n t 大小在创建表时描述。 d b s p a c e :是一组存放数据库和表的c h u n k 的逻辑集合。每个d b s p a c e 至 少分配有一个c h u n k ,叫做初始c h u n k 。b b s p a e e 可根据需要分配任意多的c h u n k , 如果完成一个d b s p a c e 上的空间,可咀继续为它分配新的c h u n k 。 t b l s p a c e :是分配给一个表的所有e x t e n t 的逻辑集合,一个t b l s p a c e 可包括一个或多个e x t e n t 。t b l s p a c e 的空间不一定是连续的,而一个e x t e n t 的内部空间则一定是连续的。 b l o b s p a c e :当o n l i n e 使用b y t e 和t e x t 数据类型是,将存放在b l o b s p a c e 中,b l o b s p a c e 是c h u n k 的逻辑集合,他们专门用于存放b l o b 数据类型,数据 行和索引不放在b l o b s p a c e 中,只存放b l o v 的页及相关b l o b 系统信息页。 逻辑日志:磁盘上有一定数目的逻辑日志文件,用于存储所有数据库的事 务日志信息,它是可重复使用的。至少有3 个逻辑日志,初始化时,它们放在根 的d b s p a c e 中。 物理日志:是o n l i n e 系统中一块连续的磁盘空间,包含一次检查点以来 被修改的页面的前映像。主要用于容错恢复机制,也用于联机备份,是所有 o n l i n e 系统的内部组成部分。 第1 3 页共6 8 页 浙江大学硕士学位论文 2 4 2 前台应用软件所用的平台及相关技术 ( - ) l o t u sn o t e s 概述 l o t u sd o m i n o n o t e s 是先进的单一架构的文档数据库和电子邮件系统。提 供了工作流自动化及标准的w e b 服务,应用和开发环境,是实现企业级信息集 成和知识管理的理想平合。l o t u sn o t e s 是一种群组工作软件( 群件) 。支持一 群人( 可能位于不同地区) 的协同工作,它被称为开放式信息共享平台。它包含 一整套基于通信基础设施的文档数据库,同时具有分布式存储和通信的特点。 整个l o t u sd o m i n o n o t e s 主要有以下功能特点 i n o t e s 是一个非常优秀的邮件管理系统,基于公用地址薄的个人注册、 群组创建和高效优良的邮件传递与接收功能,可以实现层次组织关系的邮件路 由与收发。 2 n o t e s 是针对办公自动化精心设计的文档驱动应用环境,它所提供的许 多功能本身即可满足日常办公需要 3 n o t e s 是基于文档的文本数据库,内置全文搜索引擎并提供七层安全机 制。 4 n o t e s 是个注重开放的系统,其所提供的许多模板、编程语言和接口 软件可以使用户方便地针对本单位的特殊需要开发出新的应用系统,与n u t e s 实现无缝连接 5 d o m i n o 提供了强大的w e b 功能,它本身就可以作为一个单位的w e b 服务 器。 6 n o t e s 安全性能可靠,系统的各层次人员被限制在白己的权限内,用户 的文件和数据被双钥加密即使在网上传输也不易被泄密。 7 n o t e s 的复制技术使得服务器之间以及服务器与客户机数据保持同步。 8 提供多平台支持。d o m i n o 可以运行在大部分流行的操作系统平台上,包 括m i c r o s o f tw i n d o w s n t ,i b ma i x ,h p u x ,s u n s o l a r i s ,i b mo s 2 ,n o v e l l n e t w a r e i b ma s 4 0 0 ,i b m 3 9 0 ,l i n u x 等。 ( 1 ) l , o t u sn o t e s 功能 邮件系统 第1 4 页共6 8 页 浙江大学硕士学位论文 l o t u sd o m i n o n o t e s 提供了功能强大的电子邮件系统它是l o t u s d o m i n o n o t e s 最基本、最核心的服务d o m i n o 将内在通讯安全机制与对s s l 3 ( 安 全套接层协议版本3 ) 、s m i m e ( 安全多方i n t e r n e t 邮件扩展协议) 的完全 支持结合在一起。它包括了内在的对p o p 3 ( 邮件协议版本3 ) 、i m a p 4 ( i n t e r n e t 邮件消息访问协议版本4 ) 及基于w e b 的邮件支持,同时它还支持内在的i n t e r n e t 寻址、m i m e ( 多方i n t e r n e t 邮件传递扩展协议) 格式和s m p t ( 简单邮件传输协议) 路由。用户可以使用任何p o p 3 或i m a p 4 邮件客户机或w e b 浏览器读写邮件。邮件在 服务器之间以标准的i n t e r n e t 方式存储和发送,不用进行地址转换,提高了效率 及邮件的保真度。 l o t u s 的d o m i n om a i l 产品可以支持用户在客户端的灵活选择,其中包括通过 浏览器存取网页资料、单用途的p o p 3 由邮件客户机n o t e s 的全功能应用。n o t e s 的电子邮件是将前端和后端捆绑在同一进程中,按局域网的文件服务来进行邮件 的存储,按客户服务器模式进行数据通信的。n o t e s 自f f 件使得复合文档( 包括 的r t f ,图像和语音文件) 可以在组织中流动,也可以在n o t e s 系统和外部组织之 间流动。在服务器一方,n o t e s 自f f 件为局域网和远程用户提供邮件路由的功能具 有全文索引和基于服务器的代理,并有很好的高级安全性能如加密、电子签名 和授权。n o t e s m b 件文档支持使用通过o l e 方式将非n o t e s 应用程序的现场数据引 入n o t e s $ b 件中所建立的链接是与n o t e s 数据库中的文档相关联,将在路由过程 中保持这些链接。 另外,n o t e s q f f 件提供了日历和群组日程安排。利用日历使用户能有效地安 排目己的工作时间。查看自己的日程安排。群组日历安排使用户在同时间可 以查看多个同事的空闲时间表。 在使用的时候一旦用户注册成功,系统会自动生成该用户的邮件数据库, 同时在公用通信录中登记该用户。此后,该用户所有的邮件操作都在自己的邮件 数据库中进行。 文档数据库 l o t u sd o m i n o n o t e s 优势之二是采用了先进的单一架构的文档数据库技术。 与传统的关系型数据库不同,l o t u sn o t e s 数据库是基于文档的数据库,其最基 本的元素就是文档。n o t e s 中的文档就相当于关系数据库中的记录,它可以同时 第1 5 页共6 8 页 浙江大学硕士学位论文 包含结构化和非结构化的信息,简而言之,n o t e s 数据库就是包含多个文档和设 计元素的数据库。 一、n o t e s 数据库的构成 n o t e s 数据库由设计元素和数据文档构成的。数据文档又是由域构成的。如果将 n o t e s 文档比作r d b ( 关系型数据库) 中的记录的话,那么,域就相当于r o b 中的字 段。文档就是由大量的域组成的。 ( 1 ) 表单( f o r m ) :n o t e s 文档结构是由表单定义的,是数据库的基本设计元素。 一个表单是一个提供输入数据结构的文档模板,f o r m 的数据结构反映了n o t e s 文 档的数据结构。 ( 2 ) 域( f i e l d ) :表单的一个命名的数据域,存放信息的一个信息单元,以及信息 的类型。 ( 3 ) 文档( d o c u m e n t ) :用表单建立的一组数据,相当于关系数据库中的一条记录。 可用公式通过编程输入,也可用脚本语言( s c r i p t ) 编程构造。 ( 4 ) 视图( v i e w ) 。允许用户以类似关系数据库的视图方式浏览n o t e s 数据库中的文 档。 ( 5 ) 导航器( n a v i g a t o r ) :n o t e s 数据库的一个图形化的热点集,通过单击其中的 某一热点区域就可以直接查看该热点所链接的文档信息。 ( 6 ) 代理( a g e n t ) :用l o t u s 公式或脚本语言编写的、用来实现个相关功能的一 段程序,代理的激活条件可以事先设定。 ( 7 ) 文件夹。设计者和用户可以创建共享或个人使用的文件夹,用其对数据库中 的文档进行组织和分层次管理。 二、n o t e s 数据库的特点 n o t e s 数据库主要有以下特点: ( 1 ) 文本数据库。因为n o t e s 文档数据库的基本元素就是文档本身,而n o t e s 文档可以同时包含结构化的和非结构化的信息,所以n o t e s 能够高效地存储和管 理类似文档这类非结构化的数据。 ( 2 ) 数据库中存储非结构化信息的多样化。这类非结构化信息主要包括表格 ( 如是从某个关系数据库或电子表格软件中得到的) ,格式化文本( 例如r t f 文 本) 、w w w 的页面、图形、o l e 对象、或扫描的图像以及传真件、声频或视频信号 第1 6 n共6 8 页 浙江大学硕士学位论文 这样的多媒体信息。 ( 3 ) 全文搜索。数据库内置全文搜索引攀,允许用户按自己设置的查询条件 对文档进行索引和查找。n o t e s 会将符合条件的全部文档按相关次序显示出来。 ( 4 ) 在l o t u s 中的单一数据库的大小被设计成无限制,己验证容量的大小为 6 4 g b 。 ( 5 ) 版本控制。为了记录不同用户对同一n o t e s 文档所做的修改,n o t e s 提供 了版本控制的功能。自动地版本记录可以在同一表单中实现,每一个编辑或被视 为一个主文档或被视为对原文档的应答这样,一个用户对文档的修改不至于被 另一用户的修改所覆盖。 ( 6 ) 通过存取控制列表( a c c e s sc o n t r o ll i s t ,a c l ) 控制用户、服务器和工 作组成员对数据库的存取权限。 b u s i n e s so b j e c t 技术简介 b u s i n e s so b j e c t 是一个由多个产品组成的产品族,主要包括b u s i n e s s o b j e c t ,d e s i g n e r ,d o c u m e n ta g e n t ,s u p e r v i s o r ,b u s i n e s sm i h e r 五个产品。 这几个产品功能如下: ( 1 ) s u p e r v i s o t 是b o 自身的安全管理工具。在s u p e r v i s o r 中可以建立和维护 资料库,在资料库中可以建立b o 的用户和用户组,通过对不同用户赋予不同的操 作权限,来实现对b u s i n e s so b j e c t 的使用用户、定制查询( u n i v e r s e ) 以及查询 报告的安全管理。实际上多个用户定制查询及查询结果的共享时通过资料库实现 的。 ( 2 ) d e s i g n e r :d e s i g n e r 是一个多编模型构建工具,它可以将关系库中的表 通过类、对象及对象明细等工具映射到多维模型的维、维元素及度量指标上,使 用户在符合业务逻辑的多维模型上构建查询。 ( 3 ) b u s i n e s so b j e c t :b u s i n e s so b j e c t 是一个查询定制和统计报表( 图形) 生成工具。它利用d e s i g n e r 建立多维模型定制各类查询,查询方式包括b u s i n e s s o b j e c t 定制查询语义层( u n i v e r s e ) 、手s q l 语句、存储过程及个人数据文件等, 在b u s i n e s so b j e c t 4 1 以后的版本中支持o l a pp a n n e l ,从而使其可以利用其他 一商的o l a p 服务器的功能。b u s n e s so b j e c t 将查询结果以多种报表形式及统计 第1 7 贞共6 8 页 浙江大学硕士学位论文 图形的方式提交给用户。用户可以在查询结果上进行进一步的分析,如向下向 上钻取( d r i l lu p d r i l ld o w n ) 等。另外,在b u s i n e s so b j e c t 中还提供了一种 s c r i p t 语言,该语言风格类似v i s u mb a s i c ,在程序中可以以面向对象的编程风 格调用b u s i n e s so b j e c t 提供的丰富类库。使得s c r i p t 语言可以定制出更为友好 的查询界面。 ( 4 ) d o c u m e n ta g e n t :d o c u m e n ta g e n t 是专为工作组用户的文档管理及查询 结果刷新而建立的。一组用户对应一个d o c u m e n ta g e n t ,不同用户的查询报表( 图 形) 均可发送到d o c u m e n ta g e n t , s 同组的其他用户共享。d o c u m e n ta g e n t 还可以 定义统计报表( 图形) 的刷新频度。 b u s i n e s so b j e c t 具有以下几个特点:前端分析手段灵活,表现方式多样, 语义层构建工具应用面广,应用简单,具有文档管理的数据刷新功能,可以利用 资料库对不同用户的操作权限进行管理。 至此,就将建行信贷管理信息系统前后台所要用到的平台和相关技术完整地 介绍了一遍。下面,就详细介绍这套系统的系统软件结构。 o i n f o r m i x c l i 简介 i n f o r m i x 提供了调用级接口i n f o r m i x c l i ,这是一组实现支持s q l 语句进 行数据库操作的c 语言函数,即特定于i n f o r m i x 数据库驱动程序的一组接口。 和o d b c 相比,o d b c 是微软公司对x o p e n 和s q l 访问组调用接 :_ | ( s a gc l ) 规范 的实现,而i n f o r m i x c l i 是i n f o r m i x 遵循o d b c 标准的编程接口,它们之间的 关系类似于标准s q l 和i n f o r m i x 增强s q l 。 在此银行的信贷管理信息系统中,前台的业务处理程序是由l o t u sn o t e s 开发的。软件设计也采用的是前、后台方式,即前台为w i n d o w s 操作系统,后台 为u n i x 操作系统,数据库采用i n f o r m i x - - o n l i n e 数据库。通过i n f o r m i x 。c l i 实现前后台的数据通讯联接。 至此,就将建行信贷管理信息系统前后台所要用到的平台和相关技术完整地 介绍了一遍。下面,就详细介绍这套系统的系统软件结构。 第1 8 页共6 8 页 浙江大学硕士学位论文 第三章建行信贷管理信息系统的系统结构 3 1 银行信贷业务知识简要介绍 信贷业务功能需求有两个层次:业务处理流程和业务管理功能。贯穿整个业 务功能的主线是信贷业务的处理流程,业务管理管理在业务处理流程中采集产 生,业务管理功能服务于业务处理流程。下面分别对业务处理流程和业务管理功 能的有关问题进行讨论: 3 1 1 业务处理流程 根据贷款通则的规定,以及建行的信贷业务规程和实务,信贷业务处理 流程分为以下阶段: 信贷申请受理:受理客户的信贷业务申请,收集整理客户业务申请资料, 为客户评价提供依据。 客户评价:以信贷申请受理的资料为基础,根据规范的评定过程确定客 户是否满足基本信贷条件。 信贷审批:对受
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 年度小学教师工作总结-
- 元旦演讲稿800字【五篇】
- 2021年人事主管年终工作总结
- 2024平房出售合同范本全面保障交易双方权益3篇
- 北京教案模板锦集五篇
- 2024年度跨境电商知识产权保护合同签订与执行2篇
- 教务处主任个人工作总结
- 电话客服年终总结
- 社区个人世界献血日活动总结范文集锦
- 教师学期述职报告6篇
- 中国法律史-第三次平时作业-国开-参考资料
- 摄影技巧构图(共52张PPT)
- PMS系统总体介绍课件
- SN∕T 5398-2022 进出境水果冷处理操作规程
- 苏科版一年级心理健康教育第17节《生命更美好》课件(定稿)
- 施工单位资质和资信证明材料格式模板
- 小学体质健康测试教案合集
- 三年级语文上册-17《饮湖上初晴后雨》说课稿(部编版)
- 桥梁工程施工质量控制关键点及保证措施
- 精神科护理技能测试题及答案
- 项目经理陈述材料(弥泸高速公路项目) 投标材料
评论
0/150
提交评论