(控制科学与工程专业论文)基于web的绿色贸易法规信息服务系统.pdf_第1页
(控制科学与工程专业论文)基于web的绿色贸易法规信息服务系统.pdf_第2页
(控制科学与工程专业论文)基于web的绿色贸易法规信息服务系统.pdf_第3页
(控制科学与工程专业论文)基于web的绿色贸易法规信息服务系统.pdf_第4页
(控制科学与工程专业论文)基于web的绿色贸易法规信息服务系统.pdf_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于w e b 的绿色贸易法规信息服务系统 摘要 绿色贸易相关指令的不断出现与更新 对我国机电产品出口贸易产生 重大影响 理解这些标准法规文件是从事绿色生产和贸易的基础 本文针对机电产品贸易的绿色化需求 以中小机电企业为主要服务对 象 设计并实现了一个基于w e b 的标准法规服务系统 系统采用基于b s 的三层结构模型 使用面向对象的主流语言c 结合a s e n e t 依托s q l s e r v e r 数据库 运用w e b 服务器控件在v i s u a ls t u d i o n e t 2 0 0 5 开发平台 上实现了法规信息的全面查阅和简单搜索 为用户提供了获取和理解法规 信息的平台 帮助其实现产品出口的绿色化 考虑到用户对法规信息检索的个性化需求 论文阐述了信息检索技术 的发展现状 信息检索的模型 以及个性化信息检索的相关概念和系统框 架 详细阐述了个性化信息检索的一项关键技术 即用户建模技术和兴趣 挖掘 并结合聚类算法提出了个性化系统的实现策略 最后 设计了适合 法规信息的个性化检索系统的结构和用户界面 介绍了各项功能设置 作 为法规信息服务系统的二次开发和搜索功能扩展 实现系统的个性化服 务 关键词 绿色贸易 法规 信息检索 个性化 a b s t r a c t a ni n f o r m a t i o ns e r v i c es y s t e mo fg r e e nt r a d e r e g u l a t i o n sb a s e do nw e b a b s t r a c t t h ei n s t r u c t i o n sa n d r e g u l a t i o n so fg r e e nt r a d et e c h n o l o g yh a v ea s i g n i f i c a n ti m p a c to nm e c h a n i c a la n de l e c t r i c a lp r o d u c t se x p o r t i n gw h e nm o r e a n dm o r er e g u l a t i o n sc o m eo u ta n du p d a t ec o n s t a n t l y m a k i n gp r o d u c ta n d t r a d eg r e e ni sb a s e do nu n d e r s t a n d i n gt h e s er e g u l a t i o n sp a p e r s i nt h i sp a p e r as e r v i c es y s t e mb a s e do fw e bi sd e s i g n e df o rm e c h a n i c a l a n de l e c t r i c a le n t e r p r i s e se s p e c i a l l yt h es m a l lo n e st om e e tt h e i rn e e d so f g e t t i n gt h ei n s t r u c t i o n sa n dr e g u l a t i o n so fg r e e nt r a d et e c h n o l o g y t h es y s t e m i sb a s e do nb s m o d e l u s i n gc 群l a n g u a g e w h i c hi sm a i n s t r e a m o b j e c t o r i e n t e d c o m b i n e dw i t ha s p n e t i ti sr e l i e do ns q ls e r v e rd a t a b a s e d e v e l o p e do nv i s u a ls t u d i o n e t 2 0 0 5p l a t f o r mw i t hw e bs e r v e rc o n t r 0 1 t h e u s e r sc a ng e ta n ds i m p l ys e a r c h e da l lt h er e g u l a t i o n si n f o r m a t i o nw i t ht h i s s y s t e m i tp r o v i d e sas e r v i c ep l a t f o r mt ou n d e r s t a n dt h el a w sa n dr e g u l a t i o n s h e l p i n gu s e r se x p o r t i n gp r o d u c t s c o n s i d e r i n gt h ep e r s o n a l i z e dn e e d sf o ri n f o r m a t i o nr e t r i e v a l t h i sp a p e r d e s c r i b e dt h ed e v e l o p m e n to fi n f o r m a t i o ns e a r c h i n gt e c h n o l o g y t h ec o n c e p t a n df r a m e w o r ko fp e r s o n a l i z e di n f o r m a t i o ns e a r c h i n gs y s t e m t h e t e c h n o l o g y o fu s e rm o d e l i n ga n di n t e r e s te x c a v a t i o nw h i c hi seo n eo ft h ek e yt e c h n o l o g y i i i 北京化t 人学硕j 学位论文 o fp e r s o n a l i z e di n f o r m a t i o ns e a r c h i n g i sd e s c r i b e di nd e t a i l a n dt h e n t h e s t r a t e g yo fp e r s o n a l i z e ds y s t e mc a m eo u tc o m b i n e d w i t hc l u s t e r i n ga l g o r i t h m s f i n a l l y t h es y s t e ms t r u c t u r ea n d u s e ri n t e r f a c ea r ed e s i g n e di nt h i sp a p e rw i t h t h ei n t r o d u c t i o no ft h ef e a t u r es e t t h ep e r s o n a l i z e di n f o r m a t i o ns e a r c h i n g s y s t e mo fi n s t r u c t i o n sa n dr e g u l a t i o n sm a k et h es e r v i c ep e r s o n a l i z e da sa n a d d i t i o na n dr e d e v e l o p m e n to ft h es e r v i c es y s t e m k e yw o r d s g r e e nt r a d e r e g u l m i o n s i n f o r m a t i o nr e t r i e v a l p e r s o n a l i z e d i v 符吁说明 符号说明 信息检索 机械分析和文本检索实验系统 文本检索会议 自然语言处理 基于空间向量模型 特征项的数目 第i 个特征项 特征项的集合 一个文档 特征项t i 在第j 个文档中的权重 特征项t i 在文档j 中的词频 系统文档集中的文档总数 包含特征项t i 的文档数 用户 用户a 以前评价过的资源中具有特征t i 的次数 特征t i 在用户a 中出现的次数占t i 在该用户中所有关键词出现 次数的比率 维数 即关键词的个数 两个文本的相似度 文本f u z z y 相似矩阵 一个文本 e j 和e i 之间按m 个特征项的相似度 相似因子 归一化因子 用户兴趣矢量 查询矢量 合成矢量 相似度余弦夹角肷 一篇 乃r办吩螗 r z 北京化工大学位论文原创性声明 本人郑重声明 所呈交的学位论文 是本人在导师的指导下 独立 进行研究工作所取得的成果 除文中已经注明引用的内容外 本论文不含 任何其他个人或集体己经发表或撰写过的作品成果 对本文的研究做出重 要贡献的个人和集体 均已在文中以明确方式标明 本人完全意识到本声 明的法律结果由本人承担 作者签名 蔓叁 日期 关于论文使用授权的说明 学位论文作者完全了解北京化工大学有关保留和使用学位论文的规 定 即 研究生在校攻读学位期间论文工作的知识产权单位属北京化工大 学 学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘 允 许学位论文被查阅和借阅 学校可以公布学位论文的全部或部分内容 可 以允许采用影印 缩印或其它复制手段保存 汇编学位论文 保密论文注释 本学位论文属于保密范围 在土年解密后适用本授 权书 非保密论文注释 本学位论文不属于保密范围 适用本授权书 作者签名 导师签名 日期 丛 壁 篁 近 日期 丝丝 兰亟 第一章绪论 第一章绪论 1 1 论文选题的目的意义及工作简述 绿色贸易 1 是指受限于环保指令 法规的产品和技术贸易 随着环保时代的来临 清洁生产 绿色产品 绿色消费等理念日益深入人心 与贸易相关的环境措施也纷纷 出台 为此在资源 环境等方面制定了很多技术标准 不仅要求末端产品符合环保要 求 而且规定从产品的研发 生产到包装 运输 使用等各环节都要符合环保要求并 实现循环利用 由于世界各国技术水平不均 绿色贸易要求的环保指令 法规 措施 势必会演变成一种技术先进方对技术落后方的不对等的贸易限制 即所谓的绿色贸易 壁垒 机电产品在我国出口贸易中占有主导地位 1 1 1 然而作为发展中国家 我国机电产 品的管理 生产 贸易等方面在技术上与绿色化要求还存在一定差距 在出口上也遭 遇过重大损失 掌握绿色贸易相关技能成为机电中小企业扩大出口 谋求发展的必经 之路 出口产品合乎消费国对有毒有害物质含量和能耗物耗等绿色化质量要求的法 律 法规 标准 指令 是绿色贸易的基本要求 也是绿色化生产的基本动力 熟悉 理解相关的文件是从事绿色生产和贸易的基础 这些知识涉及众多国家和部门 数量 庞大 来源复杂 收集 整理 分类并系统地呈现这些知识 提供个性化服务 对于 机电产品的生产和贸易企业 尤其是中小型企业 无疑具有重要价值 在科技部 十一五科技支撑计划 课题 出口机电产品国际绿色贸易壁垒应对 技术及应用 的支持下 本文工作的目是设计一个基于w e b 的绿色贸易标准法规信 息服务系统 为机电中小企业提供一个全面 系统地学习绿色贸易标准法规的平台 同时通过用户建模技术和兴趣挖掘对系统的信息检索功能进行二次开发 提供个性化 法规服务 1 2 本课题相关领域的历史 现状和前沿发展情况 关于绿色贸易标准法规 l l 国内外已有大量的研究成果和学术论文 也出现了一 些借助互联网进行信息服务的平台 如 海南省技术性贸易壁垒预警系统 浙江省应 对技术性贸易壁垒信息服务平台等 均侧重于绿色贸易的动态新闻信息以及指令法规 的更新 并且属于区域性的服务网站 随着信息技术的高速发展和信息量的高速膨胀 搜索引擎作为用户与w e b 进行交 互的主要手段 也在不断更新换代 上文提到的区域性服务网站也多多少少用到了搜 北京化工大学硕l j 学位论文 索 但往往局限于使用关键字提问 并存在搜索结果不够准确 包含较多无用信息等 问题 因此 针对机电产品贸易相关的标准法规给出全面系统的整理结果 并通过数据 挖掘更好地利用w e b 信息 探索个性化信息检索 将成为绿色贸易标准法规系统的发 展方向 1 3 论文章节安排 本论文共分为七章 结构安排如下 第一章绪论 阐述了本课题的研究目的及意义 以及目前研究状况 第二章相关开发技术 介绍了系统的开发模式 开发环境和相关技术 如a s p n e t c 群 s q ls e r v e r 等 第三章信息检索技术概述 阐述了信息检索的研究目的和意义 介绍了信息检索的发展和现状 探讨了信息 检索的模型 并介绍了个性化信息检索的相关概念和系统框架 第四章系统的设计与开发 对法规信息服务系统的进行了需求分析 设计了系统的结构 用户界面的栏目结 构和数据库关键表 分析了系统的安全性 编码实现了绿色贸易法规信息系统的登录 管理和前台主页 第五章用户建模技术与兴趣挖掘 建立了用户兴趣模型 获取用户兴趣和信息需求 介绍了用户兴趣模型的挖掘过 程及用户兴趣的更新方法 最后讨论了基于最大生成树的聚类算法在信息检索中的应 用 并提出了个性化信息检索的实现策略 第六章用户建模技术与兴趣挖掘 基于用户个性化兴趣的研究提出了个性化法规信息检索系统的框架结构 并设计 了用户界面 第七章结论和展望 总结全文的工作和成果 提出下一步研究的方向 2 第 二章相关开发技术 2 1 开发模式 第二章相关开发技术 近年来 随着计算机技术与网络技术迅猛的发展 信息开发模式使用最多的是 c s 和b s 两种模式 2 1 2 1 1e s 模式 c s c l i e n t s e r v e r 结构 即客户机和服务器结构 它是一种松耦合结构的模型 其最大优点是将计算机工作任务分别由客户端和服务器端共同完成 这样的结构可以 充分利用两端硬件环境的优势 将任务合理分配到客户端和服务器端来实现 降低了 系统的通讯开销 客户机朋艮务器结构包括一个客户机 或称前端 一个服务器 或称后端 如图2 1 所示 客户机的作用是访问和处理远程服务器上的数据 服务器的作用是接收和处理 客户机的数据请求 有时 可能有多个客户向同一个服务器同时请求服务 这就需要 服务器决定怎样处理这些请求 因此 在许多客户机 服务器结构中 除了客户机和服 务器外 还有其它部分 即通常讲的三层客户机 服务器结构中的中间层 图2 1c s 模式 f i g 2 1c sm o d e l 目前大多数应用软件系统都是c l i e n t s e r v e r 形式的两层结构 由于现在的软件应 用系统正在向分布式的w e b 应用发展 w e b 和c l i e n t s e r v e r 应用都可以进行同样的业 务处理 应用不同的模块共享逻辑组件 因此 内部的和外部的用户都可以访问新的 和现有的应用系统 通过现有应用系统中的逻辑可以扩展出新的应用系统 这也就是 目前应用系统的发展方向 北京化下大学硕 1 j 学位论文 传统的c s 体系结构虽然采用的是开放模式 但这只是系统开发一级的开放性 在特定的应用中无论是c l i e n t 端还是s e r v e r 端都还需要特定的软件支持 由于没能提 供用户真正期望的开放环境 c s 结构的软件需要针对不同的操作系统开发不同版本 的软件 加之产品的更新换代十分快 已经很难适应百台电脑以上局域网用户同时使 用 而且随着应用系统复杂性的提高 c s 模式暴露出的许多问题己不能适应不断增 长的多方面需求 主要体现在 开发和维护复杂 成本较高 用户界面风格不统一 不利于推广使用 移植困难 升级麻烦 信息内容和形式单一 限制了扩展性等 由于标准法规信息系统拥有的用户量比较多 因此 如果单纯采用该结构 系统 的安装与维护工作比较繁重 同时 由于应用程序直接安装在客户机 客户机直接和 数据库服务器交换数据 系统的安全性也受到一定影响 2 1 2a s 模式 2 0 世纪9 0 年代以来 蓬勃发展的w e b 技术为解决传统c s 结构的技术 瓶颈 提供了切实有效的方案 i n t r a n e t 模型是基于i n t e r n e t 的w e b 模型 它以w e b 为中心 采用t c p i p h t t p 传输协议 客户端通过b r o w s e 浏览访问w e b 服务器以及数据库 服务器 因此为浏览器朋艮务器 b r o w s e r s e r v e r 简称b s 模式 随着i n t e m e t 的出现和广泛使用 w 曲使得实现广泛的网络共享 集中的安全控 制和友好的使用界面达到了完美的统一 这为解决管理信息系统运行中存在的一些问 题提供了新的可能 基于w e b 的方式其实是一种特殊的客户 服务器方式 客户端是 各种各样的浏览器 b s 模式采用三层体系结构 3 1 主要包括数据库服务器 w 曲服 务器 w 曲浏览器三个部分 如图2 2 所示 图2 2b s 模式 f i g 2 2b sm o d e l 第一层浏览器 客户机 为用户与整个系统的接口 客户端的应用程序简化到一个 通用的浏览器 由它来解释h t m l 显示网页内容 这罩网页具有一定的交互功能 支持用户在网页提供的表单上输入信息提交给后台 并提出处理请求 这里的后台即 第二层的w e b 服务器 第二层w e b 服务器将启动相应的进程来响应浏览器的请求 并动态生成嵌入处理 结果的h t m l 代码返回给客户机浏览器 如果客户机的请求还包括数据存取 那么 4 第二章相关开发技术 w e b 服务器还需与数据库服务器协同完成这一处理任务 第三层数据库服务器的任务类似于c s 模型的第二层 负责协调不同w e b 服务器 发出的s q l 请求 管理数据库 在b s 体系结构系统中 用户通过浏览器向分布在网络上的许多服务器发出请求 服务器对浏览器的请求进行处理 将用户所需信息返回到浏览器 极少部分事务逻辑 在前端 b r o w s e r 实现 但是主要事务逻辑在服务器端 s e r v e r 实现 形成所谓三 层3 t i e r 结构 这样就大大简化了客户端电脑载荷 客户机上只需配置少量的客户端 软件 服务器将担负更多的工作 对数据库的访问和应用程序的执行将在服务器上完 成 浏览器发出请求 而其余如数据请求 加工 结果返回以及动态网页生成等工作 全部由w e bs e r v e r 完成 实际上b s 体系结构是把二层c s 结构的事务处理逻辑模块 从客户机的任务中分离出来 由w e b 服务器单独组成一层来负担其任务 这样客户机 的压力减轻了 把负荷分配给了w 曲服务器 这种结构不仅把客户机从沉重的负担和 不断对其提高的性能的要求中解放出来 也把技术维护人员从繁重的维护升级工作中 解脱出来 把主要精力放在功能服务器上程序的更新工作 这种三层结构在层与层之 间相互独立 任何一层的改变不会影响其它层的功能 本质上b s 与c s 属于同一结构体系 b s 是c s 结构的进一步发展 它主要具 有以下特点1 4 j 1 维护和升级方式简单 目前 软件系统的改进和升级越来越频繁 b s 架构的 产品明显体现着更为方便的特性 b s 架构的软件只需要管理服务器 所有的客户端 只是浏览器 根本不需要做任何的维护 对于异地服务器只需连接专网即可 实现远 程维护 升级和共享 所以客户机越来越 瘦 而服务器越来越 胖 是将来信息 化发展的主流方向 2 成本降低 选择更多 当前使用b s 架构的应用管理软件 可安装在w i n d o w s 服务器或l i n u x 服务器上 现在的趋势是安装在l i n u x 服务器上 除了l i n u x 操作系 统免费使用 而且其安全性高 所以服务器操作系统的选择是很多的 不管选用哪种 操作系统都可以让大部分人使用w i n d o w s 作为桌面操作系统电脑不受影响 3 信息共享度高 h t m l 是数据格式的一个开放标准 目前大多数流行的软件均 支持h t m l 同时m i m e 多用途的网际邮件扩充协议 技术使得b r o w s e r 可访问多 种格式文件 4 扩展性好 t c p i p h t t p 的标准性使得b s 模式可直接接入i n t e r n e t 具有良 好的扩展性 5 广域网支持 无论是p s t n d d n 帧中继 x 2 5 i s d n 还是其后出现的 c a t v a d s l b s 均能良好支持 6 应用服务器运行数据负荷较重 由于b s 架构管理软件的客户端只有浏览器 网络管理人员只需要做硬件维护 但是 应用服务器运行数据负荷较重 一旦发生服 5 北京化t 人学硕f 学位论文 务器 崩溃 等问题 后果不堪设想 因此 一般都需备有数据库备份存储服务器 以防万一 综合比较上述两类开发模式的特点 以及考虑到系统的实际使用情况 绿色贸易 标准法规信息系统选择采用w e b 环境下的b s 结构 这使得系统具有更好的开放性和 可扩展性 2 2 开发环境 确定b s 开发模式为设计标准法规信息系统迈出了第一步 下文将针对系统的相 关丌发技术进行阐述 系统的开发环境如表2 1 所示 表2 1 系统开发环境 t a b l e2 1d e v e l o p i n gi n v i r o n m e n to ft h es y s t e m 体系结构 b s 结构 开发平台 n e t 丌发语言 c j j a sp n e t 开发工具m i c r o s o f tv i s u a ls t u d i o n e t2 0 0 5 数据库服务器m i c r o s o f ts q ls e r v e r2 0 0 0 w e b 服务器软件 i n t e r n e ti n f o r m a t i o ns e r v e r 客户端运行环境w e b 浏览器 2 2 1m i c r o s o f t n e t 平台 n e t 是m i c r o s o f tx m lw e bs e r v i c e s 平台 x m lw e bs e r v i c e s 允许应用程序通 过i n t e m e t 进行通讯和共享数据 而不管所采用的是哪种操作系统 设备或编程语言 m i c r o s o f t n e t 平台提供创建x m lw e bs e r v i c e s 并将这些服务集成在一起之所需 对个人用户的好处是无缝的 吸引人的体验 微软新一代软件开发平台 s u a ls t u d i o n e t 是微软 n e t 战略产品的重要部 分 5 1 v i s u a ls t u d i o n e t 集成了v b n e t c 撑 a s p n e t 的开发环境 而微软也第一 次统一了v b 和v c 的底层对象 使v b n e t 和c 样能够在同一个运行环境的基础上访 问相同的组件的属性和方法 在这以前 大多数人认为 v c 程序员比v b 程序员 更高级些 在 n e t 时代 这种差别将不复存在 v i s u a ls t u d i o n e t 使得编写c 和编 写v b n e t 程序同样的简单和高效 m i c r o s o f t n e t 开发框架如图2 3 所示 6 第二章相关开发技术 曰困曰固日 图2 3 n e t 框架的基本层次 f i g 2 3b a s i ca r r a n g e m e n to f n e tf r a m e 上图可见 n e t 开发框架的几个主要组成部分 首先是整个开发框架的基础 即 通用语言运行时以及它所提供的一组基础类库 在开发技术方面 n e t 提供了全新 的数据库访问技术a d o n e t 以及网络应用开发技术a s p n e t 和w i n d o w s 编程技术 w i n f o r m s 在开发语言方面 n e t 提供了v b v c c 撑 j s c r i p t 等多种语言支持 而v i s u a ls t u d i o n e t 则是全面支持 n e t 的开发工具 v i s u a ls t u d i o n e t 通过提供一个统一的集成开发环境及工具 大大提高了开发者 的效率 集成了多种语言支持 简化了服务器端的开发 提供了高效地创建和使用网 络服务的方法等等 2 2 2a s p n e t 及其数据访问接口 a s e n e t 是基于 n e t 框架的一种开发技术 与以前的w e b 开发模型相比 具有 很多优点 6 1 1 增强的性能 a s e n e t 是在服务器上运行的编译好的公共语言运行库代码 与 被解释的前辈不同 a s e n e t 可利用早期绑写 实时编译 本机优化和盒外缓存服务 这相当于在编写代码之前性能便有了显著提高 7 北京化下人学硕十 学位论文 2 世界级的工具支持 a s p n e t 框架补充了v i s u a ls t u d i o 集成开发环境中的大量 工具箱和设计器 w y s i w y g 编辑 拖放服务器控件和自动部署只是这个强大的工具 所提供功能中的少数几种 3 威力和灵活性 由于a s p n e t 基于公共语言运行库 因此w e b 应用程序开发 人员可以利用整个平台的压力和灵活性 n e t 框架类库 消息处理和数据访问解决 方案都可从w e b 无缝访问 a s p n e t 也与语言无关 所以可以选择最适合应用程序 的语言 或跨多种语言分割应用程序 另外 公共语言运行库的交互性保证在迁移到 a s p n e t 时保留基于c o m 的开发中的现有投资 4 简易性 a s p n e t 使执行常见任务变得容易 从简单的窗体提交和客户端身份 验证到部署和站点配置 例如 a s p n e t 页框架使您可以生成将应用程序逻辑与表示 感谢代码清楚分开的用户界面 和在类似v i s u a lb a s i c 的简单窗体处理模型中处理事 件 另外 公共语言运行库利用托管代码服务 如自动引用计数和垃圾回收 简化了 开发 5 可管理性 a s p n e t 采用基于文本的分层配置系统 简化了将设置应用于服务 器环境和w e b 应用程序 由于配置信息是以纯文本形式存储的 因此可以在没有本地 管理工具帮助的情况下应用新设置 此 零本地管理 哲学也扩展到了a s p n e t 框 架应用程序的部署 只需将必要的文件复制到服务器 即可将a s p n e t 框架应用程 序部署到服务器 不需要重新启动服务器 即使是在部署或替换运行的编译代码时 6 可缩放性和可用性 a s p n e t 在设计时考虑了可缩放性 增加了专门用于在聚 集环境和多处理器环境中提高性能的功能 另外 进程受到a s p n e t 运行库的密切 监视和管理 以便当进程行为不正常 泄漏 死锁 时 可就地创建新进程 以帮助 保持应用程序始终可用于处理请求 7 自定义性和扩展性 a s p n e t 随附了一个设计周到的结构 它使开发人员可以 在适当的级别 插入 代码 实际上 可以用自己编写的自定义组件扩展或替换 a s p n e t 运行库的任何子组件 实现自定义身份验证或状态服务一直没有变得更容 易 8 安全性 借助内置的w i n d o w s 身份验证和基于每个应用程序的配置 可以保 证应用程序是安全的 a s p n e t 的数据访问接口 a d o n e t 7 是重要的应用程序级接口 用于在 m i c r o s o f t n e t 平台中提供数据访问服务 在a d o n e t 中 可以使用新的 n e t f r a m e w o r k 数据提供程序来访问数据源 设计a d o n e t 组件的目的是为了从数据操作中分解出数据访问 a d o n e t 的 两个核心组件会完成此任务 d a t a s e t 和 n e tf r a m e w o r k 数据提供程序 后者是一组 包括c o n n e c t i o n c o m m a n d d a t a r e a d e l 和d a t a a d a p t e r 对象在内的组件 a d o n e t 是专为基于消息的w e b 应用程序而设计的 同时还能为其他应用程序 结构提供较好的功能 通过支持对数据的松耦合访问 a d on e t 减少了与数据库的 活动连接数目 即减少了多个用户争用数据库服务器上的有限资源的可能性 从而 实现了最大程度的数据共事 图2 4 阐释了a d o n e t 结构的组件 223 群开发语言 图2 4 a d o n e t 结构附 f 蜒2 4s t r u c t u r eo f a d o n e t c 语言是由m i c r o s o f t 在2 0 0 0 年6 月发柿的一种专用在n e tf r a m e w o r k 平台上 进行开发的新的语言 j c 语言是一种争新的面向对象的语言 足m i c r o s o f t 对抗j a v a 的有力武器 钟语言从丌始就是专为n e t 而创造的 所以 甜的特性很多是作 为n e t f r a m e w o r k 特性的一种反映 作为一种p a d 语言 c 具有的特性有 1 c 耀供j a v a 风格的垃城收集 c 提供的最重要的p a d 功能之 就是j a v a 风 格的垃圾收集 在运行时的仟意时间内 所有没有引用的对象会自动删除 通过将开 发人员从手动内存管理任务中解放出来 垃圾收集使程序开发变得容易且不易出错 2 c 实现了j a v a 和d e l p h i 风格的值丹l 用类型系统 为了进一步支持r a d c 始终以j a v a 和d e l p h im 格的值 引用类型系统处理c c 指针模型 在这个系统中 内建类型 i n t e g e r r e a l s t r i n g 等等1 枚举 e n t m a e r a t i o n 和结构 s t r u c t u r e 都是值类 型 赋值运算符和比较运算符复制井检查这些类型的变量的值 接口 类和委托都足 s 用类型 赋值运算符和比较运算符复制并检查这些类型的变量所引用的对象的同一 性 北京化工人学硕i 学位论文 3 c 群接口是独立于类来声明的 c j f j 也支持类似j a v a 和d e l p h i 的接口模型 接口 是独立于类来声明的 这与c 模型是对立的 在c 中接口实际上就是抽象基类 接口和类都可以继承多个接口 而类可以继承一个基类 接口根本不能继承类 这种 模型避免了c 的多继承问题 c 中不同基类中的实现可能出现冲突 因此也不再 需要诸如虚拟继承和显式作用域这类复杂机制 c 拌的简化接口模型有助于加快应用程 序的丌发 4 类方法的声明和定义被组合在一起 c j f j 简化开发的另一个方面是将类方法的声 明和定义组合在一起 与j a v a 的做法十分类似 c 开发人员必须为声明 头文件 和定义 实现文件 维护单独的文件 结果使得软件开发过程变得复杂 c j f j 甚至能够 自动找出源代码模块之问的关系 从而使开发人员从一项附加的杂务中解脱出来 尽 管c 需要使用 i n c l u d e d e l p h i 需要使用u s e s 来定位相关的源文件 但c j f j 不需要 任何额外的语句 5 c j f j 使用方法引用 称为委托 而不使用方法指针 c j f j 使用方法引用来快速连 接对象和方法 称为委托的这些方法引用类似于d e l p h i 的过程类型 方法引用有点像 c 的方法指针 但它要优越 安全和有用得多 委托是一种引用类型 它持有方法 的签名 应用程序可将符合这一签名的任何方法赋给委托变量 当调用这种委托变量 时 相关的方法就会被调用 与d e l p h i 的过程类型不同 c j j 委托自动支持多路广播 应用程序可以将许多方法赋给一个委托变量 当调用此变量时 所有方法都会被调用 6 c j f j 使用j a v a 的简单线程同步机制 要在c j f i 中实现线程同步 开发人员只须对 关键的代码块作标志即可 j a v a 开发人员使用s y n c h r o n i z e d 关键字 而c f 开发人员使 用l o c k 隐藏的互斥块将带有标志的代码块包装起来 在任一时刻只允许一个线程执 行这段代码 除了关键字不同之外 这一机制在c 撑和j a v a 中是完全相同的 因为线 程所有编程任务最容易出错的一种 对同步进行简化的任何特性都有助于快速应用程 序开发 7 显式的重载声明 c 使用显式的重载声明来支持r a d 显式的重载声明通过 保护类的方法名称空间并指出意外的命名冲突来支持快速应用程序开发 除了对r a d 的强大支持外 c j f i 还必须致力于其他重要的开发需求 这些需求包括跨平台部署 访 问平台固有的资源和对c o m 和 n e t 平台的支持 跨平台部署 c j f i 以j a v a 解决这一问题的相同方式解决了跨平台部署的问题 c 撑编译器生成由 n e t 运行时解释的字节码流 运行时组件的工作方式与j a v a 虚拟机 十分类似 应用程序可以部署到已安装了 n e t 运行时的任何设备上 应用程序对平台固有资源的访问 与j a v a 虚拟机不同 n e t 运行时允许程序 访问平台固有的资源 例如 一个c j f i 程序可以利用w i n d o w sa p i 作为w i n d o w s 上全 功能的应用程序运行 通过使用w i n d o w sc e a p i 子集 同一个程序也可以在p d a 上 运行 当然 并不是应用程序预期的所有服务都可在所有设备上获得 因此在所有目 1 0 第二章相关开发技术 标平台上测试软件是开发人员的责任 如有必要 开发人员还可以编写特殊情况的代 码 那将使系统在缺少所需的服务时仍能够工作 支持c o m 和 n e t 为了支持c o m 和 n e t 平台 c 包含一种称为特性 a t t r i b u t e 的独特语言特性 一个特性实际上就是一个c j f i 类 它通过修饰源代码来 提供元信息 特性使c j f i 能够支持特定的技术 如c o m 和 n e t 而不会干扰语言规 范本身 2 2 4s o ls e r v e r 数据库 s q ls e r v e r 是 个全面的 集成的 端到端的数据解决方案 它为用户提供了一 个更安全更可靠和更高效的平台 通过全面的功能集 与现有系统的互操作性以及对 日常任务的自动化管理能力 s q l s e r v e r 为不同规模的企业提供了一个完整的数据解 决方案 数据库设计的基本原则是在信息服务系统总体方案的指导下 各个库应当为它所 支持的管理目标服务 在设计数据库系统时 应当重点考虑以下几个因素 1 数据库必须层次分明 布局合理 2 数据库必须高度结构化 保证数据的结构化 规范化和标准化 这是建立数据 库和进行信息交换的基础 数据结构的设计应该遵循国家标准和行业标准 尤其要重 视编码的应用 3 在设计数据库的时候 一方面要尽可能地减小冗余度 减小存储空间地占用 降低数据一致性问题发生的可能性 另一方面 还要考虑适当的冗余 提高运行速度 和降低开发难度 4 必须维护数据的正确性和一致性 在信息系统中 多个用户共享数据库 由于 并发操作 可能影响数据的一致性 因此必须用 锁 等办法保证数据的一致性 5 设定相应的安全机制 由于数据库的信息对特定的用户有特定的保密要求 安 全机制必不可少 采用s q l s e r v e r 2 0 0 0 数据库管理系统 可以在a s p n e t 页面中通过两种方法执 行s q l 语句 在页面的代码中自动执行语句 或是把s q l 语句封装到存储过程 然后 在页面中执行存储过程 存储过程 可以将一条或多条s q l 语句预先写在s q l 数据库中 并给它建立一 名称 当需要执行时 只要向s q l 数据库传入这个名称即可 s q l 数据库会自动执 行其中的全部命令 9 1 使用存储过程的好处如下 1 0 1 1 构建存储过程要比直接在页面上执行s q l 语句稍微复杂一些 但是利用存储 过程的优势可以提高应用程序的性能和可维护性 北京化t 大学硕 学位论文 使用存储过程可以在一个存储过程中封装多条s q l 语句 并把它们当成一个 语句组执行 比如 可以创建一个包含多条s q lu p d a t e 语句的存储过程 这样一次 就可以更新多个数据表中的记录了 使用存储过程执行起来比s q l 语句快得多 因为它在第一次执行时编译并优 化 以后再执行时就可以使用内存中的版本 而使用s q l 语句 每次执行时都要编 译并优化 减少网络流量 一个需要数百行s q l 语句的操作由一条执行过程代码的单独 语句就可实现 而不需要在网络中发送数百行代码 如果调用存储过程 将s q l c o m m a n d 的c o m m a n d t y p e 属性指定为s t o r e d p r o c e d u r e 的c o m m a n d t y p e 这样通过将该命令显式标识为存储过程 就不需要在执行之前分 析命令 1 2 第二三章信息榆索技术 第三章信息搜索技术 3 1 信息搜索的研究目的和意义 随着计算机的普及和互联网的迅猛发展 大量信息以电子文档信息出现在人们面 前 绿色贸易标准法规的相关电子文件更是数不胜数 因此 要想从如此海量的信息 中找到满足需要的信息无疑是一项极富挑战性的工作 显然 仅靠人工搜索和提取 其操作过程将非常繁琐 并且速度和效率也极低 信息质量也得不到保证 常规的信 息检索是基于关键字进行的 在这种检索方式中 信息的活动往往是被动的 必须有 用户的参与 获取的信息比较繁杂 不能体现个人兴趣 所以 无论是个人还是企业 都都面临一个严峻的问题 如何快速 准确地从w e b 页上获取所需信息 解决人们 获取知识的困难 迫切需要一些自动化的工具帮助人们迅速找到真正需要的信息 这 就是信息检索的任务 信息检索技术是互联网最基础 最核心的技术 一个搜索引擎 就是一个信息检索系统 它掌控者人们从信息海洋中获取有用信息的路径 信息检索 作为绿色贸易法规信息服务系统的一项重要补充功能 对系统的用户来说无疑具有重 要意义 3 1 1 提高信息获取的准确率 信息检索 1 2 i n f o r m a t i o nr e t r i e v a l i r 是指从大量的文档集合中找到与查询请 求相关的 恰当数目的文档子集 当前的网上信息检索主要通过搜索引擎来实现 其 效果远远不能令人满意 统计数据表明 l3 1 在互联网用户经常使用的网络服务中 搜 索引擎仅次于电子邮件 但对搜索引擎使用的满意程度并不高 正是由于信息急剧的 增长 使得人们在获取知时变得越来越困难 即信息获取的准确率不高 就拿绿色贸 易法规的相关网站来说 虽然多少都提供了标准法规的搜索功能 但它们搜索返回的 结果往往与用户的期望结果相差甚远 对于多数用户来说 在w e b 上寻找自己需要 的信息就如同在大海中捞针一样困难 因此一方面呈现出来的信息的超载 而另一方 面呈现出来的则是信息的饥饿 其原因是当前的检索着重于检索文档中显示存储的字 词 检索系统一般返回太多的结果以至于用户无法逐个浏览 而且检索的准确率很低 不能满足用户的需求 因此 提高检索的精度和效率 改善检索结果的组织 将使信 息检索发展到一个新水平 北京化t 人学硕 1 j 学位论文 3 1 2 适应个性化信息检索的需求 在张扬个性 倡导创造性的现代社会罩 个性化服务更是倍受人们的关注和青睐 对于绿色贸易法规信息服务系统的用户来说 由于各企业的实际情况不一样也导致不 同的用户对于标致法规信息的需求不一致 个性化信息这个概念可以从两个角度分析 第一 个性化信息是指反映人类个体 特性的一切信息 这些信息包括了这个个体的一些属性的描述 第二 个性化信息是 指由人类特性所决定的其对信息的需求的一种信息组合 以用户为中心的信息检索 主要是研究用户的行为 理解他们的主要需求 根据这些需求改进和完善检索系统的 组织和操作 向用户主动 准确地提供所需信息 3 2 信息检索的发展与现状 3 2 1 信息检索的发展 为了获取和使用信息 人们开始有目的地组织信息 于是在图书中出现了目录 随着查找信息需求的发展 又出现了一种从一些词和概念指向相关信息或文档库的指 针 即索引 i n d e x 索引也是现代信息检索系统的核心 随着计算机技术的发展 出现了利用计算机来自动建立大规模索引的方法 2 0 世纪8 0 年代到9 0 年代w w w 开始流行起来 网络信息检索开始受到重视 它将传统的全文搜索系统搬上网络 利用搜索程序进行信息的搜索 其中的核心技术 是有着几十年历史的i r 系统 5 0 年代末l u h n 提出了自动抽词的思想 引 奠定了自 动标引的理论基础 s a l t o n 在五六十年代就开始了对i r 的理论研究 他提出了信息检 索的框架 即用排文件法存储和向量检索理论 用t f i d f 和向量空间法进行索引 用 余弦法则进行r a n k i n g 和一套利用查准率和查全率进行系统评价的方法 并成功地应 用于s m a r t s y s t e mf o rm e c h a n i c a la n a l y s i sa n dr e t r i e v a lo f t e x t s s m a r t 实验系统 这 些系统依然是i r 研究的基础 z w r a s 利用格与布尔代数理论建立了代数模型 8 0 年代s a l t o n 又建立了扩展布尔检索模型 m a r o n r o b e r t 等在六十到八十年代先后建 立了三个概率检索模型 8 0 年代末 麻省大学的布鲁斯 克罗夫特根据他提出的概率 模型设计了i n q u e r y 系统 在t r e c t e x tr e t r i e v a lc o n f e r e n c e t r e c 的测试中成绩最 为突出 最近的二十年 专家学者则更对致力于信息检索系统的评价方面 例如2 0 0 3 年孟涛提出的搜索引擎信息检索评价模型 2 0 0 4 年f a z l i 等提出搜索引擎的自动性 能评价方法 l6 j 等 1 4 第三章信息检索技术 3 2 2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论