知识产权管理ArchIPat系统_第1页
知识产权管理ArchIPat系统_第2页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、知识产权管理 ArchIPat 系统为分析竞争对手的专利情况,获得风险信息并洞察公 司创新资产的整体价值,决策者可利用全文专利数据库检索 专利进行分析, 全文数据库可较快获得全球专利数据, 因此, 先进的检索工具是必须的,用户通过检索工具可以检索到需 要的数据进行有效地分析,因此,对检索到的大量数据便产 生一种需求,用有效的工具将检索到的数据转化为决策者需 要的市场信息。Archlpat 系统已由里雅斯特学院的一个研究小组开发, 知识产权管理 ArchIPat 系统可以将检索到的数据转化为市场 信息,有助于决策者进行市场监控和在特定的领域建立更广 阔的专利信息框架。知识产权管理 ArehIPa

2、t 系统框架的重点在数据类型管理 上,专利可被界定为结构化信息 (如申请号,分类等 )、非结 构化信息 (如说明书摘要、说明书等 )和附图 (如说明书附图、 图片等)。知识产权管理 ArchiPat 系统采用数据关系结构管理 模式,具有以下优势;加强著录项目之间的联系;把文本数 据置于上下文中;在一个特定文档区域中快速检索信息:使 整个专利文档转化到所需的文件格式,只需创建一个包含专 利数据的 XML 文件。如图 1 所示的知识产权管理 ArchlPat 系统框架反映了实体和专利文档特性之间的关系,使用知识产权管理 ArchlPat 系统可以检索文本和著录项目的数据,该知识产权管理 ArchI

3、Pat 系统的核心是一个关系型数据库, 能够支持常用的 数据库管理系统 (DBMS) 。图 1 中的知识产权管理 ArchIPat 系统包括以下子系统关 系型数据库管理系统(RDBMS),用于存储和管理数据;专利 文档下载系统(DownLoad)和文档理解系统(Document UnderstandingSystem)。将存储在关系型数据库管理系统中的 专利文献提取不同的领域和有意义的信息进行语义分析;信 息检索系统 (InformationRetrieval) ,用来检索信息;数据 /文 本挖掘(TM)系统,用于分析收集信息。子系统是原始模块 (如数据库结构、 信息提取算法, 数据 挖掘算法

4、和系统接口 )及商业产品的集合, 通过这些子系统可 以使用户获得所需的信息。首先,建立专利文献集合,专利文献集合包括系统之外 提供者提供的信息、专利文档下载系统,文档理解系统和知 识产权管理ArchIPat 数据库,用户在检索时通过知识产权管 理 ArchIPat 界面选择合适的数据库进行专利检索,提交的查 询可以是一般查询 (如查询从特定日期所有的专利申请)或具体查询 (如查询某一特定日期由特定公司申请的专利和特定 的国际专利分类号 ),检索到对比文献的准确性取决于提交的 查询条件。其次,通过对数据库进行检索,用户可获得并在线下载 需要的专利文献,该检索结果存储在系统数据库中,当用户 选择在

5、线下载所列出的专利文献时,文档理解系统运用信息 提取算法自动识别和提取不同字段 (发明人,申请人、 摘要等 ) 的专利文献并将其存储在数据库表中,这种算法是基于规则 算法和模型的结合,通过建立专利文献集合,用户可获得所 需的专利信息。为了对专利字段的文本进行分析, 有效地进行数据 / 文本 挖掘(TM),最后有必要对数据库表中的文本信息进行预处理, 该预处理包含了若干语言处理技术,满足信息检索和数据挖 掘系统,知识产权管理 ArchIPat 系统采用反向索引技术预先 对文本数据进行语言上的处理,知识产权管理ArchIPat 系统产生两种不同类型的索引:正文索引和主题索引,正文索引 考虑文档的整

6、个文本和每个文字,基于文本信息来进行检索; 主题索引是从专利文献中提取一些指定的主题,将这些主题 链接成词库,在数据库中每条专利记录包含提取最相关的主 题,这些记录是专利数据库的基本结构。语言处理是系统自动形成的,在处理结束时,对文档进 行检索和分析,其中语言处理步骤是瞬间完成的,以便迅速 地满足用户的需要,更好地使用信息检索或数据文本挖掘 系统。使用信息检索系统时,用户能够根据专利数据库中的全 文、字段或包含一些特定字段的关键词、特定主题对专利进 行检索,使用数据文本挖掘系统用户可以获得更多隐藏在 文本中的信息,利用图形工具将这些信息表示出来。系统功能:信息检索和数据 / 文本挖掘信息检索信

7、息检索的目的是提供快捷、有效的方法,从信息集合 中找出需要的信息, 根据用户需求的相关度对检索到的对比 文献进行排序。一篇文档内容的解释涉及从文档的文字中提 取句法和语义信息,信息检索系统使用多种技术如对文字建 立索引、建模和文档分类。如前所述, 知识产权管理 ArchIPat 系统使用反向索引技术来衡量每个词在文档中的份量。知识产权管理 ArchIPat 系统具有友好的用户界面,用户 可以通过检索著录项目获得检索来的专利文献,为了获取检 索信息,用户只需使用查询列表在数据库中检索,用户根据 提交的查询将获得的专利文献或著录项目 (如发明人 )按照相 关度的顺序排序列表。在检索期间,用户提交的

8、查询和检索 结果可以进行跟踪并保存成略图形式,用户如需回顾检索历 史,只需双击相应的保存图标,专利文献的查询结果以申请 号。标题、文摘的形式呈现。信息检索系统允许用户:点击专利文献列表查看全文:点击引用图标,查看所有专利的引用文献,如果在收集的信 息中引用文献不存在,用户可从供应商那里进行检索,决定 是否下载;选择部分专利文档,点击记事图标,自动生成记 事本,并记录显亮文本;以一种理想的文件格式发送或保存: 进行专利分析,实现网络共享。著录项目数据的查询显示结果由一个共生矩阵组成,用 户可以通过图形工具浏览,例如,用户浏览一个共生矩阵, 这个矩阵代表一家企业每人每年的申请数量,它以简单直方 图的形式表示,利用此矩阵,用户可观察随着时间的推移, 申请人专利公开的趋势并浏览逐年的公开专利。这样可提供 某企业拥有专利最多者并能判断个人是否积极参与企业或 已离开。数据与文本挖掘数据与文本挖掘技术可被定义为隐含抽取,即先前未知 但可能是有用的信息数据,它包括多种技术以便确定信息是 否有用,可用于决策、预测预报、评估等领域,其中数据与 文本挖掘包含若干不同的技术方法如专利聚类算法、数据汇 总、分类规则,发现从属网络,发

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论