版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
TRS产品技术体系总体介绍1交流要点TRS总体产品与技术体系介绍TRS技术解决方案介绍(部分)企业搜索、内容管理解决方案知识管理解决方案内网门户解决方案TRS相关产品Demo演示2企业的信息管理现状企业应用系统20%80%数据仓库非结构化资源管理各种关键业务数据各种文本、图片、邮件等其他未管理但有用的各种信息缺失3TRS公司愿景和技术理念自主创新搜索整合发现海量非结构化信息处理TRS产品具有100%的自主知识产权现实世界中80%的信息是非结构化的每18个月新增的存储量等于有史以来存储量之和!企业搜索引擎让人们像使用互联网搜索引擎那样搜索复杂的企业信息内容管理技术实现对非结构化信息的全生命周期管理(采集、生产、存贮、检索、发布、利用)智能挖掘技术通过知识提取和内容之间关系的挖掘,发现内容的新价值面向全球竞争
目标是成为中国和亚洲非结构化信息处理技术的领导者。4TRS行业技术地位自主核心技术搜索内容管理文本挖掘的知识管理国家科技进步二等奖为全文检索和非结构化数据库第一品牌中文内容管理的首倡者国内内容管理市场占有率第一覆盖从内容采集、创建、传递到分析完整的内容全生命周期管理在多次权威评测中名列前茅率先实现文本挖掘技术的产品化和实用化5TRS市场地位
2007年中国企业搜索市场主力厂商份额结构2007年中国内容管理市场主力厂商份额结构
2007年中国Web内容管理市场主力厂商份额结构企业搜索软件第一名Web内容管理软件第一名主要竞争对手均为国际知名大厂商
数据来源:赛迪顾问2008,36TRS产品架构总图7公司业务和主要产品应用领域产品类别文本挖掘全文检索内容管理核心技术结构化信息(20%)非结构化信息(80%)数据库Oracle/SQLServer/DB2/…置标信息XML/网页邮件/群件/即时消息/…Domino/SharePoint/…格式文档TXT/Office/PDF/PS/音视频/…纸质资源公文/报告/图书/…业务应用系统OA/ERP/CRM…互联网/内联网专有电子资源光盘/期刊…桌面数据信息源细分市场网站及内容管理市场企业及垂直搜索市场文本分析与挖掘市场知识管理和门户市场内容管理软件企业搜索软件互联网信息服务文本挖掘软件知识管理与门户信息类型主营业务与目标市场关系图企业内容管理电子政务知识管理企业搜索互联网垂直搜索舆情监控门户网站群数字媒体竞争情报数字图书馆8TRS主要产品列表企业搜索相关产品TRSDatabaseServer、Cluster、API、GateWayTRSWAS、TRSCDS内容管理相关产品TRSWCM、TRSEKP门户及应用整合相关产品TRSPortal、TRSIDS互联网信息服务相关产品TRSInforadar、TRSCIS、TRSOM文本挖掘基础产品TRSCKM知识挖掘工具包9企业信息化相关解决方案企业搜索解决方案网站内容管理解决方案企业知识管理解决方案企业内网门户解决方案10TRS企业搜索解决方案WorldResearchBlogsNewsProductsTheWebImagesPrintContentEnterpriseFileSharesEnterpriseApplicationIntranetSecureContentDatabasesContentMgmtCRMCorporateWebSiteSpreadsheetsDesktopPresentationsReportsIMChatsDocumentsWebPagesEmail搜索的对象与范围12应用场景互联网搜索垂直搜索服务企业内部统一检索服务某系统内部全文检索服务13TRS企业搜索总体架构数据库Web应用文件系统多媒体邮件系统Notes等系统检索入口数据库网关网络雷达文件采集邮件采集Notes等网关扩展采集统一身份及单点登录智能分析与挖掘自动分类聚类分析关联分析排重分析分类汇总知识发现拼音检索语义分析全文检索引擎索引库存储全文检索引擎检索集群服务用户权限服务关键词检索语义检索高级检索结果命中结果排序14
软件技术架构15TRS搜索引擎集群架构16TRS搜索集群扩展机制17搜索引擎接口体系18基于自然语言特点的索引策略(中文)汉语分词及字词混合索引采用语料统计的机器学习方法+歧义规则实例知识库的汉语分词解决方案,切分正确率达到99.1%。由于汉语分词不能达到100%准确,所以中文检索系统需要提供一种索引方式(字词混合索引),保证一定查准率的同时提供100%查全的手段。为了兼顾中文检索的查全和查准,索引程序也要做适应性调整。国外检索产品只是简单地内嵌一个好的分词软件并不能解决问题(英文)
英文词根英文词根采用”词典+算法”结合的解决方案,准确率达到99.999%。支持中英文以及其它几十种主流语言的混合检索。19支持各种检索高级应用组合检索以及属性字段检索和全文检索的联合查询各种逻辑表达式检索提供了多达48种检索运算符多字段相关性排序支持相关性排序,并且可以设置文档的不同字段以不同的权重,提升关键字段的权重分类汇总检索结果的分类统计,支持用正则表达式来筛选分类统计的目标字段值,并支持抽取部分子串组成新的类别。20检索的智能语义扩展语义分析检索提供基于短语、句子、段落的模糊检索
英文大小写敏感检索、中文简繁体扩展检索。支持简繁扩展检索,且简繁对照是基于词语级语境的,例如:恢复复员报复复议:恢復復員報復復議
复杂复查复制重复:複雜複查複制重複
检索时能够应用同义词典和主题词典进行扩展检索,并且词典可维护拼音检索、相似检索21技术性能优势实时动态索引
索引空间膨胀率小,一般在100%内。
提供分布式检索和负载均衡集群,以及二级集群。千万级数据秒级响应支持主流的开发平台,提供CAPI、JavaBeans和ADO.NET二次开发接口。22企业搜索应用举例:搜索的应用集成检索结果的展现,建议先作检索结果汇总的展现
点击进入各系统结果界面展现具体列表可以避免异构数据在统一界面展现的繁琐23结果的智能化组织热点词自动追踪用户搜索行为掌握用户搜索热点相关文章推荐1、利用TRSCKM的关键词抽取+TRSlike函数检索实现
对于所有文章抽取5个关键词,作为另一个字段存储,每次取得文章后根据关键词进行如下检索:keyword=like(‘本文关键词’,60)。2、可以根据关键字定义相关检索结果
同音字推荐搜索24结果的智能化组织信息来源标注,帮助用户迅速判断文档是否所要相关短语1、预置数十万的主题词库提供关联2、提供用户检索关键字自动采集、关联相关度模型cosine向量空间模型简单讲:1、根据关键字在文章出现的频度自动匹配2、关键字与主题的相关性3、剔除贡献较小的虚词、助词等25结果的人性化展现26TRS内容管理解决方案TRSWCM简介TRSWCM是TRS内容管理产品家族中的核心成员国内首款基于SOA架构的内容管理平台产品可以轻松创建内部门户、外部门户、媒体门户、信息共享平台、组织工作协作平台等等TRSWCM的功能集成文字库、图片库、视频库、资源库,四位一体,构成业界最为强大、完善的内容管理应用平台;集成强大的工作流引擎与基于表单的网上办事功能,突破并丰富了内容管理内涵扩展提供内容评论、问卷调查、智能处理、在线访谈、博客、广告管理、可视化模板等的即插即用的功能选件,极大扩展了内容管理外延全面支持Web
Service,具有灵活的扩展集成应用与二次开发功能系统与TRS全文检索、信息采集、信息分发、单点登录等产品无缝集成应用,为用户提供最为完善、先进的内容管理解决方案28定位:一套系统实现多种应用一套内容管理平台,就可以建立外部大型站点、内部信息门户、内部办公平台,部署不同的内容管理应用。TRSWCM外部网站内部门户办公平台通讯平台29网站群的管理模式30TRS知识管理解决方案TRS内网门户解决方案TRS产品相关演示TRSWCMDemo演示TRS检索Demo演示TRS知识管理Demo演示TRS内网门户Demo演示33TRS重点产品介绍TRSCKM产品介绍其他(根据现场要求)34TRS中文知识管理工具包(TRSCKM)主要功能是为中文文本应用提供开发工具箱。它集成了TRS公司最新推出的多项中文处理技术。工具包组成
TRS文本分类工具TRS文本摘要工具TRS文本聚类工具
TRS相似性检索工具TRS文本分词工具TRS政治常识校对工具
TRS信息过滤工具TRS相关短语检索工具TRS拼音同音检索工具调用
各功能模块均提供ANSIC和webservice标准接口,可以轻松地嵌入到各种编程环境中。目前已经被TRS网络雷达系统等多个TRS产品及项目采用。35功能模块简介自动分词
可以对文本进行分词,识别文本中的人名、地名、组织机构名等信息,是各种文本应用的基础。自动分类
可以自动地对文档进行分类,赋予文档一个预先定义的类别主题词,便于文档的组织,不需人工干预。自动摘要+主题词标引
可以提取文本的主题,自动生成文本摘要,为用户快速浏览信息提供快捷有效的方式。36功能模块简介自动聚类可以自动对文档进行归类,把内容相近的文档归为一类,并自动为该类生成主题词。
相似性检索(自动排重)
可以帮助用户检索与给定文档相似的文档,可以应用于文档查重等诸多领域。(政治)常识校对
可以对文章中敏感的政治内容进行校对,是审稿,校对过程的有效工具。37功能模块简介自动过滤
识别和过滤各种有害文本信
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年电力金具合作协议书
- 冷藏库租赁合同书
- 办公场所租房协议
- 广西汽车租赁合同范本汽车租赁合同范本
- 2025年其他未列明建筑服务项目建议书
- 2025年太阳能热发电系统项目发展计划
- 八年级道德与法治下册第三单元人民当家作主第六课我国国家机构第3框国家行政机关教案新人教版
- 2025年医用X射线增强电视系统项目建议书
- 2024年酒店餐饮行业临时工劳动合同范本3篇
- 2025年河北货运从业资格证考试新规
- 马克思主义基本原理+2024秋+试题 答案 国开
- 苏州大学《线性代数与解析几何》2023-2024学年第一学期期末试卷
- 《地震灾害及其防治》课件
- 2023年深圳市云端学校应届生招聘教师考试真题
- 店铺三年规划
- 2024年版电商平台入驻商家服务与销售分成合同
- 蜜雪冰城合同范例
- 2023年国网四川省电力公司招聘笔试真题
- LPG液化气充装站介质分析操作规程 202412
- 养老院环境卫生保洁方案
- 2023-2024学年广东省深圳市龙华区六年级上学期期末英语试卷
评论
0/150
提交评论