拓尔思语义智能领军者大数据+AI双轮驱动打开公司广阔空间_第1页
拓尔思语义智能领军者大数据+AI双轮驱动打开公司广阔空间_第2页
拓尔思语义智能领军者大数据+AI双轮驱动打开公司广阔空间_第3页
拓尔思语义智能领军者大数据+AI双轮驱动打开公司广阔空间_第4页
拓尔思语义智能领军者大数据+AI双轮驱动打开公司广阔空间_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

拓尔思-语义智能领军者大数据+AI双轮驱动打开公司广阔空间1对标Elasticsearch,公司搜索引擎数据库有望加速国产替代1.1大数据时代,搜索引擎数据库迈入快速发展阶段1.1.1搜索引擎数据库专注信息检索,解决大数据时代信息复杂关联问题搜索引擎数据库是一类专门用于数据内容搜索的非关系数据库。搜索引擎数据库使用索引对数据中的相似特征进行归类,并提高搜索能力。搜索引擎数据库经过优化,以处理可能很长、半结构化或非结构化的数据,它们通常提供专业的方法,例如全文搜索、复杂搜索表达式和搜索结果排名。搜索引擎的本质是根据用户的输入完成分词匹配。搜索是以token词为最基本的搜索单元,一个搜索语句经过搜索引擎的分词器会产生几个token,利用分词去构建对应的倒排索引,在用户搜索的时候,搜索对应的分词器分出的一个token时和索引中所存储的一个分词找到需要的文档。这种索引方式不需要去遍历所有的文档,而只需要遍历索引词,即可以满足对应的效果,大大提高了搜索速度。目前国外厂商占据搜索引擎引擎数据库行业领先地位。目前全球范围内主要全文搜索引擎有:Lucene、Elasticsearch、Splunk、Solr。其中Lucene是一个开放源代码的全文检索引擎工具包,不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,ES和Solr均基于此架构。根据DB-Engines的排名显示,Elasticsearch自2016年至今始终是最受欢迎的企业搜索引擎,其次是Splunk和Solr。1.1.2搜索引擎以全文检索技术为核心,未来满足多样化应用需求全文检索技术是搜索引擎数据库的技术源头。计算机的索引程序通过扫描源文本中的每一个词,对每个词构建索引,并指出该词在源文本中出现的次数和出现的位置,当用户检索数据时,计算机检索程序对预先构建好的索引文件来进行查找,并把检索的结果反馈给用户的检索方式。全文检索的核心技术通常包括索引建立和索引检索两个功能:

(1)索引建立:索引是指扫描源文档后建立索引文件。首先将不同格式的文档数据进行格式化,抽取其中的文本文件,然后把每一个不同的字符都保存为一个字表,并且记录下相同的字在文档中出现的所有位置。(2)检索检索:指基于预先构建的索引文件的位置匹配。全文搜索引擎通常由五部分组成:数据采集、数据处理、数据索引、数据搜索和用户接口。在结构方面,全文检索系统的核心应该具备文本分析引擎、索引引擎、查询引擎、对外接口和外层应用系统。在功能方面,全文检索系统应该具备索引建立、增量索引、索引优化、查询结果返回等功能,外层则应有各种不同的应用。目前全文检索技术主要发展方向体现在以下几个方面:

(1)智能检索:传统的全文检索是基于关键词进行匹配,常出现查全率和查准率不高的问题。在信息量呈爆炸式增长的大数据时代,利用关键词匹配的全文检索存在很大的局限性。智能检索技术中,除了分词词典外还包括同音词典、同义词典、相关级词典等,能够形成一个较完整的概念网络和知识体系,提供较为智能的知识提示。(2)数据挖掘同信息检索技术相结合:数据挖掘则主要包括分类、聚类自动摘要和相似性查询等方面,帮助用户更好地发现、组织和表示信息,通过提取知识来满足更高层次的检索需求。自动摘要技术可自动地从原始文献中摘取文章摘要,帮助用户快速对检索结果进行相关度评价;相似性检索根据文档内容特征来对与之相关或者相似的文档进行检索,可用于去重分析和用户个性化反馈。(3)垂直领域数据库:目前通用搜索引擎很难收集全所有主题的网络信息且成本较高,对于专业性要求更高的主题难以做到精确搜索。因此垂直主题的搜索引擎以其高度的目标化和专业化在各类搜索引擎中占据了一席之地。(4)分布式全文检索技术:分布式系统的本质就是网络互连的多个服务器共同处理某些任务。传统的集中式全文检索系统已经不能满足大容量数据的存储需求,数据量和访问量的爆发式增长对系统的高效率和扩展性提出了更高的要求,仅仅依靠单台服务器运行的检索服务已经很难满足要求。因此,为了提高检索效率,企业为了节省成本普遍选择通过机器组成分布式集群来满足服务器的性能要求。搜索引擎数据库潜在市场规模约450亿美元,发展空间广阔。根据IDC测算,2022年全球搜索引擎数据库的市场规模约为450亿美元,其中搜索系统、内容分析和认知/AI软件平台的市场规模约80亿美元;IT运营管理约90亿美元;大数据和分析软件(高级预测分析、空间和位置分析、非关系分析数据存储、分析数据的集成和完整性)约230亿美元;

安全分析(安全信息和事件管理、政策和合规、取证和事件调查)约50亿美元。1.2美国Elasticsearch为搜索引擎数据库龙头,应用场景丰富Elasticsearch

(ES)是一个伴随着大数据存储以及快速检索的需求所产生的分布式、可扩展、实时的搜索与数据分析引擎。ES使用Lucene搜索库作为其核心,又同时避免了Lucene复杂的操作方式,能够存储结构化和非结构化的大数据,并且实现对其存储数据的全文检索,速度达到毫秒级。它还包括了结构化搜索、数据分析、复杂语言处理、对象间关联关系等内容,可以通过数据建模在生产环境中配置和监视大数据集群。其特色包括:1)分布式的文件实时存储工具,并且保证每个字段都能被索引和检索;

2)分布式的实时搜索引擎,并具备数据实时分析功能;3)可拓展到上百台服务器,处理PB级别的结构化或非结构化数据。非结构化数据量的爆发式成长,叠加信息检索准确度需求增加,驱动Elasticsearch业务快速成长。从数据结构角度看,web2.0时代非结构化数据量的爆发拉动了对非关系型数据库需求,极大提高了系统对数据库高并发读写、可扩展性和高可用性的要求。此外,在对海量数据存储和访问效率上方面,传统的关系型数据库也难以满足需求。根据浪潮信息

数据,非结构化数据自2015年开始呈几何倍数增长,包括HTML、JSON、文档、图片、音视频等形式,预计未来还将加速爆发。Elasticsearch在信息检索性能上相比数据库自身的搜索功能优势显著。功能上,数据库的首要目的是存储数据,其自身的模糊搜索功能没有索引,无法实现对搜索词的逻辑及范围搜索,因此无法对查询条件进行延伸分析。而对于搜索引擎和搜索引擎数据库来说,全文检索才是目的,因此其更关注信息搜集和关联等能力,灵活度也更高,在检索时无需精确的数据结构,可以对查询条件进行延伸解析,比如近义词和联想等功能。目前,Elasticsearch实时全文搜索引擎框架已经被广泛使用。GitHub使用Elasticsearch对超过1300亿行的源码进行检索,并且用户量和数据量还在持续增长;维基百科使用Elasticsearch对PB级数据实现了全文检索、高亮展示关键词、针对输入的关键词进行搜索建议等功能;英国卫报使用Elasticsearch来处理海量访客日志,并实时把公众对文章的看法反馈给编辑;StackOverflow通过使用Elasticsearch把全文搜索、地理位置和其他相关信息进行结合,实现more-like-this功能。1.3搜索引擎数据库国产替代进程加速,公司行业积累深厚产品优势显著1.3.1数据安全要求加速数据库国产替代,公司G端客户比例较高有望率先受益数据库是我国信创重点,数字安全法出台将加速国产替代。2021年是我国数据安全的政策元年,2021年9月我国第一部数据安全的专门立法《数据安全法》正式出台,《个人信息保护法》于同年11月起正式施行。从国家层面,未来各监管部门将加大对数据安全监管力度。从企业层面,数据安全责任也将从过去被动地接受机构风险监督,逐渐转向主动合规建设。根据Gartner报告,数据库的高技术壁垒导致Oracle、IBM、微软等海外大厂长期霸占数据库市占率排行的前几名,我国数据库产品的市占率虽然在过去十几年间有了大幅提升,但仍然于海外大厂产品有着较大差异,国产化率相对较低,属于重点关注领域。公司政府客户比例高且信息敏感度高,有望率先受益于国产化需求。从1985年开始,公司前身依托自身在中文检索领域的专业优势便开始为人民日报社提供新闻资料检索系统服务;公司于1995年搭建了数据库服务器并开始为新华社服务。公司的检索产品很早完成了政府客户的验证流程,具备了先发优势。公司自04年开始,陆续为国家知识产权局、国宝局等优质国家机构提供企业搜索服务,并且开始覆盖金融、能源、公共安全等涉密领域,涉及公安、军工客户。2021年公司政府及公共安全业务收入占比达到58.81%。公司深耕语义智能赛道,处于行业领先者地位。根据IDC数据显示,2021年我国语音语义市场规模达21.7亿美元,其中科大讯飞占据13.7%的市场规模位居第一。公司以2.9%的市场份额占比位居第四,考虑语义智能相比于语音智能,结合了语言理解、知识获取等更高级别的人工智能技术,未来发展空间广阔。自然语言处理市场预计未来几年内保持高增长速度,到2030年是市场规模有望突破2000亿。随着NLP技术在金融、政务、教育、医疗等诸多行业应用落地的加速,预计未来中国NLP市场规模将加速成长。根据赛迪研究院预测,2022年相关市场规模约为174.5亿元,并在未来几年内保持约36.5%的复合增长率,预计到2030年,我国NLP市场规模将突破2000亿,达到2105亿元。1.3.2公司实现搜索引擎数据库核心技术自主可控,满足信创和国产化替换需求公司信创生态完备,数据库核心技术自主可控。公司多次被大数据相关产业联盟评为领军企业,深度参与到中国数据库标准制定。产品方面,公司海贝数据库是目前国内少有从底层数据收集,到分词和索引算法,以及储存技术的国产数据库引擎。其核心代码自主率达到100%,且通过多家国家机构认证,可彻底摆脱对Elasticsearch和Lucene等国外数据库的技术依赖。在大数据领域,拓尔思突破异构数据对大数据搜索引擎的限制,为索引数据加密提供全方位安全保障,实现了文本、图像特征、二进制的统一索引和跨数据类型跨语言的检索,并采取最新的集群技术提高了可支持的数据规模和多用户并发检索性能,为数据安全和信创领域应用提供全面保障。2021年公司基于技术突破迭代创新推出了TRS海贝大数据管理系统V9.0、TRS数据中台等核心产品。同时公司研发完成了面向云原生支撑的技术中台和AI驱动的数据中台,推出了TRS数星智能风控大数据平台、TRS数家开放服务平台、TRS网察大数据分析平台等SasS数据智能服务平台产品。公司海贝大数据搜索引擎产品在自主可控、数据安全、综合能力等层面均具备显著优势。产品支持所有数据类型,功能完备,安全可靠,兼容ES常用接口,对接主流生态,具备良好的产品力,未来有望在信创浪潮下实现国产化平滑替代。1.4公司持续延伸大数据业务新场景,知识产权业务有望贡献新增量1.4.1专利处理需求快速成长创造专利代理市场广阔空间,NLP技术应用前景可期国家政策层面支持发展知识产权行业,中国专利申请量持续成长。2021年国家提出

“知识产权强国战略”,力图实现从“中国制造”到“中国创造”的创新驱动转型。通过

《知识产权强国建设纲要(2021-2035)》以及《“十四五”国家知识产权保护和运用规划》等纲领性文件,未来中国知识产权发展将致力于实现知识产权“得到更好保护”、“形成更好市场价值”、“发挥更强经济支撑”、“具备更强影响力”的发展目标,成为真正的“知识产权强国”。中国专利申请量于2011年跃居全球第一,并在近几年内保持快速增长态势,2021年中国专利申请量达到495.7万件,2008-2021年间复合增长率达到18%。根据世界知识产权组织数据,中国2020年发明、实用新型和外观这三项专利的申请总量分别达到149.71万件、292.7万件和77.0万件,同比增长6.9%、29.0%和8.3%,均显著高于全球增速。预计未来几年中国专利数量仍将保持快速增长,并将成为拉动经济增长不可或缺的力量。专利申请数量快速成长拉动知识产权代理市场需求。知识产权代理是指代理当事人处理知识产权事务的行为,主要包括国内外专利代理和商标代理、版权登记代理。专利代理的业务范围包括专利申请、专利诉讼、专利战略布局、专利咨询等方面的业务内容。国家政策支持叠加制度不断完善,知识产权代理业务迅速发展。根据共研网数据统计显示,2021年中国支持产权代理行业市场规模约为511.89亿元,并预计2022年市场规模将超过600亿元,未来将伴随着知识产权市场的成长而保持较快增长态势。专利代理机构数量快速增长。国家知识产权局数据统计显示,截至2021年底,我国专利代理机构数量达到3934家(不含港澳台地区),执业专利代理师达26840人,行业发展势头迅猛。专利为各科技创新赛道提供高情报价值,专利信息检索查询创造新需求。在生物、新材料、新能源等高新科技领域,企业依赖专利情报所提供的重要价值,专利工作支撑企业研发创新成为近年来专利工作的重要价值探索。对于专利代理机构来说,专利服务涉及专利信息的检索、匹配等工作,NLP技术可讲传统专利数据库中的非结构化信息转化为结构化数据,可大幅提升知识产权服务的效率提升和质量提高。1.4.2公司布局专利搜索引擎赛道,基因专利检索云服务平台有望赋能行业效率提升公司自主研发基因专利检索云服务平台,为生物技术发展创新提供有力支撑。公司联合知识产权出版社,基于生物技术领域产业发展及用户需求,在强化搜索引擎技术与数据

资源优势基础上,研发能够提供序列检索与基因专利检索的SaaS云服务系统。平台涵盖全球40多个国家和组织的生物序列相关专利数据及32个公共资源库,通过对区域创新趋势和区域头部专利申请人的分析,帮助用户识别潜在的创新者和未来可能合作的重要伙伴。公司可实现基因专利信息的结构化处理和检索结果呈现,大幅提升专利服务效率。公司基因专利检索云服务平台可实现基因序列检索、专利检索、序列检索结果、序列比对等多项功能,支持融合检索及图形展示,在帮助用户分析行业发展趋势、辅助生物医学技术创新、领域研究新方向研判等场景均具备广阔应用前景。公司基于NLP核心技术积累,未来有望向专利检索领域更多细分场景延伸。除基因之外,高端制造、新能源、新材料等领域专利信息检索均存在信息非结构化、专业程度高,数据挖掘和分析难度大的特征,公司在自然语言处理领域具备技术优势,未来有望基于在基因领域的产品研发经验积累,向更多细分场景延伸。2知识图谱引导认知智能发展,对标Palantir公司成长空间广阔2.1坚持“语义智能+”为核心战略,公司AI产品应用空间广阔AI正处于弱人工智能向强人工智能发展阶段,核心为认知和理解能力的提升,NLP和CV为两大发展方向。目前AI发展处于弱人工智能阶段,在设计的程序范围内决策并采取行动,不具备独立意志且应用场景延伸性较差,代表性的有AlphaGo(围棋领域)、Siri

(语音对话)等;强人工智能则是指具有独立意志,能在设计的程序范围外自主决策并采取行动的人工智能,能帮助人们综合多方信息进行判断决策,真正提升人类的工作效率,代表性的有通用机器人、高级别自动驾驶等。语言和感知是人类思维认知的基础,也是AI发展的两大核心内容。目前AI发展有五大核心内容,即计算机视觉、机器学习、自然语言处理、机器人和语音识别,分别对标人类的感知、思维、语言理解、运动控制和交互这五大维度。目前国内外厂商在AI各方向上均取得持续进展,未来有望打开商业化空间。公司专攻语义智能赛道,是国内最早从事自然语言处理(NLP)研发的企业之一,核心竞争力显著。公司所专注的语义智能位于人工智能中的认知智能领域,即让计算机来理解人类语言或其他符号表面数据内含的确切意义,提取出信息或知识,进而进行推理、分析、决策,达到、接近或者超过人类的智慧水平。2.2对标美国Palantir,从市场规模和产品边际贡献率出发看公司成长空间2.2.1业务从G端向B端延伸,稳步发展成为知识图谱领域独角兽美国Palantir(帕兰提尔)公司,专注于大数据分析,客户从G端政府部门延伸到B端企业,逐步成长为细分赛道巨头。Palantir成立于2003年,专注于大数据分析并以此为核心,通过深入分析用户业务结构,将海量数据有机结合并挖掘数据中的价值,为决策者提供决策依据。公司分别于2008年和2016年,发布数据平台PalantirGotham和PalantirFoundry,分别面向公司的政府端客户和商业客户提供图分析服务。公司发展路线清晰,“G端-大B-小B”战略成效显著。Palantir最初为美国情报部门开发软件,以协助反恐调查和行动,客户主要为国土安全部、国家安全局、联邦调查局等政府部门,而后公司逐步从TOG向TOB拓展,客户涵盖金融、医疗、传媒等众多行业,其中不乏空中客车、可口可乐、摩根大通等全球行业巨头。公司以Gotham和Foundry两大平台为核心,持续完善行业解决方案,构建完整业务生态版图。公司基于Gotham和Foundry两大产品线拥有十余种解决方案,且两大平台分工明确,Gotham面向政府客户,而Foundry以商业客户为主。Gotham大数据分析平台建立真实世界事物特征及彼此联系,深度应用到国防、安保、反恐等政府端事物领域。Gotham的运行以多源数据为起点,包括结构化的数据(日志、财务数据报表、电子表格等)和非结构化数据(视频、邮件、文件、图片等)。Gotham可以对这些源数据进行建模,将多个数据源整合成简洁、一致的数据。传统数据建模通常围绕表单中静态的行和列展开,这种做法其实对于操作人员对数据在实际场景中的理解和应用并不友好。Gotham的厉害之处在于它在建模时已经运用了真实世界的现实事物的特征和彼此间的联系,如“人群”、“组织”等,这便大大提高了建模的灵活性,使模型有了实际意义。Gotham可以将用户数据更新实时同步,将用户行为自动记录、归因分析并存储,形成“动态本体”。PalantirFoundry起步于金融欺诈识别服务,功能模块不断扩展,应用场景日渐丰富。PalantirFoundry前身为PalantirMetropolis,最初面向企业客户尤其是金融行业的欺诈行为识别需求,后续业务逐渐拓展至36个行业,可以连接到企业数据、专业数据和公共数据集,实现数据集成、信息管理和定量分析,并发现趋势、关系和异常情况并进行预测。在后端平台,Foundry将多个来源的结构化数据整合到连贯的模型中,并对模型执行复杂计算,同时共享和迭代分析产品;在前端应用程序,它提供了一套集成的应用程序,让用户可以建立交互。从Palantir的产品可以归纳出,公司的核心优势在于对实际业务场景和数据(包含结构化和非结构化数据)逻辑的理解更深入,公司用过底层的数据关联推理和知识图谱构建,突破了人工智能在垂直领域间的壁垒,真正意义上打通了数据“上下游”之间的关系。2.2.2营收规模持续成长,边际贡献率升高彰显产品化能力Palantir年营收能力持续成长,毛利率稳中有升,支撑百亿美元市值。Palantir在2022年H1实现营业收入9.19亿美元,2018~2021年营业收入实现约37.23%的复合增长率,公司在业务成长的过程中毛利率稳中有升,2022年上半年毛利率达到78.61%,截至2022年11月18日,公司总市值达185亿美元。边际贡献率持续提升,Palantir公司产品化能力不断提升。Palantir在历次公司财报中将“边际贡献率”(ContributionMargin)作为公司的重要经营指标。边际贡献率定义为

“收入减去收入成本(CostofRevenue)、营销费用(剔除股权激励后)之后与收入的比值”。边际贡献率的提升反映出公司软件产品的前期部署流程的优化,客户的使用门槛也将降低,这将极大地有利于公司软件产品规模化扩张的能力。Palantir业务边际贡献率接近60%,公司产品化能力优势显著。Palantir产品边际贡献率在2019Q3至2020Q4实现快速增长,从15%提升至61%。公司产品化能力不断提升,有助于降低产品部署的可变成本,利于新客户拓展及公司业务向新垂直行业场景渗透。对比Palantir,拓尔思产品化仍有成长空间。由于Palantir与拓尔思财务准则上存在不一致,我们选择营业收入减去营业成本及销售费用后的余值再除以营业收入作为参考指标。经计算,公司2018-2021年这一指标从41.00%上升至50.62%,考虑往年第四季度属于公司业绩集中确认期,预计2022该指标较去年仍有提升。我们认为随着公司产品SaaS化的持续推进,公司产品的规模化盈利能力将不断增强。2.2.3业务潜在规模广阔,政府+商业端客户双轮驱动打开成长空间产品潜在市场规模超千亿,政府与商业客户发展并驾齐驱。据Palantir估计,2020年公司软件在全球商业领域和政府部门的总潜在市场规模(TAM)约为1190亿美元,其中商业领域的TAM约为560亿美元,政府部门领域的TAM约为630亿美元,而在政府部门领域,公司预计美国政府部门和国际政府部门的TAM分别约为260亿美元和370亿美元。在商业领域Palantir产品涵盖数据管理、集成和编制、应用程序开发、安全、系统和服务管理、分析和人工智能、供应链管理、企业资源管理以及内容和工作流管理领域。政府部门方面,公司客户包括美国陆军、海军和空军、美国特种作战司令部疾病控制中心等众多政府部门。标准化产品+定制化服务有望成为行业未来理想解决方案,多源数据将成为赛道玩家核心竞争力。在发展早期,Palantir也采用项目制针对每个客户提供定制化产品,后续逐渐转向构建通用软件平台,并将可复用的功能构建成为应用程序,Gotham和Foundry两大产品便是这一思想的体现。在数据处理层面,Palantir产品融合了各种不同类型的数据源,其中GothamVideo产品融合了视频数据、时间序列数据与其他标记数据,GothamGraph产品则融合调查报告、统计信息、视频、操作数据等,并最终构建成为知识图谱。2.3知识图谱应用领域广泛,有助于公司提高核心竞争力2.3.1知识图谱应用前景广阔,市场有望迎来加速发展知识图谱是新一代的知识工程技术,以NLP为底层技术,捕捉数据、信息等内容并梳理,组合成图谱形式,为AI提供知识储备。除了前文提到的专业搜索引擎外,知识图谱的主流产品形态可按通用型与垂直行业型划分,通用知识图谱强调知识广度,逐渐演变为通用互联网知识图谱,包含搜索引擎、智能推荐、智能问答等。垂直行业知识图谱强调知识深度,用于问答、辅助决策与业务分析,是支持Al大脑深度思考的知识库基础。知识图谱技术应用受行业信息化成熟度及需求影响较大,整体规模处于起步阶段,未来产品专业化和场景化趋势明确。目前知识图谱的应用逐渐从搜索引擎向各细分行业渗透,但应用受行业信息化与数字化基础、数据质量、场景明确程度、客户方需求等多因素影响,在各细分行业的渗透进程不一。互联网与金融为主要应用场景,在信创浪潮下政务、公安等有望提供市场推力,国内知识图谱市场规模有望加速成长。据艾瑞咨询数据统计,在2021年知识图谱核心市场中,金融和互联网行业占总市场的35.6%。我们认为,随着政务数字化建设的完善叠加信创浪潮,政务、公安等行业对知识图谱的业务需求会进一步扩大。根据艾瑞咨询数据,2021年中国知识图谱核心市场规模为107亿元,预计到2026年达到296亿元,2021-2026年CAGR约为22.5%。公安、金融成为知识图谱商业化应用先头阵地,公司长期布局具备先发优势。艾瑞咨询数据统计显示,公安、金融、互联网等细分行业未来几年均有望迎来知识图谱商业化应用的加速发展期,其中,由于公安、金融领域数字化和信息化程度较高,且数据挖掘需求较大,短期内有望成为知识图谱应用的先头阵地。2.3.2公司人工智能产品持续迭代提升,成为政府、金融等多行业决策大脑AI进入大数据时代,行业数据作为知识图谱的核心壁垒,公司竞争优势明显。公司从2010年开始便自主投资建设大数据中心,目前已具备数千亿数据量的数据索引、标记、查询、挖掘分析能力,万亿级数据总量的秒级检索能力,日均亿级数据获取能力。业内领先的数据分析能力支撑公司多个专业化的数据智能服务,支撑政府、媒体、金融、公安、商业等多行业用户的智能分析需求。公司安拓知识图谱平台融合大数据等核心技术,构建大规模领域知识图谱。安拓知识图谱平台融合了大数据、可视化和知识图谱相关技术,能够构建形成大规模领域知识图谱,实现知识构建管理、知识语义检索、智能文本提取、智能问答与推荐、图谱关系分析、地理空间分析等,在知识构建、知识图谱应用、领域知识图谱覆盖等方面均具有优势。目前产品已应用于政府、国家安全、公安、军事和企业等多个领域。水晶球分析师平台面向各业务领域专业分析师,支撑专项研究工作。通过TRS水晶球分析师平台,分析师可以通过平台釆集多源异构数据,形成业务领域对象结构化知识。平台提供知识浏览和编辑、对象检索、关系图分析、地图分析、统计分析等功能,可以结合时间轴、对象浏览、直方图、数据流等方式多角度探查数据。3公司业务场景持续延伸,产品SaaS化进程推动业务成长3.1虚拟人作为元宇宙核心角色,公司深度布局虚拟人“灵魂”2022年全国出台各项元宇宙政策,虚拟现实产业发展进入快车道。战新元宇宙统计数据显示,今年全国各地相继出台市级、区级元宇宙发展专项政策,对元宇宙产业发展提出针对性的指导和鼓励政策,旨在未来3~5年内构建完善的元宇宙产业生态,推动数字经济

发展,加快虚拟现实技术在各行业和场景下的商业化应用。数字虚拟人的广义定义为数字化外形的虚拟人物,其核心价值在于打破物理界限提供拟人服务与体验。随着人工智能技术不断迭代,数字虚拟人将成为虚拟世界中人机互动、人际互动的重要桥梁,解决用户虚拟环境下工作、娱乐等需求。虚拟人应用场景不断拓展,可赋能多行业领域。随着虚拟人技术结合实际应用场并形成行业应用解决方案,目前已经出现了娱乐型虚拟人、教育型虚拟人、助手型虚拟人、影视虚拟人等,虚拟人已覆盖影视、传媒、游戏、金融、文旅等领域,且可以根据用户实际需求提供定制化服务。数字虚拟人应用向多元化发展,潜在市场规模超千亿。目前虚拟人应用逐渐从娱乐化,向工具化、基建化的形式渗透,应用场景的丰富度和深度均不断提升。根据速途元宇宙研究院预测,2022年我国虚拟人整体市场规模将达到约242.3亿元,到2030年这一市场规模有望超3000亿元。我们预计未来几年内,随着NLP等人工智能技术的不断迭代,数字虚拟人经济将从目前的IP经济向人机交互发展,行业有望迎来爆发。公司依托自然语言处理与行业知识图谱技术积累,积极布局虚拟人赛道,为数字虚拟人提供“大脑”。公司与腾讯等国内顶级数字人形象团队签订战略合作协议,实现虚拟人形象与大脑的有机结合。公司虚拟数字人SaaS平台已成为客户订购虚拟数字人的全链服务平台。公司已成功注册“拓宇宙”商标,未来持续深入元宇宙领域的实践与探索。公司服务型虚拟人产品已在部分行业成功实践,未来有望渗透更多垂直应用场景。目前公司已落地了一批服务型虚拟人项目,覆盖了直播带货、智能播报、智能问答等领域,其中与广东省共建“南方乡村振兴新农人AI数智赋能平台”,定位在农产品直播内容智能创作的AIGC在线服务平台,面向农产品电商主播提供直播脚本智能创作、带货虚拟人全链租用等知识赋能服务。2022年北京冬奥会期间,公司发布虚拟人“小思”,实现自动采编、智能写稿、虚拟播报等全自动功能,通过自然语言处理、知识图谱、机器学习和音视频分析等技术,在“虚拟人代替人”进程中迈出了重要一步。签约蓝色光标,服务虚拟人率先落地。2022年2月,公司与蓝色光标达成战略合作,依托在虚拟主播、智能问答机器人、智能创作、专业领域虚拟人等方面的成功经验,结合蓝色光标在虚拟及混合现实空间营销、智能虚拟人领域的业务基础,双方将大力推动元宇宙相关业务开拓。公司将以“虚拟人+”场景为突破口,首先落地服务虚拟人,应用布局将优先面向金融、传媒、政府、营销等行业的专业服务场景。3.2人形机器人风起,公司联手赛道头部玩家入局有望受益行业发展全球“机器换人”进程加速,服务机器人市场规模稳定增长,未来人形机器人有望深入各细分消费端场景。人口老龄化趋势下全球医疗和公共卫生需求持续旺盛,叠加疫情期间大量面对面场景被无接触服务替代,接待机器人、递送机器人、测温机器人和新零售机器人等需求增加,服务机器人市场潜力巨大。全球服务型机器人潜在市场规模超200亿美元,国内市场有望迎来加速发展阶段。根据中国电子学会统计数据,预计到2023年全球服务型机器人市场规模将达到201.8亿美元,2016~2023年CAGR约为24.72%;预计到2023年我国服务型机器人市场规模将突破600亿,达613.5亿元人民币,2016~2023年CAGR约为37.87%。语音语义分析作为人机交互核心途径,帮助机器人具备听、说、理解和思考的能力。语音语义模块包含了语音识别和语义分析两部分,涉及声学信号(声源定位、语音增强等)、模式识别(声纹识别、语音识别等)、自然语言处理(自然语言理解、自然语言生成等)和语音合成等技术。小米、特斯拉相继发布商用人形机器人产品,国内外科技大厂加速布局,行业有望加速发展。2022年8月小米发布人形机器人CyberOne,搭载自研MiAI环境语义识别引擎和MiAI语音情绪识别引擎,能够实现85种环境音识别和6大类45种人类情绪识别。特斯拉发布的人形机器人擎天柱Optimus,承接自动驾驶技术,AI智能的核心Transformer架构同样是NLP领域的标志性研究成果。公司深耕NLP赛道,语义智能技术优势显著。公司在NLP、知识图谱、OCR、图像视频结构化领域均具备自主可控的底层技术并处于行业领先地位,公司未来有望依托语音语义智能交互,尤其是中文交互领域的技术优势,赋能人形机器人在知识储备、智能交互、自主决策等方面的能力提升。公司自研面向中文的智能问答云服务系统“TRS小思智能问答机器人”。公司该产品综合运用NLP、知识表示与推理等技术,通过语法语义分析、问题分类与解析等一系列处理流程,实现问题解答与人机交互,目前广泛应用于政务智能问答、企业智能客服以及金融、医疗、教育等领域的知识百科问答。公司加强与AI及机器人厂商深度合作,未来有望成为人形机器人语义智能赛道领军者。在与AI厂商合作方面,公司和北京一流科技等AI厂商共同合作研究人形机器人软件技术以及推广应用。一流科技立足于通用性深度学习标准框架的研发和推广使用,独创了自动数据模型混合并行、静态调度、去中心化和全链路异步流式执行四大核心技术,力争打造人工智能深度学习框架产品的引领者和事实工业标准。公司通过与AI厂商的深度合作,可将在自身在自然语言处理、知识图谱领域深厚的积淀与AI厂商在深度学习引擎领域的技术优势结合起来,构建机器人软件大脑,研发云端协同的AI算法框架以及面向特定领域的知识图谱技术,培育AI算法集市,设计算法模块共享、交易、分成机制,为机器人厂商提供中立、开放的软件生态并延伸应用场景。公司持续加强与国内头部机器人厂商合作。公司数字经济研究院成立机器人研究中心,和优必选、小鹏等企业进行研究和探索。优必选作为国内外领先的机器人厂商,产品在儿童陪伴、教育等领域均具备显著优势,拓尔思基于多年NLP的深厚积淀,能够进一步机器人的思考和交互能力,为用户提供更拟人化的陪伴和交互体验。3.3云和数据服务转型加速,SaaS化进程加速有望助力公司提升盈利能力公司多款产品实现全面SaaS化,云和数据业务加速发展为公司提供充足动力。2022年上半年,公司的“数家-资讯大数据平台”、“数星-智能风控平台”、“金融风险监测平台”、“网察-舆情大数据分析平台”以及“开源情报分析平台”等均已经实现了产品的全面SaaS化,未来随着公司大数据、人工智能业务在应用场景上的延伸,预计将推出更多SaaS产品,进一步提升SaaS产品收入比例。公司坚持优先发展云和数据智能服务战略,云和数据服务收入持续增长。公司2018~2021年云和数据业务收入高速增长,2021年相关收入达3.78亿元,占营业收入比例达到36.84%。在2022年经营计划中,公司明确提出支持优先发展云和数据智能服务战略,预计未来将持续保持较快增长态势。SaaS商业模式优势突出,国内市场空间广阔,公司业务转型有望打开成长空间。根据艾媒咨询统计数据,2021年中国SaaS行业市场规模达322.6亿元,预计到2023年将达到约555亿元,近几年保持约30%的复合增长率。与美国对比,头豹研究院数据显示,2020年中国SaaS行业占IT整体支出比例为1.3%,相比于2011年的0.1%大幅增长,但相对于美国2020年的5.4%仍有很大提升空间。考虑美国SaaS产业起步较早,企业数字化程度更高,未来中国企业SaaS有望加速渗透,市场规模前景可期。SaaS商业模式具备多重优势,公司加速转型有望进一步提升核心竞争力。公司加速业务云转型,整个商业模式正由销售解决方案、软件产品全面转向SaaS服务模式。传统的数字政府、融媒体等行业解决方案的生产由重建设转向重运营、重增值服务,通过叠加专业领域的数据服务,进一步深化服务能力。我们预计未来公司在专利、虚拟人、机器人等新领域业务开拓中也将采用SaaS服务模式,提升公司SaaS营收占比的同时,进一步完善业务生态,提升行业竞争力。4拓尔思,三十年耕耘成就语义智能领军者4.1深耕语义智能赛道,打造完整业务版图深耕NLP领域30年,公司发展成为国内政务领域NLP龙头厂商。公司以“语义智能+”为发展战略深耕多年,主要业务覆盖内容安全和互联网空间治理、数字政府和数据智能三大板块,向以党政机关及企事业单位为主的下游客户提供大数据检索、智能风控营销、舆情监控等服务。在数据安全领域,子公司天行网安提供数据安全传输和交换产品及服务。公司以深耕多年的大数据积累与行业领先的NLP技术成为国内政府政务领域NLP龙头,多年以来一直保持行业领先的市场地位。公司人工智能和大数据核心技术具有跨行业/领域的通用普适性,因此公司技术产品和服务所支持的业务应用落地场景众多,涵盖多个行业/领域,大型或头部企业级客户超过8000家。在具体客户应用中,公司技术产品的交付部署模式包括私有云、混合云和公有云等模式或多模式的融合,满足客户从通用到个性的完整需求。公司深耕NLP赛道三十余年,持续迭代构建牢固护城河。公司于1993年成立,坚持围绕自然语言处理技术,积极自主研发大数据和人工智能技术,具备自然语言处理领域自主可控的全产业链能力。目前公司及全资/控股子公司拥有600余项软件著作权。4.2公司股权结构稳定,核心团队经验优势丰富,研发实力雄厚公司股权结构稳定,通过收购方式进一步完善业务矩阵。公司实控人为董事长李渝勤,公司前五大股东持股比例达47.79%,其中第一大股东为信科互动科技发展有限公司,持股比例为33%,整体股权结构保持稳定。公司通过并购业务完善公司业务版图。公司于2014年收购天行网安100%股权,后者是国内最早从事网络信息安全的企业,产品应用场景覆盖公安、政府和教育等行业,此举使公司拥有行业级产品应用,为公司产品近公安领域打下了坚实基础;公司自2013年持续参股并至2018年持有广州科韵86.4%股权,后者的大数据一体化平台聚焦于公共安全和政府领域的应用。公司目前有天行网安、广拓公司、金新网银等子公司,各子公司业务布局各有侧重,支撑公司构建了完善的业务生态,未来有望持续赋能公司主营业务向更多垂直行业的细分场景延伸。公司技术人员储备丰富,研发能力突出。截至2021年末,公司在职员工合计1631人,其中技术人员达1458人,占比达89.39%。学历为大学本科及以上的员工数量达到1348人,占比达82.65%,预计公司未来通过储备高学历技术人才,进一步提升产品研发实力,推动业务向更多应用场景延伸。4.3公司营收稳健成长,费用结构合理,发展步伐坚定公司主营业务收入持续增长,未来业务扩张有望持续提升盈利能力。公司2021年实现营业收入10.29亿元,同比均有所下降,系2021年公司营业收入不再包含程度子公司2020年配套商业房产项目收入和原控股子公司奈特康赛的互联网营销收入所致,剔除上述影响后2021年主营业务收入实现同比增长31.83%,保持稳健成长。公司2022H1实现营业总收入4.25亿元,归母净利润0.74亿元,同比分别增长8.53%和36.19%。公司产品SaaS化转型有望驱动业务盈利能力进一步增强,基于公司在专利、虚拟人、机器人等领域的持续探索和布局,看好公司未来打开成长空间。公司各项费用结构稳定,毛利率与净利率有望进一步提升。2021年公司销售、研发和管理费用率分别为11.50%、9.53%和14.83%,2018至2021年各项费率保持稳定。公司2021年毛利率和净利率分别为62.13%和24.12%,近年来稳中有升,公司未来通过云及SaaS产品收入比重的持续加大,毛利率及净利率有望继续提升。4.4公司覆盖多行业优质客户,现金流保持健康公司客户优质且粘性高,行业覆盖度持续提升。公司目技术产品和服务所支持的业务应用落地场景众多,涵盖多个行业/领域,目前服务大型或头部企业级客户超过8000家。在具体客户应用中,公司技术产品的交付部署模式包括私有云、混合云和公有云等模式或多模式的融合,满足客户从通用到个性的完整需求,并且企业复购率高,客户粘性好。货币资金储备充足,公司已为新业务布局做好准备。2022Q3,公司现金储备达3.85亿元,现金储备维持健康状态。考虑公司收入集中在第四季度,且未来将持续投入开拓新业务场景,看好公司基于现金储备优势,加速新业务方面的拓展并保持良好运营状态。5盈利预测营业收入:公司是国内最早从事自然语言处理(NLP)技术研发的企业之一,主营业务包括人工智能产品及服务、大数据产品及服务和数据安全产品及服务等。公司近年来稳步发展,产品服务在政府、公安、金融、传媒等领域均具备竞争优势,2021年营业收入达10.29亿元。公司持续开辟新业务场景,未来有望将产品服务应用到知识产权、虚拟人、机器人等新赛道,我们预测公司2022-2024年营收持续提升,增长率分别为27.41%、25.48%和24.02%,对应营收为13.11亿元、16.45亿元和20.40亿元。大数据服务:根据中国信息通信研究院数据显示,2021年中国数字经济规模达到7.1万亿美元,同比增加约15.42%,且在未来几年将保持增长态势。数字化转型正由效率变革向价值变革、由企业内向产业链价值链拓展,面向实体经济的工业/产业互联网平台快速发展。公司基于自主建设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论