灼识咨询-2023中国内容发现与管理行业白皮书_第1页
灼识咨询-2023中国内容发现与管理行业白皮书_第2页
灼识咨询-2023中国内容发现与管理行业白皮书_第3页
灼识咨询-2023中国内容发现与管理行业白皮书_第4页
灼识咨询-2023中国内容发现与管理行业白皮书_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中中国内容发现与管理行业白皮书22023年3月•海外大型互联网公司基本都在其云板块中孵化内容发现与管理业务,作为•海外大型互联网公司基本都在其云板块中孵化内容发现与管理业务,作为AI技术提升应用体验的重要方向;而海外创业型互联网公司则以路线和商业模式对国内企业均具有一定的借鉴意义。业把握市场机遇提供重要参考。白皮书第一章分析了AI技术对内容发现与管理行业的变革、产业链、主要客群特征、需求偏好、行业痛点和关键成功因素。第三章主要介绍了海外内容发现与管理行业的发展历程和竞争格局,并深度分析了三家具有企业,总结其技术优势与盈利模式,为国内相关企业提供参考。•随着数字化程度的快速提高和智能技术的迅速发展,内容发现(AIDC)与内容生成(AIGC)逐渐发展为内容产业的重要方向和应对国家AI技术加速迭代等,都为内容发现与管理的产业化和成长性提供了强劲的驱动力。预计未来五年内容发现与管理产业规模将超700亿元人民币,年均复合增长率高达40.8%。OpenAI出的ChatGPT已初步验证大规模预训练模型对内容处理的有效性,内容智能处理的技术能力出现了质变和突破,解决了过、训练成本高、使用场景窄和不能满足内容场景灵活多变、高精度、高质量等需求的痛点。内容发现与管理行业在搜寻、内容风控、,行业潜力爆发则主要依赖于AI技术的突破和创新。从内容发现与管理行业的市场格局来看,国内产业玩家类型多元,专注不同细分赛道,在长期研发和行业经验积累的基础之上占据大量客依托AI大模型技术、模型工程化能力以及行业知识,分别在内容识别、内容风控、跨模态模型等方向取得重要进展,提供内容丰富、技术词附录AIArtificialIntelligence人工智能,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学AIGenerated/DiscoveredContent人工智能生产内容是继PGC、UGC之后的新型内容创作方式,智能发现内容是人工、数据库、搜索引擎等传ApplicationProgrammingInterface应用程序接口,主要目的是提供应用程序与开发人员以访问一组例程的能力,而又无需访问源码,或理解内细节CVComputervision、视频和其他视觉输入中获取有意义的信息,并根据该信息采取行动或提供建议。FileTransferProtocol文件传输协议,是用于在网络上进行文件传输的一套标准协议,允许用户以文件操作的方式(如文件的增、删、改、查、传送等)与另一主机相互通信NaturalLanguageProcessing按照技术实现难度的不同可分成简单匹配式、模落理解式三种类型OpticalCharacterRecognition模式确定纸上打印的字符的形状,然后用字符识别方法将形状翻译的过程OccupationallyGeneratedContent产内容,通过具有一定知识和专业背景的行业人士生产内容,并领取相应报酬ProfessionalGeneratedContent主化、社会关系虚拟化UserGeneratedContent将自己原创的内容通过互联网平台进行展示或者提供给其他用户Web3.0Web3.0是基于区块链技术建立起来的互联网生态系统,具备区块链去中心化、分布式、共享共建的特点1212AI大模型带来内容发现与管理产业的巨大变革局分析3解决了过去算法模型使用门槛高、场景下训练成本高、质量偏低,不能满足真实内容场景中的灵活多变、高精度、高质量等痛点GPT-1ALBERTXLMMm100PT型无需大规模标注、无需结解决了过去算法模型使用门槛高、场景下训练成本高、质量偏低,不能满足真实内容场景中的灵活多变、高精度、高质量等痛点GPT-1ALBERTXLMMm100PT型无需大规模标注、无需结型构建AI系统的新范式ChatGPT已初步验证预训练模型的效果,引发了AIGC。AIDC能力的质变,生产与创造精准模拟现实世界以及人类感官综合体系的核心,大型预训练模型的发展使得跨模态逐步成熟,AI在文字、视频、图片等模态之间的识别与转换生成能力正快速提高AI高效的发现并管理数字内容分类,预测等任务结构等•对人脑学习过程进行Transformer•开始模仿人脑进行大的进步是指导现代机器学习的(ML)进步络的成熟,使内容表示和调用的方式直接跨越为高度自然的阶段,大大提高了机器发现和生成内容的能力AIAI改变数字内容的生产模式在学习归纳数据分布的基础上,学习的模式,并创造数据中不存新样本•在分析式AI技术基础上诞生大型Transformer网络,Diffusion等新模型发现与分析17•17•根据一定范围的数的少2图片:广告图片、新闻图片、UGC发布图片等类3网站长视频、电影、剧集等音频:语音聊天、音乐、录音文件等4金融诈骗2图片:广告图片、新闻图片、UGC发布图片等类3网站长视频、电影、剧集等音频:语音聊天、音乐、录音文件等4金融诈骗×获理境资管理行业是一种借助人工智能等科技手段高效率发现、分析、处置各种数字内容的行业义与分类•在本文中,内容主要指的是数字内容,也即数字化的文字、图片、视频和音频等数。鉴于账号、关注、点赞、转发、评论、情绪等行为或关系也体现为包含价或语义的数字信息,因此这些数字行为和数字关系也属于本文所讨论的内容文字:公告新闻、文字:公告新闻、UGC、评论、网络小说等1赞、关注、转发、情绪等5√√分促广娱的行业。其主要是在内容的生产、传播、溯源等各环节,通过中对海量数字内容进行高效分析的需求监测元宇宙随着数字化的不断深入,数字内容爆发式生产且呈现多源异构数据激增的特点,内容发现与管理成为保障互元宇宙联网健康发展的关键,也是元宇宙持续发展的基石,具备国家级的战略性意义11字化世界透明度2233产3年产3年,文化部审议通过《互联网文化管理暂行规定》7年6月,国际互联网信息办公室发布《互联网新闻信息服务管理规定》“元宇宙”作为一个于现实世界平行运行的空间,其天延时、多元化、随时随地、身份属性容属性,为维护“元宇宙”长久有容发现与管理是必不可少的规范之一月,国际互联网信息办公室发布《互联网用户公众信息服务管理规定》9年布《网络短视频及《网络短视频内容审核标准细则》12月,国家互联网信息办公室室发布《网络信息内态治理规定》1年理总局联合发布《互联网信息服务》非高;另外,网内容在数字空间与物理空间、社会空间已经深度映射和融合,在数字世界进行的内容发现和管理,已成为发现和管理物理空间的重要补充,因此强化Web0时代下数据透明化的必备条件R速度Web0时代数字内容体量呈现爆炸性增长,人工内容发现成本大赋能内容发现与管理Web0时代数字内容体量呈现爆炸性增长,人工内容发现成本大赋能内容发现与管理,内容•未来单一模态数据所提供的信息已的需拟人类联觉来提•从技术上讲,计算机视觉指软件算法来检索、处理果•计算机视觉系统可用于对象寻、内容风控、媒资管理、内容营销的核心技术,是构建内容发现与管理的关键要素的有效物体、对象之间的交互关系以及潜在的语义情感信息,最终形成准确、拟人化(贴近于人的表达习惯)的自然语言表达来理解内容,主要针对内容抽取静态签;二是通过行为反馈来理解内容,通过行为积累的后验数据、统计、或模型预的知识、倾向性、投放目标以及抽象表达理解内容文本分析分析用图谱语义表示理解内容文本分析分析用图谱语义表示序列表示向性理资料来源:灼识咨询度实现质的飞跃,信息的即时度实现质的飞跃,信息的即时性、丰富度都得到极大地提升险,因此AI需具备跨模容安全、图像、音信息之间的一键检索、分析与应用、实时锁定敏感事件规划和推理能力,基于内容识别精准投放等,实现有针对性的内销以AI技术驱动和内容发现与管理场景的业务存的局面•阶段背景:中国内容发现与管理产业最初兴起,标志性事件是1998年中•行业特征:内容检索行业主要包括搜索引擎及一,以OGC和PGC发布图文为主,内容合规性理的产业尚未形成大规模的需求叉识别杂度速增长1)UGC的内容形式更丰富,包括直播、短视2)创作群体更加庞大,其产生的互联网内容信得到大幅提升判断后,再做融合分析,于内容检索领域,逐渐覆盖到舆情监搜寻、内容风控、媒资管理,以及内销六大领域05050网据部数内络外网内开络境公网据部数内络外网内开络境公…◼银行◼保险◼证券…金融…······…行业◼消费品牌络解与学习和深刻行业理解,为下游政企客户提供内容发现与管理的软硬件或服务 件台件台技术平台容发现平台提供综合性风控体系,运用AI技术等对互联网内容进行智能风控管理运用AI技术对各种类型媒体资料数据进行全面管理的完整解决方案提供跨模态综合内射到同样的高22在AI洞察潜在客群的前提下助力实现低成本精准营销行业范围ARR公开网络数据内部网络数据多模态I理解跨模态I理解ARR公开网络数据内部网络数据多模态I理解跨模态I理解机行为鉴别智能识别自动分段别现理检索信息审查等掘等查投放等发体传播分析恐信息等多种AI决策模型作为技术支撑,在多个业务场景为客户提供综合解决方案部分事业单位等非商业性质的机构•暴恐信息监测•违法信息审查•敏感信息溯源•缺乏图片、视频等复杂信息的搜部分事业单位等非商业性质的机构•暴恐信息监测•违法信息审查•敏感信息溯源•缺乏图片、视频等复杂信息的搜•媒体传播分析•违规信息审查金融行业传统银行、保险公司、证券公司,以及各大互联网金融机构等电商平台和其平台的使用者,包括快消、服装、食品餐饮等容发现与管理能够有效解决各行业痛点,确保其内容的安全性、降低运营风险、提高管理效率和获客效率乐和游戏等类型的互•娱乐平台用户年龄偏低•UGC内容数量庞大且内容复杂容•销售线索挖掘•欺诈识别与拦截•储存编目管理•盗版侵权•获客低效•金融诈骗•薅羊毛•获客低效•市场信息复杂•精准广告投放•销售线索挖掘金融行业舆情监场规模金融行业内容检金融行业舆情监场规模金融行业内容检规模索市场规模解出内容发现和内容管理市场的多元化业务矩阵行模=Σ(年投入AI投入分发或AI))金融行业内容风金融行业内容风市场规模金融行业舆情监模中国内容发现与管理行业尚处于起步阶段,随着AI技术进一步发展、互联网内容监管力度加强、下游应用场景进一步丰富,行业市场规模将迎来大规模持续增长亿元人民币 年均复合增长率2017-20212021-2026E80040.3%40.8%864.70201720182019202020212022E2023E2024E2025E2026EIAI•2022年作为AIGC元年,未来内容爆发量继续激增,内容发现和管理的需求行业范围持续扩张,解决方案进一步细化,下游客户对内容发现和管理的将保持稳定高速增长内容监内容监、涉暴、涉政、虚假造谣等违法违规内容各方需加强内容监管力度:政府出台政策促使监管部门以及各个互联网平台承担起主体的责任,引导各方加大在内容发现安全评估监测、安全事件应急处置等管理制度和技术措施•信息量爆发式增长:AIGC迅速发展,丰富了内容生成环节,使得智能化内容生产成为可能,信息密度及信息量也呈爆发方式通过互联网触达用户,扰乱网络秩序,这些都对内容管理提出了更高的要求发现与管理要求下游应用场景提高了内容发现与管理的要求及门槛,以及多模态AI技术迭代推进内容管理专业化监管力度榜刷变等营销欺诈行为。通过运用先进的AI技术,结合设备风险识别、黑产情报追踪等,能够满足企业在多种业的业务增长保驾护航预训练大模型快速发展,多模态与跨模态成为趋势:大模型已经从早期仅能识别纯文本的单模态模型,发展升级到横跨文代码等的多模态、跨模态模型。多模态AI技术能够将不同模态的原始数据映射到统一或相似的语义空方面能够极大程度提升内容风控的效率,推进内容管理专业化态迭代发展能够将不同模态的数据类型(图像、智能实现更高的性能态内容率、搜文字等功能态迭代发展能够将不同模态的数据类型(图像、智能实现更高的性能态内容率、搜文字等功能喘索技术朝着智能化方向发展管理场景中的AI赋能息处理与传送速度,减少延迟,优化用户使用体验创新检索方式,更高效地完成检索请求,提高内容检索的效率权查度更快,能够为检索112233需求服务创新升级提供支持络络提升深度学习能力,对文本进行深度理解,从而更加精准的满足内容需求提高检索结果的精确性和关联信息的相关性,满足用户更广泛的信息需求1212AI大模型带来内容发现与管理产业的巨大变革局分析3 中国内容发现与管理产业部分代表公司竞争格局技术驱动存在较高的智能营销获客情监测与网络安全服务能力和内部资源要求高 中国内容发现与管理产业部分代表公司竞争格局技术驱动存在较高的智能营销获客情监测与网络安全服务能力和内部资源要求高较好的技术研发能力和升级迭代能力,而业务驱动型公司有更强的定制化服务能力和客户拓展能力服务商服务商类型大量UGC内容,主要涉及内容风权保护、内容等多的诈骗、安全务主要以内容安全、风销、反诈为主 多的诈骗、安全务主要以内容安全、风销、反诈为主较低较高外部客户*注:指获取内容发现与管理市场上潜在第三方客户的能力,内部关联客户和已有客户除外**注:指公司在AI内容理解技术方面的研发、迭代能力国内内容发现与管理产业玩家类型多元,专注不同细分赛道;其中阿里云、百度智能云、人民中科等作为代表,依托AI大模型技术、模型工程化能力以及行业知识,分别在内容识别、内容风控等方向取得重要进展 中国内容发现与管理产业各类代表公司分析 公司名称主营业务公司背景技术/研发检索风控舆情媒资营销情报互联网大厂,阿里巴巴旗下的云计算科技公模态AI内容识别互联网大厂,中国最大的搜索引擎百度的科媒体资源搜索技术科•创业公司,在跨模态AI模型和跨模态检索技沿•多元异构跨模态AI内容识别、跨模态方面处在行业前沿•多模态AI内容识别,视频、图片、音频、文字NLP内容识别,风险点标注互联网大厂,腾讯旗下的科技公司,产品种•多模态AI内容识别,视频、图片、音频、文字NLP内容识别,风险点标注上市企业,软件与信息技术服务商,主要涉的制作、分类、•中央企业,为国家治理能力提升和产业数字供技术服务•上市企业,在智能语音和人工智能方面处于行•上市公司,电子数据取证和公安大数据领先络空间安全和社会治理龙头,领先的大数据、智能和数据安全产品及服务提供商•将文字、图像、音视频等内容运用数制作、标注、提炼、审核、整理、计算围绕智能语音和自然语言处理等内容发现和管理服务数据智能处理和信息挖掘,信息智能检索,网络安全和对抗跨模态AI1要更智能的机器学习技术来满足的内容发现与管理早进入互联网业,通过构建的研发奠定基础跨模态AI1要更智能的机器学习技术来满足的内容发现与管理早进入互联网业,通过构建的研发奠定基础行业的公司业应用场景并客户资源优势能够提高内现的准确度需求扩容+迭代能力别需求;舆情态势实时追踪结合case分析驱动优量模型小时级更新,时刻迭代升级AI技术研发能力凸显客户差异化3金融行业娱乐行业直播、社交、游体等,对内容类细致的分析和分类•利用公司规模和链闭环服务客户•通过内部生态创•独立性能够获取更多•独立性能够提高服务使客户愿意使用更深层次的定制化服务金融科技的同时诈的定制化服务4容迭代112222,需求和应用也存在着不同能否根据行业垂直或者业务垂直设计定制化的功关键之一成立相关事业群,开发、事业单位等源•网安、公安、事业单位现与管稳定需求定制需求定制数据保密安全要求速精准定位舆情情报权保护等服务1212AI大模型带来内容发现与管理产业的巨大变革局分析3•阶段背景:1994年雅虎(Yahoo)成立并开始•阶段背景:1994年雅虎(Yahoo)成立并开始接数的增长,开始支持简单的数据库搜索;此后AltaVista和Excite等搜索引擎开始出现•技术概况:这一时期学界主要从交互的角度研究模态技术开始应用于内容发的搜索与生成的公司开始采用多模态技术进•阶段背景:这一时期基于人工智能技术的内容发未兴起,但以自然语言处理、计识别为代表的人工智能技术开始•技术概况:学界已经开始利用浅层模型对多模态名,能够通过分类目录查布在各个FTP主机中的文件的变革,跨模态和多模态颠覆了传统单模态的互动方式,从而实现了图文、音视频等多形式内容的融合检索术兴起,未来有望得到广泛应用••阶段背景:近年来多个海外互联网巨头和第三方网公司纷纷布局上述智能化领域,互发展带动信息的产生量与交互需求呈,人工智能技术的应用场景不断拓宽•技术概况:在多模态技术广泛运用于内容发现与破单一模态下的信息壁垒,实现各种形式内容检索与生成的互联互通,进一步提高数字化内容的识别、监测与管理能力术在欧美内容发现与管理产业中的发展度较中国稍慢,且多集中于社交媒体和逊色高低按公司背景按主要技术路径低高低按公司背景按主要技术路径低 创业型互联网公司路径包括自然语言处理、计算机视觉、多模态或跨模态以及大数据分析等 公司背景和主要技术路径*现与管理的内部管理需求占比术类别更为全面自然语言处理本内容的自、实体搜索自然语言处理通过图像分特征提取、判断匹配等方敏感等图像的识别和处理多类型内容的综合识别与理解多类型内容的综合识别与理解进行处理多模态或跨模态*注:一*注:一个公司可能同时具备多种技术,这里指公司较为核心或领先同业的技术类别海外大型互联网公司基本都在其云板块中孵化内容发现与管理业务,作为AI技术提升应用体验的重要方向;而海外创业型互联网公司则以AI技术为核心,将内容发现与管理作为大模型应用的探索服务商服务商类别公司公公司名称公公司简介•互联网门户网站以及通•全球性的互联网跨境电•全球性的社交网路服务•微博客和社交网站服务内部自用个人企业政府景OCR•运用NLP、多模态、机器学习等人工智能技术,推出Yahoo!Search索引擎,可实现多语言的目录、网站及全文检索反感的图像和视频•运用NLP、计算机视觉、多模态等技术,推出Googlevision字审核、图片和视频内容的智能审核•大数据分析软件公司Metropolis金融、警务等领域解决方案户喜好和潜在热点•基于NLP开发了舆情监控系统和Meltwatermediainfluencer•公司基于计算机视觉和语音分析等进行Affdex情绪识别技术断,型,可以为照片标记元数据并分析对象类型后进行查找•公司通过运用计算机视觉等人工智能技术,为网站或APP开商品推荐或导购等服务公司通过API为企业客户提供Pre-trainedModels等深度学习型,从而实现内容的智能化标注、提取、翻译和搜索•公司通过开发出文本生成图片预训练模型DALL·E系列、语••••••客户群体占比:低高媒体初创公司搜索和图像识别技基于云的企业AI解决方语言识别、图人工智能服务商GooglesearchYouTubeadsGooglenetworkGoogleadvertising由GoogleadvertisingGoogleotherGoogle的收入主要GooglesearchYouTubeadsGooglenetworkGoogleadvertising由GoogleadvertisingGoogleotherGoogle的收入主要以上90%le71%81%且借助自身平台优势成为全球最大的广告服务商之一•Alphabet的全资子公司GoogleInc.是著名的美国跨国科技企业,是公认的全球最大的搜索引擎公司,业务包括互联网搜索、云计算、广告技术等,同时开发并提供大量基于互联网的产品与服务,其主要利润来自于关键词广告等服务 全球搜索引擎市场份额2021Google其他谷歌服务(GoogleGoogle其他Google的内容理解Google的内容理解Chrome是目前全球其他(Otherbets)•Google利用自身搜索引擎平将内容发现应用GoogleMaps上,并且以平台广告营销的内容,成为Google主要源之一Adsense、Admob、Admanager等应用在内的谷歌网络联盟,提供整合且精准的内容营销服务*注:截至2021年4月司HiveAI通过API服务的AI深度学习模型%超过200万名注分布式贡献者*注:截至2021年4月司HiveAI通过API服务的AI深度学习模型%超过200万名注分布式贡献者提供训练数据•YUBO-社交媒体平台YUBO了直播功能,并且成了平台最受欢迎的功能之一容的举报和投比率基于多行业和应用场景的产品和解决方案供用户体验和平台生态台的环境•产品软件使用费用•解决方案服务费用估值达到20亿美元,晋身AI内容发现与管理行业的独角兽司HiveAI的预训练模型(Pre司HiveAI的预训练模型(Pre-trainedModels)让规模的公司使用同类最佳的AI解决方案,以最具创新的公司处理数十亿个API请求•科技&数字化平台内容运营:为各类平台提供解决方案,审核并优化内容,保证平台生态质量•供多维度的赞助商心•容进行识别,分类并识别各类统计性;可从相关视频、音频、图片中提15种以上的语言•接中搜索•广告投放式公司正式成立并获资,投公司获得了JVP和GTICapital资金公司获得了JVP、GTI

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论