人工智能技术应用实践白皮书_第1页
人工智能技术应用实践白皮书_第2页
人工智能技术应用实践白皮书_第3页
人工智能技术应用实践白皮书_第4页
人工智能技术应用实践白皮书_第5页
已阅读5页,还剩114页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2022年9月|免责声明目录 1数字时代,遇见AI 2 4驾驭在AI加持下不断迭代的技术 6 8如何构建具有快速识别能力的内容风控系统? 8 9如何敏捷响应多变的业务需求? 如何实现低成本及高可用? 24 25如何获得AI能力的持续优化? 如何发挥人机交互的协同优势? 27持续创新的AI系统架构 29 模型 34解决方案 35部署与加速 37为企业插上AI技术的翅膀—网易智企服务案例详解 内容风控:互联网信息爆发式增长,内容安全审核成为企业新挑战 41 网易云信携手网易云音乐,打造互动直播和语聊房极致互动体验 46自然语言处理:客服场景多元化,亟待AI技术带动客服体系智能化升级 网易云商为松果出行部署在线机器人,人效提升至220%,年节省200万成本 可信AI 64 尾声 67鸣谢 68附录 69技术注释 69参考文献 率从30%左右降低至15.3%,从此将计算机视觉技术引入了深度神经网络算法的时2019年3月,美国计算机协会(ACM)宣布将计算机领域国际最高奖-图灵奖驾驭在AI加持下不断迭代的技术我们将深入解读网易智企AI技术团队的技术方案,透视网易智企如何在工业实践中驾驭AI技术,实现内容风控、音视频及自然语言对话三个领域技术的持续迭代。如何构建具有快速识别能力的内容风控系统?如何高效降低内容风控系统的资源消耗?机器之心×网易智企机器之心×网易智企第10页当模型有了初步的冷启动识别能力,但生成数据往往在分布上存在局构建可用的冷启动模型,从生成数据到真实数据的数据分布迁移是一项重要问题。其核心点在于,如何在识别能力较弱的情况下提升增广数据的精确度。易盾团队设计了基于跨任务融合的样本增广方案,例如用检索和分类任跨任务融合OO增广数据为了更好地平衡不确定性与精确度,易盾团队设计了跨任务师生互动的半监督学习方证学生模型的数据是其无法召回的难例,逐步舍弃能够很好识别的简单样例,提升难例的数据占比。鉴于单任务的方式容易过拟合,精度难以提高,团队设计了升级版的跨任务半监督方案,很大程度提学生模型的识别效果。另外,方案将半监督、置信学习、噪声训练进行结合,让置信学习从打标数据集整体角度出发,进一步提升数据集的精确度;噪声学习从训练角度出发,进一步改善模型训练对噪声标对数据域的问题,方案在原有任务的基础上增加数据域的识别和度量能力,以此作为置信学习(a)预处理模块学生网络不确定性建模权重进行适配和调整需要标注的数据数据域的识别和度量能力如何敏捷响应多变的业务需求?如何获得具有场景泛化能力的AI算法模型?如何驾驭AI加持下的音频技术?作为对AI算法落地难问题的响应,云信团队的解决方案是将AI与DSP进行结合、提升AI算法在复杂场景的输出信号输出信号“Areal-timemusicdete标记啸叫数据集用于模型训练,并选择对数梅尔谱作为输入特征,实现了89.46%的检测率和0.40%的误报如何驾驭AI加持下的视频处理技术?迭代剪枝模型微调得到小模型移除较小尺度因子的通道性能评估最终模型稀疏训练大模型视频超分推理耗时(ms)9876543210第21页PoutPoutA1A1A1Hashin0自研超分模型如何高效解决访客需求?如何实现低成本及高可用?提升性能并降低成本(去GPU化)如何实现快速冷启动?翻译模型如何获得AI能力的持续优化?提取答案提取答案问句重要度排序构建无向连接图计算语义相似度提取问句人工会话<E>如何发挥人机交互的协同优势?如何提高语音交互与智能外呼的智能度?机器之心×网易智企人工智能技术应用实践白皮书·2022机器之心×网易智企第28页图,提取实体信息(如图)。ASR基于端到端框架的流式语音识别系统,支持智能打断功能。ASR纠错作为ASR模块的补充,用于纠正转写过程中出现的错误。纠错过程结合云商机器人的问题,构建出有效的上下文信息,理解用户的内容进行错误识别与纠正。这个补充能够缓解ASR转写存在的上下文依赖问题,降低专有名词、近音字的错字率。在ASR纠错后,系统会进行语义检测,通过语义过滤掉无意义和不相关的回复。系统会通过内置行业知识库和模型,根据用户所属行业领域进行识别。整体上,采取相似度匹配和分类相结合的方式:识别结果依旧优先采用自定义知识的匹配结果,保证用户的特殊配置需求;未匹配到时,依赖领域知识和内置分类模型给出的识别结果。提取出用户说话内容中的重要信息,如姓名、地址、时间等,方便后续的数据统计和分析。提取的对象包括内置常用实体和自定义实体两种。常用实体采用BERT预训练模型,具有较高的准确率;自定义实体通过配置规则和相似问的方式,具备较高的灵活度。持续创新的AI系统架构对这个概念进行进一步的拆分,则包括数据、模型(模型特指初始预训练模型)、算法、解决Do将AI架构与烹饪进行类比,我们可以更好理解这五个环节如何紧密结合在一起。我们将对数据、模型、算法、解决方案及部署与加速这五个方面逐一展开,以网易智企AI技术团队所采用的架构为线索,总结AI系统架构的创新方法论。自由女神像自由女神像二次识别弱监督语义分割9(机器之心×网易智企人工智能技术应用实践白皮书·2022第38页理加速系统的设计与实现,大幅度的提升了GPU利用率、资源使用效率以及对于复杂系统和长尾需求的响应速度,大幅度地提升了AI推理服务的并发能力,降低了时延,实现了快速识别能力的明显提升。线理(单特征提取节点点上下文切换上下文分裂增从模型压缩、蒸馏、高性能部署框架等角度进行单模型优化,这部分内容业界相对较成熟,以沿用为主。网易智企技术团队的研发重点是提升计算速度,优化了包括模型剪枝、量化、蒸馏、参数共享、算子融合等方面。模型剪枝是通过结构化剪枝算法,删除模型中“贡献”很小的参数,降低模型计算FLOPS。量化算法使用更少的比特来表示模型参数,通过低比特量化计算加速,同时达到量化存储和量化加速的目的,降低模型体积。蒸馏算法旨在将大而深的教师模型的能力转移到一个小而浅的学生模型上,提升计算速度。参数共享的意图是在最大程度共享多个任务的计算参数,避免重复计算。算子融合是将网络中的算子进行合并,在保持计算结果一致的前提下将网络进行进一步的简化。为企业插上AI技术的翅膀——网易智企服务案例详解难点和问题的基础上,系统性地进行探索和优化,完成AI技术的落地。及营销客服场景实现突破与创新。挑战网易易盾为汽车之家提供全链路内容安全保障服务客户痛点及挑战部署成果审案例落地流程及使用技术以及准确率98%以上的人工检测。核准确率达到99%以上。案例小结网易云信携手网易云音乐,打造互动直播和语聊房极致互动体验客户痛点及挑战国家互联网中心数据显示,90年及之后出生的用户占2020年中国在线音乐娱部署成果案例落地流程及使用技术多人语音聊天室案例:网易云音乐多人语聊板块"歌房"SDK同步混流副唱1干声SDK扩展能力应用效果案例小结网易云商为松果出行部署在线机器人,人效提升至220%,年节省200万成本客户痛点及挑战起步价2元的基础上,超出起步里程后每增加1公里收取0.5元,超过30分钟后每增加1分钟收取0.1元。显然,部署成果其打造了全方位的智能客服体系。网易云商智能机器人是基于深度学习的对话式AI技术打造的可支持单轮、多轮交互的对话式机器人,适用于客户服知识图谱环持续赋能语音智能文本智能案例落地流程及使用技术V客服领域专用RoBERTa客服领域专用RoBERTaU升10%。第54页当前节点数:49/10000当前节点数:49/10000车辆断电-城市=92...设置当前节点数:10/10000保存为草稿校验复制节点复制节点制节点和子节点放大缩小[928】管控区回应用效果通过部署网易云商智能机器人,松果智能化咨询占比已由原来的75%提升至90%,问题解决率高达95%,人效提升至220%,实现10+人工坐席释放,每年节省人力成本约200万,实现客服中心的智能转型。案例小结教授于2021年发表的论调中指出,太多人工智能研究工作聚焦于模型,而忽略了数据,察业界在该方面的最新工作。可信AIRobustBench;而在国内,清华、阿里、RealAI等团队则于2平衡数据的数量(机器标注)和质量(人类标注或监升级版,在生成用户描述的图像时具有更高的分辨率和更低的延迟。[28][29]英伟达则在2021年11月发布了语音转写AutomaticSpeechRecognition,ASR语义理解NaturalLanguageUnderstanding,NUL数据生成DataGenerating音频3A算法Audio3AAlgorithm语义分割SemanticSegmentation多模态Multimodal/content/ince/incecp/2021/0000026/content/ince/incecp/2021/0000026/abstracthttps://ec.europa.eu/futurium/en/ai-alliance-c[7]PolicyandInvestmentRecommendhttps://ec.europa.eu/futurium/e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论