机器之心宣讲_第1页
机器之心宣讲_第2页
机器之心宣讲_第3页
机器之心宣讲_第4页
机器之心宣讲_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

A

I

路搜

心 陈

伟搜狗发展历程2004200820152016搜狐研发中心搜索引擎2003搜狗搜索搜狗输入法2006搜狗浏览器从搜狐拆分王小川任CEO20102011搜索流量超谷歌中国实现盈利全年营收$1.1312亿20122013战略合作/$

4.48亿/搜搜微信搜索

“糖猫”2014知乎

“糖猫”2代汪仔$1亿人工智能搜狗PC用户规模 位列第二Top.2PC端MAU排名数据来源:艾瑞2015年12月5.31

亿5.21亿5.20

亿5.11亿5.04

亿4.17亿搜狗输入法PC端用户第一,移动端用户第三移动端APP

MAU排名2.2亿1.7亿1.3亿1.2亿超2.7亿5.2亿移动端PC端PC用户数超5亿

位列第一用户覆盖率大于97%搜狗搜索成为中国搜索第二大搜索引擎排名公司123排名公司123排名第三排名第二差异化战略带来优质内容,市场份额迅速提升移动端PC端搜狗核心项目搜狗搜索12年的积累与沉淀

差异化战略带来优质内容市场份额迅速提升搜狗输入法互联网产品的奇迹海量用户,稳定日活不停前进,只为用户搜狗语音交互专注自然交互的语音平台众多应用场景真正解放双手排序算法、深度学习、信息检索、机器学习、自然语言处理等等人机交互、机器学习、数据挖掘、自然语言处理等等人机交互、模式识别、机器翻译、自然语言

处理、机器学习等等人工智能人工智能:在尖端技术中寻找突破目标:成为中国人工智能引领者寻求视觉认知、自然语言理解、知识表达与推理等领域的突破与清华大学成立天工智能计算研究院,王小川出任联席院长利用这个新的平台,邀请世界一流学者参与研究研究成果将应用于搜狗下一代产品搜狗的AI技术战略搜狗输入法+搜狗搜索使命:让表达与获取信息更简单自然交互+知识计算目标:辅助人做更好的决策什么是交互技术用户机器信息交互计算自然机械穿孔卡片命令行 图形界面鼠标键盘触摸语音手势文字交互2-搜狗输入法语音交互语音应当是最有效的输入计算形式;在2015年,美国使用过语音助手的用户比例已经达到65%。By 玛丽·米克(互联网女皇)《2016年互联网趋势报告》语音交互的重要性毋庸置疑搜狗语音交互产品的演进+ASR语音输入法语音搜索+NLU手机语音助手

(搜狗语音助手)当前语音交互产品是否足够好什么是好产品:语音助手的囧境:简洁有趣方便稳定刚需技术能力语音识别能力的不稳定用户需求满足的不稳定用户预期做垂直的助手而不是通用的技术能力具体产品应用场景音箱 电视 导航问题难度ASRNLU+稳定性下沉到垂直场景,知识成为核心多轮对话管理知识图谱能力分类能力说明搜狗产品矩阵命令操作电话短信/打开APP搜狗号码通、手机助手生活信息查天气/问股票/查机票/找吃的/定酒店/地图导航网页搜索、搜狗地图、搜狗网址导航娱乐消费听音乐/看电影/读资讯音乐搜索、视频搜索、新闻推荐知识问答肖申克的救赎导演是谁/

刘德华的老婆的爸爸是谁/大象怀孕周期是多久/天为什么是蓝色搜狗知立方搜狗问问

搜狗百科

知乎搜索3-搜狗知音语音识别借助深度学习快速发展语音识别准确率∝优质训练数据规模*深度学习技术能力(燃料)(发动机)语音数据2012-052014-052013-052015-052016-052012年1月上线谷歌语音API,同时开始语音技术研发2012年11月上线搜狗自有语音识别,数据量2000小时搜狗在线语音输入日请求规模超过1.6亿每天用户产生出来的语料规模是11.7万小时语音识别系统的演进端点检测&特征提取M

F

PF

B

LC

A

PC

NKLPCCPNCC解码器搜狗语音语音数据声学模型文本数据语言模型发音词典训练Hand-Crafted

->

TrainableGoodbye

GMM-HMMa

S

S2

3转移概率a

S

S1

S2

1S2…………特征矢量:…....…….X

nX

n

+1

X

n

+2X

n

+3X

n

+4b1

(

Xt

)b2

(

Xt

)b3

(

Xt

)S3隐含层可观察层输出概率状态序列…………1

1aS

S2

2aS

S3

3aS

SMbi

(

Xt

)

=

p(

Xt

|

st

=

i)

=

cj

*

N

(

Xt

,

mij

,

Sij

)j=1

Deep

Learning=

LearningRepresentations/FeaturesCNNSimple

RNN

->

LSTM

RNNCLDNN++CTCEncoder-Attention-Decoderf

=

( 近年

, 经济增长 速度

已 放缓。)Encoder-Attention-DecoderEnd-to-End

Attention-based

Large

Vocabulary

Speech

Recognition,

Dzmitry

Bahdanau,

Jan

Chorowski,DmitriySerdyuk,

Philemon

Brakel,

Yoshua

Bengio,2015Listen,

Attend

and

Spell,

W.Chan,

N.

Jaitly,

Q.V.

Le,

O.

Vinyals,2015深度学习和计算能力提升了识别的可用性504540353025201510搜狗输入法线上错误率2013

2013

2013

2013

2014

2014

2014

2014

2015

2015Q1

Q2

Q3

Q4

Q1

Q2

Q3

Q4

Q1

Q2DNNCNNLSTM端到端的模型

CLDNN+CTC硬件加速线上线下GPU集群过去一年识别错误率进一步下降30%,识别速度提升了3倍领先的语音识别能力产品思维弥补性能鸿沟非键盘设备中,4%的语音识别错误率产生的不稳定性是致命的人与人之间是如何避免错字的?我叫章砚,立早章砚台的砚立早章、女字旁的她砚台的砚、佳节的佳清华的邱勇机器有没有机会理解人类自然纠错语言?8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论