机器读心术之挖掘与自然语言处理课件_第1页
机器读心术之挖掘与自然语言处理课件_第2页
机器读心术之挖掘与自然语言处理课件_第3页
机器读心术之挖掘与自然语言处理课件_第4页
机器读心术之挖掘与自然语言处理课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器读心术之文本挖掘不自然语言处理第3

【】和幻灯片为炼数成金网络课程的教程以外范围散播,违者将可能被法律和经济课程详情

L=5000,m31250

8N-

给定句子:Markwrotea增加标记:<BOSMarkwroteabookP(Markwroteabook)

给定拼音串:tashiyanjiushengwu可能的汉字串:踏实他是…

CString={踏实 物的,他实验救生物的,他是 物的,他使烟酒生雾的,……}如果使用2-gram:)=)=智能狂拼、微软拼音输入法基于n-

=

范围为6-10bits/word。

P(Davidreadabook)=P(David|BOS)

c(BOSDavid)P(read|David) wc(BOSP(read|David) read)wc(David 于是,P(Davidreadabook

基本思想:每一种情况出现的次数加12/61/63/6其中,V为被考虑语料的词汇量(全部可能的基元数。

Good-Turing

的Kneser-Ney平滑方法的效果于其他所有的平滑方法。Katz平滑方法和Jelinek-

软件

CMUStatisticalLM

联网的打破时空限制,把天南地北志同道合的朋友组织在一起交流学习,使到原先孤立的学习组合成有组织的探索力量。并丏把原先劢辄成千上万的学习成本,直线下降至百元范围,造福大众。我们的目标是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论