文本数据挖掘:基于R语言_第1页
文本数据挖掘:基于R语言_第2页
文本数据挖掘:基于R语言_第3页
文本数据挖掘:基于R语言_第4页
文本数据挖掘:基于R语言_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文本数据挖掘:基于R语言读书笔记模板01思维导图读书笔记作者介绍内容摘要目录分析精彩摘录目录0305020406思维导图文本语言数据读者文本方法内容文本第章数据案例基础字符串词数据结构图情感可视化文档本书关键字分析思维导图内容摘要内容摘要文本是一种特殊的非结构化数据,在当今的大数据时代,其价值日趋凸显。本书利用开源而强大的R软件,对文本数据挖掘的概念、技术及技巧进行了系统的介绍。本书共11章,内容包括:走进文本数据挖掘,R语言快速入门,字符串的基本处理,用好正则表达式,导入各类文本数据,对各类文本数据进行预处理,文本特征提取的4种方法,基于机器学习的文本分类方法,文本情感分析,文本可视化,文本数据挖掘项目实践。本书还提供了丰富的应用案例和程序源代码引导读者高效学习。本书适合对文本数据挖掘感兴趣的学生、科研人员和数据科学从业者阅读。同时,本书还可以作为工具书,为需要经常进行文本数据挖掘的读者提供快速检索。读书笔记读书笔记让我对tidyfst这个基于data.table的包有了新的认识。目录分析1.1什么是文本数据挖掘1.2为什么要做文本数据挖掘1.3如何进行文本数据挖掘1.4文本数据挖掘软件工具概览第1章走进文本数据挖掘2.1开发环境配置2.3R的常用数据结构2.2R的基本数据类型第2章文本数据挖掘利器——R语言2.5数据操作入门2.4R的基础编程知识第2章文本数据挖掘利器——R语言3.1字符串的构造3.2字符串的辨识、计数与定位3.3字符串的提取3.4字符串的定制化输出第3章从基础做起1——字符串的基本处理3.5字符串的替换与删除3.7字符串的排序3.6字符串的拼接与拆分第3章从基础做起1——字符串的基本处理4.1通配符解析4.2反向引用4.3简写字符集4.4贪婪匹配与惰性匹配4.5零宽断言12345第4章从基础做起2——用好正则表达式5.1readtext包简介5.2不同格式文本文件的导入5.3读入不同编码格式的文档5.4文件数据结构的转化第5章步入正题——导入各类文本数据6.1拼写纠错6.2文本切分6.3去除标点6.4去除停用词6.5扩展缩写6.6词干提取010302040506第6章更进一步——对各类文本数据进行预处理6.8批量文档预处理6.7词形还原与词性标注第6章更进一步——对各类文本数据进行预处理7.1基本特征提取7.2基于TF-IDF的特征提取7.3词嵌入7.4文档向量化:doc2vec第7章上手文本数据挖掘——文本特征提取的4种方法8.2有监督分类8.1无监督分类第8章文本分类——基于机器学习的方法9.2中文情感分析9.1英文情感分析第9章深入理解文本内涵——文本情感分析10.1条形图10.2克利夫兰点图10.3矩形树状图10.4词云10.5词汇位置分布图12345第10章文本数据的直观表达——文本可视化10.7双文档对比可视化10.6络图第10章文本数据的直观表达——文本可视化11.1情感分析案例:量化中文新闻报道中的情感走势11.3关键词提取案例:根据CRAN的介绍文本提取R包关键字11.2文本分类案例:基于词袋模型对英文期刊摘要来源进行分类第11章举一反三——文本数据挖掘项目实践作者介绍同名作者介绍这是《文本数据挖掘:基于R

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论