11大Java开源中文分词器的分词效果对比_第1页
11大Java开源中文分词器的分词效果对比_第2页
11大Java开源中文分词器的分词效果对比_第3页
11大Java开源中文分词器的分词效果对比_第4页
11大Java开源中文分词器的分词效果对比_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、11大Java开源中文分词器的分词效果对比动力节点java在上一篇讲了11个Java开源中文分词器使用方法,这篇就来讲讲Java开源中文分词器的分词效果对比。public static MapString, Set contrast(String text) MapString, Set map = new LinkedHashMap(); map.put(word分词器, new WordEvaluation().seg(text); map.put(Stanford分词器, new StanfordEvaluation().seg(text); map.put(Ansj分词器, new A

2、nsjEvaluation().seg(text); map.put(HanLP分词器, new HanLPEvaluation().seg(text); map.put(FudanNLP分词器, new FudanNLPEvaluation().seg(text); map.put(Jieba分词器, new JiebaEvaluation().seg(text); map.put(Jcseg分词器, new JcsegEvaluation().seg(text); map.put(MMSeg4j分词器, new MMSeg4jEvaluation().seg(text); map.put(

3、IKAnalyzer分词器, new IKAnalyzerEvaluation().seg(text); map.put(smartcn分词器, new SmartCNEvaluation().seg(text); return map;public static MapString, Map contrastMore(String text) MapString, Map map = new LinkedHashMap(); map.put(word分词器, new WordEvaluation().segMore(text); map.put(Stanford分词器, new Stanfo

4、rdEvaluation().segMore(text); map.put(Ansj分词器, new AnsjEvaluation().segMore(text); map.put(HanLP分词器, new HanLPEvaluation().segMore(text); map.put(FudanNLP分词器, new FudanNLPEvaluation().segMore(text); map.put(Jieba分词器, new JiebaEvaluation().segMore(text); map.put(Jcseg分词器, new JcsegEvaluation().segMor

5、e(text); map.put(MMSeg4j分词器, new MMSeg4jEvaluation().segMore(text); map.put(IKAnalyzer分词器, new IKAnalyzerEvaluation().segMore(text); map.put(smartcn分词器, new SmartCNEvaluation().segMore(text); return map;public static void show(MapString, Set map) map.keySet().forEach(k - System.out.println(k + 的分词结果

6、:); AtomicInteger i = new AtomicInteger(); map.get(k).forEach(v - System.out.println(t + i.incrementAndGet() + 、 + v); ); );public static void showMore(MapString, Map map) map.keySet().forEach(k- System.out.println(k + 的分词结果:); AtomicInteger i = new AtomicInteger(); map.get(k).keySet().forEach(a - S

7、ystem.out.println(t + i.incrementAndGet()+ 、【 + a + 】t + map.get(k).get(a); ); );public static void main(String args) show(contrast(我爱楚离陌); showMore(contrastMore(我爱楚离陌);运行结果如下:*word分词器 的分词结果:1 、我 爱 楚离陌 Stanford分词器 的分词结果:1 、我 爱 楚 离陌 2 、我 爱 楚离陌 Ansj分词器 的分词结果:1 、我 爱 楚离 陌 2 、我 爱 楚 离 陌 HanLP分词器 的分词结果:1 、

8、我 爱 楚 离 陌 smartcn分词器 的分词结果:1 、我 爱 楚 离 陌 FudanNLP分词器 的分词结果:1 、我 爱楚离陌Jieba分词器 的分词结果:1 、我爱楚 离 陌 Jcseg分词器 的分词结果:1 、我 爱 楚 离 陌 MMSeg4j分词器 的分词结果:1 、我爱 楚 离 陌 IKAnalyzer分词器 的分词结果:1 、我 爱 楚 离 陌 *word分词器 的分词结果:1 、【全切分算法】我 爱 楚离陌 2 、【双向最大最小匹配算法】我 爱 楚离陌 3 、【正向最大匹配算法】我 爱 楚离陌 4 、【双向最大匹配算法】我 爱 楚离陌 5 、【逆向最大匹配算法】我 爱 楚离

9、陌 6 、【正向最小匹配算法】我 爱 楚离陌 7 、【双向最小匹配算法】我 爱 楚离陌 8 、【逆向最小匹配算法】我 爱 楚离陌 Stanford分词器 的分词结果:1 、【Stanford Chinese Treebank segmentation】我 爱 楚离陌 2 、【Stanford Beijing University segmentation】我 爱 楚 离陌 Ansj分词器 的分词结果:1 、【BaseAnalysis】我 爱 楚 离 陌 2 、【IndexAnalysis】我 爱 楚 离 陌 3 、【ToAnalysis】我 爱 楚 离 陌 4 、【NlpAnalysis】我

10、爱 楚离 陌 HanLP分词器 的分词结果:1 、【NLP分词】我 爱 楚 离 陌 2 、【标准分词】我 爱 楚 离 陌 3 、【N-最短路径分词】我 爱 楚 离 陌 4 、【索引分词】我 爱 楚 离 陌 5 、【最短路径分词】我 爱 楚 离 陌 6 、【极速词典分词】我 爱 楚 离 陌 smartcn分词器 的分词结果:1 、【smartcn】我 爱 楚 离 陌 FudanNLP分词器 的分词结果:1 、【FudanNLP】我 爱楚离陌Jieba分词器 的分词结果:1 、【SEARCH】我爱楚 离 陌 2 、【INDEX】我爱楚 离 陌 Jcseg分词器 的分词结果:1 、【简易模式】我 爱 楚 离 陌 2 、【复杂模式】

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论