下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、11大Java开源中文分词器的分词效果对比动力节点java在上一篇讲了11个Java开源中文分词器使用方法,这篇就来讲讲Java开源中文分词器的分词效果对比。public static MapString, Set contrast(String text) MapString, Set map = new LinkedHashMap(); map.put(word分词器, new WordEvaluation().seg(text); map.put(Stanford分词器, new StanfordEvaluation().seg(text); map.put(Ansj分词器, new A
2、nsjEvaluation().seg(text); map.put(HanLP分词器, new HanLPEvaluation().seg(text); map.put(FudanNLP分词器, new FudanNLPEvaluation().seg(text); map.put(Jieba分词器, new JiebaEvaluation().seg(text); map.put(Jcseg分词器, new JcsegEvaluation().seg(text); map.put(MMSeg4j分词器, new MMSeg4jEvaluation().seg(text); map.put(
3、IKAnalyzer分词器, new IKAnalyzerEvaluation().seg(text); map.put(smartcn分词器, new SmartCNEvaluation().seg(text); return map;public static MapString, Map contrastMore(String text) MapString, Map map = new LinkedHashMap(); map.put(word分词器, new WordEvaluation().segMore(text); map.put(Stanford分词器, new Stanfo
4、rdEvaluation().segMore(text); map.put(Ansj分词器, new AnsjEvaluation().segMore(text); map.put(HanLP分词器, new HanLPEvaluation().segMore(text); map.put(FudanNLP分词器, new FudanNLPEvaluation().segMore(text); map.put(Jieba分词器, new JiebaEvaluation().segMore(text); map.put(Jcseg分词器, new JcsegEvaluation().segMor
5、e(text); map.put(MMSeg4j分词器, new MMSeg4jEvaluation().segMore(text); map.put(IKAnalyzer分词器, new IKAnalyzerEvaluation().segMore(text); map.put(smartcn分词器, new SmartCNEvaluation().segMore(text); return map;public static void show(MapString, Set map) map.keySet().forEach(k - System.out.println(k + 的分词结果
6、:); AtomicInteger i = new AtomicInteger(); map.get(k).forEach(v - System.out.println(t + i.incrementAndGet() + 、 + v); ); );public static void showMore(MapString, Map map) map.keySet().forEach(k- System.out.println(k + 的分词结果:); AtomicInteger i = new AtomicInteger(); map.get(k).keySet().forEach(a - S
7、ystem.out.println(t + i.incrementAndGet()+ 、【 + a + 】t + map.get(k).get(a); ); );public static void main(String args) show(contrast(我爱楚离陌); showMore(contrastMore(我爱楚离陌);运行结果如下:*word分词器 的分词结果:1 、我 爱 楚离陌 Stanford分词器 的分词结果:1 、我 爱 楚 离陌 2 、我 爱 楚离陌 Ansj分词器 的分词结果:1 、我 爱 楚离 陌 2 、我 爱 楚 离 陌 HanLP分词器 的分词结果:1 、
8、我 爱 楚 离 陌 smartcn分词器 的分词结果:1 、我 爱 楚 离 陌 FudanNLP分词器 的分词结果:1 、我 爱楚离陌Jieba分词器 的分词结果:1 、我爱楚 离 陌 Jcseg分词器 的分词结果:1 、我 爱 楚 离 陌 MMSeg4j分词器 的分词结果:1 、我爱 楚 离 陌 IKAnalyzer分词器 的分词结果:1 、我 爱 楚 离 陌 *word分词器 的分词结果:1 、【全切分算法】我 爱 楚离陌 2 、【双向最大最小匹配算法】我 爱 楚离陌 3 、【正向最大匹配算法】我 爱 楚离陌 4 、【双向最大匹配算法】我 爱 楚离陌 5 、【逆向最大匹配算法】我 爱 楚离
9、陌 6 、【正向最小匹配算法】我 爱 楚离陌 7 、【双向最小匹配算法】我 爱 楚离陌 8 、【逆向最小匹配算法】我 爱 楚离陌 Stanford分词器 的分词结果:1 、【Stanford Chinese Treebank segmentation】我 爱 楚离陌 2 、【Stanford Beijing University segmentation】我 爱 楚 离陌 Ansj分词器 的分词结果:1 、【BaseAnalysis】我 爱 楚 离 陌 2 、【IndexAnalysis】我 爱 楚 离 陌 3 、【ToAnalysis】我 爱 楚 离 陌 4 、【NlpAnalysis】我
10、爱 楚离 陌 HanLP分词器 的分词结果:1 、【NLP分词】我 爱 楚 离 陌 2 、【标准分词】我 爱 楚 离 陌 3 、【N-最短路径分词】我 爱 楚 离 陌 4 、【索引分词】我 爱 楚 离 陌 5 、【最短路径分词】我 爱 楚 离 陌 6 、【极速词典分词】我 爱 楚 离 陌 smartcn分词器 的分词结果:1 、【smartcn】我 爱 楚 离 陌 FudanNLP分词器 的分词结果:1 、【FudanNLP】我 爱楚离陌Jieba分词器 的分词结果:1 、【SEARCH】我爱楚 离 陌 2 、【INDEX】我爱楚 离 陌 Jcseg分词器 的分词结果:1 、【简易模式】我 爱 楚 离 陌 2 、【复杂模式】
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新版铲车租赁合同协议书3篇
- 新版律师聘用合同范本3篇
- 安装工程合同中的工程变更处理3篇
- 招标文件递交指南技巧3篇
- 工程围挡施工合同模板3篇
- 摄影器材购销合同3篇
- 房屋买卖合同模板集锦3篇
- 新农合医保的信赖保障3篇
- 安置房转让协议书3篇
- 安装工程招标文件范本地质3篇
- 石油化工安装工程预算定额(2019版)
- 换热器的传热系数K
- 石化企业恐怖袭击事件应急预案
- 美意模块式水冷风冷冷热水机组LCD线控器使用说明书
- (完整版)钢楼梯施工方案
- 奖状证书模板优秀员工3
- 电子商务基础与应用题库
- 湿式静电除尘器技术方案0001
- T∕CSCS 018-2022 装配式建筑钢结构防腐蚀涂装技术规程
- 第二章multisim仿真作业
- 瑞文智力测验及答案经典版
评论
0/150
提交评论