- 词法分析器支持
CustomDictionary.insert
动态插入的用户词条 - 词法分析器支持用户词典中的自定义词性
- 词法分析器支持
enableCustomDictionaryForcing
提高用户词典优先级 - NLPTokenizer默认使用感知机词法分析器
- 完善圆圈数字对应关系 @AnyListen
- 开放命名实体识别的特征提取方法
- TextRankKeyword使用CoreStopWordDictionary的过滤器
- 删除人名识别中的BXD模式,优化日本人名识别
- 修复ViterbiSegment激活多个配置项带来的问题
- 微调bigram、微调人名识别模型
- 数据包兼容 data-for-1.6.2.zip
md5=3ebb9e47ecff740f09c9ec7c21324661
获取最新版的数据包,请fork
并git clone
一份仓库中的最新data。 - Portable版同步升级到v1.6.3
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.6.3</version>
</dependency>
🎉感谢所有在issue中提出宝贵建议的用户!