- 调整用户词典作用为:分词后使用用户词典合并相邻词语
- KeywordExtractor排除空格换行等
- 优化地名识别模块对短地名的处理
- 词典加载期间提供更人性化的报错信息
- 默认关闭字符正规化
- 求解两个数组中最相近的数更新到一种O(n)时间的算法
- 自动校验CoreNatureDictionary.ngram.txt的缓存与CoreNatureDictionary.txt的缓存的一致性
- 词典微调,最新数据集:data-for-1.2.4.zip
- Portable同步升级到v1.2.4,Maven:
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.2.4</version>
</dependency>