- 实现了用户自定义词性,同时支持代码动态增加和词典文件增加用户词性;请参考demo
- 实现了URL识别,支持包括".中国"在内的大部分IANA顶级域名
- BinTrie实现了Externalizable接口,可直接序列化
- 修正BinTrie的remove方法
- DoubleArrayTrie小优化
- 为NShortSegment添加用户词典功能
- 拼音词库修正
-
回滚旧版简繁词典,调整简繁分词逻辑
- 人工校对了几个词语及词性
- 新版数据包:data-for-1.2.10.zip
- Portable同步升级到v1.2.10,Maven:
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.2.10</version>
</dependency>