github hankcs/HanLP v1.7.6
v1.7.6 最后的武士 The Last Samurai

latest releases: v1.8.4, v1.8.3, v2.1.0-beta.0...
4 years ago

接下来是一个全新的时代,我们的征途是星辰大海。此后1.x分支将继续提供稳定性维护,两个版本面向的场景不同,2.0基于深度学习,面向对精度要求极其高的场景,例如端到端的问答系统解决方案;而1.x基于传统机器学习和特征工程,面向搜索引擎等对速度要求较高的场景。2.0需要时间打磨,1.x将会持续维护,保证稳定性。

HanLP

  • 新增 DocVectorModel.nearest(java.lang.String, int) 方法 fix #1332
  • 词法分析器新增空格处理 fix #797
  • 修订现代汉语补充词库 fix #1330
  • NGramDictionaryMaker等默认UTF-8编码 fix #1320
  • WordVectorModel支持自定义Map类型:#1304
  • 修复信息熵计算中的除零错误 fix #1366
  • 修复Nature的线程安全性
  • tfidf,idf的数据可以通过加载idf文件得到
  • 开放 CoreStopWordDictionary.dictionary #1356
  • 修复加载自定义停用词文件无效
  • 兼容数据包data-for-1.7.5.zip分流网盘md5=1d9e1be4378b2dbc635858d9c3517aaa
  • Portable版同步升级到v1.7.6
        <dependency>
            <groupId>com.hankcs</groupId>
            <artifactId>hanlp</artifactId>
            <version>portable-1.7.6</version>
        </dependency>

🎉感谢所有在issue中提出宝贵建议的用户!

Don't miss a new HanLP release

NewReleases is sending notifications on new releases.