重大更新:
- 批量文档识别。支持
pdf, epub, mobi
等多种格式的文档,对扫描件进行OCR或提取原有文本。可输出为 双层可搜索PDF 。 - 更强大的 排版解析 功能,代替之前的段落合并。基于 间隙树排序算法 ,解析多栏布局图片与文档时有较好的精度。
- HTTP接口参数作出了部分改动,并提供了一些更方便的选项。有需要的用户请重新参考 README_HTTP.md 。
⚠ Windows 7 用户注意:
文档识别可能在Win7上出现异常,如无法保存PDF文件、软件崩溃等。已知系统驱动、运行库不齐全的系统更有可能出现该问题。具体原因尚在调查中。
如果您发现了上述问题,请尝试安装常用运行库,并更新系统补丁到最新。或者,换用Win10及以上的系统进行文档识别。
其他功能在Win7上不受影响。
其它更新内容:
- 新增:允许隐藏托盘图标。 (#338)
- 新增:重复上一次截图区域的快捷键。 (#357)
- 新增:用本地图片浏览器打开图片的快捷按钮。 (#335)
- 修复:避免系统环境变量
QMLSCENE_DEVICE
的影响。 (#270) - 修复一些小问题,优化一些UI表现与提示语。
Help us translate / 帮助我们翻译!
We warmly invite translators to join us in our project's localization efforts!
You can review existing translations or contribute new ones.
Please visit the online platform Weblate at:
https://hosted.weblate.org/engage/umi-ocr/
配置文件迁移
Umi-OCR v2 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
下载说明
不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.0.7z.exe (128MB)
SHA256: 5349728289f353a25b5f570fe11795bb60d80c1df419bcc9977899b6c1c723a6
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.1.0.7z.exe (97MB)
SHA256: 6460148b3b8fcdfb447ed8984a9c2fa232ca0cd156d8352f47d1841b2e3614ac