- 优化部分模型和模型配置:
- 更新 PP-OCRv5默认模型配置,检测和识别均由mobile改为server模型。为了改善大多数的场景默认效果,配置中的参数
limit_side_len
由736改为64 - 新增文本行方向分类
PP-LCNet_x1_0_textline_ori
模型,精度99.42%,OCR、PP-StructureV3、PP-ChatOCRv4产线的默认文本行方向分类器改为该模型 - 优化文本行方向分类
PP-LCNet_x0_25_textline_ori
模型,精度提升3.3个百分点,当前精度98.85%
- 更新 PP-OCRv5默认模型配置,检测和识别均由mobile改为server模型。为了改善大多数的场景默认效果,配置中的参数
- 优化3.0.0版本部分存在的问题
- 优化CLI使用体验: 当使用PaddleOCR CLI不传入任何参数时,给出用法提示。
- 新增参数: PP-ChatOCRv3、PP-StructureV3支持
use_textline_orientation
参数。 - CPU推理速度优化: 所有产线CPU推理默认开启MKL-DNN。
- C++推理支持: PP-OCRv5的检测和识别串联部分支持C++推理
- 修复3.0.0版本部分存在的问题
- 修复由于公式识别、表格识别模型无法使用MKL-DNN导致PP-StructureV3在部分cpu推理报错的问题
- 修复在部分GPU环境中推理报
FatalError: Process abort signal is detected by the operating system
错误的问题 - 修复部分Python3.8环境的type hint的问题
- 修复
PPStructureV3.concatenate_markdown_pages
方法不存在的问题。 - 修复实例化
paddleocr.PaddleOCR
时同时指定lang
和model_name
时model_name
不生效的问题。