🆕 新增模型
- RT-DETRv3:新增 RT-DETRv3 目标检测模型,支持 checkpoint recompute 机制以降低训练显存占用,V100×4 精度达 47.5 mAP(#9376)
- DEIM:新增 DEIM 系列模型,包含 DFINE-HGNetv2(N/S/M/L/X)和 RTDETRv2(R18/R34/R50/R50m/R101)共 11 个规模,所有模型精度与官方论文对齐(#9381)
- PP-DocLayoutV3:新增文档版面分析模型,支持文档布局检测与阅读顺序预测(#9473)
✨ 新功能
🖥️ 硬件平台适配
- CUDA 13:适配 CUDA 13 新目录结构,修复编译时头文件搜索路径问题(#9432)
- 天数智芯(Iluvatar)GPU:新增全链路支持,覆盖训练、评估、推理及 MOT 全流程(#9472)
- 燧原 GCU:更新 GCU 平台相关配置(#9327)
- 昇腾 NPU:修复 DETR 模型在 NPU 上的训练异常(#9338)
🐛 Bug 修复
- RTDETRv2 导出:修复 Windows + GPU 环境下导出模型时的非法维度报错(#9305)
- 高性能推理(HPI):修复
im_shape处理错误及 batch size 配置问题(#9303、#9318、#9321) - 模型导出稳定性:修复多个模型导出时的序列化报错及浅拷贝问题(#9365、#9375、#9379)
- Mask R-DETR:修复动图与静态图在 inplace 操作上的行为不一致问题(#9330)
- 数据预处理:修复
RandomSizeCrop对零尺寸标注框的数据类型处理错误(#9353) - Mosaic 增强:修复
centered_affine=False下数据增强行为异常(#9394)