👀 新功能预览
PDF 增强
开启PDF增强 | 原文 | 解析结果 |
---|---|---|
![]() | ![]() | ![]() |
兼容 & 弃用
- 弃用 - 之前私有化部署的自定义文件解析方案,请同步更新到最新的配置方案。点击查看 PDF 增强解析配置
- 弃用 - 弃用旧版本地文件上传 API:/api/core/dataset/collection/create/file(以前仅商业版可用的 API,该接口已放切换成:/api/core/dataset/collection/create/localFile)
- 停止维护,即将弃用 - 外部文件库相关 API,可通过 API 文件库替代。
- API更新 - 上传文件至知识库、创建连接集合、API 文件库、推送分块数据等带有
trainingType
字段的接口,trainingType
字段未来仅支持chunk
和QA
两种模式。增强索引模式将设置单独字段:autoIndexes
,目前仍有适配旧版trainingType=auto
代码,但请尽快变更成新接口类型。具体可见:知识库 OpenAPI 文档
🚀 新增内容
- PDF增强解析交互添加到页面上。同时内嵌 Doc2x 服务,可直接使用 Doc2x 服务解析 PDF 文件。 @c121914yu
- 图片自动标注,同时修改知识库文件上传部分数据逻辑和交互。 @c121914yu
- pg vector 插件升级 0.8.0 版本,引入迭代搜索,减少部分数据无法被检索的情况。 @c121914yu
⚙️ 优化
- 知识库数据不再限制索引数量,可无限自定义。同时可自动更新输入文本的索引,不影响自定义索引。@c121914yu
- Markdown 解析,增加链接后中文标点符号检测,增加空格。@c121914yu
- Prompt 模式工具调用,支持思考模型。同时优化其格式检测,减少空输出的概率。@c121914yu
- Mongo 文件读取流合并,减少计算量。同时优化存储 chunks,极大提高大文件读取速度。50M PDF 读取时间提高 3 倍。 @lgphone
🐛 修复
- 增加网页抓取安全链接校验。 @L0nm4r
- 批量运行时,全局变量未进一步传递到下一次运行中,导致最终变量更新错误。 @newfish-cmyk
📖 完整记录
- fix: Check the url to avoid ssrf attacks by @c121914yu in #3965
- Create SECURITY.md by @c121914yu in #3967
- plugin customize author by @newfish-cmyk in #3963
- fix loop child nodes variables by @newfish-cmyk in #3980
- fix ai proxy logs pagination by @newfish-cmyk in #3954
- fix: 优化读取mongo文件性能,解决因执行Buffer.concat过多造成等待导致整个服务hang住的 by @lgphone in #3985
- simple mode tool reason by @c121914yu in #3984
- fix: link cheker by @c121914yu in #3987
New Contributors
Full Changelog: v4.8.23-fix2...v4.9.0-alpha