github labring/FastGPT v4.9.0-alpha
V4.9.0-alpha

pre-releaseone day ago

👀 新功能预览

PDF 增强

开启PDF增强 原文 解析结果
image image image

兼容 & 弃用

  1. 弃用 - 之前私有化部署的自定义文件解析方案,请同步更新到最新的配置方案。点击查看 PDF 增强解析配置
  2. 弃用 - 弃用旧版本地文件上传 API:/api/core/dataset/collection/create/file(以前仅商业版可用的 API,该接口已放切换成:/api/core/dataset/collection/create/localFile)
  3. 停止维护,即将弃用 - 外部文件库相关 API,可通过 API 文件库替代。
  4. API更新 - 上传文件至知识库、创建连接集合、API 文件库、推送分块数据等带有 trainingType 字段的接口,trainingType字段未来仅支持chunkQA两种模式。增强索引模式将设置单独字段:autoIndexes,目前仍有适配旧版trainingType=auto代码,但请尽快变更成新接口类型。具体可见:知识库 OpenAPI 文档

🚀 新增内容

  1. PDF增强解析交互添加到页面上。同时内嵌 Doc2x 服务,可直接使用 Doc2x 服务解析 PDF 文件。 @c121914yu
  2. 图片自动标注,同时修改知识库文件上传部分数据逻辑和交互。 @c121914yu
  3. pg vector 插件升级 0.8.0 版本,引入迭代搜索,减少部分数据无法被检索的情况。 @c121914yu

⚙️ 优化

  1. 知识库数据不再限制索引数量,可无限自定义。同时可自动更新输入文本的索引,不影响自定义索引。@c121914yu
  2. Markdown 解析,增加链接后中文标点符号检测,增加空格。@c121914yu
  3. Prompt 模式工具调用,支持思考模型。同时优化其格式检测,减少空输出的概率。@c121914yu
  4. Mongo 文件读取流合并,减少计算量。同时优化存储 chunks,极大提高大文件读取速度。50M PDF 读取时间提高 3 倍。 @lgphone

🐛 修复

  1. 增加网页抓取安全链接校验。 @L0nm4r
  2. 批量运行时,全局变量未进一步传递到下一次运行中,导致最终变量更新错误。 @newfish-cmyk

📖 完整记录

New Contributors

Full Changelog: v4.8.23-fix2...v4.9.0-alpha

Don't miss a new FastGPT release

NewReleases is sending notifications on new releases.