Skip to content

开发路线图

路线图可能会经常变更,如果有强烈的建议,可以在 issue 中提。

日志添加规范(For Agent):

  • 同一版本的多次功能更新时,应以功能为单位进行更新,比如之前添加了 A 功能的分不分续保,在后续的更新中修复了因 A 功能引入的 bug,那么这个修复说明应该和 A 功能描述放在一起,而不是新增一条修复记录,功能更新同理。

看板

  • 集成 LangFuse (观望) 添加用户日志与用户反馈模块,可以在 AgentView 中查看信息
  • 部分场景应该使用默认模型作为默认值而不是空值
  • 检索测试中,添加问答
  • 集成 Memory,基于 deepagents 的文件后端实现
  • 添加自定义向量模型和 rerank 模型的配置,在网页上面
  • 调研轻便的文件展示与编辑器
  • 移除 TODO 的模块与设计,移除这个中间件。
  • Yuxi-cli 相关的功能,放在后续版本中实现(不是类似于编程助手,而是工具)
  • 工作区实现长期记忆保存,要求模型只能将结果写入到 outputs 文件夹
  • 新增 present file 工具,提供预览以及保存到工作区的选项

Bugs

  • 部分异常状态下,智能体的模型名称出现重叠#279
  • 部分 local 的 mcp server 无法正常加载,但是建议在项目外部启动 mcp 服务器,然后通过 sse 的方式使用。【未复现】
  • 目前的知识库的图片存在公开访问风险
  • 生成基准测试会把所有的向量都计算一遍不合理

v0.6

新增

  • 重构后端代码 src -> backend/package/yuxi
  • 重构文档解析,统一文档解析体验,并新增 Parser 类
  • 新增 LITE 模式启动,启动时不加载知识库、知识图谱相关模块,可以使用 make up-lite 快捷启动
  • 新增沙盒环境,详见后续文档更新,统一沙盒虚拟路径前缀默认值为 /home/gem/user-data
  • 新增基于沙盒的文件系统,前端工作台可以查看文件系统,支持预览(文本、图片、PDF、HTML)、下载文件
  • 新增基于沙盒的知识库只读映射,按“用户可访问知识库 ∩ 当前 Agent 已启用知识库”暴露原始文件与解析后的 Markdown
  • 重构附件系统,直接集成在了沙盒文件系统中,附件上传后直接落盘到沙盒挂载目录
  • 优化前端流式消息体验:新增通用 useStreamSmoother 调度层,统一平滑 Agent runs SSE、普通聊天流与审批恢复流中的 loading chunk
  • 优化项目文档说明,并添加贡献指南
  • 重构前端 Agent 路由结构,体验更加顺畅,切换更加自然(类 chatgpt 体验)
  • 新增 API Key 认证功能,支持外部系统通过 API Key 调用系统服务
  • 新增 subagents 的支持,支持在 web 中添加 subagents,以及两个内置的子智能体
  • 新增内置Skills reporter,并移除内置 Agent reporter,数据库报表将由 Skills 完成
  • 新增知识库 PDF、图片的预览功能

修复

  • 重构聊天接口请求模型:流式与非流式聊天统一使用 query + agent_config_id 请求体,并移除路径中的 agent_id;同时修复非流式接口实际误走流式执行链路的问题,改为调用 invoke_messages 一次性执行,并补充对应测试
  • 修复对话线程与 Agent 配置错位的问题:发送消息时将当前 agent_config_id 绑定到 thread 的 extra_metadata,线程列表接口返回该绑定值,前端切换历史 thread 时会自动恢复对应配置
  • 为沙盒与 viewer 文件系统补齐知识库只读映射:新增 /home/gem/kbs 命名空间,按“用户可访问知识库 ∩ 当前 Agent 已启用知识库”暴露原始文件与解析后的 Markdown,并补充对应后端与 viewer 路由测试
  • 修复前端工具图标与渲染匹配不准确的问题:工具管理列表与工具调用结果统一改为基于工具 id 的精确映射,避免模糊匹配导致的误渲染,未命中的工具不再显示默认扳手图标
  • 修复 GitHub Pages 文档部署工作流失败:移除 actions/setup-node@v4 对不存在 docs/package-lock.json 的缓存依赖,并将 docs 目录安装命令从 npm ci 调整为 npm install,避免因未提交锁文件导致 CI 在依赖缓存和安装阶段直接失败

v0.5

新增

  • 优化 OCR 体验并新增对 Deepseek OCR 的支持
  • 优化 RAG 检索,支持根据文件 pattern 来检索(Agentic Mode)
  • 重构智能体对于“工具变更/模型变更”的处理逻辑,无需导入更复杂的中间件
  • 重构知识库的 Agentic 配置逻辑,与 Tools 解耦
  • 将工具与知识库解耦,在 context 中就完成解耦,虽然最终都是在 Agent 中的 get_tools 中获取
  • 优化chunk逻辑,移除 QA 分割,集成到普通分块中,并优化可视化逻辑
  • 重构知识库处理逻辑,分为 上传—解析—入库 三个阶段
  • 重构 MCP 相关配置,使用数据库来控制 #469
  • 使用 docling 解析 office 文件(docx/xlsx/pptx)
  • 优化后端的依赖,减少镜像体积 #428
  • 优化 liaghtrag 的知识库调用结果,提供 content/graph/both 多个选项
  • 优化数据库查询工具,可通过设计环境变量添加描述,让模型更好的调用
  • 优化任务组件,改用 postgresql 存储,并新增删除任务的接口
  • 支持更多类型的文档源的导入功能(支持后端配置的白名单的 URL 导入)

修复

  • 修复文件上传弹窗中 OCR 下拉选项展开时不会自动检查服务状态的问题
  • 修复知识图谱上传的向量配置错误,并新增模型选择以及 batch size 选择
  • 修复部分场景下获取工具列表报错 #470
  • 修改方法备注信息 #478
  • 修复多次 human-in-the-loop 的渲染解析问题 #453 #475
  • 修复沙盒后端接入回归:补齐 composite backend 的 sandbox_backend 参数、限制 /api/sandbox/prepare 仅允许访问当前用户线程、确保 release() 之后的 destroy() 会真正停止热池容器,并恢复 docker-compose 的完整模式默认值
  • 重构沙盒为 deer-flow 风格的 AIO provider:切换为 thread-local sandbox、统一 /home/gem/user-data/{workspace,uploads,outputs} 固定路径、移除公开 /api/sandbox/* 生命周期接口,并补充 lite 模式下的 provider 生命周期、filesystem API 与 sandbox 复用/隔离 E2E 验证
  • 调整聊天附件存储链路:线程附件改为直接落盘到 saves/threads/<thread_id>/user-data/uploads,解析成功后额外生成 uploads/attachments/*.md,不再依赖 MinIO 或显式上传到 sandbox
  • 修复知识库文件列表包体异常膨胀:上传阶段不再把批次级 content_hashes 写入每个文件的 processing_params,并从数据库详情列表接口中移除该字段,改为按需读取单文件详情

v0.4

新增

  • 新增对于上传附件的智能体中间件,详见文档
  • 新增多模态模型支持(当前仅支持图片),详见文档
  • 新建 DeepAgents 智能体(深度分析智能体),支持 todo,files 等渲染,支持文件的下载。
  • 新增基于知识库文件生成思维导图功能(#335
  • 新增基于知识库文件生成示例问题功能(#335
  • 新增知识库支持文件夹/压缩包上传的功能(#335
  • 新增自定义模型支持、新增 dashscope rerank/embeddings 模型的支持
  • 新增文档解析的图片支持,已支持 MinerU Officical、Docs、Markdown Zip格式
  • 新增暗色模式支持并调整整体 UI(#343
  • 新增知识库评估功能,支持导入评估基准或者自动构建评估基准(目前仅支持Milvus类型知识库)详见文档
  • 新增同名文件处理逻辑:遇到同名文件则在上传区域提示,是否删除旧文件
  • 新增生产环境部署脚本,固定 python 依赖版本,提升部署稳定性
  • 优化图谱可视化方式,统一图谱数据结构,统一使用基于 G6 的可视化方式,同时支持上传带属性的图谱文件,详见文档
  • 优化 DBManager / ConversationManager,支持异步操作
  • 优化 知识库详情页面,更加简洁清晰,增强文件下载功能

修复

  • 修复重排序模型实际未生效的问题
  • 修复消息中断后消息消失的问题,并改善异常效果
  • 修复当前版本如果调用结果为空的时候,工具调用状态会一直处于调用状态,尽管调用是成功的
  • 修复检索配置实际未生效的问题
  • 修复 sandbox 文件系统 ls 在异常输出下触发 KeyError: 'path' 的问题,并将工具调用异常降级为错误消息,避免直接中断聊天 stream
  • 修复智能体状态面板中文件树仍依赖 agent_state.files 的问题,改为通过真实 /api/filesystem/* 接口按层懒加载后端可见文件系统,并让输入框下方状态按钮常态化打开工作区视图
  • 为工作台新增 viewer-oriented filesystem service 与 /api/viewer/filesystem/* 接口,解耦 agent backend 语义,支持真实目录浏览、原始文件读取与下载
  • 重写沙盒技术文档,明确 thread-local sandbox、viewer-oriented filesystem service、/mnt 命名空间、skills 可见性与当前实现边界,替换过时的 /api/sandbox/* 与 user-level 设计描述
  • 收紧沙盒遗留代码:修复未注册 sandbox_router 中残留的 user/thread 参数错位,改进宿主机挂载路径映射逻辑,并为 remote sandbox provisioner 增加基础 URL 校验与销毁失败日志

破坏性更新

  • 移除 Chroma 的支持,当前版本标记为移除
  • 移除模型配置预设的 TogetherAI

v0.3

Added

  • 添加测试脚本,覆盖最常见的功能(已覆盖API)
  • 新建 tasker 模块,用来管理所有的后台任务,UI 上使用侧边栏管理。Tasker 中获取历史任务的时候,仅获取 top100 个 task。
  • 优化对文档信息的检索展示(检索结果页、详情页)
  • 优化全局配置的管理模型,优化配置管理
  • 支持 MinerU 2.5 的解析方法 0.3.5
  • 修改现有的智能体Demo,并尽量将默认助手的特性兼容到 LangGraph 的 create_agent
  • 基于 create_agent 创建 SQL Viewer 智能体 0.3.5
  • 优化 MCP 逻辑,支持 common + special 创建方式 0.3.5
  • LightRAG 知识库应该可以支持修改 LLM

Fixed

  • 修复本地知识库的 metadata 和 向量数据库中不一致的情况。
  • v1 版本的 LangGraph 的工具渲染有问题
  • upload 接口会阻塞主进程
  • LightRAG 知识库查看不了解析后的文本,偶然出现,未复现
  • 智能体的加载状态有问题:(1)智能体加载没有动画;(2)切换对话和加载中,使用同一个loading状态。
  • 前端工具调用渲染出现问题
  • 当前 ReAct 智能体有消息顺序错乱的 bug,且不会默认调用工具
  • 修复文件管理:(1)文件选择的时候会跨数据库;(2)文件校验会算上失败的文件;

本项目基于 MIT License 开源,欢迎使用和贡献。