模型配置

对话模型

系统支持多种大语言模型服务商，通过配置对应的 API 密钥即可使用：

服务商	环境变量	特点
硅基流动	`SILICONFLOW_API_KEY`	🆓 免费额度，默认推荐
OpenAI	`OPENAI_API_KEY`	GPT 系列模型
DeepSeek	`DEEPSEEK_API_KEY`	国产大模型
OpenRouter	`OPENROUTER_API_KEY`	多模型聚合平台
智谱清言	`ZHIPUAI_API_KEY`	GLM 系列模型
阿里云百炼	`DASHSCOPE_API_KEY`	通义千问系列

其余还支持火山豆包、Together、vLLM、Ollama 等。

配置方法

在 .env 文件中添加对应的环境变量：

免费获取 API Key

硅基流动注册即送 14 元额度，支持多种开源模型。

bash

MODEL_DIR=./models
SAVE_DIR=./saves
REDIS_URL=redis://redis:6379/0
RUN_EVENTS_STREAM_TTL_SECONDS=7200
RUN_CANCEL_KEY_TTL_SECONDS=1800
LANGGRAPH_CHECKPOINTER_BACKEND=postgres
VITE_USE_RUNS_API=false

# region model_provider
SILICONFLOW_API_KEY=  # 推荐使用硅基流动免费服务 https://cloud.siliconflow.cn/i/Eo5yTHGJ
TAVILY_API_KEY=  # 获取搜索服务的 api key 请访问 https://app.tavily.com/

# # 其余可选配置
# OPENAI_API_KEY=
# OPENAI_API_BASE=
# ZHIPUAI_API_KEY=
# DASHSCOPE_API_KEY=
# DEEPSEEK_API_KEY=
# ARK_API_KEY=
# TOGETHER_API_KEY=
# # endregion model_provider

# # region neo4j
# NEO4J_URI=
# NEO4J_USERNAME=
# NEO4J_PASSWORD=
# # endregion neo4j

# # Servies
# YUXI_SUPER_ADMIN_NAME=
# YUXI_SUPER_ADMIN_PASSWORD=

# # URL Whitelist (comma-separated domains/IPs, empty to disable URL parsing)
# YUXI_URL_WHITELIST=github.com,docs.example.com,gitlab.example.com,127.0.0.1

# # MinerU
# MINERU_API_KEY=

# LightRag llm 并发限制
# MAX_ASYNC=5
# EMBEDDING_FUNC_MAX_ASYNC=8

默认对话模型格式

系统的默认对话模型可以在设置页面配置，也可以通过配置项 default_model 指定，格式统一为 模型提供商/模型名称，例如：

yaml

default_model: default="siliconflow/Pro/deepseek-ai/DeepSeek-V3.2

自定义模型供应商

自定义模型供应商仅支持对话模型

自定义模型供应商仅支持对话模型，嵌入模型和重排模型请修改配置文件

系统提供了完整的自定义供应商管理功能，支持通过 Web 界面直接添加、编辑、测试和删除自定义模型供应商。

使用方法

系统支持任何 OpenAI 兼容的云服务提供商

1. Web 界面操作（推荐）

访问 系统设置 > 模型配置，在"自定义供应商"部分点击 添加自定义供应商。这里的密钥可以直接填写也可以填写对应的环境变量名称。

2. 配置文件操作

如需通过配置文件管理，编辑 saves/config/custom_providers.toml：

toml

[model_names.local-vllm]
name = "本地 vLLM 服务"
url = "https://docs.vllm.ai"
base_url = "http://localhost:8000/v1"
default = "Qwen/Qwen2.5-7B-Instruct"
env = "LOCAL_VLLM_API_KEY"
models = [
    "Qwen/Qwen2.5-7B-Instruct",
    "Qwen/Qwen2.5-14B-Instruct",
]
custom = true

[model_names.local-ollama]
name = "本地 Ollama"
url = "https://ollama.com"
base_url = "http://localhost:11434/v1"
default = "llama3.2"
env = "NO_API_KEY"
models = ["llama3.2", "qwen2.5"]
custom = true

然后在 .env 文件中添加对应的环境变量：

env

LOCAL_VLLM_API_KEY=your_api_key_here

API 端点

系统提供以下 API 端点管理自定义供应商：

GET /api/system/custom-providers - 获取所有自定义供应商
POST /api/system/custom-providers - 添加自定义供应商
PUT /api/system/custom-providers/{provider_id} - 更新自定义供应商
DELETE /api/system/custom-providers/{provider_id} - 删除自定义供应商
POST /api/system/custom-providers/{provider_id}/test - 测试供应商连接

常见配置示例

vLLM 本地服务

toml

[model_names.vllm-local]
name = "vLLM 本地服务"
base_url = "http://localhost:8000/v1"
default = "Qwen/Qwen2.5-7B-Instruct"
env = "NO_API_KEY"
models = [
    "Qwen/Qwen2.5-7B-Instruct",
    "Qwen/Qwen2.5-14B-Instruct",
    "meta-llama/Llama-3.1-8B-Instruct"
]

Ollama 本地服务

toml

[model_names.ollama-local]
name = "Ollama 本地服务"
base_url = "http://localhost:11434/v1"
default = "llama3.2"
env = "NO_API_KEY"
models = [
    "llama3.2:latest",
    "qwen2.5:latest",
    "codellama:latest"
]

第三方 API 中转服务

toml

[model_names.api-proxy]
name = "API 中转服务"
base_url = "https://api-proxy.example.com/v1"
default = "gpt-3.5-turbo"
env = "API_PROXY_KEY"
models = [
    "gpt-3.5-turbo",
    "gpt-4",
    "claude-3-sonnet"
]

故障排除

测试连接失败: 检查 API 地址格式和 API 密钥配置
模型不可用: 确认模型名称拼写和服务端是否支持该模型
权限错误: 确保用户具有管理员权限
配置未生效: 检查环境变量配置和服务重启状态

多模态模型

系统支持图片作为输入，与文本结合形成多模态查询。

支持的图片格式

JPEG、PNG、WebP、GIF、BMP
最大 10MB
超过 5MB 会自动压缩

使用方式

在对话接口中传入图片数据：

json

{
    "query": "这张图片里有什么？",
    "image_content": "<base64编码的图片数据>",
    "config": {},
    "meta": {}
}

系统会自动将图片转换为符合模型要求的格式，支持多模态的模型会同时处理图片和文本信息。

支持多模态的模型

大多数主流模型提供商都支持多模态能力，选择模型时需确认模型本身支持图片输入。

嵌入模型和重排序模型

1. 配置模型信息

在 src/config/static/models.py 中的默认配置部分添加：

python

# 默认嵌入模型配置
DEFAULT_EMBED_MODELS: dict[str, EmbedModelInfo] = {
    # ... 现有配置 ...

    "vllm/Qwen/Qwen3-Embedding-0.6B": EmbedModelInfo(
        name="Qwen/Qwen3-Embedding-0.6B",
        dimension=1024,
        base_url="http://localhost:8000/v1/embeddings",
        api_key="no_api_key",
    ),
}

# 默认重排序模型配置
DEFAULT_RERANKERS: dict[str, RerankerInfo] = {
    # ... 现有配置 ...

    "vllm/BAAI/bge-reranker-v2-m3": RerankerInfo(
        name="BAAI/bge-reranker-v2-m3",
        base_url="http://localhost:8000/v1/rerank",
        api_key="no_api_key",
    ),
}

2. 动态配置（可选）

你也可以通过代码动态添加本地模型：

python

from src.config import config
from src.config.static.models import EmbedModelInfo, RerankerInfo

# 添加本地嵌入模型
config.embed_model_names["local/embed-model"] = EmbedModelInfo(
    name="local-embed-model",
    dimension=1024,
    base_url="http://localhost:8000/v1/embeddings",
    api_key="no_api_key",
)

# 添加本地重排序模型
config.reranker_names["local/reranker-model"] = RerankerInfo(
    name="local-reranker-model",
    base_url="http://localhost:8000/v1/rerank",
    api_key="no_api_key",
)

# 保存配置
config.save()

3. 启动模型服务

bash

# 启动嵌入模型
vllm serve Qwen/Qwen3-Embedding-0.6B \
  --task embed \
  --dtype auto \
  --port 8000

# 启动重排序模型
vllm serve BAAI/bge-reranker-v2-m3 \
  --task score \
  --dtype fp16 \
  --port 8000

模型配置 ​

对话模型 ​

配置方法 ​

默认对话模型格式 ​

自定义模型供应商 ​

使用方法 ​

1. Web 界面操作（推荐） ​

2. 配置文件操作 ​

API 端点 ​

常见配置示例 ​

vLLM 本地服务 ​

Ollama 本地服务 ​

第三方 API 中转服务 ​

故障排除 ​

多模态模型 ​

支持的图片格式 ​

使用方式 ​

支持多模态的模型 ​

嵌入模型和重排序模型 ​

1. 配置模型信息 ​

2. 动态配置（可选） ​

3. 启动模型服务 ​

模型配置

对话模型

配置方法

默认对话模型格式

自定义模型供应商

使用方法

1. Web 界面操作（推荐）

2. 配置文件操作

API 端点

常见配置示例

vLLM 本地服务

Ollama 本地服务

第三方 API 中转服务

故障排除

多模态模型

支持的图片格式

使用方式

支持多模态的模型

嵌入模型和重排序模型

1. 配置模型信息

2. 动态配置（可选）

3. 启动模型服务