Dify API 生产接入实战：从调用到上线踩坑复盘

发布人：慈云数据-客服中心发布时间：2026-06-07 03:28 阅读量：187

Dify API接口调用教程｜生产环境实测

在企业应用落地大模型能力的过程中，Dify 是一个非常常见的选择。它既提供了可视化编排能力，也提供了相对完善的 API 接口，方便开发者把 AI 应用接入到业务系统、网站、后台管理系统、企业微信、钉钉、飞书机器人、客服系统以及各类自动化流程中。

本文将围绕 Dify API 接口调用 展开，结合生产环境中的实际接入经验，系统讲解从 API Key 获取、接口调用方式、流式响应、会话管理、文件上传、工作流调用，到生产环境中的超时、重试、鉴权、安全和性能优化等关键问题。

本文适合以下读者：

已经在 Dify 中创建了应用，但不知道如何通过 API 调用；
想把 Dify 接入到自己的 Java、Python、Node.js、Go 或 PHP 项目中；
正在评估 Dify 是否适合生产环境；
已经接入 Dify，但遇到超时、流式输出、上下文管理、并发等问题；
希望了解 Dify API 在实际业务系统中的最佳实践。

一、Dify API 是什么？

Dify 提供的 API，本质上是把你在 Dify 控制台中创建的 AI 应用，以 HTTP 接口的形式开放给外部系统调用。

你可以在 Dify 中创建不同类型的应用，例如：

聊天助手 Chat App；
文本生成应用 Completion App；
工作流 Workflow；
Agent 应用；
知识库问答应用；
多步骤自动化处理应用。

创建完成后，Dify 会为应用提供对应的 API 调用方式。外部系统只需要携带 API Key，并按照 Dify 要求的请求格式发送 HTTP 请求，就可以获得大模型输出结果。

简单来说：

Dify 控制台负责配置 AI 能力，Dify API 负责让业务系统调用这些能力。

二、为什么生产环境推荐使用 Dify API？

很多团队一开始使用大模型时，会直接调用 OpenAI、通义千问、DeepSeek、Claude、智谱、火山方舟等模型厂商的 API。但随着业务复杂度提升，很快会遇到一些问题：

Prompt 难以统一管理；
模型参数分散在代码中，不方便运营和产品调整；
知识库、工作流、工具调用需要额外开发；
多模型切换成本高；
无法方便地观察每次调用日志；
缺少可视化调试环境；
业务系统和 AI 编排逻辑耦合严重。

Dify 的价值就在于，它把很多 AI 应用层能力做成了平台化能力。业务系统只需要调用 Dify API，而不必直接关心底层大模型是谁。

在生产环境中，我们使用 Dify API 的典型好处包括：

Prompt 可视化管理；
工作流可在线调整；
支持知识库检索增强；
可配置多种模型供应商；
可以查看应用调用日志；
支持流式输出；
支持会话上下文；
支持变量传参；
可与内部业务系统解耦；
便于灰度测试和持续优化。

三、Dify API 调用前的准备工作

在正式调用 API 之前，需要完成以下准备。

1. 部署或使用 Dify

你可以选择两种方式：

方式一：使用 Dify 云服务

如果不想自己维护服务器，可以直接使用 Dify 官方云服务。优点是开箱即用，升级维护简单。

方式二：私有化部署 Dify

如果涉及企业内部数据、客户隐私数据、业务敏感数据，通常建议私有化部署。Dify 支持 Docker Compose 部署，适合企业内部环境使用。

生产环境中，如果数据安全要求较高，建议至少满足：

Dify 服务部署在企业内网或受控云环境；
使用 HTTPS；
数据库、向量库、Redis 独立部署或做好备份；
API Key 不暴露在前端；
配置访问控制和日志审计。

2. 创建应用

常见选择如下：

应用类型	适用场景
聊天助手	多轮对话、客服、咨询助手
文本生成	文案生成、摘要、分类、结构化提取
工作流	多步骤处理、复杂业务流程
Agent	需要工具调用、任务规划的场景
知识库应用	企业文档问答、客服知识库

如果是第一次接入 API，建议从“聊天助手”或“工作流”开始，比较容易理解。

3. 获取 API Key

进入 Dify 应用详情页，通常可以在以下位置找到 API 访问配置：

应用详情 → API 访问 → API Key

创建 API Key 后，需要妥善保存。

API Key 在请求时通过请求头传递：

Authorization: Bearer YOUR_API_KEY

注意：

API Key 不要写死在前端代码中；
不要提交到 Git 仓库；
不同环境建议使用不同 Key；
定期轮换；
泄露后要立即删除并重新生成。

四、Dify API 基础调用结构

Dify API 是标准 HTTP 接口。通常请求格式如下：

POST https://your-dify-domain/v1/chat-messages
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json

不同应用类型对应的接口可能不同，常见接口包括：

接口	说明
`/v1/chat-messages`	聊天消息接口
`/v1/completion-messages`	文本生成接口
`/v1/workflows/run`	工作流执行接口
`/v1/files/upload`	文件上传接口
`/v1/messages/{message_id}/feedbacks`	消息反馈
`/v1/conversations`	会话列表
`/v1/messages`	消息列表

具体以你当前 Dify 版本的 API 文档为准。不同版本可能会有细微变化。

五、调用聊天接口：`/v1/chat-messages`

聊天接口适合多轮对话场景，例如客服机器人、知识库问答助手、AI 助理等。

1. 请求示例

下面是一个最基础的 curl 调用示例：

curl -X POST 'https://your-dify-domain/v1/chat-messages' \
  -H 'Authorization: Bearer YOUR_API_KEY' \
  -H 'Content-Type: application/json' \
  -d '{
    "inputs": {},
    "query": "请介绍一下你们公司的售后服务政策",
    "response_mode": "blocking",
    "conversation_id": "",
    "user": "user-001"
  }'

2. 参数说明

参数	是否必填	说明
`inputs`	是	应用中定义的变量输入
`query`	是	用户输入的问题
`response_mode`	是	响应模式，常见为 `blocking` 或 `streaming`
`conversation_id`	否	会话 ID，用于多轮对话
`user`	是	用户标识，建议传业务系统用户 ID

其中 response_mode 有两种常见模式：

blocking：阻塞式返回，等待模型完整生成后一次性返回；
streaming：流式返回，边生成边返回，适合聊天界面。

3. 阻塞式响应示例

当使用 blocking 时，接口会在模型生成完成后返回完整结果。

示例响应如下：

{
  "event": "message",
  "task_id": "task-xxx",
  "id": "msg-xxx",
  "message_id": "msg-xxx",
  "conversation_id": "conv-xxx",
  "mode": "chat",
  "answer": "您好，我们的售后服务包括7天无理由退换、质量问题免费维修等...",
  "metadata": {
    "usage": {
      "prompt_tokens": 120,
      "completion_tokens": 80,
      "total_tokens": 200
    }
  },
  "created_at": 1710000000
}

生产环境中，业务系统一般需要重点关注：

answer：模型返回内容；
conversation_id：后续多轮对话需要保存；
message_id：用于反馈、日志追踪；
metadata.usage：用于统计 token 消耗。

六、Python 调用 Dify API 示例

下面是一个生产环境中较常见的 Python 调用方式。

import requests

DIFY_API_URL = "https://your-dify-domain/v1/chat-messages"
DIFY_API_KEY = "YOUR_API_KEY"

def call_dify_chat(query, user_id, conversation_id=None):
    headers = {
        "Authorization": f"Bearer {DIFY_API_KEY}",
        "Content-Type": "application/json"
    }

    payload = {
        "inputs": {},
        "query": query,
        "response_mode": "blocking",
        "conversation_id": conversation_id or "",
        "user": user_id
    }

    response = requests.post(
        DIFY_API_URL,
        headers=headers,
        json=payload,
        timeout=60
    )

    response.raise_for_status()
    data = response.json()

    return {
        "answer": data.get("answer"),
        "conversation_id": data.get("conversation_id"),
        "message_id": data.get("message_id") or data.get("id"),
        "usage": data.get("metadata", {}).get("usage", {})
    }

if __name__ == "__main__":
    result = call_dify_chat(
        query="帮我总结一下Dify API的主要功能",
        user_id="user-001"
    )

    print(result["answer"])
    print(result["conversation_id"])

生产环境建议

上面的代码只是基础示例，生产环境建议增加：

请求重试；
异常捕获；
日志记录；
超时控制；
熔断降级；
API Key 从环境变量读取；
业务侧 conversation_id 持久化；
用户输入长度限制；
敏感词和隐私信息过滤。

七、Node.js 调用 Dify API 示例

如果你的后端是 Node.js，可以使用 fetch 或 axios 调用。

async function callDifyChat(query, userId, conversationId = "") {
  const response = await fetch("https://your-dify-domain/v1/chat-messages", {
    method: "POST",
    headers: {
      "Authorization": `Bearer ${process.env.DIFY_API_KEY}`,
      "Content-Type": "application/json"
    },
    body: JSON.stringify({
      inputs: {},
      query,
      response_mode: "blocking",
      conversation_id: conversationId,
      user: userId
    })
  });

  if (!response.ok) {
    const errorText = await response.text();
    throw new Error(`Dify API Error: ${response.status}, ${errorText}`);
  }

  const data = await response.json();

  return {
    answer: data.answer,
    conversationId: data.conversation_id,
    messageId: data.message_id || data.id,
    usage: data.metadata?.usage
  };
}

在 Web 项目中，不建议浏览器直接请求 Dify API。正确方式是：

浏览器前端 → 业务后端 → Dify API

原因是 API Key 如果放在浏览器端，会被任何用户看到，存在严重安全风险。

八、流式调用：实现打字机效果

在聊天机器人场景中，用户通常希望看到模型边生成边输出，也就是类似 ChatGPT 的打字机效果。此时需要使用流式响应。

请求参数中设置：

{
  "response_mode": "streaming"
}

1. curl 示例

curl -X POST 'https://your-dify-domain/v1/chat-messages' \
  -H 'Authorization: Bearer YOUR_API_KEY' \
  -H 'Content-Type: application/json' \
  -d '{
    "inputs": {},
    "query": "请用三点说明Dify适合哪些业务场景",
    "response_mode": "streaming",
    "conversation_id": "",
    "user": "user-001"
  }'

流式响应通常基于 Server-Sent Events，也就是 SSE。服务端会不断返回类似下面的数据：

data: {"event":"message","answer":"Dify"}
data: {"event":"message","answer":" 适合"}
data: {"event":"message","answer":" 构建"}
data: {"event":"message_end","metadata":{"usage":{"total_tokens":300}}}

2. 前端如何处理流式响应？

生产环境中推荐采用以下架构：

前端页面 → 自有后端 SSE 接口 → 后端调用 Dify Streaming API

也就是说，前端不要直接连 Dify，而是连接你自己的后端。后端负责：

携带 Dify API Key；
转发流式内容；
做权限校验；
记录用户问题和模型回答；
做内容审核；
控制超时和中断。

3. Node.js 流式转发思路

伪代码如下：

app.post("/api/chat/stream", async (req, res) => {
  res.setHeader("Content-Type", "text/event-stream; charset=utf-8");
  res.setHeader("Cache-Control", "no-cache");
  res.setHeader("Connection", "keep-alive");

  const difyResp = await fetch("https://your-dify-domain/v1/chat-messages", {
    method: "POST",
    headers: {
      "Authorization": `Bearer ${process.env.DIFY_API_KEY}`,
      "Content-Type": "application/json"
    },
    body: JSON.stringify({
      inputs: {},
      query: req.body.query,
      response_mode: "streaming",
      conversation_id: req.body.conversation_id || "",
      user: req.user.id
    })
  });

  const reader = difyResp.body.getReader();
  const decoder = new TextDecoder("utf-8");

  while (true) {
    const { done, value } = await reader.read();
    if (done) break;

    const chunk = decoder.decode(value);
    res.write(chunk);
  }

  res.end();
});

实际项目中还需要处理连接断开、异常、鉴权、限流等问题。

九、工作流接口：`/v1/workflows/run`

如果你在 Dify 中创建的是 Workflow 应用，通常需要调用工作流运行接口。

工作流特别适合以下场景：

用户输入清洗；
信息抽取；
多模型协作；
调用知识库；
调用外部 HTTP 工具；
分支判断；
生成结构化 JSON；
审核与改写；
多步骤业务审批辅助。

1. 请求示例

curl -X POST 'https://your-dify-domain/v1/workflows/run' \
  -H 'Authorization: Bearer YOUR_API_KEY' \
  -H 'Content-Type: application/json' \
  -d '{
    "inputs": {
      "content": "张三，手机号13800000000，希望咨询企业版价格",
      "scene": "sales_lead_extract"
    },
    "response_mode": "blocking",
    "user": "user-001"
  }'

2. 响应示例

{
  "workflow_run_id": "run-xxx",
  "task_id": "task-xxx",
  "data": {
    "id": "run-xxx",
    "workflow_id": "workflow-xxx",
    "status": "succeeded",
    "outputs": {
      "name": "张三",
      "phone": "13800000000",
      "intent": "咨询企业版价格"
    },
    "error": null,
    "elapsed_time": 3.21,
    "total_tokens": 520,
    "created_at": 1710000000,
    "finished_at": 1710000003
  }
}

在工作流接口中，最关键的是 inputs 和 outputs。

生产环境建议在 Dify 工作流中尽量约束输出格式，例如要求模型输出 JSON，并在后端进行 JSON Schema 校验。不要完全相信模型输出。

十、文本生成接口：`/v1/completion-messages`

如果你的应用不是聊天模式，而是单次文本生成，可以使用 Completion 接口。

适用场景包括：

文章标题生成；
文案改写；
文本摘要；
分类打标；
邮件生成；
商品描述生成；
简历优化；
工单总结。

请求示例：

curl -X POST 'https://your-dify-domain/v1/completion-messages' \
  -H 'Authorization: Bearer YOUR_API_KEY' \
  -H 'Content-Type: application/json' \
  -d '{
    "inputs": {
      "topic": "Dify API 接口调用教程",
      "style": "技术博客"
    },
    "response_mode": "blocking",
    "user": "user-001"
  }'

这种模式一般不需要维护 conversation_id，因为它不是多轮对话，而是一次输入一次输出。

十一、会话管理：conversation_id 怎么用？

在聊天接口中，conversation_id 是非常重要的字段。

第一次调用时，可以传空字符串：

{
  "conversation_id": ""
}

Dify 会返回一个新的 conversation_id。业务系统应该把它保存下来，并与自己的用户、会话、业务记录关联。

例如数据库中可以设计一张表：

字段	说明
id	主键
user_id	业务用户 ID
dify_conversation_id	Dify 会话 ID
title	会话标题
created_at	创建时间
updated_at	更新时间

后续用户继续对话时，把该 conversation_id 带上：

{
  "conversation_id": "conv-xxx"
}

这样 Dify 才能理解上下文。

生产环境注意点

不同用户的 conversation_id 不要混用；
用户删除会话时，业务侧也应删除或标记失效；
长会话可能导致 token 消耗增加；
涉及敏感业务时，不要无限保留对话记录；
对话标题建议由业务侧生成或调用模型生成；
conversation_id 不应由前端随意传入，后端要校验归属权。

十二、文件上传与多模态输入

部分 Dify 应用支持文件输入，例如文档分析、图片理解、简历解析、合同审查等。

通常需要先调用文件上传接口，然后在后续消息请求中引用文件 ID。

示例：

curl -X POST 'https://your-dify-domain/v1/files/upload' \
  -H 'Authorization: Bearer YOUR_API_KEY' \
  -F 'file=@./contract.pdf' \
  -F 'user=user-001'

上传成功后，会返回文件相关信息，例如文件 ID。之后可以在聊天或工作流调用中传入该文件。

生产环境中，文件上传需要特别注意：

限制文件大小；
限制文件类型；
做病毒扫描；
做敏感信息识别；
避免用户上传恶意文件；
文件存储要有生命周期管理；
合同、财务、人事类文件要做好权限隔离。

十三、生产环境实测：常见问题与解决方案

下面结合真实生产接入经验，总结一些高频问题。

1. 接口偶发超时

大模型调用不是普通接口调用，它的耗时通常更长。尤其是涉及知识库检索、工作流、多模型节点、长文本生成时，耗时可能达到几十秒。

建议：

阻塞模式 timeout 设置为 60 秒以上；
复杂工作流建议使用 streaming；
对超长任务使用异步任务机制；
前端增加加载状态；
后端记录每次请求耗时；
对超时请求做好用户提示。

2. 流式响应被网关缓冲

很多团队在本地测试 streaming 正常，上线后发现前端不能实时显示，而是等全部生成完才一次性返回。

常见原因是：

Nginx 开启了响应缓冲；
API 网关不支持 SSE；
CDN 对流式响应做了缓存；
后端框架没有及时 flush；
HTTP 连接被中间层改写。

Nginx 可参考配置：

proxy_buffering off;
proxy_cache off;
chunked_transfer_encoding on;

同时响应头建议设置：

Content-Type: text/event-stream
Cache-Control: no-cache
Connection: keep-alive
X-Accel-Buffering: no

3. API Key 泄露风险

这是生产环境中最常见也是最严重的问题之一。

错误做法：

前端直接请求 Dify，并把 API Key 写在 JS 中

正确做法：

前端 → 业务后端 → Dify

后端负责统一管理 Key，并做用户鉴权、限流和审计。

4. 模型输出不稳定

即使 Prompt 写得很好，大模型输出仍可能存在随机性。生产环境中不要把模型输出直接作为最终事实使用。

建议：

结构化任务使用 JSON 输出；
后端做格式校验；
关键结果做人工审核；
低温度参数减少随机性；
在 Dify 中增加输出约束；
必要时增加二次校验节点；
涉及金额、法律、医疗等场景必须谨慎。

5. 知识库回答不准确

如果使用 Dify 知识库问答，效果不佳通常不是 API 调用问题，而是知识库治理问题。

需要检查：

文档切分是否合理；
是否存在过期文档；
文档标题是否清晰；
检索召回数量是否合适；
Embedding 模型是否匹配语种；
Prompt 是否要求基于知识库回答；
是否允许模型自由发挥。

十四、生产环境推荐架构

一个比较稳妥的 Dify API 接入架构如下：

用户端
  ↓
前端应用 / 小程序 / 企业微信 / 钉钉 / 飞书
  ↓
业务后端 API
  ↓
权限校验、参数校验、限流、日志、审计
  ↓
Dify API
  ↓
模型供应商 / 知识库 / 工具 / 工作流

业务后端在其中承担关键角色：

保护 API Key；
绑定用户身份；
控制访问频率；
记录请求日志；
处理异常和重试；
转换 Dify 返回结果；
做内容安全过滤；
对接企业内部系统；
统一管理会话；
统计 token 成本。

十五、错误处理与重试策略

调用 Dify API 时，可能会遇到不同类型的错误。

常见 HTTP 状态码包括：

状态码	可能原因
400	请求参数错误
401	API Key 错误或缺失
403	无权限访问
404	接口地址错误
429	请求过于频繁
500	Dify 服务内部错误
502/503/504	网关、模型服务或上游超时

生产环境建议：

400 类错误不要盲目重试，应检查参数；
401/403 直接告警；
429 可进行退避重试；
500/502/503/504 可有限重试；
每次请求记录 task_id、message_id、conversation_id；
给用户返回友好的错误提示；
对失败请求建立监控指标。

Python 中可以简单实现重试：

import time
import requests

def post_with_retry(url, headers, payload, max_retries=3):
    for i in range(max_retries):
        try:
            resp = requests.post(url, headers=headers, json=payload, timeout=60)
            if resp.status_code < 500 and resp.status_code != 429:
                resp.raise_for_status()
                return resp.json()

            time.sleep(2 ** i)

        except requests.RequestException:
            if i == max_retries - 1:
                raise
            time.sleep(2 ** i)

十六、安全与合规建议

如果 Dify API 用于生产环境，安全问题不能忽视。

1. 不要传递不必要的敏感信息

例如身份证号、银行卡号、客户隐私、商业合同等。如果业务确实需要，应做好脱敏处理。

2. 做用户权限校验

不要让用户通过接口访问其他用户的 conversation_id 或文件。

3. 做内容审核

对于用户输入和模型输出，都可以增加审核机制，防止生成违规、攻击性或不适合展示的内容。

4. 防 Prompt Injection

如果使用知识库、插件、外部网页内容，要警惕提示词注入。例如文档中包含“忽略之前所有指令”之类的内容，可能影响模型行为。

5. 日志脱敏

日志中不要直接打印完整 API Key，也不要记录过多敏感输入。

十七、性能优化建议

在生产环境中，Dify API 的性能不仅取决于 Dify 本身，还取决于底层模型、知识库、工作流复杂度和网络链路。

可优化方向包括：

缩短 Prompt；
控制用户输入长度；
减少不必要的工作流节点；
知识库文档合理切分；
对固定问题做缓存；
使用 streaming 改善用户体验；
对高频任务使用更快模型；
对复杂任务异步化；
设置合理的最大输出 token；
监控接口平均耗时和 P95 耗时。

例如，对于 FAQ 类问题，可以先在业务侧做缓存：

用户问题 → 语义匹配/缓存命中 → 返回缓存答案
                     ↓ 未命中
                  调用 Dify

这样可以降低成本，也可以提升响应速度。

十八、上线前检查清单

在把 Dify API 接入生产环境前，建议按以下清单检查：

[ ] API Key 未暴露在前端；
[ ] 后端已做用户鉴权；
[ ] 请求参数已校验；
[ ] conversation_id 已绑定用户；
[ ] 已设置合理超时时间；
[ ] 已处理 Dify 错误码；
[ ] 已支持接口日志追踪；
[ ] 已做限流防刷；
[ ] 敏感信息已脱敏；
[ ] 流式响应经过网关测试；
[ ] 关键任务有降级方案；
[ ] 工作流输出有格式校验；
[ ] 已统计 token 和调用成本；
[ ] 已配置监控告警；
[ ] 已准备 API Key 轮换机制。

十九、实测结论

从生产环境使用体验来看，Dify API 非常适合用于快速构建企业级 AI 应用。它的优势不只是“能调用大模型”，更重要的是把 Prompt、知识库、工作流、工具调用、日志观察和模型配置这些能力统一管理起来。

不过，Dify API 并不是接上就万事大吉。真正上线时，仍然需要业务后端承担大量工程化工作，包括鉴权、限流、日志、错误处理、会话管理、安全审计和成本控制。

如果只是做 Demo，直接调用接口即可；如果是生产环境，建议采用“前端不直连 Dify、后端统一代理调用”的架构，并对流式响应、超时、重试、敏感数据和 conversation_id 权限进行重点设计。

一句话总结：

Dify 负责 AI 应用编排，业务系统负责安全、权限、稳定性和用户体验。两者配合好，才能真正支撑生产环境。

二十、推荐接入流程

最后给出一个实际项目中比较稳妥的接入流程：

在 Dify 中创建应用；
配置模型、Prompt、变量和知识库；
在 Dify 控制台中完成调试；
创建 API Key；
使用 curl 验证接口；
后端封装 Dify 调用 SDK；
前端通过业务后端访问；
保存 conversation_id 和 message_id；
增加日志、限流、异常处理；
测试 blocking 和 streaming 两种模式；
压测核心业务场景；
上线后持续观察调用质量和成本。

按照这个流程接入，基本可以避免大多数初级问题，也能为后续扩展 Agent、工作流、知识库、多模型路由等能力打下良好基础。

文章标签： DifyAPI 生产环境流式响应会话管理

上一篇：Dify API 接入生产系统：从调通到稳定上线的实战笔记

下一篇：企业系统如何接入 Dify API：从调用到安全落地指南

更多栏目

新闻动态

文档中心

下载中心

目录结构

全文

产品与服务

新闻帮助

生态合作

了解我们

Dify API 生产接入实战：从调用到上线踩坑复盘

Dify API接口调用教程｜生产环境实测

一、Dify API 是什么？

二、为什么生产环境推荐使用 Dify API？

三、Dify API 调用前的准备工作

1. 部署或使用 Dify

方式一：使用 Dify 云服务

方式二：私有化部署 Dify

2. 创建应用

3. 获取 API Key

四、Dify API 基础调用结构

五、调用聊天接口：/v1/chat-messages

1. 请求示例

2. 参数说明

3. 阻塞式响应示例

六、Python 调用 Dify API 示例

生产环境建议

七、Node.js 调用 Dify API 示例

八、流式调用：实现打字机效果

1. curl 示例

2. 前端如何处理流式响应？

3. Node.js 流式转发思路

九、工作流接口：/v1/workflows/run

1. 请求示例

2. 响应示例

十、文本生成接口：/v1/completion-messages

十一、会话管理：conversation_id 怎么用？

生产环境注意点

十二、文件上传与多模态输入

十三、生产环境实测：常见问题与解决方案

1. 接口偶发超时

2. 流式响应被网关缓冲

3. API Key 泄露风险

4. 模型输出不稳定

5. 知识库回答不准确

十四、生产环境推荐架构

十五、错误处理与重试策略

十六、安全与合规建议

1. 不要传递不必要的敏感信息

2. 做用户权限校验

3. 做内容审核

4. 防 Prompt Injection

5. 日志脱敏

十七、性能优化建议

十八、上线前检查清单

十九、实测结论

二十、推荐接入流程

五、调用聊天接口：`/v1/chat-messages`

九、工作流接口：`/v1/workflows/run`

十、文本生成接口：`/v1/completion-messages`