Dify 扛住高并发：从扩容到调优的实战方案（含完整命令）

发布人：慈云数据-客服中心发布时间：2026-06-09 11:47 阅读量：203

Dify 高并发解决方案｜附完整命令

在企业级 AI 应用落地过程中，Dify 是非常常见的开源 LLMOps 平台。它可以快速构建聊天助手、知识库问答、Agent 工作流、RAG 应用，并支持多模型接入、API 发布、日志追踪和团队协作。

但很多团队在从测试环境进入生产环境后，会遇到一个非常典型的问题：并发一上来，Dify 响应变慢、接口超时、工作流排队、知识库检索延迟变高，甚至出现服务不可用。

本文将围绕 Dify 的高并发部署与优化展开，内容包括：

Dify 高并发瓶颈分析
生产环境推荐架构
Docker Compose 扩容方案
API、Worker、Web、Redis、PostgreSQL、向量数据库优化
Nginx 反向代理与负载均衡
系统内核参数优化
完整部署与扩容命令
常见问题排查命令

本文适合已经部署过 Dify，并准备将其用于生产环境或高并发场景的开发者、运维工程师和技术负责人。

一、Dify 高并发的核心瓶颈在哪里？

Dify 本身不是单一服务，而是由多个组件组成。一个典型的 Dify Docker 部署通常包含以下服务：

组件	作用
Web	前端管理页面
API	后端接口服务，负责应用调用、鉴权、工作流调度等
Worker	异步任务处理，例如知识库导入、文档切片、Embedding、部分工作流任务
PostgreSQL	主数据库，保存应用配置、用户、日志、工作流等
Redis	缓存、队列、会话、任务调度
向量数据库	存储知识库向量，例如 Weaviate、Qdrant、Milvus、PGVector
Sandbox	代码执行沙箱，用于工作流代码节点
Nginx	反向代理、静态资源、网关入口

在高并发情况下，常见瓶颈通常来自以下几个方面：

1. API 服务实例数量不足

Dify 的 API 服务是应用调用的主要入口。用户调用聊天接口、工作流接口、知识库检索接口时，都会经过 API 服务。

如果只有一个 API 容器，所有请求都打到同一个实例上，就容易出现：

请求排队；
响应时间变长；
CPU 占用过高；
内存上涨；
接口超时；
容器重启。

因此，高并发场景下必须对 API 服务进行水平扩容。

2. Worker 数量不足

Dify 中很多任务不是同步完成的，而是交给 Worker 异步处理，例如：

知识库文档导入；
文档切片；
向量化；
批量任务；
部分工作流节点；
任务队列消费。

如果 Worker 数量不足，典型表现是：

上传文档后长时间处于处理中；
知识库构建速度非常慢；
队列积压；
后台任务执行延迟；
工作流响应不稳定。

因此，高并发或大规模知识库场景下，Worker 扩容非常关键。

3. PostgreSQL 数据库压力过大

Dify 的应用配置、会话、日志、工作流运行记录等都依赖 PostgreSQL。

高并发调用下，如果数据库配置较弱，会出现：

数据库连接数耗尽；
查询变慢；
CPU 或 IO 打满；
API 等待数据库响应；
日志写入变慢；
事务阻塞。

PostgreSQL 是 Dify 生产环境中的核心组件，必须进行参数优化和资源隔离。

4. Redis 队列或缓存成为瓶颈

Redis 在 Dify 中承担缓存和队列功能。并发请求增加后，Redis 压力也会增加。

如果 Redis 配置不当，可能出现：

队列阻塞；
缓存命中率下降；
Redis 内存不足；
后台任务延迟；
连接数不足。

生产环境中，Redis 不建议使用默认配置裸跑，至少需要设置持久化、内存上限、淘汰策略和连接数。

5. 向量数据库检索性能不足

Dify 的知识库问答依赖向量数据库。如果知识库规模较大，并发查询较高，向量数据库会成为关键瓶颈。

不同向量数据库有不同特点：

向量数据库	特点
Weaviate	Dify 默认常见方案，易部署
Qdrant	性能较好，部署简单
Milvus	适合大规模向量场景
PGVector	与 PostgreSQL 集成方便，但大规模性能有限

如果检索慢，LLM 还没开始生成，前置 RAG 阶段就已经消耗大量时间。

6. 大模型接口本身限流

很多时候，Dify 慢并不是 Dify 自己慢，而是模型供应商接口限制导致的，例如：

OpenAI RPM / TPM 限制；
Azure OpenAI 部署限流；
通义千问、火山、智谱等接口限流；
本地模型推理能力不足；
GPU 显存和吞吐不足。

因此，高并发方案不仅要扩 Dify，还要考虑模型层限流和调度策略。

二、Dify 高并发推荐架构

生产环境中，不建议所有服务只部署在一台机器上。一个相对稳妥的架构如下：

用户 / 客户端
      |
      v
  SLB / Nginx
      |
      v
+-------------------+
| Dify API 多实例   |
| api-1 api-2 api-3 |
+-------------------+
      |
      +------------------> PostgreSQL 主库
      |
      +------------------> Redis
      |
      +------------------> 向量数据库
      |
      +------------------> Worker 多实例
      |
      +------------------> Sandbox
      |
      +------------------> 模型供应商 / 本地模型服务

推荐部署原则：

API 服务水平扩容，至少 2 个实例；
Worker 服务独立扩容，根据任务量增加；
PostgreSQL 独立部署，不要和 API 抢资源；
Redis 独立部署，并设置合理内存策略；
向量数据库独立部署，大知识库场景尤其重要；
Nginx 或云负载均衡统一入口；
模型服务限流与多 Key 分流；
开启监控和日志分析。

三、基础环境准备

以下命令以 Ubuntu 22.04 为例。

1. 更新系统

sudo apt update && sudo apt upgrade -y

2. 安装基础工具

sudo apt install -y \
  curl \
  wget \
  git \
  vim \
  htop \
  net-tools \
  unzip \
  lsof \
  ca-certificates \
  gnupg \
  software-properties-common

3. 安装 Docker

curl -fsSL https://get.docker.com | bash

启动 Docker：

sudo systemctl enable docker
sudo systemctl start docker

查看 Docker 版本：

docker version

4. 安装 Docker Compose Plugin

sudo apt install -y docker-compose-plugin

检查版本：

docker compose version

5. 将当前用户加入 Docker 组

sudo usermod -aG docker $USER

重新登录服务器后验证：

docker ps

四、拉取 Dify 项目

cd /opt
sudo git clone https://github.com/langgenius/dify.git
sudo chown -R $USER:$USER /opt/dify
cd /opt/dify

进入 Docker 目录：

cd docker

复制环境变量文件：

cp .env.example .env

编辑配置：

vim .env

五、关键环境变量优化

Dify 的 .env 文件中有大量配置项，不同版本字段可能略有变化。生产环境重点关注以下配置。

1. 修改访问地址

CONSOLE_WEB_URL=https://dify.example.com
APP_WEB_URL=https://dify.example.com
SERVICE_API_URL=https://dify.example.com

如果 API 单独使用域名，也可以设置为：

SERVICE_API_URL=https://api-dify.example.com

2. 配置 Secret Key

不要使用默认值，应生成随机密钥。

openssl rand -base64 42

然后写入：

SECRET_KEY=你的随机密钥

3. Redis 配置

如果使用内置 Redis，可以先保持默认；如果使用外部 Redis，配置类似：

REDIS_HOST=redis.example.internal
REDIS_PORT=6379
REDIS_USERNAME=
REDIS_PASSWORD=your_redis_password
REDIS_DB=0

4. PostgreSQL 配置

外部 PostgreSQL 示例：

DB_USERNAME=dify
DB_PASSWORD=your_strong_password
DB_HOST=postgres.example.internal
DB_PORT=5432
DB_DATABASE=dify

5. 向量数据库选择

例如使用 Qdrant：

VECTOR_STORE=qdrant
QDRANT_URL=http://qdrant:6333
QDRANT_API_KEY=

如果使用 Weaviate：

VECTOR_STORE=weaviate
WEAVIATE_ENDPOINT=http://weaviate:8080
WEAVIATE_API_KEY=

六、首次启动 Dify

在 /opt/dify/docker 目录执行：

docker compose up -d

查看容器：

docker compose ps

查看日志：

docker compose logs -f

如果只查看 API 日志：

docker compose logs -f api

查看 Worker 日志：

docker compose logs -f worker

七、API 服务水平扩容

高并发场景下，最直接的优化是增加 API 实例。

Docker Compose 支持通过 --scale 扩容服务。

例如扩容 API 为 3 个实例：

docker compose up -d --scale api=3

查看是否扩容成功：

docker compose ps

你应该能看到类似：

docker-api-1
docker-api-2
docker-api-3

如果并发继续增加，可以扩为 5 个：

docker compose up -d --scale api=5

注意：API 扩容后，前端流量必须能正确转发到多个 API 实例。如果你使用的是 Dify 自带 Nginx，需要确认其 upstream 配置是否能识别多个容器；如果不能，建议使用外部 Nginx 或云负载均衡。

八、Worker 服务扩容

Worker 对异步任务处理能力影响很大。比如知识库导入慢、Embedding 排队严重时，可以扩容 Worker。

扩容 Worker 为 3 个：

docker compose up -d --scale worker=3

扩容 Worker 为 5 个：

docker compose up -d --scale worker=5

查看 Worker 日志：

docker compose logs -f worker

查看容器资源占用：

docker stats

如果 Worker CPU 占用长期很高，说明任务处理压力较大，可以继续增加 Worker 数量，但要注意数据库、Redis、Embedding 模型接口是否会被打满。

九、Nginx 反向代理配置

如果你使用外部 Nginx，可以将流量转发到 Dify 的 Nginx 或 API/Web 服务。

1. 安装 Nginx

sudo apt install -y nginx

启动 Nginx：

sudo systemctl enable nginx
sudo systemctl start nginx

2. 创建站点配置

sudo vim /etc/nginx/conf.d/dify.conf

写入以下内容：

server {
    listen 80;
    server_name dify.example.com;

    client_max_body_size 100M;

    location / {
        proxy_pass http://127.0.0.1:80;
        proxy_http_version 1.1;

        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;

        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";

        proxy_connect_timeout 60s;
        proxy_send_timeout 300s;
        proxy_read_timeout 300s;
    }
}

检查配置：

sudo nginx -t

重载 Nginx：

sudo systemctl reload nginx

十、HTTPS 证书配置

生产环境强烈建议开启 HTTPS。

安装 Certbot：

sudo apt install -y certbot python3-certbot-nginx

申请证书：

sudo certbot --nginx -d dify.example.com

自动续期测试：

sudo certbot renew --dry-run

查看证书定时任务：

systemctl list-timers | grep certbot

十一、PostgreSQL 优化方案

如果 Dify 高并发明显卡在数据库，可以从 PostgreSQL 入手。

1. 查看数据库连接数

进入 PostgreSQL 容器：

docker compose exec db psql -U postgres

查看连接情况：

SELECT count(*) FROM pg_stat_activity;

查看各状态连接数：

SELECT state, count(*) 
FROM pg_stat_activity 
GROUP BY state;

查看慢查询：

SELECT pid, now() - pg_stat_activity.query_start AS duration, query
FROM pg_stat_activity
WHERE state = 'active'
ORDER BY duration DESC;

退出：

\q

2. 推荐 PostgreSQL 参数

如果是独立 PostgreSQL，可以编辑：

sudo vim /etc/postgresql/15/main/postgresql.conf

参考配置如下，需根据机器内存调整：

max_connections = 300
shared_buffers = 4GB
effective_cache_size = 12GB
work_mem = 16MB
maintenance_work_mem = 1GB
checkpoint_completion_target = 0.9
wal_buffers = 16MB
default_statistics_target = 100
random_page_cost = 1.1
effective_io_concurrency = 200

重启 PostgreSQL：

sudo systemctl restart postgresql

查看是否生效：

sudo -u postgres psql -c "SHOW max_connections;"
sudo -u postgres psql -c "SHOW shared_buffers;"

3. 使用 PgBouncer 连接池

高并发 API 多实例时，数据库连接数会快速增加。建议在 PostgreSQL 前加 PgBouncer。

安装：

sudo apt install -y pgbouncer

编辑配置：

sudo vim /etc/pgbouncer/pgbouncer.ini

示例：

[databases]
dify = host=127.0.0.1 port=5432 dbname=dify

[pgbouncer]
listen_addr = 0.0.0.0
listen_port = 6432
auth_type = md5
auth_file = /etc/pgbouncer/userlist.txt
pool_mode = transaction
max_client_conn = 1000
default_pool_size = 50
reserve_pool_size = 20

创建用户密码文件：

sudo vim /etc/pgbouncer/userlist.txt

格式：

"dify" "md5你的密码哈希"

生成 md5 密码格式：

echo -n "your_passworddify" | md5sum

结果前面加 md5。

启动 PgBouncer：

sudo systemctl enable pgbouncer
sudo systemctl restart pgbouncer

然后在 Dify .env 中将数据库端口改为 PgBouncer：

DB_HOST=你的PgBouncer地址
DB_PORT=6432

重启 Dify：

docker compose down
docker compose up -d

十二、Redis 优化方案

1. 查看 Redis 状态

进入 Redis：

docker compose exec redis redis-cli

查看信息：

INFO

查看内存：

INFO memory

查看连接：

INFO clients

查看慢日志：

SLOWLOG GET 10

退出：

exit

2. Redis 推荐配置

如果是独立 Redis，编辑：

sudo vim /etc/redis/redis.conf

建议配置：

maxclients 10000
maxmemory 4gb
maxmemory-policy allkeys-lru
tcp-keepalive 300
timeout 0
appendonly yes
appendfsync everysec

重启 Redis：

sudo systemctl restart redis-server

查看配置：

redis-cli CONFIG GET maxmemory
redis-cli CONFIG GET maxclients

十三、向量数据库优化建议

1. Qdrant 部署命令

如果你希望使用 Qdrant，可以单独创建目录：

sudo mkdir -p /data/qdrant
sudo chown -R $USER:$USER /data/qdrant

运行 Qdrant：

docker run -d \
  --name qdrant \
  --restart always \
  -p 6333:6333 \
  -p 6334:6334 \
  -v /data/qdrant:/qdrant/storage \
  qdrant/qdrant:latest

检查状态：

curl http://127.0.0.1:6333/health

Dify .env 配置：

VECTOR_STORE=qdrant
QDRANT_URL=http://你的Qdrant地址:6333
QDRANT_API_KEY=

重启 Dify：

cd /opt/dify/docker
docker compose down
docker compose up -d

2. Weaviate 资源建议

如果使用 Weaviate，需要关注内存消耗。知识库越大，向量数量越多，内存压力越明显。

查看 Weaviate 日志：

docker compose logs -f weaviate

查看资源：

docker stats

如果知识库规模很大，建议：

将向量数据库单独部署；
使用 SSD；
提高内存；
控制单个知识库文档数量；
合理设置分段大小；
避免频繁重建索引。

十四、系统内核参数优化

高并发下，Linux 默认参数可能不够。

编辑：

sudo vim /etc/sysctl.conf

追加：

fs.file-max = 1000000
net.core.somaxconn = 65535
net.core.netdev_max_backlog = 65535
net.ipv4.tcp_max_syn_backlog = 65535
net.ipv4.tcp_tw_reuse = 1
net.ipv4.ip_local_port_range = 1024 65535
net.ipv4.tcp_fin_timeout = 15
net.ipv4.tcp_keepalive_time = 600

生效：

sudo sysctl -p

查看：

sysctl net.core.somaxconn
sysctl net.ipv4.ip_local_port_range

十五、文件句柄优化

编辑 limits：

sudo vim /etc/security/limits.conf

追加：

* soft nofile 1048576
* hard nofile 1048576
root soft nofile 1048576
root hard nofile 1048576

编辑 systemd 配置：

sudo vim /etc/systemd/system.conf

设置：

DefaultLimitNOFILE=1048576

编辑用户级 systemd：

sudo vim /etc/systemd/user.conf

设置：

DefaultLimitNOFILE=1048576

重新加载：

sudo systemctl daemon-reexec

查看当前限制：

ulimit -n

十六、Docker 日志限制

高并发场景下日志量会很大，如果不限制 Docker 日志，磁盘可能被打满。

创建或编辑：

sudo vim /etc/docker/daemon.json

写入：

{
  "log-driver": "json-file",
  "log-opts": {
    "max-size": "200m",
    "max-file": "5"
  }
}

重启 Docker：

sudo systemctl restart docker

重新启动 Dify：

cd /opt/dify/docker
docker compose up -d

查看磁盘：

df -h

查看 Docker 占用：

docker system df

十七、模型接口高并发优化

Dify 的最终响应速度高度依赖模型服务。

1. 使用多个模型 Key

如果模型供应商支持多个 API Key，可以配置多个模型供应商账号或多个部署，以减少单 Key 限流影响。

2. 控制最大 Token

在应用配置中合理设置：

最大回复长度；
上下文轮数；
Prompt 长度；
RAG 召回数量。

过大的上下文会导致：

首 Token 时间变长；
Token 消耗增加；
模型接口更容易限流；
用户等待时间变长。

3. 本地模型服务扩容

如果使用 Ollama、vLLM、Xinference、LocalAI 等本地模型，需要单独优化模型推理层。

例如 vLLM 启动示例：

docker run -d \
  --name vllm-qwen \
  --restart always \
  --gpus all \
  -p 8000:8000 \
  -v /data/models:/models \
  vllm/vllm-openai:latest \
  --model /models/Qwen2.5-7B-Instruct \
  --host 0.0.0.0 \
  --port 8000 \
  --max-model-len 8192

测试接口：

curl http://127.0.0.1:8000/v1/models

十八、常用监控与排查命令

1. 查看容器状态

docker compose ps

2. 查看实时资源

docker stats

3. 查看 API 日志

docker compose logs -f api

4. 查看 Worker 日志

docker compose logs -f worker

5. 查看最近 200 行日志

docker compose logs --tail=200 api

6. 查看端口监听

sudo netstat -tulnp

或：

sudo ss -tulnp

7. 查看 CPU 和内存

htop

8. 查看磁盘

df -h

9. 查看目录占用

du -sh /opt/dify/*

10. 清理无用 Docker 资源

谨慎执行：

docker system prune -af

清理未使用 volume，生产环境慎用：

docker volume prune

十九、推荐扩容组合

不同并发规模可以参考以下组合。

小型生产环境

适合内部系统或低并发应用：

API：2 个实例
Worker：2 个实例
PostgreSQL：独立 2C4G 或 4C8G
Redis：独立 1C2G
向量库：与应用同机或独立

扩容命令：

docker compose up -d --scale api=2 --scale worker=2

中型生产环境

适合日活较高的企业应用：

API：3～5 个实例
Worker：3～5 个实例
PostgreSQL：独立 4C16G+
Redis：独立 2C4G+
向量库：独立部署
Nginx：独立入口

扩容命令：

docker compose up -d --scale api=5 --scale worker=5

大型生产环境

适合多团队、多应用、高频 API 调用：

API：多节点部署，每节点多个实例
Worker：按任务类型和队列拆分
PostgreSQL：高配置主库 + 备份 + 连接池
Redis：主从或云 Redis
向量库：独立集群
模型服务：多 Key、多部署、多模型网关
入口：云 SLB / Nginx / Kubernetes Ingress
监控：Prometheus + Grafana + Loki

此时更建议使用 Kubernetes 部署，而不是单机 Docker Compose。

二十、完整一键扩容示例

假设 Dify 已经部署在 /opt/dify/docker，希望将 API 和 Worker 都扩容到 4 个实例，可执行：

cd /opt/dify/docker

docker compose pull

docker compose up -d --scale api=4 --scale worker=4

docker compose ps

docker stats

查看日志：

docker compose logs -f api worker

如果要回退为 2 个实例：

docker compose up -d --scale api=2 --scale worker=2

如果要停止：

docker compose down

如果要重新启动：

docker compose up -d

二十一、生产环境注意事项

1. 不要只扩 API，不看数据库

很多人遇到并发问题后，只是简单增加 API 容器数量。短期可能有效，但如果数据库连接数、Redis 队列、模型接口限流没有同步优化，最终瓶颈会转移到后端依赖服务。

2. Worker 不是越多越好

Worker 增加后，会消耗更多 Redis、数据库和模型 Embedding 接口资源。如果 Embedding 接口本身限流，Worker 太多反而会导致大量重试和失败。

3. 知识库分段要合理

RAG 应用中，知识库切片大小和召回数量会直接影响检索速度和模型上下文长度。建议根据业务测试：

分段过小：召回数量多，噪声大；
分段过大：上下文长，模型响应慢；
召回过多：Token 成本高，首包时间变长；
召回过少：答案准确率下降。

4. 日志要定期清理

高并发 API 调用会产生大量日志。需要关注：

Docker 日志；
Dify 应用日志；
PostgreSQL 数据增长；
会话记录；
工作流运行记录。

5. 必须做备份

生产环境至少备份：

PostgreSQL；
Redis，如有必要；
向量数据库数据；
.env 配置；
上传文件和存储目录。

PostgreSQL 备份示例：

docker compose exec db pg_dump -U postgres dify > dify_backup.sql

恢复示例：

cat dify_backup.sql | docker compose exec -T db psql -U postgres dify

总结

Dify 的高并发优化不是单点扩容，而是一个完整体系。最基础的做法是扩容 API 和 Worker：

docker compose up -d --scale api=4 --scale worker=4

但真正稳定的生产环境，还需要同时优化：

Nginx 入口；
PostgreSQL 连接池和参数；
Redis 内存与连接；
向量数据库性能；
模型接口限流；
系统内核参数；
日志与磁盘；
监控与备份。

如果只是测试环境，Docker Compose 已经足够。如果面向企业级高并发应用，建议逐步演进到独立数据库、独立 Redis、独立向量数据库，最后根据规模迁移到 Kubernetes 或云原生架构。

高并发的关键不是“把某个容器开得更多”，而是让整个链路的每一环都具备足够的吞吐能力。对于 Dify 来说，API、Worker、数据库、Redis、向量库和模型服务共同决定了最终的并发上限。

文章标签： Dify 高并发 DockerCompose PostgreSQL

上一篇：大促扛得住、客服回得快：跨境电商的 Dify 高并发实战方案

下一篇：Dify 扛不住并发？这套异步队列方案直接落地，源码也给你了

更多栏目

新闻动态

文档中心

下载中心

目录结构

全文

产品与服务

新闻帮助

生态合作

了解我们