FastGPT 内网落地实战:从部署架构到配置文件一次讲清
FastGPT 私有化部署方案|附配置文件
FastGPT 是一套面向企业知识库、智能问答和工作流编排的开源平台。相比直接调用通用大模型,FastGPT 更强调 私有数据接入、权限控制、知识检索增强(RAG)和可视化编排,非常适合希望在本地环境、内网环境或云上专有资源中落地 AI 应用的团队。
对于很多企业来说,真正上线 AI 能力并不难,难的是同时满足这几项要求:
- 数据不能出公网
- 模型调用可控、可审计
- 知识库可持续更新
- 系统要能扩展、能运维、能恢复
- 前后端、数据库、向量检索、对象存储都要稳定协同
这也是为什么 FastGPT 的私有化部署很有价值。本文将从 部署架构、环境准备、核心配置、安装步骤、常见问题与优化建议 几个方面,给出一套可落地的 FastGPT 私有化部署方案,并附上可参考的配置文件示例,帮助你快速搭建稳定可用的企业级环境。
一、FastGPT 适合什么场景
FastGPT 并不是单纯的聊天机器人,而是一套围绕大模型能力构建的应用平台。它适合以下场景:
1. 企业知识库问答
把产品文档、制度文件、技术手册、FAQ、工单记录等导入知识库,供员工或客户进行智能问答。
2. 内部智能助手
例如 HR 政策助手、IT 运维助手、客服辅助助手、销售支持助手等。
3. 多步骤工作流
例如“接收问题 → 检索知识库 → 生成答案 → 调用工具 → 返回结果”,适合复杂业务链路。
4. 私有数据处理
对于金融、制造、政务、医疗等行业,数据合规要求高,必须在可控环境中完成 AI 能力部署。
二、推荐部署架构
一个比较成熟的 FastGPT 私有化方案,通常包含以下组件:
- FastGPT Web/API
- MongoDB:存储业务数据、知识库配置、对话记录等
- MySQL / MariaDB:部分版本或扩展场景可能需要
- Redis:缓存、队列、临时状态
- 向量库:如
pgvector、Milvus、Qdrant等 - 对象存储:如
MinIO,用于文件上传和知识库文件管理 - 大模型服务:OpenAI、Azure OpenAI、通义、智谱、DeepSeek、Qwen、本地模型服务等
- Nginx / Gateway:反向代理、HTTPS、路径转发
- Docker / Docker Compose:最常见的部署方式
如果是中小规模团队,建议优先采用 Docker Compose 单机部署,部署快、维护简单、便于验证业务流程。若是生产环境或大规模使用,再升级到 Kubernetes + 分布式存储 + 独立数据库集群。
三、部署前准备
1. 服务器建议
最低建议配置如下:
- CPU:4 核以上
- 内存:8GB 起步,推荐 16GB 以上
- 磁盘:100GB 以上,知识库文件多时建议更高
- 系统:Ubuntu 22.04 / Debian 12 / CentOS Stream
- 网络:可访问模型服务或具备内网模型推理服务
如果要跑本地大模型,还需要额外准备 GPU 资源,具体取决于模型大小和并发量。
2. 基础软件
建议安装:
DockerDocker ComposeNginxGitcurl
3. 域名和证书
如果是企业内网,也建议至少准备一个内部域名,例如:
fastgpt.company.localai-docs.internal.example.com
生产环境建议启用 HTTPS,避免接口明文传输。
四、私有化部署总体思路
FastGPT 的私有化部署,本质上是把以下几个部分全部接入企业自己的控制范围:
- 应用服务自托管
- 数据库自托管
- 文件存储自托管
- 向量检索自托管
- 模型访问自托管或受控代理
- 日志、监控、备份自托管
这样做的好处是:
- 数据不出企业边界
- 运维和审计更容易
- 可根据业务负载自由扩容
- 可以对接统一身份认证、网关和审计系统
五、Docker Compose 部署示例
下面给出一套通用参考配置。不同版本的 FastGPT 镜像名、环境变量名可能会有差异,实际部署时请结合你使用的版本文档进行微调,但整体思路是一致的。
1. docker-compose.yml
version: "3.9"
services:
mongo:
image: mongo:6
container_name: fastgpt-mongo
restart: always
ports:
- "27017:27017"
environment:
MONGO_INITDB_ROOT_USERNAME: fastgpt
MONGO_INITDB_ROOT_PASSWORD: fastgpt123
volumes:
- ./data/mongo:/data/db
networks:
- fastgpt-net
redis:
image: redis:7
container_name: fastgpt-redis
restart: always
ports:
- "6379:6379"
command: ["redis-server", "--appendonly", "yes"]
volumes:
- ./data/redis:/data
networks:
- fastgpt-net
minio:
image: minio/minio:latest
container_name: fastgpt-minio
restart: always
ports:
- "9000:9000"
- "9001:9001"
environment:
MINIO_ROOT_USER: minioadmin
MINIO_ROOT_PASSWORD: minioadmin123
command: server /data --console-address ":9001"
volumes:
- ./data/minio:/data
networks:
- fastgpt-net
fastgpt:
image: ghcr.io/labring/fastgpt:latest
container_name: fastgpt-app
restart: always
depends_on:
- mongo
- redis
- minio
ports:
- "3000:3000"
env_file:
- .env
volumes:
- ./config:/app/data/config
networks:
- fastgpt-net
networks:
fastgpt-net:
driver: bridge
2. .env 配置文件
# 基础环境
NODE_ENV=production
PORT=3000
# MongoDB
MONGODB_URI=mongodb://fastgpt:fastgpt123@mongo:27017/fastgpt?authSource=admin
# Redis
REDIS_URL=redis://redis:6379
# MinIO
MINIO_ENDPOINT=minio
MINIO_PORT=9000
MINIO_USE_SSL=false
MINIO_ACCESS_KEY=minioadmin
MINIO_SECRET_KEY=minioadmin123
MINIO_BUCKET=fastgpt
# 大模型服务示例
OPENAI_BASE_URL=https://api.openai.com/v1
OPENAI_API_KEY=your_openai_key
# 如果使用本地模型网关,可替换成内部地址
# OPENAI_BASE_URL=http://your-llm-gateway:8000/v1
# 安全配置
JWT_SECRET=change_this_to_a_long_random_string
3. Nginx 反向代理配置
server {
listen 80;
server_name fastgpt.company.local;
client_max_body_size 100m;
location / {
proxy_pass http://127.0.0.1:3000;
proxy_http_version 1.1;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_set_header X-Forwarded-Proto $scheme;
proxy_read_timeout 300;
proxy_send_timeout 300;
}
}
如果启用 HTTPS,可以再配合证书和 443 端口配置。
六、部署步骤
第一步:准备目录
建议创建如下目录结构:
fastgpt/
├── docker-compose.yml
├── .env
├── config/
└── data/
第二步:启动依赖服务
执行:
docker compose up -d mongo redis minio
先确认数据库、缓存、对象存储正常运行。
第三步:启动 FastGPT
执行:
docker compose up -d fastgpt
然后查看日志:
docker logs -f fastgpt-app
第四步:初始化访问
通过浏览器访问:
http://服务器IP:3000
如果前面配置了 Nginx,则访问你的域名即可。
第五步:创建管理员账号
首次启动通常需要在页面里完成管理员初始化。完成后建议立即修改默认配置,并为系统设置更强的密码策略。
七、知识库接入建议
FastGPT 的价值核心在于知识库。部署完成后,建议优先做这几件事:
1. 先导入高质量文档
不要一上来就导大量杂乱文档。先从高频、标准化、结构清晰的资料开始,例如:
- 产品手册
- 运维手册
- 常见问题
- 公司制度
- 客服话术
2. 按业务域划分知识库
不要把所有内容塞进同一个库。建议按域划分:
- 产品知识库
- 技术知识库
- 人事制度库
- 销售支持库
这样更利于权限管理、召回准确率和后续维护。
3. 控制切分粒度
切分太大,检索不准;切分太小,上下文不完整。通常要根据文档类型不断调参,找到合适的 chunk 大小和重叠策略。
4. 提高文档质量
知识库效果的上限,往往不是模型决定的,而是文档质量决定的。标题层级清晰、内容准确、表述统一,效果会明显更好。
八、模型接入策略
FastGPT 支持接入多种模型。私有化部署时,建议根据场景选择:
1. 公有云模型
优点是效果好、接入快;缺点是数据可能出网,不适合高合规场景。
2. 企业内网模型网关
推荐方式之一。通过企业内部代理层统一转发模型请求,既便于审计,也便于多模型切换。
3. 本地开源模型
适合对数据安全要求极高的场景,比如:
- Qwen
- DeepSeek
- Llama 系列
- GLM 系列
本地部署时要考虑推理框架、显存占用、吞吐和响应时间。
4. 混合方案
很多企业最终会采用混合架构:
- 低敏感任务走云模型
- 高敏感任务走本地模型
- 通用问答与核心业务分别配置不同模型
这是比较现实也比较稳定的方案。
九、生产环境优化建议
1. 做好持久化
以下数据必须持久化:
- MongoDB 数据
- Redis 持久化数据
- MinIO 文件
- 配置文件
- 日志文件
否则容器一旦重建,数据很容易丢失。
2. 做好备份
建议定期备份:
- MongoDB 备份
- MinIO 文件备份
.env和配置目录备份- Nginx 配置备份
3. 做好权限隔离
生产环境中建议:
- 不直接暴露数据库端口到公网
- MinIO 仅在内网访问
- FastGPT 通过网关访问
- 管理后台走单独域名或 VPN
4. 做好监控
至少要监控:
- 容器状态
- CPU / 内存 / 磁盘
- 接口错误率
- 模型调用延迟
- 知识库检索成功率
5. 做好限流
如果用户量上来,建议为:
- 登录接口
- 文档上传
- 模型请求
- 知识库检索
设置合理限流,避免突发流量拖垮服务。
十、常见问题排查
1. 页面打不开
检查:
- 容器是否启动成功
- 端口是否占用
- Nginx 配置是否正确
- 安全组是否放行
- 防火墙是否拦截
2. 数据库连接失败
检查:
MONGODB_URI是否正确- 用户名密码是否一致
- Mongo 容器是否健康
- 网络是否在同一 Docker 网络中
3. 文件上传失败
检查:
- MinIO 是否正常
- Bucket 是否已创建
- 权限是否正确
- 对象存储地址是否可访问
4. 模型调用失败
检查:
- API Key 是否有效
base_url是否正确- 模型名称是否匹配
- 网络是否能访问模型网关
5. 检索效果差
通常不是“部署问题”,而是“知识库问题”,建议检查:
- 文档质量
- 切分策略
- 嵌入模型
- 向量库配置
- 检索 topK 参数
十一、推荐的落地路线
如果你准备把 FastGPT 真正用到业务里,建议分三阶段推进:
第一阶段:验证可用
目标是跑通部署、登录、上传文档、问答返回、模型联通。
第二阶段:小范围试点
选择一个部门或一个业务场景,比如客服知识库或内部制度问答,持续优化文档和提示词。
第三阶段:企业级上线
补齐:
- 权限体系
- 审计日志
- 备份恢复
- 高可用部署
- 监控告警
- 多模型路由
这样才能从“能用”走向“好用、稳用、可管”。
十二、总结
FastGPT 的私有化部署并不只是把程序跑起来,更重要的是把 模型、数据、知识库、权限、运维 整体纳入企业可控范围。对于需要构建内部 AI 应用平台的团队来说,它的优势非常明显:既保留了大模型带来的智能能力,又兼顾了数据安全和业务可扩展性。
如果你只是想快速验证效果,可以用 Docker Compose 在单机先跑通;如果你已经进入生产阶段,则建议围绕数据库持久化、对象存储、安全网关、监控备份和模型网关做进一步完善。
总之,FastGPT 的最佳实践不是“直接上线”,而是先搭好稳定的底座,再逐步把知识库、工作流和业务系统接入进来。这样,AI 才能真正成为企业生产力,而不是一个只能演示的概念项目。
如果你愿意,我还可以继续帮你补一版:
- 更适合公众号发布的排版版本
- 带目录与封面导语的长文版
- 适合技术博客发布的实操版
- 补充 Docker Compose 完整生产级配置