上一篇 下一篇 分享链接 返回 返回顶部

零基础把 AI 浏览器部署上线:从服务器到 HTTPS 的生产实战指南

发布人:慈云数据-客服中心 发布时间:7小时前 阅读量:0

AI浏览器 生产环境部署指南|零基础可学

随着大模型技术快速发展,“AI浏览器”正在成为企业知识检索、自动化办公、智能客服、数据分析、网页代理执行等场景中的重要入口。它不仅仅是一个普通浏览器加上聊天框,而是集成了 大语言模型、网页解析、插件工具、权限控制、用户系统、日志审计、向量检索、自动化执行能力 的综合型应用。

对于零基础学习者来说,最难的往往不是写一个 Demo,而是把 AI 浏览器真正部署到生产环境,让它能够稳定、安全、可维护地服务真实用户。本文将从基础概念、架构设计、服务器准备、环境安装、项目部署、反向代理、HTTPS、安全策略、监控运维、常见问题等方面,系统讲解 AI 浏览器的生产环境部署方法。


一、什么是 AI 浏览器?

AI 浏览器可以理解为一种“带有人工智能能力的浏览器或网页工作台”。它通常具备以下能力:

  1. 网页内容理解
    能够读取网页文本、表格、图片信息,并进行总结、翻译、问答或结构化提取。

  2. 自然语言交互
    用户可以用自然语言下达任务,例如:“帮我总结这个页面”“把这篇文章提取成表格”“帮我找出价格最低的商品”。

  3. 工具调用能力
    AI 可以调用搜索、数据库、API、爬虫、文件读取、网页自动化等工具完成复杂任务。

  4. 多模型接入
    支持接入 OpenAI、Claude、Gemini、通义千问、智谱、DeepSeek、本地模型等。

  5. 企业知识库集成
    通过向量数据库实现文档检索增强,让 AI 能回答企业内部资料相关问题。

  6. 权限与审计
    生产环境中必须控制用户权限、数据访问范围,并记录操作日志。

简单来说,AI 浏览器是一个将浏览器、AI 助手、自动化工具和知识库结合起来的智能工作平台。


二、生产环境部署与本地 Demo 的区别

很多初学者在本地运行 AI 项目时,只需要执行:

npm install
npm run dev

或者:

python app.py

项目就能跑起来。但这并不代表可以直接用于生产环境。

生产环境需要重点考虑以下问题:

维度 本地开发环境 生产环境
访问方式 localhost 域名 + HTTPS
稳定性 可以随时重启 需要长期运行
安全性 通常较弱 必须限制权限、防攻击
日志 可有可无 必须保留与分析
性能 单人测试 多用户并发
配置 写在本地文件 使用环境变量或密钥管理
数据 测试数据 真实用户数据
运维 手动操作 自动化部署、监控、告警

因此,生产部署不是简单地“把项目放到服务器上运行”,而是要构建一个可靠的运行体系。


三、AI 浏览器常见技术架构

一个典型的 AI 浏览器生产系统可以分为以下几个部分:

用户浏览器
   ↓
Nginx / CDN / HTTPS
   ↓
前端应用 React / Vue / Next.js
   ↓
后端服务 Node.js / Python / Go
   ↓
AI 模型服务 OpenAI / DeepSeek / 本地大模型
   ↓
数据库 PostgreSQL / MySQL / MongoDB
   ↓
缓存 Redis
   ↓
向量数据库 Milvus / Qdrant / pgvector
   ↓
对象存储 MinIO / S3
   ↓
日志监控 Prometheus / Grafana / ELK

1. 前端层

前端负责用户界面,包括:

  • 浏览器工作台;
  • 对话窗口;
  • 网页内容展示;
  • 文件上传;
  • 插件配置;
  • 用户登录;
  • 任务执行进度展示。

常见技术栈:

  • React;
  • Vue;
  • Next.js;
  • Vite;
  • Tailwind CSS。

2. 后端层

后端负责业务逻辑,例如:

  • 用户认证;
  • 调用大模型 API;
  • 管理会话历史;
  • 调用工具;
  • 处理文件;
  • 管理知识库;
  • 写入数据库;
  • 权限判断。

常见技术栈:

  • Node.js + Express / NestJS;
  • Python + FastAPI / Flask;
  • Go + Gin;
  • Java + Spring Boot。

3. 模型层

模型可以是第三方 API,也可以是自建模型服务。

常见方案:

  • OpenAI API;
  • Anthropic Claude;
  • Google Gemini;
  • DeepSeek;
  • 通义千问;
  • 智谱 GLM;
  • Ollama 本地模型;
  • vLLM 自建推理服务。

4. 数据层

生产环境一般至少需要:

  • 关系型数据库:存用户、会话、配置;
  • Redis:缓存、限流、任务队列;
  • 向量数据库:知识库检索;
  • 对象存储:保存上传文件、截图、导出文件。

四、部署前准备工作

在正式部署之前,需要先准备好基础资源。

1. 服务器配置建议

如果只是小团队内部使用,可以从较低配置开始:

用途 推荐配置
测试环境 2 核 CPU / 4GB 内存 / 40GB 硬盘
小型生产 4 核 CPU / 8GB 内存 / 80GB 硬盘
中型生产 8 核 CPU / 16GB 内存 / 200GB 硬盘
自建大模型 GPU 服务器,显存根据模型大小决定

如果使用第三方模型 API,不需要 GPU。如果要部署本地大模型,例如 Qwen、Llama、DeepSeek-R1-Distill 等,则需要根据模型参数量准备显卡。

2. 操作系统建议

推荐使用 Linux 服务器:

  • Ubuntu 22.04 LTS;
  • Debian 12;
  • Rocky Linux;
  • CentOS Stream。

对于零基础用户,建议选择 Ubuntu 22.04 LTS,资料丰富,社区支持好。

3. 域名与 DNS

生产环境最好使用域名访问,例如:

https://ai-browser.example.com

需要完成以下步骤:

  1. 购买域名;
  2. 在 DNS 服务商处添加 A 记录;
  3. 将域名解析到服务器公网 IP;
  4. 配置 HTTPS 证书。

4. 必备软件

生产服务器常用组件包括:

  • Git;
  • Docker;
  • Docker Compose;
  • Nginx;
  • Node.js 或 Python;
  • PostgreSQL;
  • Redis;
  • Certbot;
  • Fail2ban;
  • UFW 防火墙。

如果是零基础部署,最推荐的方式是使用 Docker Compose,因为它可以统一管理前端、后端、数据库、缓存等服务,减少环境差异。


五、服务器初始化

以下以 Ubuntu 22.04 为例。

1. 登录服务器

ssh root@你的服务器IP

首次登录后,建议更新系统:

apt update && apt upgrade -y

2. 创建普通用户

不要长期使用 root 运行服务,建议创建部署用户:

adduser deploy
usermod -aG sudo deploy

然后切换用户:

su - deploy

3. 配置防火墙

安装并启用 UFW:

sudo apt install ufw -y
sudo ufw allow OpenSSH
sudo ufw allow 80
sudo ufw allow 443
sudo ufw enable

查看状态:

sudo ufw status

生产环境只开放必要端口。通常只需要:

  • 22:SSH;
  • 80:HTTP;
  • 443:HTTPS。

数据库端口不要暴露到公网。


六、安装 Docker 与 Docker Compose

1. 安装 Docker

curl -fsSL https://get.docker.com | sudo bash

将当前用户加入 docker 组:

sudo usermod -aG docker $USER

重新登录服务器后检查:

docker version

2. 安装 Docker Compose

新版本 Docker 通常已集成 Compose 插件:

docker compose version

如果能看到版本号,说明安装成功。


七、规划项目目录

建议统一放在 /opt 或用户目录下:

sudo mkdir -p /opt/ai-browser
sudo chown -R deploy:deploy /opt/ai-browser
cd /opt/ai-browser

推荐目录结构:

/opt/ai-browser
├── docker-compose.yml
├── .env
├── frontend
├── backend
├── nginx
│   └── default.conf
├── data
│   ├── postgres
│   ├── redis
│   └── uploads
└── logs

这样做的好处是:

  • 配置清晰;
  • 数据可持久化;
  • 日志方便排查;
  • 后续备份简单。

八、环境变量配置

生产环境中,不要把 API Key、数据库密码、JWT 密钥直接写进代码。

可以新建 .env 文件:

nano .env

示例内容:

APP_ENV=production
APP_PORT=3000

DOMAIN=ai-browser.example.com

POSTGRES_DB=ai_browser
POSTGRES_USER=ai_user
POSTGRES_PASSWORD=请替换为强密码

REDIS_PASSWORD=请替换为强密码

JWT_SECRET=请替换为随机长字符串

OPENAI_API_KEY=sk-xxxx
OPENAI_BASE_URL=https://api.openai.com/v1

MODEL_NAME=gpt-4o-mini

UPLOAD_DIR=/app/uploads
LOG_LEVEL=info

密钥生成建议

可以使用以下命令生成随机字符串:

openssl rand -base64 48

注意:

  • .env 文件不要提交到 Git;
  • 不要截图公开 API Key;
  • 不要把数据库密码写在文档中;
  • 生产和测试环境使用不同密钥。

九、Docker Compose 部署示例

下面是一个简化版 docker-compose.yml 示例,适合理解生产部署结构。

services:
  frontend:
    build:
      context: ./frontend
      dockerfile: Dockerfile
    container_name: ai-browser-frontend
    restart: always
    environment:
      - NODE_ENV=production
    depends_on:
      - backend

  backend:
    build:
      context: ./backend
      dockerfile: Dockerfile
    container_name: ai-browser-backend
    restart: always
    env_file:
      - .env
    volumes:
      - ./data/uploads:/app/uploads
      - ./logs:/app/logs
    depends_on:
      - postgres
      - redis

  postgres:
    image: postgres:16
    container_name: ai-browser-postgres
    restart: always
    environment:
      POSTGRES_DB: ai_browser
      POSTGRES_USER: ai_user
      POSTGRES_PASSWORD: ${POSTGRES_PASSWORD}
    volumes:
      - ./data/postgres:/var/lib/postgresql/data
    ports:
      - "127.0.0.1:5432:5432"

  redis:
    image: redis:7
    container_name: ai-browser-redis
    restart: always
    command: redis-server --requirepass ${REDIS_PASSWORD}
    volumes:
      - ./data/redis:/data
    ports:
      - "127.0.0.1:6379:6379"

  nginx:
    image: nginx:1.25
    container_name: ai-browser-nginx
    restart: always
    volumes:
      - ./nginx/default.conf:/etc/nginx/conf.d/default.conf
      - ./data/uploads:/var/www/uploads
    ports:
      - "80:80"
      - "443:443"
    depends_on:
      - frontend
      - backend

关键说明

  1. restart: always
    表示服务异常退出后自动重启。

  2. 数据目录挂载
    PostgreSQL、Redis、上传文件必须持久化,否则容器删除后数据会丢失。

  3. 数据库只监听本地
    127.0.0.1:5432:5432 表示不直接暴露到公网。

  4. Nginx 作为统一入口
    用户只访问 Nginx,不直接访问后端容器。


十、前端生产构建

如果前端使用 React、Vue 或 Next.js,通常需要构建生产包。

React / Vue / Vite 示例

frontend/Dockerfile

FROM node:20-alpine AS builder

WORKDIR /app

COPY package*.json ./
RUN npm install

COPY . .
RUN npm run build

FROM nginx:1.25-alpine

COPY --from=builder /app/dist /usr/share/nginx/html

EXPOSE 80

这类项目构建后是静态文件,由 Nginx 提供访问。

Next.js 示例

如果是 Next.js 服务端渲染项目,可以使用:

FROM node:20-alpine

WORKDIR /app

COPY package*.json ./
RUN npm install

COPY . .
RUN npm run build

EXPOSE 3000

CMD ["npm", "start"]

部署时要注意 Next.js 不是纯静态应用,可能需要单独运行 Node 服务。


十一、后端服务生产配置

以后端使用 Python FastAPI 为例。

backend/Dockerfile

FROM python:3.11-slim

WORKDIR /app

COPY requirements.txt ./
RUN pip install --no-cache-dir -r requirements.txt

COPY . .

EXPOSE 8000

CMD ["gunicorn", "main:app", "-k", "uvicorn.workers.UvicornWorker", "-w", "4", "-b", "0.0.0.0:8000"]

为什么不用 python main.py

开发环境可以直接运行:

python main.py

但生产环境建议使用 Gunicorn + Uvicorn Worker,因为它具备:

  • 多进程能力;
  • 更好的稳定性;
  • 更适合处理并发请求;
  • 可配合容器重启策略。

如果后端是 Node.js,建议使用:

  • PM2;
  • Docker restart 策略;
  • NestJS 生产模式;
  • 日志输出到 stdout。

十二、Nginx 反向代理配置

Nginx 是生产环境常用入口,负责:

  • 转发前端请求;
  • 转发 API 请求;
  • 配置 HTTPS;
  • 限制上传大小;
  • 设置超时时间;
  • 增加安全响应头。

示例 nginx/default.conf

server {
    listen 80;
    server_name ai-browser.example.com;

    client_max_body_size 50m;

    location / {
        proxy_pass http://frontend:80;
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
    }

    location /api/ {
        proxy_pass http://backend:8000/;
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

        proxy_connect_timeout 60s;
        proxy_send_timeout 300s;
        proxy_read_timeout 300s;
    }

    location /uploads/ {
        alias /var/www/uploads/;
    }
}

AI 应用为什么要加长超时时间?

因为大模型生成内容可能耗时较长,尤其是:

  • 长文档总结;
  • 多轮工具调用;
  • 网页自动化任务;
  • 知识库检索;
  • 大文件解析。

如果 Nginx 默认超时时间太短,用户可能看到 504 Gateway Timeout。


十三、配置 HTTPS 证书

生产环境必须使用 HTTPS,尤其是 AI 浏览器涉及用户输入、账号登录、API Key、文件上传等敏感信息。

方案一:使用云厂商证书

如果你使用阿里云、腾讯云、华为云等,可以申请免费证书,然后在 Nginx 中配置。

方案二:使用 Let's Encrypt

如果 Nginx 直接安装在宿主机,可以使用 Certbot:

sudo apt install certbot python3-certbot-nginx -y
sudo certbot --nginx -d ai-browser.example.com

如果 Nginx 在 Docker 容器中,也可以使用:

  • Nginx Proxy Manager;
  • acme.sh;
  • Traefik;
  • Caddy。

对于零基础用户,推荐使用 Nginx Proxy Manager,它有图形界面,配置证书比较简单。


十四、启动项目

进入项目目录:

cd /opt/ai-browser

启动服务:

docker compose up -d

查看运行状态:

docker compose ps

查看日志:

docker compose logs -f

只查看后端日志:

docker compose logs -f backend

如果需要重新构建:

docker compose up -d --build

如果需要停止:

docker compose down

注意:不要随意使用 docker compose down -v,因为 -v 会删除数据卷,可能导致数据库数据丢失。


十五、数据库初始化与迁移

生产项目通常需要执行数据库迁移。

例如 Node.js Prisma:

docker compose exec backend npx prisma migrate deploy

Python Alembic:

docker compose exec backend alembic upgrade head

Django:

docker compose exec backend python manage.py migrate

生产迁移注意事项

  1. 迁移前先备份数据库;
  2. 不要在高峰期执行大表结构变更;
  3. 测试环境先跑一遍;
  4. 迁移失败要有回滚方案;
  5. 不要手动修改生产数据库结构,除非明确知道后果。

十六、AI 模型 API 配置

AI 浏览器的核心能力来自模型调用。生产环境需要注意以下几点。

1. API Key 管理

不要将 API Key 写在前端代码中。前端代码会被用户下载,任何写在前端的密钥都可能泄露。

正确做法:

前端 → 后端 → 模型服务

错误做法:

前端 → 模型服务

除非模型服务专门支持前端安全令牌,否则不要直接从浏览器调用模型 API。

2. 设置调用限额

应限制每个用户的调用频率,例如:

  • 每分钟最多 20 次;
  • 每天最多 1000 次;
  • 单次最多输入 100K tokens;
  • 文件最大 50MB;
  • 单任务最长 5 分钟。

3. 成本控制

大模型调用可能产生费用,因此需要:

  • 记录每次调用 tokens;
  • 按用户统计消耗;
  • 设置预算告警;
  • 对异常请求自动拦截;
  • 区分免费用户和付费用户额度。

4. 降级策略

当主模型不可用时,可以切换备用模型。例如:

  • GPT-4o → GPT-4o-mini;
  • Claude Sonnet → DeepSeek;
  • 云模型 → 本地模型;
  • 高级模型 → 普通模型。

十七、知识库与向量数据库部署

很多 AI 浏览器会支持“上传文档后问答”。这通常需要向量数据库。

常见选择

向量数据库 特点
pgvector 基于 PostgreSQL,适合中小规模
Qdrant 部署简单,性能不错
Milvus 适合大规模向量检索
Elasticsearch 适合全文检索 + 向量混合
Weaviate 功能完整,生态成熟

零基础推荐

如果项目规模不大,推荐使用 PostgreSQL + pgvector,原因是:

  • 少维护一个组件;
  • 数据和向量放在同一个数据库;
  • 备份简单;
  • 学习成本较低。

文档入库流程

通常包括:

上传文件
  ↓
解析文本
  ↓
文本清洗
  ↓
分块 Chunk
  ↓
调用 Embedding 模型
  ↓
写入向量数据库
  ↓
用户提问
  ↓
向量检索
  ↓
拼接上下文
  ↓
调用大模型生成答案

生产环境中要特别注意文件安全,不要允许用户上传可执行脚本并直接执行。


十八、网页自动化与沙箱安全

AI 浏览器可能具备自动打开网页、点击按钮、填写表单、抓取内容的能力。这类能力非常强大,也非常危险。

常见技术

  • Playwright;
  • Puppeteer;
  • Selenium;
  • Browserless;
  • Chrome DevTools Protocol。

生产安全建议

  1. 浏览器自动化服务独立容器运行
    不要和主后端放在同一个容器中。

  2. 禁用宿主机敏感目录挂载
    避免自动化浏览器读取服务器文件。

  3. 限制访问内网地址
    防止 SSRF 攻击,例如访问:

    http://localhost
    http://127.0.0.1
    http://169.254.169.254
  4. 限制执行时间
    防止任务卡死占用资源。

  5. 记录操作日志
    包括访问 URL、点击行为、表单提交等。

  6. 敏感操作需要用户确认
    例如付款、发送邮件、删除数据、提交表单等。


十九、日志、监控与告警

生产环境不能靠“用户反馈才知道系统坏了”。必须主动监控。

1. 应用日志

至少记录:

  • 请求时间;
  • 用户 ID;
  • 请求路径;
  • 响应状态;
  • 错误堆栈;
  • 模型调用耗时;
  • token 消耗;
  • 工具调用结果。

日志中不要记录明文密码、API Key、身份证号等敏感信息。

2. 系统监控

建议监控:

  • CPU 使用率;
  • 内存使用率;
  • 磁盘空间;
  • 网络流量;
  • 容器状态;
  • 数据库连接数;
  • Redis 内存;
  • API 错误率;
  • 模型响应时间。

3. 常见工具

工具 用途
Prometheus 指标采集
Grafana 可视化面板
Loki 日志收集
ELK 日志分析
Sentry 错误追踪
Uptime Kuma 站点可用性监控

零基础可以先部署 Uptime Kuma,用来检测网站是否可访问。


二十、备份与恢复策略

只部署不备份,是生产环境的大忌。

需要备份的内容

  1. PostgreSQL 数据;
  2. 上传文件;
  3. 向量数据库;
  4. .env 配置;
  5. Nginx 配置;
  6. 用户生成的重要内容;
  7. 日志审计数据。

PostgreSQL 备份示例

docker compose exec postgres pg_dump -U ai_user ai_browser > backup.sql

恢复示例:

cat backup.sql | docker compose exec -T postgres psql -U ai_user ai_browser

备份原则

建议遵循 3-2-1 原则:

  • 至少 3 份数据;
  • 使用 2 种不同存储介质;
  • 至少 1 份异地备份。

例如:

  • 本机每日备份;
  • 对象存储每周备份;
  • 异地服务器每月备份。

二十一、安全加固清单

AI 浏览器生产部署必须重视安全。

1. 登录安全

  • 使用强密码;
  • 支持 MFA 双因素认证;
  • 设置登录失败锁定;
  • 后台管理入口限制 IP;
  • 用户密码使用 bcrypt/argon2 加密。

2. API 安全

  • 所有接口鉴权;
  • 后端校验权限;
  • 防止越权访问;
  • 设置请求频率限制;
  • 校验输入参数;
  • 防止 SQL 注入;
  • 防止 XSS;
  • 防止 CSRF。

3. 文件安全

  • 限制上传大小;
  • 限制文件类型;
  • 文件名重命名;
  • 存储路径隔离;
  • 病毒扫描;
  • 不允许直接执行上传文件。

4. 模型安全

  • 对 Prompt Injection 做防护;
  • 不将系统提示词暴露给用户;
  • 工具调用前做权限判断;
  • 高风险操作要求二次确认;
  • 过滤敏感输出;
  • 对企业私有数据做访问控制。

5. 服务器安全

  • 禁止 root 密码登录;
  • 使用 SSH Key;
  • 定期更新系统补丁;
  • 安装 Fail2ban;
  • 关闭无用端口;
  • 数据库不暴露公网;
  • 定期检查日志。

二十二、性能优化建议

当用户量增加后,需要优化系统性能。

1. 前端优化

  • 开启 gzip 或 brotli;
  • 使用 CDN;
  • 图片懒加载;
  • 减少首屏资源;
  • 静态文件缓存;
  • 分包加载。

2. 后端优化

  • 数据库索引;
  • Redis 缓存;
  • 异步任务队列;
  • 模型响应流式输出;
  • 限制并发任务;
  • 使用连接池;
  • 慢查询分析。

3. AI 调用优化

  • 对长文档先摘要再问答;
  • 缓存相同问题结果;
  • 使用更便宜的模型处理简单任务;
  • Embedding 批量处理;
  • 对上下文做压缩;
  • 使用流式响应提升体验。

4. 水平扩展

当单台服务器无法支撑时,可以拆分:

Nginx 负载均衡
   ↓
多个后端实例
   ↓
共享数据库 / Redis / 对象存储

容器编排可以进一步使用:

  • Docker Swarm;
  • Kubernetes;
  • 阿里云 ACK;
  • 腾讯云 TKE;
  • AWS EKS。

零基础阶段不建议一开始就上 Kubernetes,复杂度较高。


二十三、上线前检查清单

正式对外发布前,建议逐项检查:

  • [ ] 域名可以正常访问;
  • [ ] HTTPS 证书有效;
  • [ ] HTTP 自动跳转 HTTPS;
  • [ ] API Key 未暴露在前端;
  • [ ] 数据库未开放公网;
  • [ ] Redis 设置了密码;
  • [ ] .env 未提交到 Git;
  • [ ] 用户登录功能正常;
  • [ ] 权限控制有效;
  • [ ] 文件上传有限制;
  • [ ] 日志可以查看;
  • [ ] 错误有告警;
  • [ ] 数据库已备份;
  • [ ] 模型调用额度已设置;
  • [ ] Nginx 超时时间适合 AI 任务;
  • [ ] 服务器磁盘空间充足;
  • [ ] 关键操作有审计日志;
  • [ ] 已准备回滚方案。

二十四、常见问题与解决方案

1. 网站打不开

排查步骤:

docker compose ps
docker compose logs -f nginx
sudo ufw status

检查:

  • 容器是否运行;
  • 80/443 端口是否开放;
  • 域名是否解析正确;
  • Nginx 配置是否错误。

2. API 请求 502

通常表示 Nginx 找不到后端服务。

检查:

docker compose logs -f backend

可能原因:

  • 后端容器启动失败;
  • 端口写错;
  • 服务名写错;
  • 后端连接数据库失败。

3. AI 回复很慢

可能原因:

  • 模型服务响应慢;
  • 上下文过长;
  • 网络不稳定;
  • 没有使用流式输出;
  • 后端同步阻塞;
  • 并发请求过多。

优化方式:

  • 使用流式响应;
  • 缩短上下文;
  • 增加超时时间;
  • 增加队列;
  • 更换模型供应商;
  • 做结果缓存。

4. 上传文件失败

检查:

  • Nginx client_max_body_size
  • 后端上传大小限制;
  • 磁盘空间;
  • 文件目录权限;
  • 文件格式是否允许。

5. 数据库连接失败

检查:

  • 数据库用户名密码;
  • .env 是否加载;
  • Docker 网络是否正常;
  • PostgreSQL 容器是否启动;
  • 数据库连接地址是否写成了容器服务名。

在 Docker Compose 中,后端连接 PostgreSQL 通常应使用:

postgres:5432

而不是:

localhost:5432

因为 localhost 在容器内指向的是后端容器自己。


二十五、推荐的最小生产方案

如果你是零基础,希望先上线一个可用版本,推荐如下组合:

模块 推荐方案
服务器 Ubuntu 22.04,4 核 8GB
部署方式 Docker Compose
前端 React / Vue / Next.js
后端 FastAPI / NestJS
数据库 PostgreSQL
缓存 Redis
向量检索 pgvector
反向代理 Nginx
HTTPS Let's Encrypt
监控 Uptime Kuma + Docker logs
模型 第三方 API
文件存储 本机目录,后期迁移 MinIO/S3

这套方案学习成本低,维护难度适中,适合个人项目、小团队内部系统、企业试点项目。


二十六、生产部署的正确心态

零基础学习部署 AI 浏览器,不要追求一步到位。更合理的路线是:

  1. 先本地跑通项目
    理解前端、后端、数据库、模型之间的关系。

  2. 再用 Docker 部署单机版
    让服务可以在服务器上稳定运行。

  3. 然后配置域名和 HTTPS
    达到真正可访问的生产形态。

  4. 接着完善安全与备份
    避免数据泄露和数据丢失。

  5. 最后做监控、扩容和自动化部署
    提升可靠性和运维效率。

很多人会跳过安全、日志、备份,直接上线。短期看节省时间,长期看风险极高。生产环境真正重要的不是“能跑”,而是“稳定、安全、可恢复、可持续维护”。


结语

AI 浏览器的生产环境部署,涉及前端、后端、数据库、模型服务、Nginx、HTTPS、安全、监控、备份等多个环节。对于零基础学习者来说,刚开始可能会觉得内容很多,但只要按照模块逐步推进,就能建立完整的部署能力。

最推荐的入门路径是:Ubuntu 服务器 + Docker Compose + Nginx + PostgreSQL + Redis + 第三方大模型 API。这套组合既能满足小型生产环境需求,又不会过早引入 Kubernetes、自建 GPU 推理集群等复杂系统。

最后请记住:AI 应用的生产部署不仅是技术问题,更是安全、成本、稳定性和用户体验的综合工程。一个优秀的 AI 浏览器,不只是能回答问题,还应该在真实环境中可靠运行、保护数据、控制成本,并为用户提供持续稳定的智能服务。

目录结构
全文