AI搜索上线实战：从一键部署到生产环境稳定运行

发布人：慈云数据-客服中心发布时间：2026-06-04 09:34 阅读量：104

AI搜索生产环境部署指南｜一键部署

随着大模型与企业知识库的深度融合，AI搜索已经从“智能问答演示”逐渐走向真实业务场景。相比传统关键词搜索，AI搜索不仅能理解用户意图，还能结合企业文档、数据库、网页、工单、知识库等多源数据，生成更准确、更自然、更可解释的答案。对于企业而言，如何将AI搜索稳定、安全、可扩展地部署到生产环境，是落地过程中的关键一步。

本文将围绕“生产环境部署”和“一键部署”两个核心目标，系统介绍AI搜索系统的架构设计、部署准备、环境配置、Docker Compose一键部署方案、Kubernetes生产部署建议、数据初始化、权限安全、监控告警、备份恢复以及上线检查清单，帮助团队快速完成从测试环境到生产环境的迁移。

一、AI搜索生产环境的典型架构

一个完整的AI搜索系统通常不是单一服务，而是由多个模块协同组成。生产环境中，推荐采用模块化、容器化、可观测、可扩展的架构。

典型架构如下：

用户 / 业务系统
     │
     ▼
Web 前端 / API 网关
     │
     ▼
AI搜索应用服务
     │
     ├── 用户鉴权与权限控制
     ├── 查询改写 / 意图识别
     ├── 检索召回
     ├── 重排序
     ├── 大模型生成回答
     └── 引用来源与答案校验
     │
     ├───────────────┐
     ▼               ▼
向量数据库        关系型数据库
Milvus/Qdrant     PostgreSQL/MySQL
     │               │
     ▼               ▼
文档切分与索引    用户、权限、任务、日志
     │
     ▼
对象存储 / 文件系统
MinIO / S3 / NAS
     │
     ▼
监控告警 / 日志系统
Prometheus / Grafana / Loki

在生产环境中，AI搜索至少需要包含以下核心组件：

组件	作用
前端服务	提供用户搜索、问答、知识库管理等界面
API服务	处理业务请求、鉴权、查询逻辑、答案生成
Worker服务	执行文档解析、切分、向量化、索引构建等异步任务
向量数据库	存储文本片段Embedding，用于语义检索
关系型数据库	存储用户、文档元数据、任务状态、权限配置
Redis	用于缓存、队列、限流、会话等
对象存储	存放原始文件、解析结果、附件资源
大模型服务	可接入OpenAI、Azure OpenAI、本地大模型或私有模型服务
监控系统	收集服务状态、接口耗时、错误率、资源使用率

二、部署前准备

在进行一键部署之前，需要先确认生产环境的基础资源是否满足要求。AI搜索涉及向量检索、文档解析和大模型调用，对CPU、内存、磁盘和网络都有一定要求。

1. 推荐服务器配置

如果是中小规模团队内部知识库，推荐配置如下：

场景	CPU	内存	磁盘	说明
测试环境	4核	8GB	100GB SSD	适合功能验证
小型生产	8核	16GB	300GB SSD	适合几十万文本片段
中型生产	16核	32GB	1TB SSD	适合百万级文本片段
大型生产	32核以上	64GB以上	分布式存储	建议使用Kubernetes部署

如果使用本地大模型进行推理，还需要额外准备GPU资源。例如部署7B或14B模型，建议使用至少一张24GB显存以上的GPU。如果只是调用云端模型API，则无需GPU。

2. 软件依赖

生产环境建议使用Linux服务器，例如Ubuntu 22.04 LTS、Debian 12、CentOS Stream或Rocky Linux。

基础依赖如下：

docker >= 24.0
docker compose >= 2.20
git
curl
openssl

安装Docker示例：

curl -fsSL https://get.docker.com | bash
systemctl enable docker
systemctl start docker

安装Docker Compose插件：

docker compose version

如果系统未安装，可参考Docker官方文档安装。

3. 域名与HTTPS证书

生产环境强烈建议使用域名访问，并开启HTTPS。例如：

https://search.example.com

证书可以使用以下方式：

使用Nginx反向代理并配置Let’s Encrypt证书；
使用云厂商负载均衡自动签发证书；
使用企业内部CA证书；
在测试或内网场景中使用自签名证书。

三、一键部署目录结构

为了方便管理，建议将AI搜索的部署文件统一放在一个目录中，例如：

ai-search-deploy/
├── docker-compose.yml
├── .env
├── nginx/
│   └── nginx.conf
├── init/
│   └── init.sql
├── data/
│   ├── postgres/
│   ├── redis/
│   ├── minio/
│   └── vector/
├── logs/
└── scripts/
    ├── deploy.sh
    ├── backup.sh
    ├── restore.sh
    └── healthcheck.sh

其中：

docker-compose.yml：定义所有服务；
.env：存放环境变量；
nginx.conf：反向代理配置；
data/：持久化数据目录；
logs/：日志目录；
scripts/deploy.sh：一键部署脚本；
backup.sh和restore.sh：备份与恢复脚本。

四、环境变量配置

.env文件是生产部署的关键配置入口。示例如下：

# 基础配置
APP_ENV=production
APP_NAME=ai-search
APP_PORT=8080
WEB_PORT=3000
PUBLIC_BASE_URL=https://search.example.com

# 数据库配置
POSTGRES_HOST=postgres
POSTGRES_PORT=5432
POSTGRES_DB=aisearch
POSTGRES_USER=aisearch
POSTGRES_PASSWORD=请替换为强密码

# Redis配置
REDIS_HOST=redis
REDIS_PORT=6379
REDIS_PASSWORD=请替换为强密码

# 对象存储配置
MINIO_ENDPOINT=minio:9000
MINIO_ACCESS_KEY=请替换为AccessKey
MINIO_SECRET_KEY=请替换为SecretKey
MINIO_BUCKET=ai-search-docs

# 向量数据库配置
VECTOR_DB=qdrant
QDRANT_HOST=qdrant
QDRANT_PORT=6333
VECTOR_COLLECTION=enterprise_docs

# Embedding配置
EMBEDDING_PROVIDER=openai
EMBEDDING_MODEL=text-embedding-3-small
OPENAI_API_KEY=请替换为真实Key
OPENAI_BASE_URL=https://api.openai.com/v1

# LLM配置
LLM_PROVIDER=openai
LLM_MODEL=gpt-4o-mini
LLM_TEMPERATURE=0.2
LLM_MAX_TOKENS=2048

# 安全配置
JWT_SECRET=请使用openssl生成随机字符串
ADMIN_EMAIL=admin@example.com
ADMIN_PASSWORD=请替换为管理员初始密码

# 检索配置
TOP_K=10
RERANK_TOP_K=5
CHUNK_SIZE=800
CHUNK_OVERLAP=120

# 日志配置
LOG_LEVEL=info

生产环境中务必注意：

不要使用默认密码；
.env文件不要提交到Git仓库；
密钥应使用密钥管理服务，例如Vault、KMS、云厂商Secret Manager；
定期轮换API Key和数据库密码；
不同环境使用不同配置，例如开发、测试、生产分离。

五、Docker Compose一键部署方案

以下是一个适合中小规模生产环境的docker-compose.yml示例。实际镜像名称可以替换为企业内部镜像仓库地址。

version: "3.9"

services:
  nginx:
    image: nginx:1.25
    container_name: ai-search-nginx
    restart: always
    ports:
      - "80:80"
      - "443:443"
    volumes:
      - ./nginx/nginx.conf:/etc/nginx/nginx.conf:ro
      - ./logs/nginx:/var/log/nginx
      - ./certs:/etc/nginx/certs:ro
    depends_on:
      - web
      - api
    networks:
      - ai-search-net

  web:
    image: registry.example.com/ai-search/web:latest
    container_name: ai-search-web
    restart: always
    env_file:
      - .env
    depends_on:
      - api
    networks:
      - ai-search-net

  api:
    image: registry.example.com/ai-search/api:latest
    container_name: ai-search-api
    restart: always
    env_file:
      - .env
    volumes:
      - ./logs/api:/app/logs
    depends_on:
      - postgres
      - redis
      - qdrant
      - minio
    networks:
      - ai-search-net

  worker:
    image: registry.example.com/ai-search/worker:latest
    container_name: ai-search-worker
    restart: always
    env_file:
      - .env
    volumes:
      - ./logs/worker:/app/logs
    depends_on:
      - api
      - redis
      - postgres
      - qdrant
      - minio
    networks:
      - ai-search-net

  postgres:
    image: postgres:16
    container_name: ai-search-postgres
    restart: always
    environment:
      POSTGRES_DB: ${POSTGRES_DB}
      POSTGRES_USER: ${POSTGRES_USER}
      POSTGRES_PASSWORD: ${POSTGRES_PASSWORD}
    volumes:
      - ./data/postgres:/var/lib/postgresql/data
      - ./init/init.sql:/docker-entrypoint-initdb.d/init.sql:ro
    networks:
      - ai-search-net

  redis:
    image: redis:7
    container_name: ai-search-redis
    restart: always
    command: >
      redis-server
      --requirepass ${REDIS_PASSWORD}
      --appendonly yes
    volumes:
      - ./data/redis:/data
    networks:
      - ai-search-net

  qdrant:
    image: qdrant/qdrant:v1.9.0
    container_name: ai-search-qdrant
    restart: always
    volumes:
      - ./data/vector:/qdrant/storage
    networks:
      - ai-search-net

  minio:
    image: minio/minio:RELEASE.2024-05-10T01-41-38Z
    container_name: ai-search-minio
    restart: always
    command: server /data --console-address ":9001"
    environment:
      MINIO_ROOT_USER: ${MINIO_ACCESS_KEY}
      MINIO_ROOT_PASSWORD: ${MINIO_SECRET_KEY}
    volumes:
      - ./data/minio:/data
    networks:
      - ai-search-net

networks:
  ai-search-net:
    driver: bridge

该配置将AI搜索相关服务全部容器化，便于快速部署、迁移和升级。对于单机生产环境，Docker Compose是非常高效的方案；对于高并发和高可用场景，则建议使用Kubernetes。

六、Nginx反向代理配置

生产环境通常不直接暴露Web和API容器端口，而是通过Nginx统一入口访问。示例配置如下：

events {}

http {
    client_max_body_size 200m;

    upstream ai_search_web {
        server web:3000;
    }

    upstream ai_search_api {
        server api:8080;
    }

    server {
        listen 80;
        server_name search.example.com;

        location / {
            proxy_pass http://ai_search_web;
            proxy_set_header Host $host;
            proxy_set_header X-Real-IP $remote_addr;
            proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        }

        location /api/ {
            proxy_pass http://ai_search_api;
            proxy_set_header Host $host;
            proxy_set_header X-Real-IP $remote_addr;
            proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
            proxy_read_timeout 300s;
        }
    }
}

如果启用HTTPS，可以增加443监听，并配置证书路径：

server {
    listen 443 ssl;
    server_name search.example.com;

    ssl_certificate /etc/nginx/certs/fullchain.pem;
    ssl_certificate_key /etc/nginx/certs/privkey.pem;

    location / {
        proxy_pass http://ai_search_web;
    }

    location /api/ {
        proxy_pass http://ai_search_api;
        proxy_read_timeout 300s;
    }
}

七、一键部署脚本

为了减少人工操作，可以编写scripts/deploy.sh实现一键部署。

#!/usr/bin/env bash
set -e

echo "==> AI搜索生产环境一键部署开始"

if [ ! -f ".env" ]; then
  echo "错误：未找到.env文件，请先创建并填写生产配置"
  exit 1
fi

echo "==> 创建数据和日志目录"
mkdir -p data/postgres data/redis data/minio data/vector
mkdir -p logs/nginx logs/api logs/worker

echo "==> 拉取最新镜像"
docker compose pull

echo "==> 启动服务"
docker compose up -d

echo "==> 等待服务启动"
sleep 15

echo "==> 查看服务状态"
docker compose ps

echo "==> 执行健康检查"
bash scripts/healthcheck.sh || {
  echo "健康检查失败，请查看日志"
  docker compose logs --tail=100
  exit 1
}

echo "==> 部署完成"
echo "访问地址：请打开 PUBLIC_BASE_URL 配置的域名"

赋予执行权限：

chmod +x scripts/deploy.sh

执行一键部署：

bash scripts/deploy.sh

健康检查脚本示例：

#!/usr/bin/env bash
set -e

API_URL=${API_URL:-http://localhost/api/health}

echo "检查API健康状态：$API_URL"

curl -f "$API_URL" >/dev/null 2>&1

echo "API健康检查通过"

八、初始化管理员与知识库

部署完成后，需要完成系统初始化。通常包括以下步骤：

创建管理员账号；
创建默认知识库；
配置Embedding模型；
配置大模型；
上传测试文档；
执行索引构建；
验证搜索与问答效果。

如果系统支持命令行初始化，可以执行类似命令：

docker compose exec api python manage.py init-admin
docker compose exec api python manage.py create-default-kb
docker compose exec worker python manage.py reindex

如果通过Web页面初始化，则登录管理员账号后进入后台配置：

模型管理；
知识库管理；
用户与角色；
检索参数；
系统安全；
日志审计。

九、数据导入与索引构建流程

AI搜索的效果很大程度取决于数据质量。生产环境中，建议建立标准化的数据导入流程。

1. 文档采集

常见数据来源包括：

PDF、Word、Excel、PPT；
Markdown、TXT、HTML；
企业Wiki；
Confluence、Notion、飞书文档；
Git仓库；
工单系统；
数据库；
FAQ系统；
API文档。

2. 文档解析

文档解析要处理格式差异、编码问题、表格、图片OCR、目录结构等。对于PDF文档，尤其要注意扫描版PDF和文本版PDF的差异。扫描版PDF需要OCR能力，否则无法获得有效文本。

3. 文本切分

切分策略会显著影响召回质量。常见参数包括：

CHUNK_SIZE=800
CHUNK_OVERLAP=120

一般建议：

规章制度、合同类文档：切分稍大，保留上下文；
FAQ类文档：按问答对切分；
技术文档：按标题层级切分；
表格数据：尽量保留表头和行之间的关系。

4. 向量化与入库

文档切分后，需要调用Embedding模型生成向量，并写入向量数据库。每个向量记录通常包含：

文本片段；
文档ID；
文档标题；
章节标题；
权限标签；
更新时间；
来源URL；
向量值。

5. 检索与重排序

用户提问后，系统会先进行语义召回，再通过重排序模型筛选更相关的文本片段，最后交给大模型生成答案。生产环境建议开启引用来源功能，让用户能够看到答案依据，降低幻觉风险。

十、生产环境安全建议

AI搜索往往连接企业内部知识库，安全性必须优先考虑。

1. 身份认证

推荐支持以下认证方式：

用户名密码；
企业SSO；
LDAP；
OAuth2；
OIDC；
SAML；
飞书、钉钉、企业微信登录。

对于生产环境，不建议仅使用简单共享密码。

2. 权限隔离

AI搜索不能只做“全库检索”，必须根据用户权限过滤数据。例如：

部门权限；
项目权限；
文档级权限；
标签权限；
数据源权限；
行级权限。

检索时应在向量召回阶段或重排序前后进行权限过滤，避免用户通过AI问答获取无权查看的信息。

3. 敏感信息保护

建议增加以下机制：

上传文档敏感词检测；
答案输出脱敏；
API Key加密存储；
日志中隐藏密码、Token、身份证号、手机号；
限制管理员操作权限；
启用审计日志。

4. 网络安全

生产部署建议：

数据库不暴露公网；
Redis不暴露公网；
MinIO管理端口不暴露公网；
只开放80/443端口；
使用防火墙限制访问来源；
启用HTTPS；
定期扫描镜像漏洞。

十一、监控、日志与告警

AI搜索系统上线后，需要持续监控运行状态。否则一旦出现大模型接口异常、向量数据库故障、Worker任务堆积，用户体验会迅速下降。

1. 核心监控指标

建议监控以下指标：

类别	指标
API服务	QPS、P95延迟、错误率、超时率
Worker服务	队列长度、任务失败率、索引耗时
数据库	连接数、慢查询、磁盘空间
Redis	内存使用、连接数、队列长度
向量数据库	查询耗时、集合大小、写入失败率
大模型调用	Token消耗、接口失败率、平均响应时间
系统资源	CPU、内存、磁盘、网络

2. 日志管理

日志应至少包含：

请求ID；
用户ID；
请求时间；
查询内容；
检索片段ID；
模型名称；
Token消耗；
响应耗时；
错误堆栈。

但需要注意，日志中可能包含用户问题和企业知识内容，因此必须做好访问控制和脱敏处理。

3. 告警策略

推荐配置以下告警：

API错误率超过5%；
P95响应时间超过10秒；
Worker队列堆积超过阈值；
数据库磁盘使用率超过80%；
Redis内存使用率超过80%；
大模型接口连续失败；
证书即将过期；
备份任务失败。

十二、备份与恢复

生产环境中，备份不是可选项，而是上线前必须完成的能力。

1. 需要备份的数据

AI搜索系统主要需要备份：

PostgreSQL数据库；
向量数据库数据；
MinIO对象存储；
.env配置文件；
Nginx配置；
用户上传的原始文档；
索引任务记录。

2. PostgreSQL备份脚本

scripts/backup.sh示例：

#!/usr/bin/env bash
set -e

BACKUP_DIR=backup/$(date +%Y%m%d_%H%M%S)
mkdir -p "$BACKUP_DIR"

echo "==> 备份PostgreSQL"
docker compose exec -T postgres pg_dump \
  -U "$POSTGRES_USER" \
  "$POSTGRES_DB" > "$BACKUP_DIR/postgres.sql"

echo "==> 备份配置文件"
cp .env "$BACKUP_DIR/env.backup"
cp docker-compose.yml "$BACKUP_DIR/docker-compose.yml"

echo "==> 备份完成：$BACKUP_DIR"

3. 恢复建议

恢复时应遵循：

停止业务写入；
恢复数据库；
恢复对象存储；
恢复向量数据库；
启动服务；
执行健康检查；
抽样验证搜索结果。

对于大规模知识库，也可以只备份原始文档和元数据，向量索引通过重建恢复。但这种方式恢复时间较长，需要提前评估。

十三、升级与回滚策略

AI搜索系统升级可能涉及应用镜像、数据库结构、索引格式、模型配置等变化。生产环境升级必须谨慎。

1. 升级前准备

升级前建议：

备份数据库；
备份配置文件；
记录当前镜像版本；
在测试环境验证新版本；
阅读Release Notes；
确认是否需要执行数据库迁移；
准备回滚方案。

2. 灰度升级

如果有多个实例，可以采用灰度方式：

先升级一个API实例；
观察错误率和响应时间；
验证核心功能；
再逐步升级其他实例。

Docker Compose单机部署可以通过固定镜像版本降低风险，例如：

image: registry.example.com/ai-search/api:v1.2.3

不建议生产环境长期使用latest标签，因为它无法保证版本可追溯。

3. 快速回滚

回滚示例：

docker compose down
# 修改docker-compose.yml中的镜像版本为旧版本
docker compose up -d

如果数据库结构发生了不可逆迁移，仅回滚镜像可能无法恢复，因此升级前的数据库备份非常重要。

十四、Kubernetes生产部署建议

对于高可用、高并发、多团队共享场景，推荐使用Kubernetes部署AI搜索。

1. 推荐拆分

在Kubernetes中，建议将组件拆分为：

web Deployment
api Deployment
worker Deployment
postgres StatefulSet或使用云数据库
redis StatefulSet或使用云Redis
qdrant StatefulSet或使用托管向量数据库
minio StatefulSet或使用S3对象存储
ingress
configmap
secret
hpa

2. 高可用建议

生产环境更推荐使用托管服务：

组件	推荐方案
PostgreSQL	云数据库RDS
Redis	云Redis
对象存储	S3、OSS、COS、OBS
向量数据库	托管Milvus、Qdrant集群
模型服务	云API或独立GPU推理集群

这样可以降低运维复杂度，把重点放在AI搜索应用本身。

3. 弹性扩缩容

API服务一般是无状态的，可以水平扩展：

kubectl scale deployment ai-search-api --replicas=3

Worker服务则根据任务队列长度扩容，例如文档导入高峰期增加Worker数量。

十五、性能优化建议

AI搜索生产环境常见瓶颈包括：模型响应慢、向量检索慢、文档解析慢、数据库查询慢、并发不足等。

1. 检索优化

控制TOP_K数量，避免召回过多；
使用重排序提高准确率；
建立合理的向量索引；
按知识库、部门、权限过滤；
对热门问题做缓存；
对长查询进行查询改写。

2. 模型调用优化

对简单问题使用轻量模型；
对复杂问题使用高质量模型；
设置合理的超时时间；
控制最大输出Token；
开启流式输出；
对失败请求进行重试；
使用模型网关统一管理不同模型。

3. 文档处理优化

使用异步任务队列；
大文件分批处理；
避免重复向量化；
对未变化文档跳过索引；
对解析失败文档记录原因；
定时清理无效索引。

十六、上线前检查清单

正式上线前，建议逐项检查：

[ ] 域名已配置；
[ ] HTTPS证书有效；
[ ] 默认密码已修改；
[ ] 数据库不暴露公网；
[ ] Redis不暴露公网；
[ ] MinIO管理端口不暴露公网；
[ ] 管理员账号已创建；
[ ] 用户权限已验证；
[ ] 测试文档已完成索引；
[ ] 搜索结果可返回引用来源；
[ ] 大模型API Key有效；
[ ] 日志不输出敏感信息；
[ ] 监控面板已配置；
[ ] 告警规则已生效；
[ ] 备份脚本已验证；
[ ] 恢复流程已演练；
[ ] 升级回滚方案已准备；
[ ] 压测结果满足业务要求。

十七、常见问题排查

1. 页面能打开，但搜索无结果

可能原因：

文档尚未完成索引；
Worker服务未启动；
向量数据库连接失败；
Embedding接口调用失败；
当前用户无文档权限；
检索参数设置过低。

排查命令：

docker compose logs worker --tail=200
docker compose logs api --tail=200
docker compose ps

2. 上传文档失败

可能原因：

Nginx上传大小限制过小；
对象存储配置错误；
文件格式不支持；
磁盘空间不足；
Worker解析任务异常。

可检查：

df -h
docker compose logs minio --tail=100
docker compose logs api --tail=100

3. 回答速度很慢

可能原因：

大模型接口响应慢；
检索召回数量过多；
重排序模型耗时；
数据库连接池不足；
API实例数量不足。

优化方向：

减少TOP_K；
开启流式输出；
增加API副本；
使用更快的模型；
对热门问题做缓存。

4. 答案不准确

可能原因：

文档切分不合理；
Embedding模型质量不足；
召回片段不相关；
缺少重排序；
提示词设计不合理；
知识库内容过期。

改进建议：

调整切分长度和重叠；
增加标题、章节等元数据；
引入Rerank模型；
清理过期文档；
优化Prompt；
开启引用来源校验。

十八、总结

AI搜索的生产环境部署，不只是把服务跑起来，更重要的是让系统具备稳定性、安全性、可观测性和可持续演进能力。对于中小规模场景，可以优先采用Docker Compose一键部署，快速完成上线；对于高并发和多业务线场景，则建议使用Kubernetes、托管数据库、对象存储和独立模型服务构建高可用架构。

一套可靠的AI搜索生产系统，应至少满足以下要求：

服务容器化，支持一键部署；
数据持久化，支持备份恢复；
接入权限体系，避免越权访问；
开启HTTPS和安全配置；
支持监控、日志和告警；
检索链路可调优；
模型配置可切换；
升级过程可回滚；
上线前完成压测和演练。

当这些基础能力完善后，AI搜索才能真正从演示系统变成企业可依赖的生产级基础设施。通过本文提供的部署思路、配置示例和检查清单，团队可以快速搭建一套可运行、可维护、可扩展的AI搜索平台，并在实际业务中不断优化搜索质量和用户体验。

文章标签： AI搜索生产环境部署一键部署 DockerCompose

上一篇：2026企业AI搜索上线实战：从RAG架构到权限、评测与运维闭环

下一篇：从 Demo 到稳定上线：AI 搜索生产部署的实战经验与避坑指南

更多栏目

新闻动态

文档中心

下载中心

目录结构

全文

产品与服务

新闻帮助

生态合作

了解我们

AI搜索上线实战：从一键部署到生产环境稳定运行

AI搜索 生产环境部署指南｜一键部署

一、AI搜索生产环境的典型架构

二、部署前准备

1. 推荐服务器配置

2. 软件依赖

3. 域名与HTTPS证书

三、一键部署目录结构

四、环境变量配置

五、Docker Compose一键部署方案

六、Nginx反向代理配置

七、一键部署脚本

八、初始化管理员与知识库

九、数据导入与索引构建流程

1. 文档采集

2. 文档解析

3. 文本切分

4. 向量化与入库

5. 检索与重排序

十、生产环境安全建议

1. 身份认证

2. 权限隔离

3. 敏感信息保护

4. 网络安全

十一、监控、日志与告警

1. 核心监控指标

2. 日志管理

3. 告警策略

十二、备份与恢复

1. 需要备份的数据

2. PostgreSQL备份脚本

3. 恢复建议

十三、升级与回滚策略

1. 升级前准备

2. 灰度升级

3. 快速回滚

十四、Kubernetes生产部署建议

1. 推荐拆分

2. 高可用建议

3. 弹性扩缩容

十五、性能优化建议

1. 检索优化

2. 模型调用优化

3. 文档处理优化

十六、上线前检查清单

十七、常见问题排查

1. 页面能打开，但搜索无结果

2. 上传文档失败

3. 回答速度很慢

4. 答案不准确

十八、总结

AI搜索生产环境部署指南｜一键部署