从 Demo 到生产：一套可落地的 DeepSeek 企业级应用搭建实战（附源码）

发布人：慈云数据-客服中心发布时间：2026-06-06 21:12 阅读量：128

DeepSeek 企业级实战方案｜附源码

在企业级 AI 落地场景中，DeepSeek 不仅可以作为一个“聊天机器人”使用，更适合被设计成面向业务系统的智能中台能力，例如：企业知识库问答、客服辅助、代码生成、数据分析助手、合同审查、运营文案生成、销售话术推荐、内部流程自动化等。

本文将从企业实战角度，介绍如何基于 DeepSeek 构建一套可落地、可扩展、可监控、可接入业务系统的企业级 AI 应用方案，并附带核心源码示例，帮助你快速搭建一个支持多轮对话、知识库检索、权限控制、日志追踪和流式输出的 DeepSeek 企业应用基础框架。

一、企业为什么需要 DeepSeek 实战方案？

很多企业在引入大模型时，常见的做法是直接调用 API，让模型回答问题。但这种方式通常只能完成 Demo，难以真正进入生产环境。

企业级应用关注的不只是“能不能回答”，还包括以下问题：

数据是否安全？
- 用户问题是否会泄露敏感信息？
- 企业内部文档是否被外部访问？
- 不同部门是否能访问不同知识库？
回答是否可靠？
- 模型是否引用了企业内部知识？
- 是否会胡编乱造？
- 能否给出来源依据？
系统是否稳定？
- 高并发下是否可用？
- API 失败是否有重试机制？
- 是否支持限流、降级和熔断？
是否便于集成？
- 能否接入企业微信、钉钉、飞书？
- 能否嵌入 CRM、ERP、OA、客服系统？
- 能否通过统一 API 对外提供服务？
是否可运维？
- 是否有日志？
- 是否能统计 Token 消耗？
- 是否能监控请求耗时和错误率？

因此，一个真正可用的 DeepSeek 企业级方案，不能只是简单调用模型接口，而应该构建完整的工程化体系。

二、整体架构设计

一个典型的企业级 DeepSeek 应用架构如下：

用户端
  ├── Web 管理后台
  ├── 企业微信 / 钉钉 / 飞书
  ├── 客服系统
  └── 业务系统 API

        ↓

AI 接入层
  ├── 用户认证
  ├── 权限校验
  ├── 请求限流
  ├── Prompt 模板管理
  ├── 会话管理
  └── 流式响应

        ↓

AI 编排层
  ├── DeepSeek API 调用
  ├── RAG 知识库检索
  ├── 工具调用
  ├── 多轮上下文处理
  ├── 敏感词过滤
  └── 结果后处理

        ↓

数据层
  ├── MySQL / PostgreSQL
  ├── Redis
  ├── Milvus / FAISS / pgvector
  ├── MinIO / OSS
  └── 日志系统

        ↓

运维监控
  ├── Prometheus
  ├── Grafana
  ├── ELK
  ├── Token 统计
  └── 异常告警

该架构的核心思想是：将 DeepSeek 作为大模型能力底座，通过企业 AI 中台进行统一接入、统一编排和统一治理。

三、核心能力拆解

1. 多轮对话能力

多轮对话是企业 AI 助手的基础能力。系统需要保存用户上下文，避免用户每次都重复描述问题。

例如：

用户：帮我写一份客户拜访总结。
AI：可以，请提供客户名称、拜访时间和沟通内容。

用户：客户是华东某制造企业，昨天拜访的，主要聊了 ERP 升级。
AI：好的，以下是一份客户拜访总结……

这就需要系统保存历史消息，并在调用 DeepSeek 时带上上下文。

2. RAG 企业知识库问答

企业内部知识往往不在模型训练数据中，例如：

公司制度
产品手册
API 文档
销售资料
项目交付文档
合同模板
售后知识库

为了让模型回答企业专有问题，需要使用 RAG，即 Retrieval-Augmented Generation，检索增强生成。

基本流程：

用户提问
  ↓
向量化问题
  ↓
从知识库检索相关文档片段
  ↓
将片段拼接进 Prompt
  ↓
调用 DeepSeek
  ↓
返回带依据的答案

RAG 的优势是能够减少幻觉，让模型基于企业文档回答问题。

3. 权限控制

在企业环境中，不同用户可访问的数据不同。

例如：

HR 可以访问人事制度；
销售可以访问销售资料；
财务可以访问财务制度；
普通员工不能访问管理层文件；
外部客户只能访问公开知识库。

因此知识库检索时不能只按语义相似度查询，还必须叠加权限过滤。

4. 流式输出

对于大模型应用来说，流式输出非常重要。相比等待完整答案生成后再返回，流式输出可以让用户更快看到结果，体验更好。

例如 ChatGPT、DeepSeek 官网的逐字输出效果，本质上就是服务端不断将模型生成内容推送给前端。

5. 日志与成本统计

企业使用大模型时，一定要关注成本。

需要记录：

用户 ID
请求时间
输入 Token
输出 Token
模型名称
接口耗时
请求结果
错误信息
所属部门
业务系统来源

这些数据可以用于成本分摊、异常分析和容量规划。

四、技术选型建议

本文示例采用以下技术栈：

模块	技术
Web 服务	FastAPI
模型接口	DeepSeek API
数据库	PostgreSQL / MySQL
缓存	Redis
向量数据库	FAISS / Milvus / pgvector
文档解析	Python-docx / PyPDF / Unstructured
鉴权	JWT
日志	Loguru
部署	Docker / Kubernetes
前端	Vue / React

如果是中小型团队，可以先使用：

FastAPI
Redis
PostgreSQL + pgvector
DeepSeek API

如果是大型企业，可以考虑：

微服务架构
Kubernetes
Milvus
Prometheus + Grafana
ELK
API Gateway

五、项目目录结构

下面是一个企业级 DeepSeek 应用的基础目录结构：

deepseek-enterprise-demo/
├── app/
│   ├── main.py
│   ├── config.py
│   ├── routers/
│   │   ├── chat.py
│   │   └── knowledge.py
│   ├── services/
│   │   ├── deepseek_service.py
│   │   ├── rag_service.py
│   │   ├── auth_service.py
│   │   └── log_service.py
│   ├── models/
│   │   ├── chat.py
│   │   └── user.py
│   ├── db/
│   │   └── database.py
│   └── utils/
│       ├── prompt.py
│       └── token_counter.py
├── requirements.txt
├── Dockerfile
└── docker-compose.yml

六、环境准备

1. 安装依赖

requirements.txt 示例：

fastapi==0.115.0
uvicorn==0.30.6
openai==1.40.6
python-dotenv==1.0.1
pydantic==2.8.2
loguru==0.7.2
redis==5.0.8
sqlalchemy==2.0.32
psycopg2-binary==2.9.9
faiss-cpu==1.8.0.post1
numpy==1.26.4

安装：

pip install -r requirements.txt

2. 配置环境变量

创建 .env 文件：

DEEPSEEK_API_KEY=你的DeepSeek_API_Key
DEEPSEEK_BASE_URL=https://api.deepseek.com
DEEPSEEK_MODEL=deepseek-chat

REDIS_HOST=localhost
REDIS_PORT=6379

DATABASE_URL=postgresql://postgres:password@localhost:5432/deepseek_demo

JWT_SECRET=your_jwt_secret

七、核心源码实现

下面给出可运行的核心代码示例。

1. 配置文件

app/config.py

from pydantic_settings import BaseSettings


class Settings(BaseSettings):
    DEEPSEEK_API_KEY: str
    DEEPSEEK_BASE_URL: str = "https://api.deepseek.com"
    DEEPSEEK_MODEL: str = "deepseek-chat"

    REDIS_HOST: str = "localhost"
    REDIS_PORT: int = 6379

    DATABASE_URL: str
    JWT_SECRET: str

    class Config:
        env_file = ".env"


settings = Settings()

注意：如果使用 pydantic_settings，需要额外安装：
pip install pydantic-settings

2. DeepSeek 调用服务

app/services/deepseek_service.py

from openai import OpenAI
from app.config import settings


class DeepSeekService:
    def __init__(self):
        self.client = OpenAI(
            api_key=settings.DEEPSEEK_API_KEY,
            base_url=settings.DEEPSEEK_BASE_URL
        )

    def chat(self, messages: list):
        response = self.client.chat.completions.create(
            model=settings.DEEPSEEK_MODEL,
            messages=messages,
            temperature=0.3,
            max_tokens=2048
        )
        return response.choices[0].message.content

    def stream_chat(self, messages: list):
        stream = self.client.chat.completions.create(
            model=settings.DEEPSEEK_MODEL,
            messages=messages,
            temperature=0.3,
            max_tokens=2048,
            stream=True
        )

        for chunk in stream:
            if chunk.choices and chunk.choices[0].delta.content:
                yield chunk.choices[0].delta.content


deepseek_service = DeepSeekService()

3. Prompt 模板

app/utils/prompt.py

SYSTEM_PROMPT = """
你是企业内部 AI 助手，负责基于企业知识库为员工提供准确、专业、合规的回答。

请遵守以下规则：
1. 优先依据提供的企业知识库内容回答；
2. 如果知识库中没有相关信息，请明确说明“当前知识库未找到相关依据”；
3. 不要编造制度、价格、合同条款或内部流程；
4. 回答要结构化，必要时使用列表或表格；
5. 涉及敏感数据、个人隐私、财务信息时，要提醒用户确认权限；
6. 输出语言为中文。
"""


def build_rag_prompt(question: str, context: str):
    return f"""
以下是从企业知识库中检索到的相关内容：

【知识库内容】
{context}

【用户问题】
{question}

请基于以上知识库内容回答用户问题。
如果知识库内容不足以回答，请明确说明依据不足。
"""

4. 简化版 RAG 服务

为了便于理解，下面使用 FAISS 实现一个简化版知识库检索服务。真实生产环境中，建议使用 Milvus、pgvector 或 Elasticsearch + 向量检索混合方案。

app/services/rag_service.py

import faiss
import numpy as np
from typing import List


class SimpleRAGService:
    def __init__(self):
        self.dimension = 384
        self.index = faiss.IndexFlatL2(self.dimension)
        self.documents = []

    def fake_embedding(self, text: str) -> np.ndarray:
        """
        示例用的伪向量函数。
        生产环境中应替换为真正的 embedding 模型。
        """
        np.random.seed(abs(hash(text)) % (10 ** 8))
        return np.random.rand(self.dimension).astype("float32")

    def add_document(self, content: str, metadata: dict = None):
        vector = self.fake_embedding(content)
        self.index.add(np.array([vector]))
        self.documents.append({
            "content": content,
            "metadata": metadata or {}
        })

    def search(self, query: str, top_k: int = 3, user_dept: str = None) -> List[dict]:
        if len(self.documents) == 0:
            return []

        query_vector = self.fake_embedding(query)
        distances, indexes = self.index.search(np.array([query_vector]), top_k)

        results = []
        for idx in indexes[0]:
            if idx == -1:
                continue

            doc = self.documents[idx]

            # 权限过滤示例
            dept = doc["metadata"].get("dept")
            visibility = doc["metadata"].get("visibility", "public")

            if visibility == "private" and dept != user_dept:
                continue

            results.append(doc)

        return results


rag_service = SimpleRAGService()

5. Chat API 路由

app/routers/chat.py

from fastapi import APIRouter, Header, HTTPException
from fastapi.responses import StreamingResponse
from pydantic import BaseModel
from typing import Optional

from app.services.deepseek_service import deepseek_service
from app.services.rag_service import rag_service
from app.utils.prompt import SYSTEM_PROMPT, build_rag_prompt

router = APIRouter(prefix="/api/chat", tags=["chat"])


class ChatRequest(BaseModel):
    question: str
    user_id: str
    department: Optional[str] = None
    session_id: Optional[str] = None
    use_rag: bool = True
    stream: bool = False


@router.post("")
def chat(req: ChatRequest, authorization: str = Header(default=None)):
    if not authorization:
        raise HTTPException(status_code=401, detail="缺少 Authorization 请求头")

    messages = [
        {"role": "system", "content": SYSTEM_PROMPT}
    ]

    if req.use_rag:
        docs = rag_service.search(
            query=req.question,
            top_k=3,
            user_dept=req.department
        )

        context = "\n\n".join([doc["content"] for doc in docs])

        user_prompt = build_rag_prompt(req.question, context)
    else:
        user_prompt = req.question

    messages.append({
        "role": "user",
        "content": user_prompt
    })

    if req.stream:
        return StreamingResponse(
            deepseek_service.stream_chat(messages),
            media_type="text/plain"
        )

    answer = deepseek_service.chat(messages)

    return {
        "question": req.question,
        "answer": answer
    }

6. 知识库接口

app/routers/knowledge.py

from fastapi import APIRouter
from pydantic import BaseModel
from typing import Optional

from app.services.rag_service import rag_service

router = APIRouter(prefix="/api/knowledge", tags=["knowledge"])


class KnowledgeRequest(BaseModel):
    content: str
    dept: Optional[str] = None
    visibility: str = "public"


@router.post("/add")
def add_knowledge(req: KnowledgeRequest):
    rag_service.add_document(
        content=req.content,
        metadata={
            "dept": req.dept,
            "visibility": req.visibility
        }
    )

    return {
        "success": True,
        "message": "知识已添加"
    }

7. FastAPI 启动入口

app/main.py

from fastapi import FastAPI
from app.routers import chat, knowledge

app = FastAPI(
    title="DeepSeek Enterprise Demo",
    description="DeepSeek 企业级实战方案示例",
    version="1.0.0"
)

app.include_router(chat.router)
app.include_router(knowledge.router)


@app.get("/")
def health_check():
    return {
        "status": "ok",
        "message": "DeepSeek Enterprise Demo is running"
    }

启动服务：

uvicorn app.main:app --reload --host 0.0.0.0 --port 8000

八、接口测试

1. 添加公开知识

curl -X POST http://localhost:8000/api/knowledge/add \
  -H "Content-Type: application/json" \
  -d '{
    "content": "公司报销制度规定：员工差旅报销需在出差结束后7个工作日内提交，需提供发票、行程单和审批单。",
    "visibility": "public"
  }'

2. 添加部门私有知识

curl -X POST http://localhost:8000/api/knowledge/add \
  -H "Content-Type: application/json" \
  -d '{
    "content": "销售部重点客户分级规则：年采购金额超过500万元的客户定义为S级客户。",
    "dept": "sales",
    "visibility": "private"
  }'

3. 普通问答请求

curl -X POST http://localhost:8000/api/chat \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer test-token" \
  -d '{
    "question": "员工差旅报销需要多久内提交？",
    "user_id": "u001",
    "department": "hr",
    "use_rag": true,
    "stream": false
  }'

返回示例：

{
  "question": "员工差旅报销需要多久内提交？",
  "answer": "根据知识库内容，公司报销制度规定：员工差旅报销需在出差结束后7个工作日内提交，并需提供发票、行程单和审批单。"
}

4. 流式问答请求

curl -N -X POST http://localhost:8000/api/chat \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer test-token" \
  -d '{
    "question": "请总结一下公司报销制度",
    "user_id": "u001",
    "department": "finance",
    "use_rag": true,
    "stream": true
  }'

九、企业级增强点

上面的代码是一个基础版本，适合作为 PoC 或 MVP。如果要进入生产环境，还需要继续增强以下能力。

1. 替换真实 Embedding 模型

示例中使用的是 fake_embedding，生产环境不能这样做。建议使用真实的文本向量模型，例如：

bge-large-zh
bge-m3
text2vec
企业自部署 embedding 模型
云厂商 embedding API

真实向量化接口示例：

def embedding(text: str):
    response = embedding_client.create(
        model="bge-m3",
        input=text
    )
    return response.data[0].embedding

2. 文档切片策略

企业知识库文档通常较长，不能直接整篇塞进向量数据库。需要先切片。

常见切片策略：

策略	说明
固定长度切片	每 500～1000 字切一段
按标题切片	根据 Markdown 标题、Word 标题切分
按段落切片	保留自然语义段落
滑动窗口	相邻片段保留一定重叠
结构化切片	针对合同、制度、API 文档单独处理

推荐方式：

每段 500～800 中文字，重叠 100～150 字。

这样既能保留语义完整性，又能控制 Prompt 长度。

3. 混合检索

单纯向量检索有时不够准确，尤其是涉及编号、专有名词、产品型号、合同条款时。

建议采用混合检索：

向量检索 + 关键词检索 + 权限过滤 + 重排序

例如：

使用向量检索召回 20 条；
使用关键词 BM25 召回 20 条；
合并去重；
使用 rerank 模型重排序；
取前 3～5 条进入 Prompt。

4. 敏感信息过滤

企业 AI 系统必须考虑数据安全。

可以增加以下机制：

输入敏感词检测；
输出敏感词检测；
身份证、手机号、银行卡号脱敏；
合同金额权限校验；
内部文件访问控制；
管理后台审计日志。

示例脱敏函数：

import re


def mask_phone(text: str):
    return re.sub(r'(\d{3})\d{4}(\d{4})', r'\1****\2', text)


def mask_id_card(text: str):
    return re.sub(r'(\d{6})\d{8}(\w{4})', r'\1********\2', text)

5. 会话上下文管理

多轮对话中，不能无限制传递历史消息，否则会导致 Token 成本暴涨。

建议策略：

最近 N 轮完整保留；
更早历史做摘要；
摘要存入 Redis 或数据库；
每个会话设置最大 Token 限制；
涉及知识库问答时，每轮重新检索。

Redis 存储示例：

import json
import redis

r = redis.Redis(host="localhost", port=6379, db=0)


def save_message(session_id: str, role: str, content: str):
    key = f"chat:session:{session_id}"
    r.rpush(key, json.dumps({
        "role": role,
        "content": content
    }, ensure_ascii=False))
    r.expire(key, 60 * 60 * 24 * 7)


def get_messages(session_id: str, limit: int = 10):
    key = f"chat:session:{session_id}"
    items = r.lrange(key, -limit, -1)
    return [json.loads(item) for item in items]

十、部署方案

1. Dockerfile

FROM python:3.11-slim

WORKDIR /app

COPY requirements.txt .

RUN pip install --no-cache-dir -r requirements.txt

COPY . .

EXPOSE 8000

CMD ["uvicorn", "app.main:app", "--host", "0.0.0.0", "--port", "8000"]

2. docker-compose.yml

version: "3.8"

services:
  deepseek-api:
    build: .
    container_name: deepseek-enterprise-demo
    ports:
      - "8000:8000"
    env_file:
      - .env
    depends_on:
      - redis

  redis:
    image: redis:7
    container_name: deepseek-redis
    ports:
      - "6379:6379"

启动：

docker-compose up -d

十一、生产环境最佳实践

1. Prompt 不要写死在代码中

建议将 Prompt 模板存入数据库或配置中心，方便不同业务场景动态调整。

例如：

客服助手 Prompt
法务审查 Prompt
SQL 生成 Prompt
运营文案 Prompt
招聘面试 Prompt

2. 为不同业务配置不同模型参数

不同场景的模型参数不一样。

场景	temperature 建议
制度问答	0.1～0.3
合同审查	0.1～0.2
数据分析	0.2～0.4
文案生成	0.7～0.9
头脑风暴	0.8～1.0

制度、财务、法务类场景要降低随机性，创意类场景可以适当提高随机性。

3. 增加限流和熔断

为了避免接口被滥用，需要设置限流策略。

例如：

单用户每分钟最多 20 次；
单部门每天最多消耗 100 万 Token；
单 IP 每分钟最多 60 次；
DeepSeek API 异常时自动降级；
请求超时后返回兜底提示。

4. 成本统计

建议按以下维度统计成本：

维度	说明
用户	统计个人使用量
部门	用于内部成本分摊
应用	区分客服、知识库、代码助手
模型	对比不同模型成本
时间	按日、周、月统计趋势

5. 回答质量评估

上线后需要持续评估 AI 回答质量。

可以建立评分体系：

准确性
完整性
可读性
是否引用依据
是否越权
是否包含敏感信息
用户满意度

同时可以将用户差评问题进入人工复核流程，持续优化知识库和 Prompt。

十二、典型落地场景

1. 企业知识库助手

员工可以直接询问：

年假怎么算？
差旅报销需要什么材料？
新员工入职流程是什么？
销售合同审批需要几级？

AI 从企业制度和流程文档中检索答案，并给出依据。

2. 智能客服助手

客服人员在处理用户咨询时，AI 可以自动推荐答案：

客户问某产品是否支持私有化部署？
客户反馈接口调用失败如何排查？
客户要求退款应该走什么流程？

系统可以接入产品手册、售后文档和历史工单。

3. 销售助手

销售可以使用 AI 生成：

客户拜访纪要；
商务邮件；
解决方案大纲；
行业分析；
竞品对比；
跟进话术。

结合 CRM 数据后，还可以根据客户阶段推荐下一步动作。

4. 法务合同审查

法务场景可以让 AI 辅助检查：

付款条款是否异常；
违约责任是否缺失；
合同主体是否一致；
是否存在高风险表述；
是否符合公司标准模板。

但需要注意，法务场景建议采用“辅助审查”定位，最终结论仍应由专业人员确认。

5. 代码研发助手

研发团队可以使用 DeepSeek 辅助：

代码生成；
单元测试生成；
代码解释；
Bug 排查；
SQL 优化；
接口文档生成。

如果接入企业代码仓库和内部技术文档，还可以形成企业专属研发助手。

十三、常见问题与解决方案

问题一：模型回答看似合理但实际错误

解决方案：

使用 RAG；
要求模型只基于知识库回答；
输出引用来源；
对高风险场景增加人工确认；
对无依据内容明确提示“不确定”。

问题二：知识库检索不到正确内容

解决方案：

优化文档切片；
使用更好的 embedding 模型；
引入关键词检索；
增加 rerank；
优化查询改写；
清洗低质量文档。

问题三：Token 成本过高

解决方案：

控制上下文长度；
只保留最近几轮对话；
知识库只取最相关片段；
对历史会话做摘要；
设置用户和部门配额；
对简单问题走规则或缓存。

问题四：不同用户看到不该看的知识

解决方案：

知识库文档打权限标签；
检索时进行权限过滤；
输出前再次校验；
增加审计日志；
接入企业统一身份认证。

十四、总结

DeepSeek 企业级落地的关键，不在于简单调用一次模型接口，而在于构建完整的 AI 工程体系。

一套成熟的 DeepSeek 企业级方案至少应具备：

统一 API 接入；
多轮对话管理；
RAG 知识库增强；
权限控制；
流式输出；
敏感信息过滤；
日志审计；
Token 成本统计；
异常监控；
可扩展部署能力。

本文给出的源码示例适合作为企业 AI 应用的基础框架。你可以在此基础上继续扩展真实 embedding、向量数据库、文档解析、权限体系、前端页面、企业微信或飞书机器人等能力，最终形成适合自身业务场景的 DeepSeek AI 中台。

如果你正在做企业级大模型应用，建议从一个明确的小场景开始，例如“制度问答”或“客服知识库助手”，先完成 MVP，再逐步扩展到销售、法务、研发、运营等更多业务场景。这样既能快速验证价值，也能降低一次性投入风险。

文章标签： DeepSeek企业级方案 RAG知识库权限控制流式输出

上一篇：DeepSeek 私有化落地指南：从部署命令到企业级知识库实战

下一篇：DeepSeek 企业落地全流程：架构、安全、RAG 与配置实战指南

更多栏目

新闻动态

文档中心

下载中心

目录结构

全文

产品与服务

新闻帮助

生态合作

了解我们

从 Demo 到生产：一套可落地的 DeepSeek 企业级应用搭建实战（附源码）

DeepSeek 企业级实战方案｜附源码

一、企业为什么需要 DeepSeek 实战方案？

二、整体架构设计

三、核心能力拆解

1. 多轮对话能力

2. RAG 企业知识库问答

3. 权限控制

4. 流式输出

5. 日志与成本统计

四、技术选型建议

五、项目目录结构

六、环境准备

1. 安装依赖

2. 配置环境变量

七、核心源码实现

1. 配置文件

2. DeepSeek 调用服务

3. Prompt 模板

4. 简化版 RAG 服务

5. Chat API 路由

6. 知识库接口

7. FastAPI 启动入口

八、接口测试

1. 添加公开知识

2. 添加部门私有知识

3. 普通问答请求

4. 流式问答请求

九、企业级增强点

1. 替换真实 Embedding 模型

2. 文档切片策略

3. 混合检索

4. 敏感信息过滤

5. 会话上下文管理

十、部署方案

1. Dockerfile

2. docker-compose.yml

十一、生产环境最佳实践

1. Prompt 不要写死在代码中

2. 为不同业务配置不同模型参数

3. 增加限流和熔断

4. 成本统计

5. 回答质量评估

十二、典型落地场景

1. 企业知识库助手

2. 智能客服助手

3. 销售助手

4. 法务合同审查

5. 代码研发助手

十三、常见问题与解决方案

问题一：模型回答看似合理但实际错误

问题二：知识库检索不到正确内容

问题三：Token 成本过高

问题四：不同用户看到不该看的知识

十四、总结