上一篇 下一篇 分享链接 返回 返回顶部

DeepSeek 真正上手前,这些坑最好先避开

发布人:慈云数据-客服中心 发布时间:5小时前 阅读量:0

DeepSeek 使用避坑指南|附完整命令

DeepSeek 近一段时间非常火,很多人开始用它写代码、做翻译、总结资料、搭建本地大模型,甚至接入自己的业务系统。但真正上手之后,不少人会遇到各种问题:模型选错、提示词写不好、API 调不通、本地部署跑不动、上下文超限、回答不稳定、费用控制不好、隐私数据误上传等。

本文是一份偏实战的 DeepSeek 使用避坑指南,会从使用方式、模型选择、提示词技巧、API 调用、本地部署、常见报错、成本控制、安全合规等方面进行系统梳理,并附上常用完整命令,方便你直接复制使用。


一、先搞清楚:你到底要怎么用 DeepSeek?

在正式使用 DeepSeek 之前,最重要的不是马上提问,而是先搞清楚自己的使用场景。不同场景对应的使用方式、模型选择和成本完全不同。

常见使用方式主要有以下几类:

使用方式 适合人群 优点 注意事项
官网网页端 普通用户、轻度使用者 上手简单,无需配置 高峰期可能慢,功能受限
API 调用 开发者、企业用户 可集成到系统,灵活性高 需要管理 Key、成本和限流
本地部署 技术用户、隐私敏感场景 数据不出本地,可离线使用 对硬件要求较高
第三方平台调用 快速体验者 操作方便,模型多 注意平台稳定性和数据安全
Ollama 部署 本地轻量化体验 命令简单,适合入门 模型大小影响速度和效果

很多人一开始就想“我要本地部署最强模型”,结果发现显卡不够、内存不足、速度很慢。其实如果只是日常写作、总结、翻译,网页端或 API 就够用了;如果是代码辅助、自动化工作流,可以考虑 API;如果是公司内部资料处理,才更适合考虑本地部署。


二、模型选择避坑:不是越大越好

DeepSeek 有不同类型的模型,例如通用对话模型、推理模型、代码模型,以及蒸馏后的轻量模型。很多新手常犯的错误是:看到参数量大就直接选最大模型。实际上,模型越大并不一定越适合你。

1. 日常问答、写作、总结

如果你的需求是:

  • 写公众号文章;
  • 总结会议纪要;
  • 翻译英文资料;
  • 改写文案;
  • 制作学习笔记;

那么使用通用对话模型即可。没必要每次都使用推理能力更强但速度更慢的模型。

2. 复杂推理、数学、逻辑分析

如果你的需求是:

  • 数学推导;
  • 复杂决策分析;
  • 代码调试思路分析;
  • 多步骤推理;
  • 长链路问题拆解;

可以使用推理模型。推理模型通常会更擅长“想清楚再回答”,但速度可能更慢,成本也可能更高。

3. 编程任务

如果你要让 DeepSeek 帮你:

  • 写 Python 脚本;
  • 解释 Java 代码;
  • 修复报错;
  • 生成 SQL;
  • 设计接口;
  • 优化算法;

建议明确告诉它语言、框架、版本、运行环境和输入输出要求。不要只说“帮我写个爬虫”,否则它可能给出不符合实际环境的代码。

4. 本地部署模型

如果你用 Ollama、LM Studio、vLLM 等方式本地运行 DeepSeek 相关模型,需要考虑:

  • 显卡显存;
  • 系统内存;
  • CPU 性能;
  • 模型量化版本;
  • 上下文长度;
  • 推理速度。

对于普通电脑,建议先从小参数量模型开始,不要盲目下载几十 GB 的大模型。


三、提示词避坑:不要只问一句“帮我写一下”

很多人觉得模型不好用,其实不是模型能力不行,而是问题问得太模糊。

例如:

帮我写一篇文章。

这种提示词太宽泛。模型不知道你要什么主题、风格、字数、受众、结构、重点、禁忌,自然很容易输出一篇泛泛而谈的文章。

更好的写法是:

请你扮演一名有 10 年经验的科技专栏作者,帮我写一篇面向普通职场人的文章。

主题:AI 工具如何提升日常办公效率
字数:不少于 1500 字
风格:通俗易懂,避免过度技术化
结构:
1. 开头用一个真实工作场景引入
2. 介绍 5 个具体使用场景
3. 每个场景给出可直接使用的提示词
4. 结尾总结注意事项

要求:
- 使用中文
- 用 Markdown 排版
- 不要使用空泛口号
- 案例要贴近日常办公

可以看到,好的提示词通常包含以下要素:

  1. 角色:让模型知道以什么身份回答;
  2. 任务:明确要完成什么;
  3. 背景:说明上下文;
  4. 格式:指定输出结构;
  5. 约束:告诉它不要做什么;
  6. 示例:提供参考样式;
  7. 检查标准:说明什么样算合格。

四、DeepSeek 常用提示词模板

下面给出几个可以直接复制使用的模板。

1. 文章写作模板

你是一名专业中文内容编辑,请根据以下要求写一篇文章。

文章主题:{填写主题}
目标读者:{填写读者群体}
文章字数:不少于 {填写字数} 字
文章风格:{通俗易懂 / 专业严谨 / 轻松幽默 / 深度分析}
文章结构:
1. 引言:说明问题背景
2. 正文:分 4-6 个小节展开
3. 案例:至少包含 2 个具体例子
4. 总结:给出可执行建议

额外要求:
- 使用 Markdown 格式
- 标题层级清晰
- 不要堆砌概念
- 不要编造具体数据

2. 代码生成模板

你是一名资深软件工程师,请帮我完成以下编程任务。

编程语言:Python 3.11
运行环境:macOS / Linux
任务描述:
{详细描述功能}

输入示例:
{输入示例}

输出示例:
{输出示例}

要求:
1. 给出完整可运行代码
2. 添加必要注释
3. 说明依赖安装命令
4. 说明运行命令
5. 考虑异常情况

3. 报错排查模板

你是一名资深后端工程师,请帮我分析以下报错。

运行环境:
- 操作系统:Ubuntu 22.04
- Python 版本:3.11
- 框架版本:FastAPI 0.110
- 数据库:PostgreSQL 15

我执行的命令:
{粘贴命令}

报错信息:
{粘贴完整报错}

相关代码:
{粘贴代码}

请按以下格式回答:
1. 报错原因
2. 定位思路
3. 修改方案
4. 修改后的代码
5. 如何验证修复成功

4. 资料总结模板

请你阅读下面的资料,并帮我总结。

总结要求:
1. 用 300 字概括核心内容
2. 提炼 5 个关键观点
3. 列出 3 个可执行建议
4. 如果资料中存在不确定或缺少依据的内容,请单独指出
5. 使用 Markdown 表格展示重点信息

资料如下:
{粘贴资料}

五、API 调用避坑:Key、模型名、参数一个都不能错

如果你准备通过 API 调用 DeepSeek,首先要注意以下几点:

  1. 不要把 API Key 写死在前端代码里
  2. 不要把 API Key 提交到 GitHub
  3. 确认 Base URL 是否正确
  4. 确认模型名称是否正确
  5. 设置合理的 max_tokens,避免费用失控
  6. 生产环境要加超时、重试和日志
  7. 不要把用户隐私数据直接传给模型

下面给出常见调用方式。


六、使用 curl 调用 DeepSeek API

说明:请将 YOUR_API_KEY 替换为你自己的 API Key。

curl https://api.deepseek.com/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "deepseek-chat",
    "messages": [
      {
        "role": "system",
        "content": "你是一名专业、严谨、简洁的中文助手。"
      },
      {
        "role": "user",
        "content": "请用三点说明如何提高工作效率。"
      }
    ],
    "temperature": 0.7,
    "max_tokens": 800
  }'

如果你想使用推理模型,可以类似这样:

curl https://api.deepseek.com/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "deepseek-reasoner",
    "messages": [
      {
        "role": "user",
        "content": "请分析一个小团队是否应该自研 CRM 系统,从成本、效率、风险三个角度展开。"
      }
    ],
    "temperature": 0.3,
    "max_tokens": 1200
  }'

常见坑点

  • Authorization 前面必须是 Bearer
  • Content-Type 不要漏;
  • JSON 中字符串必须使用英文双引号;
  • 如果请求超时,可以减少输出长度或检查网络;
  • 如果返回模型不存在,优先检查模型名是否拼写错误。

七、使用 Python 调用 DeepSeek API

建议使用环境变量保存 API Key,不要直接写在代码里。

1. 设置环境变量

macOS / Linux:

export DEEPSEEK_API_KEY="YOUR_API_KEY"

Windows PowerShell:

$env:DEEPSEEK_API_KEY="YOUR_API_KEY"

如果你希望长期生效,可以写入 shell 配置文件。

macOS / Linux:

echo 'export DEEPSEEK_API_KEY="YOUR_API_KEY"' >> ~/.zshrc
source ~/.zshrc

如果你使用 Bash:

echo 'export DEEPSEEK_API_KEY="YOUR_API_KEY"' >> ~/.bashrc
source ~/.bashrc

2. 安装依赖

pip install openai

3. Python 示例代码

创建文件:

touch deepseek_demo.py

写入以下代码:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("DEEPSEEK_API_KEY"),
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[
        {"role": "system", "content": "你是一名专业的中文写作助手。"},
        {"role": "user", "content": "请写一段 200 字左右的 AI 办公工具介绍。"}
    ],
    temperature=0.7,
    max_tokens=800
)

print(response.choices[0].message.content)

运行命令:

python deepseek_demo.py

4. 流式输出示例

如果你希望像聊天窗口一样逐字输出,可以使用流式调用。

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("DEEPSEEK_API_KEY"),
    base_url="https://api.deepseek.com"
)

stream = client.chat.completions.create(
    model="deepseek-chat",
    messages=[
        {"role": "user", "content": "请用 Markdown 写一份 Python 入门学习路线。"}
    ],
    stream=True,
    temperature=0.7,
    max_tokens=1000
)

for chunk in stream:
    if chunk.choices and chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="", flush=True)

运行:

python deepseek_stream.py

八、使用 Node.js 调用 DeepSeek API

1. 初始化项目

mkdir deepseek-node-demo
cd deepseek-node-demo
npm init -y

2. 安装依赖

npm install openai dotenv

3. 创建 .env

touch .env

写入:

DEEPSEEK_API_KEY=YOUR_API_KEY

4. 创建脚本

touch index.js

代码如下:

import OpenAI from "openai";
import dotenv from "dotenv";

dotenv.config();

const client = new OpenAI({
  apiKey: process.env.DEEPSEEK_API_KEY,
  baseURL: "https://api.deepseek.com",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "deepseek-chat",
    messages: [
      {
        role: "system",
        content: "你是一名专业的中文技术助手。",
      },
      {
        role: "user",
        content: "请解释什么是 API,并给一个生活化例子。",
      },
    ],
    temperature: 0.7,
    max_tokens: 800,
  });

  console.log(completion.choices[0].message.content);
}

main().catch(console.error);

由于上面使用了 ES Module,需要修改 package.json

{
  "type": "module"
}

运行:

node index.js

九、本地部署避坑:Ollama 是新手最友好的方式之一

如果你希望在本地运行 DeepSeek 相关模型,可以使用 Ollama。它安装简单,命令清晰,适合个人学习和测试。

1. 安装 Ollama

macOS 可以直接使用 Homebrew:

brew install ollama

Linux 可以使用官方安装脚本:

curl -fsSL https://ollama.com/install.sh | sh

安装完成后查看版本:

ollama --version

启动服务:

ollama serve

如果已经自动启动,可以不用重复执行。

2. 下载并运行模型

以 DeepSeek R1 蒸馏模型为例:

ollama run deepseek-r1:1.5b

如果你的电脑配置稍好,可以尝试:

ollama run deepseek-r1:7b

或者:

ollama run deepseek-r1:8b

查看本地已有模型:

ollama list

删除模型:

ollama rm deepseek-r1:1.5b

3. 使用 Ollama API

Ollama 默认服务地址通常是:

http://localhost:11434

通过 curl 调用:

curl http://localhost:11434/api/generate \
  -d '{
    "model": "deepseek-r1:1.5b",
    "prompt": "请用中文解释什么是大语言模型。",
    "stream": false
  }'

聊天接口示例:

curl http://localhost:11434/api/chat \
  -d '{
    "model": "deepseek-r1:1.5b",
    "messages": [
      {
        "role": "user",
        "content": "请列出学习 Python 的 5 个步骤。"
      }
    ],
    "stream": false
  }'

4. 本地部署常见坑

坑一:模型太大,电脑跑不动

如果你的电脑内存只有 8GB,不建议直接跑大模型。可以先用:

ollama run deepseek-r1:1.5b

如果运行流畅,再尝试更大模型。

坑二:第一次运行很慢

第一次运行需要下载模型,速度取决于网络和模型大小。你可以先查看模型列表:

ollama list

如果模型已下载,再运行会快很多。

坑三:回答速度慢

本地运行速度受硬件影响很大。可以尝试:

  • 使用更小模型;
  • 关闭其他占用内存的软件;
  • 使用量化模型;
  • 升级显卡或内存;
  • 降低上下文长度。

坑四:以为本地小模型效果等于线上大模型

本地小模型适合学习、轻量任务、隐私场景,但在复杂推理、长文写作、代码质量等方面,通常不如线上大模型。


十、上下文长度避坑:不是资料越多越好

很多人使用 DeepSeek 时,会一次性粘贴大量资料,然后问:“帮我总结一下。”结果模型可能漏掉重点,甚至输出不准确。

这是因为模型有上下文窗口限制。即使能输入很长文本,也不代表它能完美处理所有细节。

更好的做法是:

1. 分段处理

我会分 5 次发送一份资料。你先不要总结,只回复“已收到第 X 部分”。
等我说“资料发送完毕”后,你再进行整体总结。

2. 先提取结构,再深入分析

请先阅读以下资料,只做两件事:
1. 提取文章结构
2. 列出每一部分的核心观点

暂时不要展开评论。

3. 让模型基于原文引用

请总结以下资料,并在每个观点后面引用原文中的关键句作为依据。
如果原文没有依据,请标注“原文未说明”。

这样可以显著降低模型胡编乱造的概率。


十一、回答不稳定避坑:调好 temperature

API 调用时经常会看到 temperature 参数。简单理解:

  • temperature 越低,回答越稳定、保守;
  • temperature 越高,回答越发散、有创造性。

推荐设置:

场景 temperature 建议
代码生成 0.1 - 0.3
数据分析 0.1 - 0.3
法律、制度类文本 0.1 - 0.3
普通问答 0.5 - 0.7
创意写作 0.7 - 1.0
头脑风暴 0.8 - 1.2

如果你希望输出稳定,建议这样设置:

{
  "temperature": 0.2,
  "max_tokens": 1000
}

如果你希望输出更有创意,可以这样:

{
  "temperature": 0.9,
  "max_tokens": 1200
}

十二、成本控制避坑:别让 API 悄悄烧钱

使用 API 时,成本主要和输入、输出 token 数有关。很多人一开始测试时不控制 max_tokens,也不做限流,结果费用增长很快。

建议你做到以下几点:

  1. 设置 max_tokens
  2. 对用户输入长度做限制;
  3. 对同一用户请求频率做限制;
  4. 对重复问题做缓存;
  5. 日志中记录 token 使用量;
  6. 对异常循环调用设置熔断;
  7. 后台设置预算提醒。

Python 中记录 token 用量

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("DEEPSEEK_API_KEY"),
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[
        {"role": "user", "content": "请总结项目管理的三个核心原则。"}
    ],
    max_tokens=500
)

print(response.choices[0].message.content)

if response.usage:
    print("Prompt tokens:", response.usage.prompt_tokens)
    print("Completion tokens:", response.usage.completion_tokens)
    print("Total tokens:", response.usage.total_tokens)

十三、隐私与安全避坑:不要把敏感信息直接丢给模型

无论使用 DeepSeek 还是其他大模型,都要注意数据安全。以下内容不建议直接上传:

  • 身份证号;
  • 手机号;
  • 银行卡号;
  • 客户名单;
  • 合同原文;
  • 公司内部机密;
  • 未公开财务数据;
  • 生产系统密钥;
  • 用户隐私信息;
  • 医疗记录。

如果确实需要处理,可以先进行脱敏。

脱敏示例

原始内容:

客户张三,手机号 13812345678,身份证号 110101199001011234,购买了某产品。

脱敏后:

客户 A,手机号 [已脱敏],身份证号 [已脱敏],购买了某产品。

可以让模型处理脱敏文本:

以下资料已做脱敏处理,请帮我总结客户需求和潜在风险,不要尝试还原任何个人身份信息。

十四、常见报错与解决方法

1. 401 Unauthorized

通常是 API Key 错误或没有传 Authorization。

检查命令:

echo $DEEPSEEK_API_KEY

curl 示例:

curl https://api.deepseek.com/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-chat",
    "messages": [{"role": "user", "content": "你好"}]
  }'

2. 400 Bad Request

常见原因:

  • JSON 格式错误;
  • 模型名称错误;
  • messages 格式错误;
  • max_tokens 参数不合理。

可以用 JSON 校验工具检查请求体。

3. 429 Too Many Requests

表示请求过于频繁或触发限流。解决方法:

  • 降低请求频率;
  • 增加重试间隔;
  • 使用队列削峰;
  • 检查是否出现死循环调用。

4. 请求超时

可以尝试:

  • 减少 max_tokens
  • 缩短输入内容;
  • 使用流式输出;
  • 增加客户端超时时间;
  • 检查网络连接。

十五、推荐工作流:让 DeepSeek 真正变成生产力工具

如果你只是偶尔问一句,DeepSeek 当然也能用。但如果想把它变成稳定的生产力工具,建议采用以下工作流:

第一步:明确任务

不要直接问,要先定义目标。

我的目标是:在 30 分钟内完成一份产品需求文档初稿。

第二步:让模型先提问

在开始写之前,请先问我 5 个必须确认的问题。

第三步:生成大纲

请根据以上信息,先生成一份 PRD 文档大纲,不要写正文。

第四步:逐节生成

请先写第 1 节“需求背景”,要求不少于 300 字,语言专业但不要空泛。

第五步:自检优化

请检查上面的内容是否存在:
1. 表述模糊
2. 逻辑跳跃
3. 缺少用户场景
4. 缺少验收标准

然后给出修改版。

这种方式比“一次性生成完整文档”更稳定,质量也更高。


十六、DeepSeek 使用总结:记住这 10 条就够了

  1. 先明确场景,再选择模型,不要盲目追求最大模型;
  2. 提示词越具体,输出越稳定
  3. 写代码时必须提供环境、版本和输入输出要求
  4. API Key 不要写进前端或公开仓库
  5. 调用 API 时设置 max_tokens 和 temperature
  6. 本地部署先从小模型开始,不要一步到位
  7. 长资料要分段处理,不要一次性乱塞
  8. 涉及事实、数据、法律、医疗时要人工核验
  9. 敏感信息先脱敏,再交给模型处理
  10. 把 DeepSeek 当助手,不要当最终责任人

结语

DeepSeek 的价值不在于“替你完成一切”,而在于帮你更快地整理思路、生成初稿、分析问题、提高效率。真正用好它的关键,不只是会提问,更是会拆任务、会验证结果、会控制成本、会保护数据。

如果你是普通用户,建议先从网页端和高质量提示词开始;如果你是开发者,可以进一步尝试 API 调用和自动化集成;如果你对隐私和离线使用有要求,可以使用 Ollama 等工具进行本地部署。

最后记住一句话:模型能力决定上限,使用方法决定下限。 会用的人,DeepSeek 是生产力工具;不会用的人,它可能只是一个“看起来很聪明但偶尔胡说”的聊天机器人。

目录结构
全文