DeepSeek 真正上手前,这些坑最好先避开
DeepSeek 使用避坑指南|附完整命令
DeepSeek 近一段时间非常火,很多人开始用它写代码、做翻译、总结资料、搭建本地大模型,甚至接入自己的业务系统。但真正上手之后,不少人会遇到各种问题:模型选错、提示词写不好、API 调不通、本地部署跑不动、上下文超限、回答不稳定、费用控制不好、隐私数据误上传等。
本文是一份偏实战的 DeepSeek 使用避坑指南,会从使用方式、模型选择、提示词技巧、API 调用、本地部署、常见报错、成本控制、安全合规等方面进行系统梳理,并附上常用完整命令,方便你直接复制使用。
一、先搞清楚:你到底要怎么用 DeepSeek?
在正式使用 DeepSeek 之前,最重要的不是马上提问,而是先搞清楚自己的使用场景。不同场景对应的使用方式、模型选择和成本完全不同。
常见使用方式主要有以下几类:
| 使用方式 | 适合人群 | 优点 | 注意事项 |
|---|---|---|---|
| 官网网页端 | 普通用户、轻度使用者 | 上手简单,无需配置 | 高峰期可能慢,功能受限 |
| API 调用 | 开发者、企业用户 | 可集成到系统,灵活性高 | 需要管理 Key、成本和限流 |
| 本地部署 | 技术用户、隐私敏感场景 | 数据不出本地,可离线使用 | 对硬件要求较高 |
| 第三方平台调用 | 快速体验者 | 操作方便,模型多 | 注意平台稳定性和数据安全 |
| Ollama 部署 | 本地轻量化体验 | 命令简单,适合入门 | 模型大小影响速度和效果 |
很多人一开始就想“我要本地部署最强模型”,结果发现显卡不够、内存不足、速度很慢。其实如果只是日常写作、总结、翻译,网页端或 API 就够用了;如果是代码辅助、自动化工作流,可以考虑 API;如果是公司内部资料处理,才更适合考虑本地部署。
二、模型选择避坑:不是越大越好
DeepSeek 有不同类型的模型,例如通用对话模型、推理模型、代码模型,以及蒸馏后的轻量模型。很多新手常犯的错误是:看到参数量大就直接选最大模型。实际上,模型越大并不一定越适合你。
1. 日常问答、写作、总结
如果你的需求是:
- 写公众号文章;
- 总结会议纪要;
- 翻译英文资料;
- 改写文案;
- 制作学习笔记;
那么使用通用对话模型即可。没必要每次都使用推理能力更强但速度更慢的模型。
2. 复杂推理、数学、逻辑分析
如果你的需求是:
- 数学推导;
- 复杂决策分析;
- 代码调试思路分析;
- 多步骤推理;
- 长链路问题拆解;
可以使用推理模型。推理模型通常会更擅长“想清楚再回答”,但速度可能更慢,成本也可能更高。
3. 编程任务
如果你要让 DeepSeek 帮你:
- 写 Python 脚本;
- 解释 Java 代码;
- 修复报错;
- 生成 SQL;
- 设计接口;
- 优化算法;
建议明确告诉它语言、框架、版本、运行环境和输入输出要求。不要只说“帮我写个爬虫”,否则它可能给出不符合实际环境的代码。
4. 本地部署模型
如果你用 Ollama、LM Studio、vLLM 等方式本地运行 DeepSeek 相关模型,需要考虑:
- 显卡显存;
- 系统内存;
- CPU 性能;
- 模型量化版本;
- 上下文长度;
- 推理速度。
对于普通电脑,建议先从小参数量模型开始,不要盲目下载几十 GB 的大模型。
三、提示词避坑:不要只问一句“帮我写一下”
很多人觉得模型不好用,其实不是模型能力不行,而是问题问得太模糊。
例如:
帮我写一篇文章。
这种提示词太宽泛。模型不知道你要什么主题、风格、字数、受众、结构、重点、禁忌,自然很容易输出一篇泛泛而谈的文章。
更好的写法是:
请你扮演一名有 10 年经验的科技专栏作者,帮我写一篇面向普通职场人的文章。
主题:AI 工具如何提升日常办公效率
字数:不少于 1500 字
风格:通俗易懂,避免过度技术化
结构:
1. 开头用一个真实工作场景引入
2. 介绍 5 个具体使用场景
3. 每个场景给出可直接使用的提示词
4. 结尾总结注意事项
要求:
- 使用中文
- 用 Markdown 排版
- 不要使用空泛口号
- 案例要贴近日常办公
可以看到,好的提示词通常包含以下要素:
- 角色:让模型知道以什么身份回答;
- 任务:明确要完成什么;
- 背景:说明上下文;
- 格式:指定输出结构;
- 约束:告诉它不要做什么;
- 示例:提供参考样式;
- 检查标准:说明什么样算合格。
四、DeepSeek 常用提示词模板
下面给出几个可以直接复制使用的模板。
1. 文章写作模板
你是一名专业中文内容编辑,请根据以下要求写一篇文章。
文章主题:{填写主题}
目标读者:{填写读者群体}
文章字数:不少于 {填写字数} 字
文章风格:{通俗易懂 / 专业严谨 / 轻松幽默 / 深度分析}
文章结构:
1. 引言:说明问题背景
2. 正文:分 4-6 个小节展开
3. 案例:至少包含 2 个具体例子
4. 总结:给出可执行建议
额外要求:
- 使用 Markdown 格式
- 标题层级清晰
- 不要堆砌概念
- 不要编造具体数据
2. 代码生成模板
你是一名资深软件工程师,请帮我完成以下编程任务。
编程语言:Python 3.11
运行环境:macOS / Linux
任务描述:
{详细描述功能}
输入示例:
{输入示例}
输出示例:
{输出示例}
要求:
1. 给出完整可运行代码
2. 添加必要注释
3. 说明依赖安装命令
4. 说明运行命令
5. 考虑异常情况
3. 报错排查模板
你是一名资深后端工程师,请帮我分析以下报错。
运行环境:
- 操作系统:Ubuntu 22.04
- Python 版本:3.11
- 框架版本:FastAPI 0.110
- 数据库:PostgreSQL 15
我执行的命令:
{粘贴命令}
报错信息:
{粘贴完整报错}
相关代码:
{粘贴代码}
请按以下格式回答:
1. 报错原因
2. 定位思路
3. 修改方案
4. 修改后的代码
5. 如何验证修复成功
4. 资料总结模板
请你阅读下面的资料,并帮我总结。
总结要求:
1. 用 300 字概括核心内容
2. 提炼 5 个关键观点
3. 列出 3 个可执行建议
4. 如果资料中存在不确定或缺少依据的内容,请单独指出
5. 使用 Markdown 表格展示重点信息
资料如下:
{粘贴资料}
五、API 调用避坑:Key、模型名、参数一个都不能错
如果你准备通过 API 调用 DeepSeek,首先要注意以下几点:
- 不要把 API Key 写死在前端代码里;
- 不要把 API Key 提交到 GitHub;
- 确认 Base URL 是否正确;
- 确认模型名称是否正确;
- 设置合理的 max_tokens,避免费用失控;
- 生产环境要加超时、重试和日志;
- 不要把用户隐私数据直接传给模型。
下面给出常见调用方式。
六、使用 curl 调用 DeepSeek API
说明:请将
YOUR_API_KEY替换为你自己的 API Key。
curl https://api.deepseek.com/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "deepseek-chat",
"messages": [
{
"role": "system",
"content": "你是一名专业、严谨、简洁的中文助手。"
},
{
"role": "user",
"content": "请用三点说明如何提高工作效率。"
}
],
"temperature": 0.7,
"max_tokens": 800
}'
如果你想使用推理模型,可以类似这样:
curl https://api.deepseek.com/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "deepseek-reasoner",
"messages": [
{
"role": "user",
"content": "请分析一个小团队是否应该自研 CRM 系统,从成本、效率、风险三个角度展开。"
}
],
"temperature": 0.3,
"max_tokens": 1200
}'
常见坑点
Authorization前面必须是Bearer;Content-Type不要漏;- JSON 中字符串必须使用英文双引号;
- 如果请求超时,可以减少输出长度或检查网络;
- 如果返回模型不存在,优先检查模型名是否拼写错误。
七、使用 Python 调用 DeepSeek API
建议使用环境变量保存 API Key,不要直接写在代码里。
1. 设置环境变量
macOS / Linux:
export DEEPSEEK_API_KEY="YOUR_API_KEY"
Windows PowerShell:
$env:DEEPSEEK_API_KEY="YOUR_API_KEY"
如果你希望长期生效,可以写入 shell 配置文件。
macOS / Linux:
echo 'export DEEPSEEK_API_KEY="YOUR_API_KEY"' >> ~/.zshrc
source ~/.zshrc
如果你使用 Bash:
echo 'export DEEPSEEK_API_KEY="YOUR_API_KEY"' >> ~/.bashrc
source ~/.bashrc
2. 安装依赖
pip install openai
3. Python 示例代码
创建文件:
touch deepseek_demo.py
写入以下代码:
import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DEEPSEEK_API_KEY"),
base_url="https://api.deepseek.com"
)
response = client.chat.completions.create(
model="deepseek-chat",
messages=[
{"role": "system", "content": "你是一名专业的中文写作助手。"},
{"role": "user", "content": "请写一段 200 字左右的 AI 办公工具介绍。"}
],
temperature=0.7,
max_tokens=800
)
print(response.choices[0].message.content)
运行命令:
python deepseek_demo.py
4. 流式输出示例
如果你希望像聊天窗口一样逐字输出,可以使用流式调用。
import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DEEPSEEK_API_KEY"),
base_url="https://api.deepseek.com"
)
stream = client.chat.completions.create(
model="deepseek-chat",
messages=[
{"role": "user", "content": "请用 Markdown 写一份 Python 入门学习路线。"}
],
stream=True,
temperature=0.7,
max_tokens=1000
)
for chunk in stream:
if chunk.choices and chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="", flush=True)
运行:
python deepseek_stream.py
八、使用 Node.js 调用 DeepSeek API
1. 初始化项目
mkdir deepseek-node-demo
cd deepseek-node-demo
npm init -y
2. 安装依赖
npm install openai dotenv
3. 创建 .env
touch .env
写入:
DEEPSEEK_API_KEY=YOUR_API_KEY
4. 创建脚本
touch index.js
代码如下:
import OpenAI from "openai";
import dotenv from "dotenv";
dotenv.config();
const client = new OpenAI({
apiKey: process.env.DEEPSEEK_API_KEY,
baseURL: "https://api.deepseek.com",
});
async function main() {
const completion = await client.chat.completions.create({
model: "deepseek-chat",
messages: [
{
role: "system",
content: "你是一名专业的中文技术助手。",
},
{
role: "user",
content: "请解释什么是 API,并给一个生活化例子。",
},
],
temperature: 0.7,
max_tokens: 800,
});
console.log(completion.choices[0].message.content);
}
main().catch(console.error);
由于上面使用了 ES Module,需要修改 package.json:
{
"type": "module"
}
运行:
node index.js
九、本地部署避坑:Ollama 是新手最友好的方式之一
如果你希望在本地运行 DeepSeek 相关模型,可以使用 Ollama。它安装简单,命令清晰,适合个人学习和测试。
1. 安装 Ollama
macOS 可以直接使用 Homebrew:
brew install ollama
Linux 可以使用官方安装脚本:
curl -fsSL https://ollama.com/install.sh | sh
安装完成后查看版本:
ollama --version
启动服务:
ollama serve
如果已经自动启动,可以不用重复执行。
2. 下载并运行模型
以 DeepSeek R1 蒸馏模型为例:
ollama run deepseek-r1:1.5b
如果你的电脑配置稍好,可以尝试:
ollama run deepseek-r1:7b
或者:
ollama run deepseek-r1:8b
查看本地已有模型:
ollama list
删除模型:
ollama rm deepseek-r1:1.5b
3. 使用 Ollama API
Ollama 默认服务地址通常是:
http://localhost:11434
通过 curl 调用:
curl http://localhost:11434/api/generate \
-d '{
"model": "deepseek-r1:1.5b",
"prompt": "请用中文解释什么是大语言模型。",
"stream": false
}'
聊天接口示例:
curl http://localhost:11434/api/chat \
-d '{
"model": "deepseek-r1:1.5b",
"messages": [
{
"role": "user",
"content": "请列出学习 Python 的 5 个步骤。"
}
],
"stream": false
}'
4. 本地部署常见坑
坑一:模型太大,电脑跑不动
如果你的电脑内存只有 8GB,不建议直接跑大模型。可以先用:
ollama run deepseek-r1:1.5b
如果运行流畅,再尝试更大模型。
坑二:第一次运行很慢
第一次运行需要下载模型,速度取决于网络和模型大小。你可以先查看模型列表:
ollama list
如果模型已下载,再运行会快很多。
坑三:回答速度慢
本地运行速度受硬件影响很大。可以尝试:
- 使用更小模型;
- 关闭其他占用内存的软件;
- 使用量化模型;
- 升级显卡或内存;
- 降低上下文长度。
坑四:以为本地小模型效果等于线上大模型
本地小模型适合学习、轻量任务、隐私场景,但在复杂推理、长文写作、代码质量等方面,通常不如线上大模型。
十、上下文长度避坑:不是资料越多越好
很多人使用 DeepSeek 时,会一次性粘贴大量资料,然后问:“帮我总结一下。”结果模型可能漏掉重点,甚至输出不准确。
这是因为模型有上下文窗口限制。即使能输入很长文本,也不代表它能完美处理所有细节。
更好的做法是:
1. 分段处理
我会分 5 次发送一份资料。你先不要总结,只回复“已收到第 X 部分”。
等我说“资料发送完毕”后,你再进行整体总结。
2. 先提取结构,再深入分析
请先阅读以下资料,只做两件事:
1. 提取文章结构
2. 列出每一部分的核心观点
暂时不要展开评论。
3. 让模型基于原文引用
请总结以下资料,并在每个观点后面引用原文中的关键句作为依据。
如果原文没有依据,请标注“原文未说明”。
这样可以显著降低模型胡编乱造的概率。
十一、回答不稳定避坑:调好 temperature
API 调用时经常会看到 temperature 参数。简单理解:
temperature越低,回答越稳定、保守;temperature越高,回答越发散、有创造性。
推荐设置:
| 场景 | temperature 建议 |
|---|---|
| 代码生成 | 0.1 - 0.3 |
| 数据分析 | 0.1 - 0.3 |
| 法律、制度类文本 | 0.1 - 0.3 |
| 普通问答 | 0.5 - 0.7 |
| 创意写作 | 0.7 - 1.0 |
| 头脑风暴 | 0.8 - 1.2 |
如果你希望输出稳定,建议这样设置:
{
"temperature": 0.2,
"max_tokens": 1000
}
如果你希望输出更有创意,可以这样:
{
"temperature": 0.9,
"max_tokens": 1200
}
十二、成本控制避坑:别让 API 悄悄烧钱
使用 API 时,成本主要和输入、输出 token 数有关。很多人一开始测试时不控制 max_tokens,也不做限流,结果费用增长很快。
建议你做到以下几点:
- 设置
max_tokens; - 对用户输入长度做限制;
- 对同一用户请求频率做限制;
- 对重复问题做缓存;
- 日志中记录 token 使用量;
- 对异常循环调用设置熔断;
- 后台设置预算提醒。
Python 中记录 token 用量
import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DEEPSEEK_API_KEY"),
base_url="https://api.deepseek.com"
)
response = client.chat.completions.create(
model="deepseek-chat",
messages=[
{"role": "user", "content": "请总结项目管理的三个核心原则。"}
],
max_tokens=500
)
print(response.choices[0].message.content)
if response.usage:
print("Prompt tokens:", response.usage.prompt_tokens)
print("Completion tokens:", response.usage.completion_tokens)
print("Total tokens:", response.usage.total_tokens)
十三、隐私与安全避坑:不要把敏感信息直接丢给模型
无论使用 DeepSeek 还是其他大模型,都要注意数据安全。以下内容不建议直接上传:
- 身份证号;
- 手机号;
- 银行卡号;
- 客户名单;
- 合同原文;
- 公司内部机密;
- 未公开财务数据;
- 生产系统密钥;
- 用户隐私信息;
- 医疗记录。
如果确实需要处理,可以先进行脱敏。
脱敏示例
原始内容:
客户张三,手机号 13812345678,身份证号 110101199001011234,购买了某产品。
脱敏后:
客户 A,手机号 [已脱敏],身份证号 [已脱敏],购买了某产品。
可以让模型处理脱敏文本:
以下资料已做脱敏处理,请帮我总结客户需求和潜在风险,不要尝试还原任何个人身份信息。
十四、常见报错与解决方法
1. 401 Unauthorized
通常是 API Key 错误或没有传 Authorization。
检查命令:
echo $DEEPSEEK_API_KEY
curl 示例:
curl https://api.deepseek.com/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-chat",
"messages": [{"role": "user", "content": "你好"}]
}'
2. 400 Bad Request
常见原因:
- JSON 格式错误;
- 模型名称错误;
- messages 格式错误;
- max_tokens 参数不合理。
可以用 JSON 校验工具检查请求体。
3. 429 Too Many Requests
表示请求过于频繁或触发限流。解决方法:
- 降低请求频率;
- 增加重试间隔;
- 使用队列削峰;
- 检查是否出现死循环调用。
4. 请求超时
可以尝试:
- 减少
max_tokens; - 缩短输入内容;
- 使用流式输出;
- 增加客户端超时时间;
- 检查网络连接。
十五、推荐工作流:让 DeepSeek 真正变成生产力工具
如果你只是偶尔问一句,DeepSeek 当然也能用。但如果想把它变成稳定的生产力工具,建议采用以下工作流:
第一步:明确任务
不要直接问,要先定义目标。
我的目标是:在 30 分钟内完成一份产品需求文档初稿。
第二步:让模型先提问
在开始写之前,请先问我 5 个必须确认的问题。
第三步:生成大纲
请根据以上信息,先生成一份 PRD 文档大纲,不要写正文。
第四步:逐节生成
请先写第 1 节“需求背景”,要求不少于 300 字,语言专业但不要空泛。
第五步:自检优化
请检查上面的内容是否存在:
1. 表述模糊
2. 逻辑跳跃
3. 缺少用户场景
4. 缺少验收标准
然后给出修改版。
这种方式比“一次性生成完整文档”更稳定,质量也更高。
十六、DeepSeek 使用总结:记住这 10 条就够了
- 先明确场景,再选择模型,不要盲目追求最大模型;
- 提示词越具体,输出越稳定;
- 写代码时必须提供环境、版本和输入输出要求;
- API Key 不要写进前端或公开仓库;
- 调用 API 时设置 max_tokens 和 temperature;
- 本地部署先从小模型开始,不要一步到位;
- 长资料要分段处理,不要一次性乱塞;
- 涉及事实、数据、法律、医疗时要人工核验;
- 敏感信息先脱敏,再交给模型处理;
- 把 DeepSeek 当助手,不要当最终责任人。
结语
DeepSeek 的价值不在于“替你完成一切”,而在于帮你更快地整理思路、生成初稿、分析问题、提高效率。真正用好它的关键,不只是会提问,更是会拆任务、会验证结果、会控制成本、会保护数据。
如果你是普通用户,建议先从网页端和高质量提示词开始;如果你是开发者,可以进一步尝试 API 调用和自动化集成;如果你对隐私和离线使用有要求,可以使用 Ollama 等工具进行本地部署。
最后记住一句话:模型能力决定上限,使用方法决定下限。 会用的人,DeepSeek 是生产力工具;不会用的人,它可能只是一个“看起来很聪明但偶尔胡说”的聊天机器人。