上一篇 下一篇 分享链接 返回 返回顶部

AI 浏览器从零部署指南:Docker、模型配置与常用命令一次搞定

发布人:慈云数据-客服中心 发布时间:6小时前 阅读量:0

AI浏览器 部署完整教程|附完整命令

随着大模型能力的不断增强,“AI 浏览器”正在成为一个非常实用的自动化工具。它可以像人一样打开网页、点击按钮、填写表单、读取页面内容,并根据你的自然语言指令完成一系列浏览器操作。例如:自动搜索资料、整理网页信息、登录后台查看数据、批量处理网页任务、抓取公开页面内容等。

本文将以目前常见的 Browser-Use WebUI / AI Browser Agent 部署思路为例,完整讲解如何在服务器或本地电脑上部署一个可用的 AI 浏览器环境。文章会包含环境准备、Docker 部署、源码部署、模型配置、浏览器配置、常见问题排查以及完整命令,适合初学者直接照着操作。

说明:不同项目可能名称略有差异,例如 AI Browser、Browser Use、Browser Agent、AI 浏览器助手等,但核心部署逻辑基本一致:
大语言模型 API + 浏览器自动化框架 + WebUI 前端界面 + Playwright/Chromium 浏览器环境。


一、AI 浏览器是什么?

AI 浏览器不是传统意义上的 Chrome、Edge、Firefox 浏览器,而是一个结合了大语言模型与浏览器自动化能力的智能代理系统。

它通常由以下几个部分组成:

  1. 大语言模型

    • 例如 OpenAI GPT、Claude、Gemini、DeepSeek、通义千问、智谱、Ollama 本地模型等。
    • 负责理解用户任务、规划操作步骤、分析网页内容。
  2. 浏览器自动化引擎

    • 常见方案是 Playwright 或 Selenium。
    • 负责打开网页、点击、输入、滚动、截图、读取 DOM 等操作。
  3. Agent 执行框架

    • 负责将大模型的思考结果转化为浏览器动作。
    • 例如 browser-use、LangChain、AutoGen 等相关框架。
  4. WebUI 管理界面

    • 用户可以在网页中输入任务。
    • 查看 AI 执行过程、浏览器截图、日志和结果。
  5. 运行环境

    • 可以部署在本地电脑、Linux 服务器、Docker 容器或云主机上。

简单理解就是:

你输入一句话:
“帮我打开某个网站,搜索 AI 浏览器部署教程,并总结前 5 篇文章的核心内容。”

AI 浏览器会自动打开网页、搜索、阅读、整理,最后给你结果。


二、部署前准备

本文以 Ubuntu 22.04 / 24.04 Linux 服务器 为主要示例。如果你使用的是 macOS 或 Windows,也可以参考源码部署部分。

1. 推荐服务器配置

建议配置如下:

项目 推荐配置
CPU 2 核及以上
内存 4GB 起步,建议 8GB
硬盘 20GB 以上
系统 Ubuntu 22.04 / Ubuntu 24.04
网络 可访问模型 API 地址
Docker 推荐安装
Python 3.11 或 3.12

如果你只是测试功能,2 核 4G 也可以运行。但如果要长时间执行复杂网页任务,建议使用 4 核 8G 或更高配置。


三、更新系统环境

首先登录你的服务器。

ssh root@你的服务器IP

更新系统软件包:

apt update && apt upgrade -y

安装常用工具:

apt install -y \
  curl \
  wget \
  git \
  vim \
  unzip \
  ca-certificates \
  gnupg \
  lsb-release \
  software-properties-common

查看系统版本:

lsb_release -a

查看 CPU、内存和磁盘:

lscpu
free -h
df -h

四、方式一:使用 Docker 部署 AI 浏览器

Docker 部署是最推荐的方式,因为它可以减少 Python、浏览器依赖、系统库冲突等问题。

1. 安装 Docker

如果你的服务器还没有 Docker,可以执行以下命令安装:

curl -fsSL https://get.docker.com | bash

启动 Docker:

systemctl enable docker
systemctl start docker

查看 Docker 版本:

docker version

安装 Docker Compose 插件:

apt install -y docker-compose-plugin

查看 Compose 版本:

docker compose version

如果输出版本号,说明 Docker 环境安装成功。


2. 创建部署目录

创建一个专门用于 AI 浏览器的目录:

mkdir -p /opt/ai-browser
cd /opt/ai-browser

3. 克隆项目代码

这里以常见的 Browser-Use WebUI 项目为示例:

git clone https://github.com/browser-use/web-ui.git

进入项目目录:

cd web-ui

如果你的网络访问 GitHub 较慢,可以尝试使用代理或镜像源。也可以先在本地下载压缩包,再上传到服务器。


4. 查看项目文件

ls -la

一般你会看到类似文件:

Dockerfile
docker-compose.yml
requirements.txt
.env.example
README.md
src/

如果项目中提供了 .env.example,可以复制一份作为环境配置文件:

cp .env.example .env

如果没有 .env.example,可以手动创建:

touch .env

五、配置模型 API

AI 浏览器必须连接大语言模型。你可以使用 OpenAI、DeepSeek、通义千问、智谱、OpenRouter、Ollama 等。

1. 使用 OpenAI

编辑 .env 文件:

vim .env

写入以下内容:

OPENAI_API_KEY=你的OpenAI_API_KEY
OPENAI_BASE_URL=https://api.openai.com/v1
MODEL_NAME=gpt-4o

如果使用 GPT-4o mini,可以写:

OPENAI_API_KEY=你的OpenAI_API_KEY
OPENAI_BASE_URL=https://api.openai.com/v1
MODEL_NAME=gpt-4o-mini

2. 使用 DeepSeek

如果你使用 DeepSeek API,可以配置为 OpenAI 兼容模式:

OPENAI_API_KEY=你的DeepSeek_API_KEY
OPENAI_BASE_URL=https://api.deepseek.com
MODEL_NAME=deepseek-chat

如果项目要求模型提供商字段,也可以增加:

LLM_PROVIDER=openai

完整示例:

LLM_PROVIDER=openai
OPENAI_API_KEY=sk-xxxxxxxxxxxxxxxx
OPENAI_BASE_URL=https://api.deepseek.com
MODEL_NAME=deepseek-chat

3. 使用通义千问 DashScope

如果项目支持 OpenAI 兼容接口,可以使用阿里云 DashScope 兼容模式:

OPENAI_API_KEY=你的DashScope_API_KEY
OPENAI_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1
MODEL_NAME=qwen-plus

也可以使用更强的模型:

MODEL_NAME=qwen-max

4. 使用本地 Ollama

如果你希望完全本地运行模型,可以使用 Ollama。

先安装 Ollama:

curl -fsSL https://ollama.com/install.sh | sh

启动 Ollama:

systemctl enable ollama
systemctl start ollama

拉取模型:

ollama pull qwen2.5:7b

测试模型:

ollama run qwen2.5:7b

如果 AI 浏览器项目支持 OpenAI 兼容接口,可以让 Ollama 监听本地接口:

OPENAI_API_KEY=ollama
OPENAI_BASE_URL=http://host.docker.internal:11434/v1
MODEL_NAME=qwen2.5:7b

在 Linux Docker 中,host.docker.internal 可能不可用,可以在 docker-compose.yml 中添加:

extra_hosts:
  - "host.docker.internal:host-gateway"

也可以直接使用宿主机 IP。


六、Docker Compose 部署

1. 编写 docker-compose.yml

如果项目已经提供 docker-compose.yml,可以先查看:

cat docker-compose.yml

如果没有,你可以创建一个基础版本:

vim docker-compose.yml

写入:

services:
  ai-browser:
    build:
      context: .
      dockerfile: Dockerfile
    container_name: ai-browser
    restart: unless-stopped
    ports:
      - "7788:7788"
    env_file:
      - .env
    volumes:
      - ./data:/app/data
      - ./downloads:/app/downloads
    extra_hosts:
      - "host.docker.internal:host-gateway"
    shm_size: "2gb"

这里说明一下:

  • 7788:7788:将容器内 WebUI 端口映射到服务器 7788 端口。
  • env_file:加载 .env 模型配置。
  • volumes:保存数据和下载文件。
  • shm_size:给 Chromium 浏览器更大的共享内存,减少崩溃概率。
  • restart:容器异常退出后自动重启。

2. 构建镜像

docker compose build

如果构建较慢,请耐心等待。首次构建会下载 Python 依赖、浏览器依赖和系统库。


3. 启动服务

docker compose up -d

查看容器状态:

docker ps

查看日志:

docker logs -f ai-browser

如果日志中出现类似:

Running on http://0.0.0.0:7788

说明服务已经启动成功。


4. 访问 WebUI

在浏览器中打开:

http://你的服务器IP:7788

如果你是在本地部署,可以访问:

http://127.0.0.1:7788

进入页面后,通常可以看到任务输入框。你可以输入:

打开百度,搜索“AI 浏览器是什么”,阅读搜索结果并总结。

或者:

打开 https://example.com,提取页面标题和主要内容。

七、开放服务器端口

如果你无法访问 http://服务器IP:7788,可能是防火墙或云服务器安全组没有放行端口。

1. Ubuntu UFW 防火墙

查看防火墙状态:

ufw status

放行 7788 端口:

ufw allow 7788/tcp

重新加载:

ufw reload

2. 云服务器安全组

如果你使用阿里云、腾讯云、华为云、AWS、Azure 等,需要进入控制台添加安全组规则:

类型 协议 端口 来源
自定义 TCP TCP 7788 0.0.0.0/0

如果只是自己使用,建议来源 IP 填写自己的公网 IP,避免被别人访问。


八、配置反向代理和域名访问

如果你想通过域名访问,例如:

https://ai.example.com

可以使用 Nginx 反向代理。

1. 安装 Nginx

apt install -y nginx

启动 Nginx:

systemctl enable nginx
systemctl start nginx

2. 新建站点配置

vim /etc/nginx/sites-available/ai-browser.conf

写入:

server {
    listen 80;
    server_name ai.example.com;

    client_max_body_size 100M;

    location / {
        proxy_pass http://127.0.0.1:7788;
        proxy_http_version 1.1;

        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;

        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";

        proxy_read_timeout 3600;
        proxy_send_timeout 3600;
    }
}

启用站点:

ln -s /etc/nginx/sites-available/ai-browser.conf /etc/nginx/sites-enabled/ai-browser.conf

检查配置:

nginx -t

重载 Nginx:

systemctl reload nginx

3. 配置 HTTPS 证书

安装 Certbot:

apt install -y certbot python3-certbot-nginx

申请证书:

certbot --nginx -d ai.example.com

按照提示输入邮箱并确认即可。

证书申请成功后访问:

https://ai.example.com

九、方式二:源码部署 AI 浏览器

如果你不想使用 Docker,也可以直接用 Python 源码部署。源码部署适合开发调试,但对环境要求更高。


1. 安装 Python 3.11

Ubuntu 默认 Python 版本可能不是 3.11,可以这样安装:

apt update
apt install -y python3 python3-pip python3-venv

查看版本:

python3 --version

如果版本低于 3.10,建议安装 Python 3.11:

add-apt-repository ppa:deadsnakes/ppa -y
apt update
apt install -y python3.11 python3.11-venv python3.11-dev

查看:

python3.11 --version

2. 克隆代码

mkdir -p /opt/ai-browser
cd /opt/ai-browser
git clone https://github.com/browser-use/web-ui.git
cd web-ui

3. 创建虚拟环境

python3.11 -m venv venv

激活虚拟环境:

source venv/bin/activate

升级 pip:

pip install --upgrade pip setuptools wheel

4. 安装依赖

如果项目有 requirements.txt

pip install -r requirements.txt

如果项目使用 pyproject.toml

pip install .

如果安装过程慢,可以使用国内镜像源:

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

5. 安装 Playwright 浏览器

AI 浏览器通常依赖 Playwright 控制 Chromium。

安装 Playwright:

pip install playwright

安装 Chromium:

playwright install chromium

安装系统依赖:

playwright install-deps

如果只想安装 Chromium 依赖:

playwright install-deps chromium

6. 配置环境变量

复制配置文件:

cp .env.example .env

编辑:

vim .env

写入模型配置,例如 DeepSeek:

LLM_PROVIDER=openai
OPENAI_API_KEY=你的DeepSeek_API_KEY
OPENAI_BASE_URL=https://api.deepseek.com
MODEL_NAME=deepseek-chat

或者 OpenAI:

LLM_PROVIDER=openai
OPENAI_API_KEY=你的OpenAI_API_KEY
OPENAI_BASE_URL=https://api.openai.com/v1
MODEL_NAME=gpt-4o-mini

7. 启动项目

不同项目启动命令可能不同。常见方式如下。

如果使用 Gradio:

python webui.py --ip 0.0.0.0 --port 7788

如果入口文件是 app.py

python app.py

如果使用 Streamlit:

streamlit run app.py --server.address 0.0.0.0 --server.port 7788

如果使用 Uvicorn:

uvicorn app:app --host 0.0.0.0 --port 7788

如果不确定入口文件,可以查看 README:

cat README.md

或者查看目录:

ls -la

十、使用 systemd 后台运行源码服务

源码运行时,如果你关闭 SSH,服务可能会停止。可以使用 systemd 管理。

1. 创建服务文件

vim /etc/systemd/system/ai-browser.service

写入以下内容,注意根据你的实际路径修改:

[Unit]
Description=AI Browser WebUI Service
After=network.target

[Service]
Type=simple
WorkingDirectory=/opt/ai-browser/web-ui
EnvironmentFile=/opt/ai-browser/web-ui/.env
ExecStart=/opt/ai-browser/web-ui/venv/bin/python webui.py --ip 0.0.0.0 --port 7788
Restart=always
RestartSec=5
User=root

[Install]
WantedBy=multi-user.target

如果你的启动文件不是 webui.py,请改成实际命令。


2. 启动服务

重新加载 systemd:

systemctl daemon-reload

启动服务:

systemctl start ai-browser

设置开机自启:

systemctl enable ai-browser

查看状态:

systemctl status ai-browser

查看日志:

journalctl -u ai-browser -f

十一、AI 浏览器使用示例

部署完成后,可以在 WebUI 中输入任务。下面给几个适合测试的提示词。

1. 搜索并总结资料

打开百度,搜索“AI 浏览器部署教程”,阅读前 3 个搜索结果,整理每篇文章的核心步骤,并输出对比表格。

2. 提取网页内容

打开 https://example.com,提取页面标题、正文内容和所有链接。

3. 自动填写表单

打开指定测试表单页面,填写姓名、邮箱和备注内容,填写完成后不要提交,等待我确认。

4. 数据整理

打开某个公开新闻网站,查找今天关于人工智能的新闻,整理标题、来源、发布时间和摘要。

5. 网页检查

打开我的网站首页,检查页面是否存在 404 链接,并输出检测结果。

十二、常见问题排查

1. 容器启动失败

查看日志:

docker logs -f ai-browser

常见原因包括:

  • .env 没有配置 API Key。
  • 模型名称写错。
  • 端口被占用。
  • Docker 镜像构建失败。
  • Chromium 依赖不完整。

检查端口占用:

ss -tulnp | grep 7788

如果端口被占用,可以修改 docker-compose.yml

ports:
  - "7799:7788"

然后重启:

docker compose down
docker compose up -d

2. Playwright 报错缺少依赖

如果源码部署出现类似错误:

Host system is missing dependencies to run browsers

执行:

playwright install-deps

或者:

apt install -y \
  libnss3 \
  libnspr4 \
  libatk1.0-0 \
  libatk-bridge2.0-0 \
  libcups2 \
  libdrm2 \
  libxkbcommon0 \
  libxcomposite1 \
  libxdamage1 \
  libxfixes3 \
  libxrandr2 \
  libgbm1 \
  libasound2 \
  libpango-1.0-0 \
  libcairo2

然后重新安装浏览器:

playwright install chromium

3. 模型 API 连接失败

测试 API 是否可访问:

curl https://api.openai.com/v1/models \
  -H "Authorization: Bearer 你的API_KEY"

如果使用 DeepSeek:

curl https://api.deepseek.com/models \
  -H "Authorization: Bearer 你的API_KEY"

如果使用 DashScope:

curl https://dashscope.aliyuncs.com/compatible-mode/v1/models \
  -H "Authorization: Bearer 你的API_KEY"

如果返回模型列表或 JSON 信息,说明 API 可以连接。


4. AI 执行很慢

常见原因:

  1. 模型响应慢。
  2. 网页加载慢。
  3. 浏览器截图和 DOM 分析消耗时间。
  4. 服务器配置较低。
  5. 任务描述过于复杂。

优化建议:

  • 使用响应速度更快的模型,例如 gpt-4o-minideepseek-chatqwen-plus
  • 将复杂任务拆成多个小任务。
  • 避免一次打开太多网页。
  • 使用更高配置服务器。
  • 尽量指定目标网址,减少搜索过程。

5. 浏览器页面空白或崩溃

Docker 部署时建议加大共享内存:

shm_size: "2gb"

然后重启:

docker compose down
docker compose up -d

源码部署时可以尝试重新安装 Chromium:

playwright install chromium

十三、升级和维护

1. Docker 部署升级

进入项目目录:

cd /opt/ai-browser/web-ui

拉取最新代码:

git pull

重新构建:

docker compose build --no-cache

重启:

docker compose down
docker compose up -d

查看日志:

docker logs -f ai-browser

2. 源码部署升级

进入目录:

cd /opt/ai-browser/web-ui

激活环境:

source venv/bin/activate

拉取代码:

git pull

更新依赖:

pip install -r requirements.txt --upgrade

重新安装浏览器:

playwright install chromium

重启服务:

systemctl restart ai-browser

查看日志:

journalctl -u ai-browser -f

3. 备份配置

建议定期备份 .env、数据目录和下载目录。

cd /opt/ai-browser
tar czvf ai-browser-backup-$(date +%F).tar.gz web-ui/.env web-ui/data web-ui/downloads

如果要恢复:

tar xzvf ai-browser-backup-2025-01-01.tar.gz -C /opt/ai-browser

十四、安全建议

AI 浏览器可以访问网页、读取内容、自动点击,因此一定要注意安全。

1. 不要公开暴露 WebUI

如果直接开放公网端口,任何人都可能访问你的 AI 浏览器,消耗你的模型额度,甚至执行危险操作。

建议:

  • 使用 Nginx Basic Auth。
  • 限制安全组来源 IP。
  • 增加登录认证。
  • 不要在公共网络中暴露后台。

2. 给 Nginx 增加密码认证

安装工具:

apt install -y apache2-utils

创建账号密码:

htpasswd -c /etc/nginx/.ai-browser.htpasswd admin

修改 Nginx 配置:

vim /etc/nginx/sites-available/ai-browser.conf

location / 中加入:

auth_basic "AI Browser Login";
auth_basic_user_file /etc/nginx/.ai-browser.htpasswd;

完整示例:

location / {
    auth_basic "AI Browser Login";
    auth_basic_user_file /etc/nginx/.ai-browser.htpasswd;

    proxy_pass http://127.0.0.1:7788;
    proxy_http_version 1.1;

    proxy_set_header Host $host;
    proxy_set_header X-Real-IP $remote_addr;
    proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
    proxy_set_header X-Forwarded-Proto $scheme;

    proxy_set_header Upgrade $http_upgrade;
    proxy_set_header Connection "upgrade";

    proxy_read_timeout 3600;
    proxy_send_timeout 3600;
}

检查并重载:

nginx -t
systemctl reload nginx

3. 不要让 AI 操作敏感账户

不建议让 AI 浏览器直接操作:

  • 银行账户;
  • 支付账户;
  • 生产数据库后台;
  • 云服务器控制台;
  • 企业核心管理系统;
  • 涉及隐私和敏感信息的网站。

即使要使用,也应该采用只读账号、测试账号或受限权限账号。


十五、一键部署命令示例

如果你想快速部署,可以参考下面的完整命令。注意需要先替换你的 API Key。

apt update && apt upgrade -y

apt install -y \
  curl \
  wget \
  git \
  vim \
  unzip \
  ca-certificates \
  gnupg \
  lsb-release \
  software-properties-common

curl -fsSL https://get.docker.com | bash

systemctl enable docker
systemctl start docker

apt install -y docker-compose-plugin

mkdir -p /opt/ai-browser
cd /opt/ai-browser

git clone https://github.com/browser-use/web-ui.git

cd web-ui

cat > .env < docker-compose.yml <

部署成功后访问:

http://你的服务器IP:7788

十六、完整卸载命令

如果你想删除 AI 浏览器,可以执行:

cd /opt/ai-browser/web-ui
docker compose down

删除容器和镜像:

docker rm -f ai-browser
docker image prune -a -f

删除项目目录:

rm -rf /opt/ai-browser

如果还想卸载 Docker:

apt remove -y docker docker-engine docker.io containerd runc docker-compose-plugin
apt autoremove -y

十七、总结

AI 浏览器的核心价值在于把大语言模型的理解能力和浏览器自动化能力结合起来,让 AI 不只是“回答问题”,而是可以真正进入网页执行任务。它可以帮助我们完成资料搜索、网页信息提取、表单处理、数据整理、网站测试等工作。

本文介绍了两种部署方式:

  1. Docker 部署

    • 推荐普通用户使用;
    • 环境隔离好;
    • 部署更稳定;
    • 升级和卸载方便。
  2. 源码部署

    • 适合开发者调试;
    • 灵活性更高;
    • 但需要处理 Python、Playwright、浏览器依赖等问题。

如果你只是想快速体验,建议直接使用 Docker 方式部署。部署完成后,只需要配置好模型 API,就可以通过 WebUI 输入任务,让 AI 自动操作浏览器。

最后提醒一句:AI 浏览器虽然强大,但它仍然可能误点、误读或执行错误操作。因此,在处理敏感任务时一定要谨慎,最好使用测试账号、只读权限,并在关键操作前设置人工确认。

目录结构
全文