上一篇 下一篇 分享链接 返回 返回顶部

内网搭一套会干活的浏览器:AI 浏览器私有化部署实战与完整命令

发布人:慈云数据-客服中心 发布时间:7小时前 阅读量:0

AI浏览器 私有化部署方案|附完整命令

在企业内部知识检索、自动化运营、网页数据采集、后台表单录入、测试巡检等场景中,“AI 浏览器”正在成为一种非常实用的工具。它不是简单地在浏览器里接入一个聊天机器人,而是让大模型能够“看懂网页、操作网页、读取页面内容、点击按钮、填写表单、完成任务”。

相比直接使用公有云上的 AI Agent 或在线浏览器插件,很多企业更关心的是:能不能把 AI 浏览器部署在自己的服务器上?数据能不能不出内网?账号、Cookie、业务系统页面能不能不暴露给第三方?

答案是可以的。

本文提供一套可落地的 AI 浏览器私有化部署方案,基于以下组件搭建:

  • Ollama:本地运行大模型;
  • Open WebUI:提供本地大模型的可视化聊天界面;
  • Browserless Chrome:提供可远程控制的无头 Chromium 浏览器;
  • Python Agent 服务:通过大模型调用浏览器执行任务;
  • Docker Compose:统一编排,方便部署、升级和迁移;
  • Nginx:可选,用于反向代理和内网访问控制。

这套方案适合部署在企业内网服务器、私有云、边缘节点或本地工作站上。


一、什么是 AI 浏览器?

传统浏览器依赖人来操作,比如打开网页、点击按钮、搜索内容、填写表单等。AI 浏览器则是在传统浏览器的基础上增加了一个“智能操作层”。

它通常具备以下能力:

  1. 理解用户任务

    例如用户输入:

    打开公司 OA 系统,查询今天待审批的流程,并把标题整理成表格。

  2. 访问网页

    AI Agent 可以启动或连接浏览器,打开指定网址。

  3. 读取网页内容

    它可以获取页面文本、按钮、输入框、链接、表格等元素信息。

  4. 自动操作页面

    包括点击、输入、滚动、选择下拉框、提交表单等。

  5. 结合大模型做决策

    大模型根据页面状态判断下一步应该做什么。

  6. 输出结构化结果

    最终可以输出 Markdown、JSON、Excel 数据,或者调用内部接口继续处理。


二、为什么要私有化部署?

很多 AI 浏览器或 AI Agent 工具默认依赖云端模型和云端执行环境。对于个人用户来说问题不大,但对企业而言,通常会遇到以下顾虑:

1. 数据安全

AI 浏览器可能访问内部系统,例如:

  • OA;
  • CRM;
  • ERP;
  • 财务系统;
  • 工单系统;
  • 内部知识库;
  • 测试环境;
  • 管理后台。

这些页面中的内容、Cookie、Token、账号密码都属于敏感数据。如果交给外部平台执行,风险较高。

2. 合规要求

金融、政务、医疗、制造等行业通常要求核心数据不能出内网,或者必须经过严格审计。

私有化部署可以让:

  • 模型在内网运行;
  • 浏览器在内网运行;
  • 任务日志保存在本地;
  • 访问行为可审计;
  • 网络出口可控。

3. 成本可控

如果任务量较大,例如批量网页巡检、自动化测试、后台数据处理,长期使用云端大模型和云端浏览器会产生较高费用。

私有化部署可以根据业务量自建服务器资源,降低长期成本。

4. 可定制能力更强

企业往往需要与内部系统集成,例如:

  • 接入 LDAP / AD;
  • 接入 SSO;
  • 对接内部知识库;
  • 调用内部 API;
  • 自定义浏览器插件;
  • 限制可访问域名;
  • 记录详细操作日志。

这些都更适合在私有化环境中完成。


三、整体架构设计

本方案的架构如下:

用户
 │
 │ 访问 Web 页面 / 调用 API
 ▼
AI Agent 服务
 │
 ├── 调用本地大模型 Ollama
 │
 ├── 控制 Browserless Chrome
 │
 └── 输出任务执行结果
       │
       ▼
企业内部业务系统 / 外部网页

组件说明如下:

组件 作用
Ollama 在本地运行大语言模型,例如 Qwen、Llama、DeepSeek 等
Open WebUI 本地大模型的可视化管理与聊天界面
Browserless Chrome 提供远程可控的 Chromium 浏览器环境
Python Agent 负责任务编排、调用模型、控制浏览器
Docker Compose 管理所有容器服务
Nginx 可选,用于统一入口、HTTPS、访问控制

四、服务器配置建议

最低配置

适合测试和小规模使用:

CPU:4 核
内存:16 GB
硬盘:100 GB SSD
GPU:可选
系统:Ubuntu 22.04 LTS

如果只运行小模型,例如 qwen2.5:7bllama3.1:8b,CPU 也可以跑,但速度较慢。

推荐配置

适合企业内部日常使用:

CPU:8 核或以上
内存:32 GB 或以上
硬盘:300 GB SSD
GPU:NVIDIA 16 GB 显存以上
系统:Ubuntu 22.04 LTS / Ubuntu 24.04 LTS

模型选择建议

模型 说明
qwen2.5:7b 中文能力较好,资源占用相对可控
qwen2.5:14b 效果更好,建议有 GPU
llama3.1:8b 通用能力较好
deepseek-r1:7b 推理能力较强,但输出可能偏长
qwen2.5-coder:7b 适合代码和自动化脚本场景

本文以 qwen2.5:7b 为示例。


五、安装 Docker 与 Docker Compose

以下命令以 Ubuntu 22.04 / 24.04 为例。

1. 更新系统

sudo apt update
sudo apt upgrade -y

2. 安装依赖

sudo apt install -y ca-certificates curl gnupg lsb-release git vim unzip

3. 添加 Docker 官方 GPG Key

sudo install -m 0755 -d /etc/apt/keyrings

curl -fsSL https://download.docker.com/linux/ubuntu/gpg \
  | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg

sudo chmod a+r /etc/apt/keyrings/docker.gpg

4. 添加 Docker 软件源

echo \
  "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg] \
  https://download.docker.com/linux/ubuntu \
  $(. /etc/os-release && echo "$VERSION_CODENAME") stable" \
  | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

5. 安装 Docker

sudo apt update

sudo apt install -y docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

6. 启动 Docker

sudo systemctl enable docker
sudo systemctl start docker

7. 验证安装

docker version
docker compose version

8. 将当前用户加入 Docker 用户组

sudo usermod -aG docker $USER

执行后建议重新登录服务器,或者执行:

newgrp docker

六、创建部署目录

sudo mkdir -p /opt/ai-browser
sudo chown -R $USER:$USER /opt/ai-browser
cd /opt/ai-browser

创建项目结构:

mkdir -p agent nginx data

最终目录类似:

/opt/ai-browser
├── docker-compose.yml
├── agent
│   ├── Dockerfile
│   ├── requirements.txt
│   └── app.py
├── nginx
│   └── default.conf
└── data

七、编写 Docker Compose 文件

创建 docker-compose.yml

cat > docker-compose.yml <<'EOF'
services:
  ollama:
    image: ollama/ollama:latest
    container_name: ai-browser-ollama
    restart: unless-stopped
    ports:
      - "11434:11434"
    volumes:
      - ollama_data:/root/.ollama

  open-webui:
    image: ghcr.io/open-webui/open-webui:main
    container_name: ai-browser-open-webui
    restart: unless-stopped
    ports:
      - "3000:8080"
    environment:
      - OLLAMA_BASE_URL=http://ollama:11434
      - WEBUI_AUTH=true
    volumes:
      - open_webui_data:/app/backend/data
    depends_on:
      - ollama

  browserless:
    image: browserless/chrome:latest
    container_name: ai-browser-chrome
    restart: unless-stopped
    ports:
      - "3001:3000"
    environment:
      - TOKEN=change-this-browserless-token
      - MAX_CONCURRENT_SESSIONS=5
      - CONNECTION_TIMEOUT=300000
      - DEFAULT_BLOCK_ADS=true
      - ENABLE_DEBUGGER=false
    shm_size: "2gb"

  agent:
    build:
      context: ./agent
    container_name: ai-browser-agent
    restart: unless-stopped
    ports:
      - "8000:8000"
    environment:
      - OLLAMA_BASE_URL=http://ollama:11434
      - OLLAMA_MODEL=qwen2.5:7b
      - BROWSERLESS_WS=ws://browserless:3000?token=change-this-browserless-token
    depends_on:
      - ollama
      - browserless

volumes:
  ollama_data:
  open_webui_data:
EOF

注意:生产环境请务必将 change-this-browserless-token 修改为高强度随机字符串。

生成随机 Token:

openssl rand -hex 32

例如:

TOKEN_VALUE=$(openssl rand -hex 32)
echo $TOKEN_VALUE

然后替换文件中的 Token:

sed -i "s/change-this-browserless-token/$TOKEN_VALUE/g" docker-compose.yml

八、编写 AI Agent 服务

这个 Agent 服务提供一个简单的 HTTP API,用户提交任务后,服务会调用本地 Ollama 模型,并连接 Browserless Chrome 执行浏览器操作。

为了便于理解,本文实现一个基础版本:
它可以接收任务描述、目标网址,并返回模型生成的执行计划。后续你可以继续扩展为真正的 Playwright 自动操作流程。

1. 创建 requirements.txt

cat > agent/requirements.txt <<'EOF'
fastapi==0.115.6
uvicorn==0.34.0
requests==2.32.3
playwright==1.49.1
pydantic==2.10.4
EOF

2. 创建 app.py

cat > agent/app.py <<'EOF'
import os
import json
import requests
from fastapi import FastAPI
from pydantic import BaseModel
from playwright.async_api import async_playwright

OLLAMA_BASE_URL = os.getenv("OLLAMA_BASE_URL", "http://ollama:11434")
OLLAMA_MODEL = os.getenv("OLLAMA_MODEL", "qwen2.5:7b")
BROWSERLESS_WS = os.getenv("BROWSERLESS_WS", "ws://browserless:3000")

app = FastAPI(title="Private AI Browser Agent")


class BrowserTask(BaseModel):
    url: str
    task: str


def call_ollama(prompt: str) -> str:
    response = requests.post(
        f"{OLLAMA_BASE_URL}/api/generate",
        json={
            "model": OLLAMA_MODEL,
            "prompt": prompt,
            "stream": False
        },
        timeout=300
    )
    response.raise_for_status()
    return response.json().get("response", "")


@app.get("/health")
def health():
    return {
        "status": "ok",
        "model": OLLAMA_MODEL,
        "ollama": OLLAMA_BASE_URL
    }


@app.post("/plan")
def plan(task: BrowserTask):
    prompt = f"""
你是一个企业内部 AI 浏览器助手。
用户希望你访问网页并完成任务。

目标网址:
{task.url}

用户任务:
{task.task}

请你输出一个详细的浏览器操作计划,要求:
1. 使用步骤列表;
2. 明确每一步要点击、输入或读取什么;
3. 如果需要登录,提醒用户准备账号;
4. 不要编造网页上不存在的信息;
5. 输出中文。
"""
    result = call_ollama(prompt)
    return {
        "url": task.url,
        "task": task.task,
        "plan": result
    }


@app.post("/snapshot")
async def snapshot(task: BrowserTask):
    async with async_playwright() as p:
        browser = await p.chromium.connect_over_cdp(BROWSERLESS_WS)
        page = await browser.new_page()
        await page.goto(task.url, wait_until="domcontentloaded", timeout=60000)

        title = await page.title()
        text = await page.locator("body").inner_text(timeout=60000)

        await browser.close()

    text = text[:6000]

    prompt = f"""
你是一个网页内容分析助手。
下面是用户任务和网页正文,请根据网页内容回答用户问题。

用户任务:
{task.task}

网页标题:
{title}

网页正文:
{text}

要求:
1. 只基于网页正文回答;
2. 不确定就说明不确定;
3. 输出中文;
4. 如适合,请用 Markdown 表格整理。
"""
    answer = call_ollama(prompt)

    return {
        "url": task.url,
        "title": title,
        "answer": answer
    }
EOF

3. 创建 Dockerfile

cat > agent/Dockerfile <<'EOF'
FROM python:3.11-slim

WORKDIR /app

ENV PYTHONDONTWRITEBYTECODE=1
ENV PYTHONUNBUFFERED=1

RUN apt-get update && apt-get install -y \
    wget \
    ca-certificates \
    fonts-noto-cjk \
    && rm -rf /var/lib/apt/lists/*

COPY requirements.txt /app/requirements.txt

RUN pip install --no-cache-dir -r /app/requirements.txt \
    && python -m playwright install --with-deps chromium

COPY app.py /app/app.py

EXPOSE 8000

CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "8000"]
EOF

九、启动服务

/opt/ai-browser 目录下执行:

docker compose up -d --build

查看容器状态:

docker compose ps

查看日志:

docker compose logs -f

单独查看 Ollama 日志:

docker logs -f ai-browser-ollama

十、下载本地大模型

进入 Ollama 容器:

docker exec -it ai-browser-ollama bash

下载模型:

ollama pull qwen2.5:7b

也可以下载其他模型:

ollama pull qwen2.5:14b
ollama pull llama3.1:8b
ollama pull qwen2.5-coder:7b
ollama pull deepseek-r1:7b

退出容器:

exit

在宿主机测试模型:

curl http://127.0.0.1:11434/api/generate \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen2.5:7b",
    "prompt": "请用一句话介绍什么是AI浏览器",
    "stream": false
  }'

如果能返回内容,说明 Ollama 已正常工作。


十一、访问 Open WebUI

浏览器访问:

http://服务器IP:3000

首次打开需要创建管理员账号。

创建完成后,可以在 Open WebUI 中选择 qwen2.5:7b 模型进行对话测试。

如果是内网部署,建议只允许内网网段访问,例如:

http://192.168.1.100:3000

十二、测试 AI Agent API

1. 健康检查

curl http://127.0.0.1:8000/health

正常返回示例:

{
  "status": "ok",
  "model": "qwen2.5:7b",
  "ollama": "http://ollama:11434"
}

2. 生成网页操作计划

curl -X POST http://127.0.0.1:8000/plan \
  -H "Content-Type: application/json" \
  -d '{
    "url": "https://example.com",
    "task": "打开页面,判断这个网站主要展示了什么内容"
  }'

返回内容中会包含 AI 生成的浏览器操作计划。

3. 抓取网页正文并让模型分析

curl -X POST http://127.0.0.1:8000/snapshot \
  -H "Content-Type: application/json" \
  -d '{
    "url": "https://example.com",
    "task": "总结这个页面的主要内容"
  }'

这个接口会实际打开网页,读取页面正文,然后调用本地大模型总结。


十三、启用 GPU 加速

如果服务器有 NVIDIA GPU,建议为 Ollama 开启 GPU 支持。

1. 安装 NVIDIA 驱动

先查看显卡:

lspci | grep -i nvidia

安装推荐驱动:

sudo ubuntu-drivers autoinstall
sudo reboot

重启后验证:

nvidia-smi

2. 安装 NVIDIA Container Toolkit

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey \
  | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg

curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list \
  | sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' \
  | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

sudo apt update
sudo apt install -y nvidia-container-toolkit

配置 Docker:

sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker

验证:

docker run --rm --gpus all nvidia/cuda:12.4.1-base-ubuntu22.04 nvidia-smi

3. 修改 docker-compose.yml

将 Ollama 服务改成如下形式:

  ollama:
    image: ollama/ollama:latest
    container_name: ai-browser-ollama
    restart: unless-stopped
    ports:
      - "11434:11434"
    volumes:
      - ollama_data:/root/.ollama
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]

然后重启:

docker compose down
docker compose up -d

查看 Ollama 是否使用 GPU:

docker logs -f ai-browser-ollama

也可以在另一个终端观察显存:

watch -n 1 nvidia-smi

十四、配置 Nginx 反向代理,可选

如果你希望通过统一域名访问服务,例如:

http://ai-browser.company.local

可以使用 Nginx 反向代理。

1. 安装 Nginx

sudo apt install -y nginx

2. 创建配置文件

sudo tee /etc/nginx/sites-available/ai-browser.conf > /dev/null <<'EOF'
server {
    listen 80;
    server_name ai-browser.company.local;

    client_max_body_size 100m;

    location /webui/ {
        proxy_pass http://127.0.0.1:3000/;
        proxy_http_version 1.1;
        proxy_set_header Host $host;
        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";
        proxy_set_header X-Real-IP $remote_addr;
    }

    location /agent/ {
        proxy_pass http://127.0.0.1:8000/;
        proxy_http_version 1.1;
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
    }
}
EOF

启用配置:

sudo ln -s /etc/nginx/sites-available/ai-browser.conf /etc/nginx/sites-enabled/ai-browser.conf
sudo nginx -t
sudo systemctl reload nginx

如果是内网域名,需要在 DNS 或本机 hosts 中添加解析。

例如本机测试:

sudo sh -c 'echo "192.168.1.100 ai-browser.company.local" >> /etc/hosts'

十五、安全加固建议

AI 浏览器具备“访问网页”和“自动操作”的能力,因此安全边界一定要设计清楚。

1. 不要直接暴露到公网

除非你已经做好认证、审计、限流、HTTPS 和访问控制,否则不建议将以下端口暴露到公网:

11434:Ollama
3000:Open WebUI
3001:Browserless
8000:Agent API

建议只允许内网访问。

2. 修改 Browserless Token

不要使用默认 Token。可以通过以下命令生成:

openssl rand -hex 32

然后写入 docker-compose.yml

3. 限制服务器防火墙

例如只允许内网访问:

sudo ufw allow from 192.168.0.0/16 to any port 3000
sudo ufw allow from 192.168.0.0/16 to any port 8000
sudo ufw allow from 192.168.0.0/16 to any port 11434
sudo ufw enable
sudo ufw status

如果通过 Nginx 统一代理,可以不开放容器端口给外部,只暴露 80 或 443。

4. 控制可访问域名

生产环境建议在 Agent 服务中增加域名白名单,例如只允许访问:

*.company.local
oa.company.local
crm.company.local
wiki.company.local

避免 AI 浏览器被滥用访问不可信网站。

5. 记录操作日志

建议记录:

  • 用户是谁;
  • 提交了什么任务;
  • 访问了哪个 URL;
  • AI 做了哪些操作;
  • 最终输出了什么;
  • 是否发生异常。

这对审计和问题排查非常重要。


十六、常见问题排查

1. Open WebUI 无法连接 Ollama

检查容器是否正常:

docker compose ps

检查 Ollama 日志:

docker logs ai-browser-ollama

检查 Open WebUI 环境变量:

docker inspect ai-browser-open-webui | grep OLLAMA_BASE_URL

如果修改过配置,重启服务:

docker compose restart open-webui

2. 模型响应很慢

可能原因:

  • 使用 CPU 跑大模型;
  • 内存不足;
  • 模型参数过大;
  • 并发请求过多。

解决方式:

docker stats

查看资源占用。如果没有 GPU,建议先使用小模型:

docker exec -it ai-browser-ollama ollama pull qwen2.5:7b

如果有 GPU,检查:

nvidia-smi

3. Browserless 无法打开页面

检查日志:

docker logs ai-browser-chrome

检查端口:

curl http://127.0.0.1:3001/json/version

如果访问内部系统失败,可能是容器 DNS 或网络策略问题。可以进入 Agent 容器测试:

docker exec -it ai-browser-agent bash

然后执行:

python -c "import requests; print(requests.get('https://example.com').status_code)"

4. 中文显示乱码

本文 Dockerfile 已安装:

fonts-noto-cjk

如果仍有问题,可以进入容器确认字体:

docker exec -it ai-browser-agent bash
fc-list | grep Noto

如缺少 fc-list,可安装字体工具。

5. Agent 接口报错

查看日志:

docker logs -f ai-browser-agent

重建 Agent:

docker compose build agent
docker compose up -d agent

十七、如何扩展为真正的“自动操作型”AI 浏览器?

本文示例中的 /snapshot 接口已经能够打开网页、读取正文并让模型分析。要进一步实现“自动点击、填写、提交”,可以继续扩展以下能力:

1. 增加页面元素提取

通过 Playwright 获取页面上的按钮、输入框、链接:

buttons = await page.locator("button").all_inner_texts()
links = await page.locator("a").all_inner_texts()
inputs = await page.locator("input").count()

2. 让模型输出结构化动作

要求模型输出 JSON,例如:

[
  {
    "action": "click",
    "selector": "text=登录"
  },
  {
    "action": "fill",
    "selector": "#username",
    "value": "admin"
  },
  {
    "action": "fill",
    "selector": "#password",
    "value": "******"
  }
]

3. Agent 执行动作

根据模型返回的动作调用 Playwright:

await page.click(selector)
await page.fill(selector, value)
await page.press(selector, "Enter")

4. 加入人工确认机制

对于高风险动作,例如:

  • 删除数据;
  • 提交审批;
  • 支付;
  • 修改权限;
  • 导出敏感数据;

必须增加人工确认。

建议策略:

低风险:AI 自动执行
中风险:AI 给出计划,用户确认后执行
高风险:只生成建议,不允许自动执行

十八、生产环境部署建议

如果要在企业内部正式使用,建议至少增加以下能力:

1. 用户认证

可以接入:

  • LDAP;
  • 企业微信;
  • 飞书;
  • 钉钉;
  • SSO;
  • OAuth2;
  • Keycloak。

2. 权限控制

不同用户可访问不同系统,例如:

用户角色 可访问范围
普通员工 知识库、公开业务系统
运营人员 CRM、工单系统
财务人员 财务系统
管理员 全部系统和配置后台

3. 任务队列

如果任务较多,建议引入队列:

  • Redis Queue;
  • Celery;
  • RabbitMQ;
  • Kafka。

避免所有任务同时执行,导致浏览器实例过多。

4. 会话隔离

每个用户使用独立浏览器上下文:

context = await browser.new_context()
page = await context.new_page()

任务结束后销毁上下文,避免 Cookie 混用。

5. 文件存储

如果 AI 浏览器需要下载文件或生成截图,可以挂载本地目录:

volumes:
  - ./data/downloads:/downloads

6. 审计与告警

建议记录所有任务并对异常行为告警,例如:

  • 访问了非白名单域名;
  • 高频提交表单;
  • 下载大量文件;
  • 多次登录失败;
  • 触发敏感关键词。

十九、升级与维护命令

查看所有容器

docker compose ps

查看资源占用

docker stats

重启全部服务

docker compose restart

停止服务

docker compose down

启动服务

docker compose up -d

更新镜像

docker compose pull
docker compose up -d

重新构建 Agent

docker compose build agent
docker compose up -d agent

备份数据卷

创建备份目录:

mkdir -p /opt/ai-browser-backup

备份 Ollama 数据:

docker run --rm \
  -v ai-browser_ollama_data:/data \
  -v /opt/ai-browser-backup:/backup \
  alpine \
  tar czf /backup/ollama_data_$(date +%F).tar.gz -C /data .

备份 Open WebUI 数据:

docker run --rm \
  -v ai-browser_open_webui_data:/data \
  -v /opt/ai-browser-backup:/backup \
  alpine \
  tar czf /backup/open_webui_data_$(date +%F).tar.gz -C /data .

查看备份文件:

ls -lh /opt/ai-browser-backup

二十、总结

本文提供了一套完整的 AI 浏览器私有化部署方案。通过 Ollama、本地大模型、Browserless Chrome、Python Agent 和 Docker Compose,可以在企业内网快速搭建一个可控、可扩展、可审计的 AI 浏览器基础平台。

这套方案的核心价值在于:

  1. 数据不出内网
    模型、浏览器、任务日志都可以部署在自己的服务器中。

  2. 可连接内部系统
    适合 OA、CRM、ERP、知识库、后台管理系统等场景。

  3. 可逐步扩展
    可以从网页总结开始,逐步扩展到点击、填写、下载、截图、巡检和自动化执行。

  4. 成本可控
    通过本地模型和私有算力降低长期使用成本。

  5. 安全边界清晰
    可结合白名单、权限控制、人工确认和审计日志,降低自动化操作风险。

如果只是做概念验证,可以直接按照本文命令部署。
如果要用于生产环境,建议进一步完善认证、权限、审计、任务队列、会话隔离和高风险操作确认机制。

最终,AI 浏览器不应该被简单理解为“会聊天的浏览器”,而应该被视为一种新的企业自动化入口:它连接用户意图、大语言模型、浏览器环境和内部业务系统,让大量重复性、流程化、网页化的工作逐步实现智能化。

目录结构
全文