上一篇 下一篇 分享链接 返回 返回顶部

AI浏览器这一年:功能升级、Agent能力与插件源码实战汇总

发布人:慈云数据-客服中心 发布时间:2小时前 阅读量:0

AI浏览器 最新更新内容汇总|附源码

在过去一年里,“AI浏览器”逐渐从一个概念产品,变成了许多开发者、内容创作者、研究人员和企业团队日常工作中的新工具。传统浏览器主要解决“访问网页、管理标签页、收藏信息、下载文件”等问题,而AI浏览器进一步把大模型能力融入浏览场景:它不仅能打开网页,还能理解网页、总结内容、提取数据、辅助搜索、自动填写表单、生成回复,甚至帮助用户完成跨页面的复杂任务。

本文将围绕“AI浏览器”的最新更新方向进行系统梳理,包括功能升级、交互变化、隐私安全、插件生态、Agent能力、网页理解能力等内容。同时,文章后半部分会附上一份可运行的简化版“AI浏览器”源码示例,帮助你理解AI浏览器的基本实现思路。


一、AI浏览器是什么?

所谓AI浏览器,并不是简单地在浏览器里接入一个聊天机器人,而是将大语言模型、多模态理解、网页解析、任务自动化等能力与浏览器核心功能深度结合。

传统浏览器的工作方式通常是:

  1. 用户输入网址或搜索关键词;
  2. 浏览器加载网页;
  3. 用户阅读、点击、复制、收藏;
  4. 用户在不同页面之间手动完成任务。

而AI浏览器的工作方式更接近:

  1. 用户提出目标,例如“帮我总结这篇文章”“帮我比较这三款产品”“帮我找出页面里的联系方式”;
  2. AI自动读取当前页面内容;
  3. AI理解网页结构、文本、图片和表格;
  4. AI根据用户意图给出答案,甚至执行下一步操作。

因此,AI浏览器的核心价值不是“打开网页”,而是“理解网页并协助完成任务”。


二、最新更新内容汇总

下面从多个维度汇总AI浏览器近期比较典型的更新内容。


1. 网页内容理解能力增强

早期的AI浏览器通常只能读取网页中的纯文本内容,对于复杂网页、动态加载内容、表格、代码块、评论区、弹窗等支持并不稳定。

最新版本的AI浏览器在网页理解方面有明显提升,主要体现在以下几个方面:

1.1 支持结构化解析网页

新版本不再只是粗暴提取网页文本,而是会识别页面结构,例如:

  • 标题;
  • 副标题;
  • 正文段落;
  • 表格;
  • 列表;
  • 代码块;
  • 图片说明;
  • 链接;
  • 评论内容;
  • 商品参数;
  • 时间、作者、来源等元信息。

这样做的好处是,AI在总结网页时能够更准确地区分“正文内容”和“无关内容”。例如广告栏、导航栏、页脚、推荐文章等内容,不会轻易被混入总结结果。

1.2 支持长网页分段理解

很多网页内容非常长,例如技术文档、政策文件、学术文章、新闻专题等。如果直接把整个网页内容塞给模型,可能会超出上下文长度限制,也会导致回答不稳定。

新的AI浏览器通常采用“分块解析 + 向量检索 + 上下文拼接”的方式:

  1. 先将网页内容拆分为多个语义片段;
  2. 对每个片段进行向量化;
  3. 当用户提问时,只检索与问题最相关的片段;
  4. 把相关片段发送给模型生成答案。

这种方式既节省Token,又能提升问答准确率。

1.3 支持多语言网页理解

AI浏览器现在通常支持中英日韩法德西等多种语言网页总结。用户可以打开英文文档,然后直接用中文提问,例如:

“这篇英文文章主要讲了什么?”
“帮我提取其中关于性能优化的建议。”
“把结论部分翻译成中文。”

这对于开发者查阅英文技术资料、外贸人员浏览海外网站、研究人员阅读外文论文都非常有帮助。


2. 页面总结功能升级

网页总结是AI浏览器最常用的功能之一。最新版本的页面总结已经不再局限于“生成一段摘要”,而是提供了多种输出模式。

2.1 一键摘要

用户打开网页后,可以直接点击“总结当前页面”,AI会自动输出:

  • 文章主题;
  • 核心观点;
  • 关键结论;
  • 适合人群;
  • 重点内容;
  • 可能的争议点。

这种功能适合快速判断网页是否值得深入阅读。

2.2 分层总结

对于长文内容,AI浏览器可以生成分层摘要,例如:

## 文章概览
本文主要讨论……

## 核心观点
1. ……
2. ……
3. ……

## 关键细节
- ……
- ……

## 作者结论
作者认为……

## 我的建议
如果你是初学者,可以重点关注……

相比一段式总结,分层总结更加清晰,便于用户快速定位信息。

2.3 面向不同角色的总结

新的AI浏览器还支持根据用户角色生成不同版本的总结。例如同一篇技术文章,可以生成:

  • 给产品经理看的版本;
  • 给开发者看的版本;
  • 给运营人员看的版本;
  • 给老板看的版本;
  • 给学生看的版本。

这体现了AI浏览器从“内容压缩工具”向“个性化理解助手”的升级。


3. AI搜索能力升级

传统搜索引擎主要返回网页列表,用户需要自己点击、阅读、判断。而AI浏览器通常会把搜索、阅读和回答结合起来。

3.1 搜索结果自动整理

当用户搜索一个问题时,AI浏览器可以自动读取多个搜索结果,并输出结构化答案。例如:

“2025年适合学习的前端框架有哪些?”

AI浏览器可能会自动整理:

框架 特点 适合人群 学习难度
React 生态成熟 前端开发者 中等
Vue 上手简单 初学者、中小团队 较低
Svelte 编译型框架 追求性能的开发者 中等
Solid 响应式细粒度更新 高性能场景 较高

这种方式比单纯返回链接更高效。

3.2 支持来源引用

为了降低AI幻觉风险,新的AI浏览器会在回答中附带引用来源,例如:

根据页面A的介绍……
根据页面B的测试数据……
根据官方文档……

部分产品还会在答案旁边标注来源编号,用户点击即可跳转到原网页对应位置。

3.3 支持追问式搜索

用户不再需要每次重新输入完整搜索词,而是可以连续追问:

“只看开源方案。”
“哪个更适合个人开发者?”
“帮我生成一个学习路线。”
“再给我推荐三篇教程。”

AI浏览器会保留上下文,使搜索过程变成一次连续对话。


4. Agent自动化任务能力增强

AI浏览器最值得关注的升级方向,是Agent能力。所谓Agent,可以理解为能够根据目标自动规划步骤、调用工具并执行操作的AI助手。

4.1 自动操作网页

最新AI浏览器已经可以在一定程度上执行网页操作,例如:

  • 点击按钮;
  • 填写输入框;
  • 选择下拉菜单;
  • 提交表单;
  • 翻页;
  • 下载文件;
  • 复制指定内容;
  • 根据条件筛选列表。

例如用户输入:

“帮我在这个页面筛选价格低于500元、评分高于4.5的商品。”

AI浏览器可以尝试自动操作筛选条件,并整理最终结果。

4.2 多步骤任务规划

过去的AI工具大多只能回答问题,而Agent型AI浏览器可以拆解任务。例如:

“帮我找三款适合远程办公的降噪耳机,并整理价格、续航、优缺点。”

AI可能会执行如下步骤:

  1. 搜索相关产品;
  2. 打开多个评测页面;
  3. 提取产品参数;
  4. 对比价格和用户评价;
  5. 生成表格;
  6. 输出购买建议。

这种能力非常适合资料收集、竞品分析、信息比对等场景。

4.3 人工确认机制

由于自动化操作可能涉及支付、提交、删除等高风险行为,新版AI浏览器一般会加入人工确认机制。例如:

  • 自动填写可以执行;
  • 自动提交需要用户确认;
  • 涉及付款必须用户手动确认;
  • 涉及删除、发布、发送邮件等敏感操作需要二次确认。

这也是AI浏览器走向实际生产力工具的重要保障。


5. 隐私与安全更新

AI浏览器读取网页内容、分析用户行为,因此隐私安全非常关键。近期更新中,隐私保护已经成为重要方向。

5.1 本地解析优先

一些AI浏览器开始采用本地优先策略:

  • 页面DOM结构在本地解析;
  • 敏感字段本地过滤;
  • 只把必要文本发送给模型;
  • 用户可以手动选择是否上传网页内容。

这种方式可以减少不必要的数据暴露。

5.2 敏感信息识别

新的AI浏览器会自动识别并遮蔽敏感信息,例如:

  • 手机号;
  • 邮箱;
  • 身份证号;
  • 银行卡号;
  • 地址;
  • Cookie;
  • Token;
  • 密码字段;
  • 企业内部系统数据。

在发送给AI模型之前,系统会将这些内容替换为占位符,例如:

[PHONE_NUMBER]
[EMAIL]
[TOKEN]

5.3 权限分级

AI浏览器的插件或AI助手不应默认拥有所有权限。较新的设计会区分:

  • 当前页面读取权限;
  • 所有网页读取权限;
  • 剪贴板权限;
  • 文件下载权限;
  • 表单填写权限;
  • 自动点击权限;
  • 网络请求权限。

用户可以按需授权,降低安全风险。


6. 插件生态与开发者工具升级

AI浏览器不只是终端用户工具,也逐渐成为开发者平台。

6.1 支持自定义Prompt

很多AI浏览器支持用户创建自己的Prompt模板,例如:

请你作为一名资深产品经理,阅读当前网页,并按照以下格式输出:

1. 页面目标用户:
2. 核心卖点:
3. 转化路径:
4. 可能的优化点:
5. 可复用的文案:

这样用户可以把固定工作流沉淀为模板,提高效率。

6.2 支持自定义工具

开发者可以为AI浏览器扩展工具,例如:

  • 查询数据库;
  • 调用内部API;
  • 生成报表;
  • 连接知识库;
  • 执行脚本;
  • 调用企业系统。

这意味着AI浏览器未来可能成为企业内部工作流入口。

6.3 面向开发者的调试面板

一些AI浏览器增加了开发者调试功能:

  • 查看AI读取了哪些网页内容;
  • 查看Prompt构造过程;
  • 查看模型调用日志;
  • 查看Token消耗;
  • 查看工具调用结果;
  • 查看失败原因。

这对于企业落地和插件开发都非常重要。


7. 多模态能力更新

随着多模态模型的发展,AI浏览器不再只理解文字,也开始理解图片、截图和页面布局。

7.1 截图问答

用户可以圈选页面某个区域,然后提问:

“这个图表说明了什么?”
“这张流程图的关键步骤是什么?”
“帮我把图片里的表格转成Markdown。”

AI浏览器会读取截图内容并进行解释。

7.2 图片内容提取

对于电商页面、设计网站、数据看板,很多关键信息并不在HTML文本中,而是在图片里。多模态AI浏览器可以识别图片中的文字、图表、颜色、布局等信息。

7.3 页面视觉理解

未来AI浏览器不仅会读取DOM,还会理解页面视觉结构。例如:

  • 哪些内容是主视觉;
  • 哪个按钮最重要;
  • 页面转化路径是什么;
  • 用户视线可能如何移动;
  • 页面设计是否存在可用性问题。

这对设计评审、落地页优化、广告分析都很有价值。


三、AI浏览器典型应用场景

AI浏览器的应用范围非常广,下面列举几个高频场景。


1. 学习与资料阅读

学生、研究人员、开发者可以用AI浏览器快速阅读长文档、论文、博客和技术文档。

常见操作包括:

  • 总结文章;
  • 翻译段落;
  • 提取术语;
  • 解释代码;
  • 生成学习笔记;
  • 制作思维导图大纲;
  • 根据文章生成问答题。

2. 内容创作

内容创作者可以用AI浏览器进行选题、资料整理和文章改写。

例如:

  • 阅读多篇竞品文章;
  • 提取爆款标题;
  • 总结用户评论;
  • 生成文章大纲;
  • 改写成小红书、公众号、知乎风格;
  • 提取数据和案例。

3. 电商与价格比较

AI浏览器可以帮助用户比较商品:

  • 提取商品参数;
  • 整理价格;
  • 对比评价;
  • 总结优缺点;
  • 判断是否值得购买;
  • 查找替代品。

对于采购、选品、电商运营人员来说,这类能力非常实用。


4. 企业办公

企业内部可以利用AI浏览器处理:

  • CRM页面总结;
  • 工单分析;
  • 合同阅读;
  • 竞品监控;
  • 招聘简历筛选;
  • 内部知识库问答;
  • 数据报表解释。

如果结合企业私有模型和内部权限系统,AI浏览器有机会成为企业知识工作入口。


四、AI浏览器的实现原理

一个简化版AI浏览器通常包括以下模块:

  1. 页面加载模块:负责打开网页;
  2. 内容提取模块:从网页中提取正文;
  3. 清洗模块:过滤导航、广告、脚本等无关内容;
  4. AI调用模块:将内容发送给大模型;
  5. 交互模块:用户输入问题,AI返回回答;
  6. 安全模块:过滤敏感信息;
  7. 历史记录模块:保存对话上下文。

如果是浏览器插件形式,还需要:

  • manifest.json
  • content script;
  • background service worker;
  • popup页面;
  • 权限声明;
  • 消息通信机制。

下面提供一个基于Chrome Extension Manifest V3的简化示例,实现“读取当前网页正文并调用AI总结”的功能。


五、AI浏览器插件源码示例

说明:以下代码是教学示例,便于理解AI浏览器的基础架构。实际生产环境需要增加错误处理、权限控制、流式输出、Token截断、敏感信息过滤、用户配置等功能。


1. 项目目录结构

ai-browser-extension/
├── manifest.json
├── popup.html
├── popup.js
├── content.js
├── background.js
└── style.css

2. manifest.json

{
  "manifest_version": 3,
  "name": "Mini AI Browser Assistant",
  "version": "1.0.0",
  "description": "一个简化版AI浏览器助手,可读取当前网页并生成摘要。",
  "permissions": [
    "activeTab",
    "scripting",
    "storage"
  ],
  "host_permissions": [
    ""
  ],
  "action": {
    "default_popup": "popup.html",
    "default_title": "AI浏览器助手"
  },
  "background": {
    "service_worker": "background.js"
  },
  "content_scripts": [
    {
      "matches": [
        ""
      ],
      "js": [
        "content.js"
      ],
      "run_at": "document_idle"
    }
  ]
}

3. popup.html




  
  AI浏览器助手
  


  

AI浏览器助手

AI结果

等待操作...

4. style.css

body {
  margin: 0;
  padding: 0;
  width: 380px;
  font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Arial, sans-serif;
  background: #f6f7fb;
  color: #222;
}

.app {
  padding: 16px;
}

h1 {
  font-size: 18px;
  margin: 0 0 16px;
}

h2 {
  font-size: 15px;
  margin: 0 0 8px;
}

.section {
  margin-bottom: 14px;
  padding: 12px;
  background: #fff;
  border-radius: 10px;
  box-shadow: 0 1px 4px rgba(0,0,0,0.06);
}

label {
  display: block;
  margin-bottom: 6px;
  font-size: 13px;
  color: #555;
}

input,
textarea {
  width: 100%;
  box-sizing: border-box;
  border: 1px solid #ddd;
  border-radius: 8px;
  padding: 8px;
  outline: none;
  font-size: 13px;
}

textarea {
  min-height: 70px;
  resize: vertical;
}

button {
  margin-top: 8px;
  margin-right: 6px;
  border: none;
  border-radius: 8px;
  padding: 8px 10px;
  background: #2563eb;
  color: #fff;
  cursor: pointer;
  font-size: 13px;
}

button:hover {
  background: #1d4ed8;
}

pre {
  white-space: pre-wrap;
  word-break: break-word;
  font-size: 13px;
  line-height: 1.6;
  max-height: 360px;
  overflow: auto;
}

5. content.js

function getMainText() {
  const clonedBody = document.body.cloneNode(true);

  const removeSelectors = [
    "script",
    "style",
    "noscript",
    "iframe",
    "svg",
    "canvas",
    "nav",
    "footer",
    "header",
    "aside",
    "form",
    "button"
  ];

  removeSelectors.forEach(selector => {
    clonedBody.querySelectorAll(selector).forEach(el => el.remove());
  });

  const title = document.title || "";
  const h1 = document.querySelector("h1")?.innerText || "";

  let text = clonedBody.innerText || "";
  text = text
    .replace(/\n{3,}/g, "\n\n")
    .replace(/[ \t]{2,}/g, " ")
    .trim();

  const maxLength = 12000;
  if (text.length > maxLength) {
    text = text.slice(0, maxLength) + "\n\n[内容过长,已截断]";
  }

  return {
    url: location.href,
    title,
    h1,
    text
  };
}

chrome.runtime.onMessage.addListener((message, sender, sendResponse) => {
  if (message.type === "GET_PAGE_TEXT") {
    const pageData = getMainText();
    sendResponse(pageData);
  }

  return true;
});

6. popup.js

const apiKeyInput = document.getElementById("apiKey");
const saveKeyBtn = document.getElementById("saveKeyBtn");
const summaryBtn = document.getElementById("summaryBtn");
const extractBtn = document.getElementById("extractBtn");
const askBtn = document.getElementById("askBtn");
const questionInput = document.getElementById("question");
const resultEl = document.getElementById("result");

async function getCurrentTab() {
  const tabs = await chrome.tabs.query({
    active: true,
    currentWindow: true
  });

  return tabs[0];
}

async function getPageText() {
  const tab = await getCurrentTab();

  return await chrome.tabs.sendMessage(tab.id, {
    type: "GET_PAGE_TEXT"
  });
}

async function getApiKey() {
  const data = await chrome.storage.local.get(["apiKey"]);
  return data.apiKey;
}

async function saveApiKey() {
  const apiKey = apiKeyInput.value.trim();

  if (!apiKey) {
    alert("请输入API Key");
    return;
  }

  await chrome.storage.local.set({ apiKey });
  alert("保存成功");
}

async function callAI(prompt) {
  const apiKey = await getApiKey();

  if (!apiKey) {
    throw new Error("请先保存API Key");
  }

  const response = await chrome.runtime.sendMessage({
    type: "CALL_AI",
    payload: {
      apiKey,
      prompt
    }
  });

  if (!response.ok) {
    throw new Error(response.error || "AI调用失败");
  }

  return response.data;
}

function buildSummaryPrompt(pageData) {
  return `
你是一名专业的网页阅读助手。请阅读以下网页内容,并用中文输出结构化摘要。

要求:
1. 先给出一句话总结;
2. 再列出5个核心要点;
3. 提取重要数据、观点或结论;
4. 给出适合阅读人群;
5. 如果内容不足,请说明原因。

网页标题:${pageData.title}
网页H1:${pageData.h1}
网页URL:${pageData.url}

网页内容:
${pageData.text}
`;
}

function buildExtractPrompt(pageData) {
  return `
请从以下网页中提取关键信息,并按照Markdown格式输出。

输出格式:
## 关键信息
- ...

## 重要概念
- ...

## 可执行建议
- ...

## 可能的风险或限制
- ...

网页标题:${pageData.title}
网页URL:${pageData.url}

网页内容:
${pageData.text}
`;
}

function buildAskPrompt(pageData, question) {
  return `
你是一名AI浏览器助手。请只根据给定网页内容回答用户问题。
如果网页内容中没有相关信息,请明确说明“当前网页未提供足够信息”。

网页标题:${pageData.title}
网页URL:${pageData.url}

网页内容:
${pageData.text}

用户问题:
${question}
`;
}

async function handleSummary() {
  try {
    resultEl.textContent = "正在读取网页内容...";
    const pageData = await getPageText();

    resultEl.textContent = "正在生成摘要...";
    const prompt = buildSummaryPrompt(pageData);

    const answer = await callAI(prompt);
    resultEl.textContent = answer;
  } catch (error) {
    resultEl.textContent = `错误:${error.message}`;
  }
}

async function handleExtract() {
  try {
    resultEl.textContent = "正在读取网页内容...";
    const pageData = await getPageText();

    resultEl.textContent = "正在提取关键信息...";
    const prompt = buildExtractPrompt(pageData);

    const answer = await callAI(prompt);
    resultEl.textContent = answer;
  } catch (error) {
    resultEl.textContent = `错误:${error.message}`;
  }
}

async function handleAsk() {
  try {
    const question = questionInput.value.trim();

    if (!question) {
      alert("请输入问题");
      return;
    }

    resultEl.textContent = "正在读取网页内容...";
    const pageData = await getPageText();

    resultEl.textContent = "正在回答问题...";
    const prompt = buildAskPrompt(pageData, question);

    const answer = await callAI(prompt);
    resultEl.textContent = answer;
  } catch (error) {
    resultEl.textContent = `错误:${error.message}`;
  }
}

async function init() {
  const apiKey = await getApiKey();

  if (apiKey) {
    apiKeyInput.value = apiKey;
  }

  saveKeyBtn.addEventListener("click", saveApiKey);
  summaryBtn.addEventListener("click", handleSummary);
  extractBtn.addEventListener("click", handleExtract);
  askBtn.addEventListener("click", handleAsk);
}

init();

7. background.js

下面的示例使用兼容OpenAI风格的接口。你可以根据自己的模型服务修改API_URL和请求参数。

const API_URL = "https://api.openai.com/v1/chat/completions";

chrome.runtime.onMessage.addListener((message, sender, sendResponse) => {
  if (message.type === "CALL_AI") {
    const { apiKey, prompt } = message.payload;

    fetch(API_URL, {
      method: "POST",
      headers: {
        "Content-Type": "application/json",
        "Authorization": `Bearer ${apiKey}`
      },
      body: JSON.stringify({
        model: "gpt-4o-mini",
        messages: [
          {
            role: "system",
            content: "你是一个专业、严谨、擅长总结网页内容的AI浏览器助手。"
          },
          {
            role: "user",
            content: prompt
          }
        ],
        temperature: 0.3
      })
    })
      .then(async res => {
        if (!res.ok) {
          const errText = await res.text();
          throw new Error(errText);
        }

        return res.json();
      })
      .then(data => {
        const content = data.choices?.[0]?.message?.content || "未获取到AI回复";

        sendResponse({
          ok: true,
          data: content
        });
      })
      .catch(error => {
        sendResponse({
          ok: false,
          error: error.message
        });
      });

    return true;
  }
});

六、如何安装和运行

1. 创建项目

新建一个文件夹:

mkdir ai-browser-extension
cd ai-browser-extension

然后按照上面的目录结构创建对应文件。


2. 打开Chrome扩展管理页面

在Chrome地址栏输入:

chrome://extensions/

打开右上角的“开发者模式”。


3. 加载插件

点击“加载已解压的扩展程序”,选择你的ai-browser-extension文件夹。

加载成功后,浏览器右上角会出现插件图标。


4. 使用插件

使用步骤如下:

  1. 打开任意网页;
  2. 点击插件图标;
  3. 输入并保存API Key;
  4. 点击“总结当前网页”;
  5. 等待AI返回结果;
  6. 也可以在输入框中对当前网页继续提问。

七、源码可继续优化的方向

上面的源码只是一个最小可用版本。如果想把它扩展成更接近真实AI浏览器的产品,可以从以下几个方向继续优化。


1. 增加敏感信息过滤

在发送网页内容给AI之前,可以增加正则匹配,过滤手机号、邮箱、Token等内容。

示例:

function maskSensitiveInfo(text) {
  return text
    .replace(/[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}/g, "[EMAIL]")
    .replace(/1[3-9]\d{9}/g, "[PHONE]")
    .replace(/Bearer\s+[A-Za-z0-9._-]+/g, "Bearer [TOKEN]")
    .replace(/sk-[A-Za-z0-9]{20,}/g, "[API_KEY]");
}

然后在content.js中调用:

text = maskSensitiveInfo(text);

2. 增加网页分块

当网页内容很长时,直接截断会损失信息。可以改成分块处理:

function chunkText(text, chunkSize = 3000) {
  const chunks = [];

  for (let i = 0; i < text.length; i += chunkSize) {
    chunks.push(text.slice(i, i + chunkSize));
  }

  return chunks;
}

进一步可以先对每个分块生成摘要,再对多个摘要进行二次总结。


3. 增加流式输出

目前示例是等待完整结果返回后一次性显示。真实产品中,流式输出体验更好,用户可以看到内容逐字生成。

可以使用ReadableStream处理SSE响应,不过Chrome扩展中需要注意service worker生命周期问题。


4. 增加右键菜单

用户可以选中网页中的一段文字,然后右键选择:

  • 总结选中内容;
  • 翻译选中内容;
  • 解释选中内容;
  • 改写选中内容;
  • 提取关键词。

这会比只总结整页更加灵活。


5. 增加历史记录

可以把用户的问题和AI回答保存到本地:

async function saveHistory(item) {
  const data = await chrome.storage.local.get(["history"]);
  const history = data.history || [];

  history.unshift({
    ...item,
    time: new Date().toISOString()
  });

  await chrome.storage.local.set({
    history: history.slice(0, 50)
  });
}

6. 增加自定义Prompt模板

用户可以保存常用模板,例如:

  • 技术文章总结;
  • 竞品分析;
  • SEO分析;
  • 产品卖点提取;
  • 学习笔记生成;
  • 论文摘要;
  • 电商评论分析。

这会显著提升AI浏览器的实用性。


八、AI浏览器未来趋势

AI浏览器仍处于快速发展阶段。未来可能出现以下趋势:

1. 从“网页总结”走向“任务完成”

简单总结只是第一阶段。真正有价值的是让AI帮助用户完成完整任务,例如完成调研、整理报告、提交表单、生成邮件、对比报价等。

2. 从“单页面理解”走向“多页面协作”

未来AI浏览器会同时理解多个标签页内容,并进行跨页面比较。例如:

“帮我对比这三个标签页中的产品参数,并推荐最值得购买的一款。”

3. 从“云端模型”走向“端云结合”

隐私敏感场景会更多采用本地小模型,复杂推理任务再调用云端大模型。端云结合可以兼顾成本、速度和隐私。

4. 从“插件形态”走向“系统级入口”

AI浏览器可能会成为操作系统、办公套件和企业平台的重要入口。用户不再需要频繁切换应用,而是通过一个AI浏览器完成信息获取、理解、整理和执行。

5. 从“被动助手”走向“主动助手”

未来AI浏览器可能会主动提醒用户:

  • 当前网页是否可信;
  • 商品价格是否偏高;
  • 文章观点是否存在偏见;
  • 表单是否可能泄露隐私;
  • 页面是否包含钓鱼风险;
  • 某个操作是否存在安全隐患。

九、总结

AI浏览器的本质,是让浏览器从“网页访问工具”升级为“智能任务助手”。它通过网页理解、AI搜索、内容总结、问答交互、自动化操作和多模态识别,把用户从大量重复阅读和机械操作中解放出来。

从最新更新来看,AI浏览器正在经历几个重要变化:

  1. 网页解析更加结构化;
  2. 页面总结更加个性化;
  3. AI搜索更加接近直接答案;
  4. Agent能力逐渐成熟;
  5. 隐私安全机制不断完善;
  6. 插件生态开始形成;
  7. 多模态理解成为新方向。

本文附带的源码示例展示了一个最小可用AI浏览器助手的实现方式:通过Chrome扩展读取当前网页内容,再调用大模型生成摘要或回答问题。虽然示例较简单,但它已经覆盖了AI浏览器的核心链路:网页读取、内容清洗、Prompt构造、模型调用和结果展示。

如果你想继续深入,可以在此基础上加入分块摘要、向量检索、右键菜单、历史记录、自定义Prompt、敏感信息过滤和网页自动化操作。随着大模型能力进一步提升,AI浏览器很可能成为下一代互联网入口之一。

目录结构
全文