大多数人跳过浏览器操作器。如何实现超越表面的研究？

ManusAI(@ManusAI_HQ)

ManusAI(@ManusAI_HQ)2026年5月8日

大多数人跳过浏览器操作器。如何实现超越表面的研究？

8.7Score

TL;DR · AI 摘要

ManusAI 的浏览器操作器通过授权本地浏览器环境，突破公开搜索限制，可访问需登录或订阅的私有数据，实现深度自动化研究与流程执行。

核心要点

浏览器操作器需手动授权，仅在用户许可下运行于本地 Chrome/Edge 环境。
可访问付费订阅、企业系统及需认证的政府门户等非公开数据源。
支持跨设备任务延续与移动端触发，任务状态可在不同终端无缝衔接。

结构提纲

按章节快速跳转。

§AI 研究的局限性
传统 AI 搜索受限于公开网页，无法访问需登录或订阅的私有内容，导致信息深度不足。
·浏览器操作器的核心机制
通过授权本地浏览器会话，AI 可以像用户一样操作网页，访问个人账户内所有可访问资源。
·权限控制与用户主权
所有操作必须经用户主动授权，且可随时中断或接管，确保全程可控。
·跨设备与移动端支持
任务可在工作电脑与个人设备间无缝迁移，支持手机端发起后台任务。
·典型应用场景举例
包括自动填写签证申请、提取政府税务文件、处理内部 HR 或财务系统流程。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

ManusAI 浏览器操作器（Browser Operator）
- 核心能力
  - 访问私有数据源
  - 跨设备任务同步
  - 移动端触发
- 安全机制
  - 用户主动授权
  - 实时中断与接管
  - 敏感操作暂停确认
- 典型应用
  - 政府门户文件提取
  - 企业系统自动化
  - 表单填写与流程导航

金句 / Highlights

值得收藏与分享的关键句。

真正影响决策的信息，藏在登录后、仪表盘中以及你已付费订阅的内容里。
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X
一旦授权浏览器操作器，它将在每个任务中运行于你的本地浏览器环境，操作你已能访问的网站。
— 第 3 段
⬇︎ 下载 PNG 𝕏 分享到 X
你可以在任何时刻中断并接管，清楚看到 Manus 当前所在的页面，并回溯每一步操作记录。
— 第 5 段
⬇︎ 下载 PNG 𝕏 分享到 X

#ManusAI#AI 自动化#浏览器操作器#网络研究#企业工具

打开原文

文章

大多数人跳过了浏览器操作员。以下是超越表层研究的方法。

让你的AI为你做研究，然后观察它遇到瓶颈。它调用搜索API，抓取几个公开页面，最后给你一份谷歌决定展示内容的礼貌摘要。真正能影响决策的关键信息，往往藏在登录后的内容、管理后台以及你已付费订阅的服务中——而这些，普通的聊天机器人根本无法触及。

但浏览器操作员可以弥合这一差距，且完全由你掌控。 一切操作只有在你明确授权后才会发生。一旦开启“我的浏览器”连接器并授予权限，Manus 就会在你本地的 Chrome 或 Edge 浏览器会话中运行，看到你所看到的一切，访问你所能访问的所有内容。正是这一转变——基于你自己的浏览器环境，并获得你的许可——解锁了此前根本无法实现的研究新类别。

为什么浏览器操作员能深入挖掘？

有时高价值的信息就隐藏在你已付费订阅的服务中，存在于企业系统内部，或位于需要身份验证才能进入的门户平台。这些内容都无法通过云端访问。一旦你授权浏览器操作员，它就能在每个任务中，于你本地的浏览器环境中执行操作，从而访问你日常使用的网站。

同样的能力也延伸到了专业自动化场景。通过 Manus API 触发浏览器操作员，可实现端到端的网页操作。这对那些从未开放公共 API 的内部公司工具尤其有用，例如老旧的人力资源门户、财务系统或政府网站。

通往长尾网络的导航指南

除了研究之外，浏览器操作员还悄然成为探索网络最复杂角落的向导。比如你需要从像 IRIS 这样的政府门户中提取一份深藏在三层菜单之后的税务文件。Manus 可以一步步点击导航，精准找到你所需的文件。又或者设想填写签证申请：Manus 能定位正确的模板文档，逐节引导填写表单，并标记出需要你输入信息的字段。它不再只是给你一段泛泛的说明文字，而是真正在你的浏览器中与你一同完成每一步操作。

这种可见性至关重要。你可以在任何时刻中断并接管控制，清楚知道 Manus 当前所在页面，并在任务完成后回溯每一步操作路径。如果遇到敏感步骤（如支付页面），Manus 会暂停等待你确认。整个过程，你始终掌握主导权。

随时随地运行，随时接管控制

浏览器操作员并不绑定单一设备。如果你在工作笔记本上启动一个任务，稍后可在个人设备上继续执行，无缝衔接。要启用此功能，请在 Manus 设置中打开“我的浏览器”连接器，点击“配置”，然后开启“允许跨浏览器任务”。启用后，Manus 可以驱动所有与你的账户关联的已授权浏览器会话——这在你于一台设备登录供应商门户，却希望在另一台设备上执行实际研究时非常实用；或当你想将繁重的自动化任务移出主工作机时尤为方便。

你甚至可以通过手机触发浏览器操作员。通勤途中，通过 Manus 移动应用发送一条指令，Manus 就会在你授权的桌面电脑上启动浏览器会话，并在后台完成任务。回到办公桌时，工作早已完成。

先授权你的浏览器

在让 Manus 代表你浏览之前，你必须先授予它使用本地会话的权限。整个过程不到一分钟，且全程由你掌控其访问范围。

打开你的 Manus 工作区，进入“连接器”标签页。
开启“我的浏览器”连接器，并为 Chrome 或 Edge 安装浏览器扩展。
启动一个新的提示，要求 Manus 使用你的浏览器。
当 Manus 请求权限接管新标签页时，点击“授权”。

三种使用浏览器操作员的方式

连接成功后，你可以将原本耗时数小时的多标签流程交由 Manus 处理。以下是我在研究中使用的三种方式，从简单的数据提取到完整的演示文稿构建，逐步递进。

规划团队出行并自动填写预订表单

规划一次团队外派活动通常需要在一台显示器上开着 Google 地图，在另一台显示器上切换浏览或 Airbnb。你需要权衡预算、用户评价和距离特定场地的距离，这意味着无穷无尽的交叉比对。

我把这些繁琐的分页操作交给 Manus 来处理。我输入提示：“我正在为同事预订酒店，因此请忽略中可能预填的账户信息，仅使用我稍后提供的客人信息。使用‘我的浏览器’在芝加哥市中心搜索 10 月 12 日至 15 日的酒店，筛选四星级及以上、每晚价格低于 300 美元的选项。对前 3 名结果，使用 Google 地图检查步行至麦考密克会展中心的距离。在此聊天中总结前三名的结果，包括价格、评分和步行时间，以便我做出选择。”

Manus 打开预订网站，设置好我的入住日期和筛选条件，然后进入地图页面验证通勤时间，最终直接在 Manus 聊天中返回一份清晰的前三名汇总。选定酒店后，我发送一条后续提示，要求 Manus 开始预订并填写客人信息。当系统停在信用卡支付页面时，它会暂停，让我接管浏览器，自行安全地完成付款。

无需在标签页间混乱切换，快速生成采购候选清单

当需要大批量采购设备时，调研阶段通常会耗掉半天时间。你得逐个点击零售商页面，避开广告推广内容，将价格复制到表格中，再浏览数百条评价，试图找出耐用性或组装方面的潜在问题，才能决定是否下单。

现在，我把整个调研过程交给 Manus 完成。我输入指令：“我正在为公司办公区建设采购升降桌。请使用我的浏览器搜索沃尔玛，跳过广告结果，打开前4个自然排名的页面。针对每个产品，提取价格和平均评分，并总结出前三条最关键的用户评价，让我能提前识别耐用性或组装方面的问题。最后生成一张清晰的对比表格，我可以直接插入采购简报中。”

Manus 在我当前活跃的浏览器标签页中打开零售商页面，自动过滤掉广告内容，并逐一处理每个商品详情页。它利用原生的广域研究能力读取每一条评论，随后将价格、评分和潜在风险点整理成一张结构清晰的对比表格。我获得了一份可直接决策的候选清单，完全无需自己手动打开任何标签页。

从你在 Substack 上阅读的新闻简报中提取研究摘要

我关注的领域中最深刻的分析，往往藏在 Substack 上的新闻简报里。Lenny 的新闻简报就是其中之一。其存档中充满了关于 AI 代理、变现模式和产品战略的文章，我希望能从中汲取灵感，但几乎从未有时间坐下来，一个接一个打开这些文章，提取真正与当前问题相关的内容。

于是我让 Manus 代我完成这次调研。我输入提示：“我正在构建一个关于 AI 如何重塑产品变现与代理策略的观点。请使用我的浏览器打开 Substack，进入 Lenny 的新闻简报，查找过去 30 天内最相关的文章，全文阅读，并提炼出核心论点。我希望得到一个仪表板，展示最强有力的主张、每位作者所依据的支持证据，以及各篇文章中共同浮现的待解问题。”

由于 Manus 运行在我的授权浏览器会话中，它能无缝继承我已登录的状态。如果某份简报是我订阅的，Manus 可以像我本人从邮箱点击进入一样，直接打开完整文章。它逐篇通读，然后将观点整合成一份清晰的仪表板，清晰呈现最强主张、背后的证据支撑，以及值得进一步深入探究的问题。我获得了一份高质量的研究摘要，内容来自我原本就关注的写作资源。

一个拥有“双手”的智能体

真正的 AI 智能体不应只存在于聊天窗口中。一个真正有能力的智能体需要一个可用的工作环境：一个可以运行代码的沙箱、一个能浏览网页的浏览器，以及连接外部服务的接口。这些就是智能体的“双手”。当智能体能够使用浏览器时，它便不再只是总结信息，而是能够基于信息采取行动。

由于浏览器操作器直接运行在你的本地浏览器环境中，它也严格遵守你的边界。所有敏感数据不会离开你的设备，智能体仅能访问你授权的内容。这种协作模式建立在透明之上：你可以实时观察它的操作，随时中断，或在遇到敏感步骤（如支付页面）时亲自接管。自动化不该是黑箱，而应是一个你愿意托付真实任务、且始终掌握控制权的可靠伙伴。