跳到主要内容

Chrome 中的 Claude 与计算机操作

进阶

Claude 能做的不只是对话——它还能操作软件:在浏览器中读取并对网页执行操作,或控制一台计算机(移动光标、点击、输入)以跨应用完成任务。这很强大,也值得了解其防护机制。

两项相关的能力

  • Chrome 中的 Claude——一个浏览器端智能体,可以读取当前页面并代你在其中执行操作(导航、点击、填写表单)。
  • 计算机操作——对桌面进行更通用的控制(截图 + 鼠标/键盘),用于操作原生应用和跨应用的工作流。

把它们用在那些原本繁琐的事情上:跨页面收集信息、填写重复性表单、多步骤的网页任务。

安全模型(请先阅读此处)

让 AI 代你点击和输入,恰恰是提示词注入变得危险的地方:恶意网页可能包含试图劫持智能体的指令。

:::warning 将链接和页面视为不可信

  • 对任何有重大后果的操作要在场监督——不要在任务进行到一半时走开。
  • 不要随意让它访问敏感账户(银行、管理后台)。
  • 核实目标地址——智能体不应跟随可疑链接或执行隐藏在页面中的指令。
  • 最小权限——受限/需授权模式的存在正是为了让智能体在不该执行操作的地方只看不动。 :::

适合 vs 有风险的任务

适合需谨慎
跨页面研究,只读任何会花钱的操作
填写已知的、无害的表单登录敏感账户
在你监督下提取信息对陌生人发来的邮件/页面执行操作

下一步