Zum Hauptinhalt springen

Claude in Chrome & Computer Use

Fortgeschritten

Claude kann mehr als nur reden – es kann Software bedienen: eine Webseite im Browser lesen und darauf handeln oder einen Computer steuern (den Cursor bewegen, klicken, tippen), um Aufgaben über Apps hinweg zu erledigen. Mächtig, und es lohnt sich, die Leitplanken zu verstehen.

Zwei verwandte Fähigkeiten

  • Claude in Chrome – ein browserseitiger Agent, der die aktuelle Seite lesen und in deinem Namen Aktionen darin ausführen kann (navigieren, klicken, Formulare ausfüllen).
  • Computer use – allgemeinere Steuerung eines Desktops (Screenshots + Maus/Tastatur), um native Apps und App-übergreifende Arbeitsabläufe zu bedienen.

Nutze sie für Dinge, die sonst mühsam sind: Informationen über Seiten hinweg sammeln, wiederkehrende Formulare ausfüllen, mehrstufige Web-Aufgaben.

Das Sicherheitsmodell (lies das zuerst)

Eine KI in deinem Namen klicken und tippen zu lassen ist genau dort, wo Prompt-Injection gefährlich wird: Eine bösartige Webseite kann Anweisungen enthalten, die versuchen, den Agenten zu kapern.

:::warning Behandle Links und Seiten als nicht vertrauenswürdig

  • Sei anwesend und beaufsichtige alles Folgenreiche – geh nicht mitten in einer Aufgabe weg.
  • Richte ihn nicht beiläufig auf sensible Konten (Banking, Admin).
  • Überprüfe Ziele – ein Agent sollte keinem verdächtigen Link folgen oder auf in einer Seite versteckte Anweisungen handeln.
  • Minimale Rechte – eingeschränkte/berechtigungsbasierte Modi existieren genau deshalb, damit der Agent schauen, aber dort nicht handeln kann, wo er es nicht soll. :::

Gute vs. riskante Aufgaben

Gut geeignetSei vorsichtig
Recherche über Seiten hinweg, nur lesendAlles, was Geld ausgibt
Ein bekanntes, harmloses Formular ausfüllenAnmeldung bei sensiblen Konten
Informationen extrahieren, die du beaufsichtigstAuf E-Mails/Seiten von Fremden handeln

Weiter