Zum Hauptinhalt springen
Verwenden Sie dieses Tool, um zu lesen, was derzeit in einer App oder einem Browserfenster sichtbar ist, bevor Sie Maßnahmen ergreifen.

Was es tut

– Ruft standardmäßig Inhalte aus dem aktiven App-Fenster ab. – Akzeptiert optionales windowID (pid/title), um auf ein bestimmtes Fenster abzuzielen. – Gibt extrahierten Textinhalt zurück.
  • Fügt bei Bedarf OCR-Text aus Screenshots hinzu.

Häufige Verwendung

  • Lesen Sie den Seiten- oder App-Status, bevor Sie darauf klicken.
  • Extrahieren Sie sichtbare Inhalte für Zusammenfassungen.
  • Bauen Sie vor der mehrstufigen Automatisierung einen stabilen Kontext auf.

Eingabe

  • windowID (optional): Zielen Sie auf ein bestimmtes Fenster von list_windows.

Gute Paarung