remote-browser

von browser-use

remote-browser unterstützt sandboxed Agents dabei, einen Headless-Browser für Browser-Automatisierung zu steuern. Damit lassen sich Seiten öffnen, Zustände prüfen, indexierte Elemente anklicken, Eingaben tippen, Screenshots erstellen und Verbindungen zu lokalen Apps oder CDP-basierten Browser-Sitzungen herstellen.

Stars84.9k

Favoriten0

Kommentare0

Hinzugefügt29. März 2026

KategorieBrowser Automation

Installationsbefehl

npx skills add browser-use/browser-use --skill remote-browser

Kurationswert

Diese Skill erreicht 78/100 und ist damit ein solider Kandidat für ein Directory-Listing: Agents erhalten einen klaren Auslöser für den Einsatz, einen konkreten befehlsbasierten Ablauf und praktischen Mehrwert für die Browser-Steuerung in sandboxed Umgebungen. Für Installation und einzelne Umgebungsdetails müssen Anwender jedoch weiterhin externe Setup-Dokumentation heranziehen.

78/100

Stärken

Hohe Eindeutigkeit beim Einsatz: Die Beschreibung grenzt den Anwendungsfall klar auf sandboxed bzw. entfernte Agents ein, die Webnavigation, Formularausfüllung, Screenshots oder Tunnel-Freigabe benötigen.
Der operative Ablauf ist konkret: `SKILL.md` beschreibt einen Schritt-für-Schritt-Loop mit `open`, `state`, indexierten Aktionen wie `click`/`input`, Verifikation und `close`.
Bietet Agents spürbaren Mehrwert über einen generischen Prompt hinaus, indem mehrere Verbindungsmodi, Headless-Betrieb und Browser-Persistenz über mehrere Befehle hinweg dokumentiert werden.

Hinweise

Installation und Einrichtung sind im Skill nicht in sich geschlossen: Es wird nur auf ein externes CLI README verwiesen, und in `SKILL.md` fehlt ein Installationsbefehl.
Die Begleitmaterialien sind knapp: Es gibt keine Skripte, Referenzen, Regeln oder ergänzenden Ressourcen, daher können Fehlersuche und der Umgang mit Sonderfällen mehr Eigenaufwand erfordern.

Agent Browser Sandbox Chrome Chrome Devtools Protocol Cli Automation Testing

Überblick

Überblick über die remote-browser-Skill

Die remote-browser-Skill ist für ein ganz bestimmtes, aber häufiges Problem gedacht: Ihr Agent läuft auf einer entfernten oder sandboxed Maschine ohne normalen Desktop-Browser, muss aber dennoch echte Browser-Automatisierung ausführen. Statt sich auf vage Web-Browsing-Prompts zu verlassen, bietet remote-browser einen befehlsgesteuerten Workflow zum Öffnen von Seiten, Prüfen des Seitenzustands, Klicken auf indexierte Elemente, Eingeben von Text in Felder, Erstellen von Screenshots und sauberen Beenden der Sitzung.

Für wen die remote-browser-Skill am besten geeignet ist

Die remote-browser-Skill passt besonders für Nutzer, die:

Agents in CI, auf Cloud-VMs, in Dev-Containern oder gehosteten Coding-Sandboxes ausführen
zuverlässige Seiteninteraktion benötigen und nicht nur reine Text-Fetches aus dem Web
wiederholbare Browser-Automatisierungs-Schritte wie Login-Flows, Formularausfüllung, Navigationsprüfungen und UI-Validierung wollen
möglicherweise einen lokalen Dev-Server per Tunnel bereitstellen und ihn aus der Browser-Sitzung heraus prüfen müssen

Wenn Sie bereits einen lokalen interaktiven Browser haben und manuell klicken können, ist diese Skill weniger wichtig. Ihren größten Nutzen hat sie, wenn der Agent ohne explizite Browser-Steuerung praktisch blind ist.

Die eigentliche Aufgabe, die remote-browser löst

Nutzer installieren remote-browser nicht einfach nur, um „einen Browser zu öffnen“. Sie installieren die Skill, damit ein Agent Web-Aufgaben aus einer Umgebung ohne GUI mit weniger Rätselraten erledigen kann:

eine Ziel-URL öffnen
prüfen, was tatsächlich klickbar oder beschreibbar ist
auf stabilen Elementindizes arbeiten
das Ergebnis nach jeder Aktion verifizieren
die Browser-Sitzung über mehrere Befehle hinweg offen halten

Damit ist sie in Remote-Umgebungen mit zustandsbehafteter Interaktion deutlich praktikabler als ein generischer Prompt wie „bitte browse diese Website“.

Was remote-browser von normalen Prompts unterscheidet

Der wichtigste Unterschied bei remote-browser ist der Fokus auf explizite Browser-Befehle und Seitenzustandsprüfung statt auf unscharfes Browsen in natürlicher Sprache. Der dokumentierte Workflow ist:

eine Seite öffnen
den aktuellen Zustand prüfen
über indexierte Elemente interagieren
verifizieren
wiederholen

Diese Struktur ist einfach, aber genau sie reduziert Fehlklicks, Irrtümer bei versteckten Elementen und halluzinierte Annahmen über die UI.

Wichtige Punkte vor der Einführung von remote-browser

Bevor Sie die remote-browser-Skill verwenden, sollten Sie Folgendes wissen:

sie setzt voraus, dass browser-use-Werkzeuge in der Umgebung verfügbar sind
die Skill ist für sandboxed Agents gedacht, nicht primär für lokales, menschlich gesteuertes Browsen
sie funktioniert am besten, wenn Sie sie iterativ steuern, statt in einem einzigen Durchlauf eine lange autonome Browsing-Kette zu verlangen
die Sitzung bleibt zwischen Befehlen bestehen, was für mehrstufige Abläufe nützlich ist
es gibt eine Setup-Prüfung über browser-use doctor

So verwenden Sie die remote-browser-Skill

Installationskontext für remote-browser

Das grundlegende Verzeichnis-Muster zum Hinzufügen der Skill ist:

npx skills add https://github.com/browser-use/browser-use --skill remote-browser

Nach dem Hinzufügen sollten Sie prüfen, ob die Ausführungsumgebung die zugrunde liegenden Browser-Werkzeuge tatsächlich verwenden kann. Die Skill verweist selbst auf:

browser-use doctor

Führen Sie das zuerst aus, wenn Browser-Befehle fehlschlagen oder die Umgebung frisch bereitgestellt wurde. Für Setup-Details über die Skill-Seite hinaus verweist das Repository auf:

browser_use/skill_cli/README.md

Was remote-browser von Ihrer Umgebung benötigt

Damit remote-browser zuverlässig funktioniert, braucht der Agent in der Regel:

Zugriff auf die browser-use-CLI
die Berechtigung, die erlaubten Browser-Befehle auszuführen
Netzwerkzugriff auf die Zielseite
eine erreichbare Ziel-URL, ob öffentlich, lokal über einen Tunnel oder über eine CDP-/Cloud-Browser-Verbindung

Wenn Ihre Aufgabe eine auf localhost laufende App innerhalb der Sandbox betrifft, stellen Sie sicher, dass Sie diese vorab nach außen erreichbar machen können. Sonst kann die Skill die relevante Seite nicht erreichen.

Der schnellste Weg durch das Repository

Wenn Sie den kürzesten Weg zu einer effektiven Nutzung suchen, lesen Sie in dieser Reihenfolge:

skills/remote-browser/SKILL.md
browser_use/skill_cli/README.md für Installations- und Umgebungsdetails
weitere übergreifende Repo-Dokumentation nur dann, wenn das Setup Ihrer Umgebung noch unklar ist

Das ist eine kleine Skill. Den höchsten Mehrwert bringt hier das Lesen des Befehls-Workflows und der Browser-Modi, nicht ein breiter Überblick über das ganze Repository.

Zentrales Nutzungsmuster für remote-browser

Die praktische remote-browser usage-Schleife sieht so aus:

browser-use open <url>
browser-use state
browser-use click <index>
browser-use input <index> "text"
browser-use screenshot
browser-use close

Der entscheidende Schritt ist browser-use state. Nutzen Sie ihn zwischen den Aktionen, damit der Agent mit der aktuellen Seitenstruktur arbeitet, statt anzunehmen, dass Buttons oder Felder nach einer Navigation noch an derselben Stelle sind.

Browser-Modi, die die Installationsentscheidung beeinflussen

Die remote-browser-Skill unterstützt mehrere Verbindungsmodi, was für die Einführung wichtig ist:

browser-use open <url>
browser-use cloud connect
browser-use --connect open <url>
browser-use --cdp-url ws://localhost:9222/... open <url>

In der Praxis gilt:

verwenden Sie das normale open, wenn ein Headless-Chromium-Flow ausreicht
nutzen Sie cloud connect, wenn Sie eine bereitgestellte Browser-Umgebung brauchen
verwenden Sie --connect oder --cdp-url, wenn Sie bereits einen Browser über CDP bereitstellen

Das ist einer der wichtigsten Entscheidungspunkte: Wenn Ihr Unternehmen bereits gemanagte Browser betreibt, kann eine CDP-basierte Nutzung besser passen, als eine neue Browser-Sitzung zu starten.

Welche Eingaben remote-browser besser machen

Eine schwache Anfrage ist:

„Teste die Website und sag mir, ob sie funktioniert.“

Eine starke Anfrage ist:

„Use the remote-browser skill to open https://example.com/login, inspect page state, sign in with the provided test account, navigate to Settings, verify the Save button is clickable, take a screenshot after saving, and report any blocking UI errors.“

Bessere Eingaben enthalten:

die genaue URL
das Ziel der Aufgabe
Zugangsdaten oder Testdaten, falls nötig
die Erfolgsbedingung
ob Screenshots oder eine abschließende Statusprüfung erforderlich sind
eventuelle Einschränkungen wie „do not submit the final form“

So wird aus allgemeiner Browser-Automatisierung ein kontrollierter Task-Runner.

So wird aus einem groben Ziel ein vollständiger Prompt

Eine praxistaugliche Prompt-Vorlage für remote-browser for Browser Automation ist:

environment: wo der Agent läuft
target: URL oder Einstiegspunkt der App
task: die auszuführende User Journey
guardrails: zu vermeidende Aktionen
evidence: Screenshot, Endzustand oder ein konkretes Verifikationsergebnis

Beispiel:

Use the remote-browser skill. The agent is running in a sandbox. Open http://localhost:3000 through the available tunnel, inspect the page state before each action, log in with the supplied test account, create one sample record, confirm the success message appears, and take a screenshot at the end. Do not delete existing data.

Das funktioniert besser, weil es dem Agenten nicht nur sagt, was zu tun ist, sondern auch, wie der Fortschritt überprüft werden soll.

Empfohlener Schritt-für-Schritt-Workflow

Für die meisten Aufgaben sollte der Workflow kurz und explizit bleiben:

falls nötig die Umgebung mit browser-use doctor prüfen
die Zielseite öffnen
den Zustand vor der ersten Interaktion prüfen
eine Aktion nach der anderen mithilfe von Indizes ausführen
nach jeder relevanten Seitenänderung den Zustand erneut prüfen
an Kontrollpunkten Screenshots aufnehmen
den Browser am Ende schließen

Das ist deutlich besser, als eine ganze Browsing-Sitzung in einen einzigen riesigen Prompt zu pressen.

Praktische Tipps, die Fehler mit remote-browser reduzieren

Hilfreiche Tipps mit hoher Wirkung für die Nutzung des remote-browser guide:

vor dem Klicken immer state anfordern, wenn sich die Seite geändert haben könnte
kurze Interaktionszyklen langen autonomen Läufen vorziehen
Screenshots bei Meilensteinen anfordern, nicht nur ganz am Ende
klar angeben, ob die Aufgabe vor destruktiven Aktionen stoppen soll
bei einer lokalen App prüfen, ob sie aus dem Browser-Kontext tatsächlich erreichbar ist

Die meisten Fehler entstehen durch schlechtes Task-Framing, nicht durch die Click- oder Input-Befehle selbst.

Häufige Aufgabentypen, für die remote-browser besonders gut passt

Die remote-browser-Skill ist besonders nützlich für:

Login- und Auth-Smoke-Tests
Formularausfüllung und Submit-Flows
Verifikation von Seitennavigation
Screenshot-Erstellung in Headless-Umgebungen
Tests eines getunnelten lokalen Dev-Servers durch einen sandboxed Agent
wiederholbare UI-Prüfungen, bei denen die Zustandsprüfung vor jeder Aktion wichtig ist

Weniger überzeugend ist sie für einfache statische Seitenabrufe oder Aufgaben, die keine Browser-Sitzung benötigen.

FAQ zur remote-browser-Skill

Ist remote-browser einsteigerfreundlich?

Ja, wenn Sie in einer einfachen Schleife denken können: öffnen, prüfen, handeln, verifizieren. Für den Einstieg brauchen Sie kein fortgeschrittenes Wissen über Browser-Automatisierung. Die größte Hürde für Einsteiger ist eher das Setup der Umgebung als die Komplexität der Befehle.

Wann sollte ich remote-browser statt eines normalen Browsing-Prompts verwenden?

Nutzen Sie remote-browser, wenn der Agent mit echten Seitenelementen interagieren und den Sitzungszustand beibehalten muss. Ein normaler Prompt kann reichen, um öffentliche Webinhalte zusammenzufassen, ist aber deutlich schwächer bei Formularen, authentifizierten Abläufen oder schrittweisen UI-Aufgaben in einer Sandbox.

Benötigt remote-browser einen lokalen GUI-Browser?

Nein. Der Zweck der remote-browser skill ist gerade, einen Browser von einer sandboxed oder entfernten Maschine aus zu steuern, auf der dem Agenten kein normaler GUI-Browser zur Verfügung steht.

Kann remote-browser mit vorhandenen Browsern arbeiten?

Ja. Die dokumentierten Modi umfassen die Verbindung über CDP mit --connect oder --cdp-url. Das ist hilfreich, wenn bereits ein Browser-Prozess oder ein gemanagter Browser-Endpunkt vorhanden ist.

Ist remote-browser nur für öffentliche Websites gedacht?

Nein. Die Skill kann auch bei lokalen Entwicklungs-Apps helfen, wenn diese korrekt bereitgestellt werden, zum Beispiel über einen Tunnel, den die Remote-Umgebung erreichen kann. Entscheidend ist, dass die Seite aus der Browser-Sitzung heraus erreichbar ist.

Wo liegen die wichtigsten Grenzen von remote-browser?

remote-browser install allein reicht nicht aus, wenn:

browser-use nicht korrekt eingerichtet ist
die Ziel-App nicht erreichbar ist
die Aufgabe versteckten Business-Kontext erfordert, den der Agent nie bekommen hat
Sie zu viel Autonomie ohne Zwischenverifikation verlangen

Die Skill gibt Browser-Kontrolle, aber kein magisches Wissen über Ihre App.

Wann ist remote-browser keine gute Wahl?

Verzichten Sie auf remote-browser, wenn:

ein einfacher HTTP-Fetch ausreicht
die Aufgabe kein Klicken, Tippen, Navigieren oder Screenshots erfordert
Sie ein vollständiges Test-Framework mit Assertions, Fixtures und Orchestrierung großer Test-Suites brauchen
Ihre Umgebung die Browser-Ausführung vollständig verbietet

In solchen Fällen ist ein anderes Werkzeug oft einfacher oder robuster.

So verbessern Sie die remote-browser-Skill

remote-browser mit besserem Task-Framing steuern

Der größte Hebel für die Qualität der Ergebnisse ist die Qualität des Prompts. Gute remote-browser-Prompts benennen:

die genaue Seite
die genaue User Journey
die Abbruch- oder Endbedingung
die geforderten Nachweise
alle verbotenen Aktionen

Das reduziert Mehrdeutigkeit und verhindert, dass der Agent bei unklaren UI-Zuständen improvisieren muss.

Zustandsbewusste Interaktion anfordern, nicht blindes Klicken

Eine starke Anweisung ist:

„Inspect state before each major interaction and after each navigation.“

Diese eine Zeile verbessert die Zuverlässigkeit spürbar, weil sich der Agent immer wieder an der tatsächlichen Seitenstruktur orientiert, statt auf Annahmen aus vorherigen Schritten zu bauen.

Erfolgskriterien vorgeben, die der Agent prüfen kann

Statt:

„Stell sicher, dass es funktioniert“

besser:

„Bestätige, dass das Dashboard lädt, der Profilname sichtbar ist und nach dem Update ein Screenshot gespeichert wurde.“

Prüfbare Endzustände führen zu besseren Ergebnissen bei der remote-browser usage als subjektive Zielvorgaben.

Mehrstufige Abläufe in Kontrollpunkte aufteilen

Bei längeren Aufgaben sollte der Agent nach Meilensteinen berichten, etwa nach:

Seite geöffnet
Login abgeschlossen
Zielformular erreicht
Ergebnis der Übermittlung verifiziert

Solche Kontrollpunkte helfen, falsche Abzweigungen früh zu erkennen, und sind oft schneller als einen langen Ablauf nach einem versteckten Fehler komplett neu zu starten.

Screenshots gezielt einsetzen

Fordern Sie nicht bei jedem Klick Screenshots an. Sinnvoll sind sie:

nach dem Login
vor dem Absenden wichtiger Formulare
nach einem Erfolgs- oder Fehlerzustand
beim Endergebnis

So erhalten Sie genug Nachweise, ohne den Workflow unnötig aufzublähen.

Typische Fehlerbilder bei remote-browser explizit adressieren

Typische remote-browser-Fehlerquellen sind:

Interaktion, bevor der aktuelle Zustand geprüft wurde
veraltete Elementindizes nach einer Navigation
eine localhost-App als Ziel, die nicht erreichbar gemacht wurde
zu ungenaue Prompts ohne Erfolgsbedingung
die Annahme, dass Zugangsdaten oder Testdaten existieren, obwohl sie nie bereitgestellt wurden

Wenn Ergebnisse flaky wirken, prüfen Sie diese Punkte zuerst, bevor Sie die Skill verantwortlich machen.

Mit engeren Prompts den ersten Durchlauf erfolgreicher machen

Für den ersten Versuch sollten Sie nicht fragen:

„Teste die komplette App vollständig.“

Sondern:

„Öffne die Login-Seite, melde dich an, navigiere zu Billing und sag mir, ob der Upgrade-Button vorhanden ist.“

Ein engerer erster Durchlauf validiert Umgebung, Zugriff und Browser-Kontrolle schnell.

Nach dem ersten Ergebnis iterativ nachschärfen

Wenn der erste Lauf teilweise erfolgreich ist, ergänzen Sie die fehlenden Details:

die korrekte URL hinzufügen
präzisieren, welcher Button oder Text relevant ist
angeben, ob nach einem Fehler fortgesetzt werden soll
beim fehlschlagenden Schritt einen weiteren state-Dump anfordern

Die beste Praxis im remote-browser guide ist iteratives Nachschärfen, nicht Perfektion im ersten Versuch.

Vertrauen erhöhen, indem remote-browser zur echten Umgebung passt

Wenn Ihr Team bereits Cloud-Browser oder CDP-Endpunkte nutzt, sagen Sie das im Prompt und wählen Sie den passenden Modus. Wenn Sie auf getunnelte localhost-Apps angewiesen sind, nennen Sie die Tunnel-URL ausdrücklich. Je genauer Ihr Prompt zur realen Ausführungsumgebung passt, desto weniger muss der Agent erraten.

Wissen, wann man über remote-browser hinausgehen sollte

Wenn Sie belastbare Regressionstests, komplexe Assertions oder die Orchestrierung größerer Test-Suites brauchen, sollten Sie remote-browser als gezielte Ausführungshilfe nutzen, nicht als Ersatz für einen vollständigen Browser-Test-Stack. Seine Stärke liegt als Agent-Skill für interaktive Browser-Aufgaben, besonders in sandboxed Umgebungen.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

playwright-interactive

von openai

playwright-interactive ist eine Browser-Automatisierungs-Skill für dauerhafte Playwright-Sitzungen in lokalen Web- und Electron-Apps. Damit kannst du den UI-Zustand prüfen, Interaktionen erneut versuchen und funktionale oder visuelle QA durchführen, ohne die Toolchain neu zu starten. Ideal, wenn du einen praxisnahen Leitfaden für iteratives Debugging mit playwright-interactive suchst.

Browser Automation

Favoriten 0GitHub 0

playwright-skill

von testdino-hq

playwright-skill ist ein Playwright-spezifischer Leitfaden für zuverlässige Browser-Automatisierung. Er hilft Teams dabei, Tests für E2E-Flows, API-Prüfungen, Komponententests, visuelle Regressionen, Barrierefreiheit, Authentifizierung, CI/CD und die Migration von Cypress oder Selenium zu schreiben, zu debuggen und zu skalieren. Verwenden Sie die playwright-skill Skill, wenn Sie praxisnahe Muster statt allgemeiner Testberatung suchen.

Test Automation

Favoriten 0GitHub 0

data-scraper-agent

von affaan-m

data-scraper-agent hilft beim Aufbau einer wiederholbaren Public-Data-Pipeline für Web Scraping, Anreicherung und Speicherung. Es ist für das Monitoring von Jobs, Preisen, News, Repos, Sport und Listings nach Zeitplan mit GitHub Actions ausgelegt, mit Ausgaben nach Notion, Sheets oder Supabase. Am besten für laufendes Tracking, nicht für einmalige Extraktionen.

Web Scraping

Favoriten 0GitHub 156.1k

playwright-best-practices

von currents-dev

playwright-best-practices ist ein Playwright- + TypeScript-Skill für stabile Tests, weniger Flakiness, bessere Auth-Flows, die richtige Wahl zwischen Fixtures und Page Objects sowie den Umgang mit CI, Popups, Mobile, iframes, websockets und Multi-User-Szenarien – mit praxisnaher, repo-gestützter Anleitung.

Test Automation

Favoriten 0GitHub 174

x-twitter-scraper

von Xquik-dev

Verwende x-twitter-scraper, um X-(Twitter-)Daten und bestätigungspflichtige Aktionen über Xquik abzurufen. Unterstützt sind Tweet-Suche, Nutzerabfragen, Follower-Extraktion, Medien-Downloads, Monitore, Webhooks, MCP und Schreibaktionen. Am besten geeignet für Web-Scraping-artige Recherchen mit API-Schlüssel, nicht mit X-Login-Daten.

Web Scraping

Favoriten 0GitHub 71

composio

von ComposioHQ

Nutze Composio, um KI-Workflows über CLI oder SDK mit externen Apps zu verbinden. Dieses Composio-Skill ist auf Workflow-Automatisierung, App-Aktionen, Verbindungen pro Nutzer, Toolkit-Erkennung und einen praxisnahen Installations- und Nutzungsleitfaden ausgelegt, bevor du mit dem Aufbau beginnst.

Workflow Automation

Favoriten 0GitHub 48

playwright-skill

von lackeyjb

playwright-skill ist eine Skill für Browser-Automatisierung zum Testen von Seiten, Ausfüllen von Formularen, Prüfen von Links, Erstellen von Screenshots, Validieren responsiver Layouts und für Login- oder Checkout-Flows. Sie erkennt Dev-Server automatisch, nutzt einen universellen Executor und hilft dir, zuverlässige Playwright-Aufgaben mit weniger Setup und Rätselraten auszuführen.

Browser Automation

Favoriten 0GitHub 0

browser-use

von browser-use

browser-use ist ein Skill für Browser-Automatisierung: Seiten öffnen, Status prüfen, indizierte Elemente anklicken, in Felder tippen, Screenshots erstellen und eine persistente Browser-Sitzung weiterverwenden. Geeignet für zuverlässiges Ausfüllen von Formularen, Navigation und eingeloggte Workflows mit der browser-use CLI.

Browser Automation

Favoriten 0GitHub 84.9k

browser-testing-with-devtools

von addyosmani

browser-testing-with-devtools unterstützt Agents dabei, echtes Browserverhalten über Chrome DevTools MCP zu testen und zu debuggen. Damit lassen sich das DOM prüfen, Konsolenfehler erfassen, Netzwerkanfragen analysieren, die Performance profilieren und Korrekturen direkt im laufenden Browser verifizieren.

Test Automation

Favoriten 0GitHub 18.7k

baoyu-post-to-x

von JimLiu

baoyu-post-to-x automatisiert das Posten auf X mit echtem Chrome und CDP. Veröffentliche Text, Bilder, Videos, Quote Posts und Markdown-basierte X Articles mit bun-Skripten, Vorschaumodus und browserbasierter Ausführung.

Social Media

Favoriten 0GitHub 13.2k

use-my-browser

von xixu-me

use-my-browser ist ein Skill für Browser-Automatisierungsstrategien, mit dem sich die passende Web-Ebene wählen lässt: öffentliche Web-Tools, live Chrome, raw fetch oder Playwright für angemeldete, dynamische und DevTools-gesteuerte Aufgaben.

Browser Automation

Favoriten 0GitHub 6

playwright-cli

von VoltAgent

playwright-cli ist eine Browser-Automatisierungsskill für Playwright direkt über die Kommandozeile. Sie hilft beim Öffnen von Seiten, Prüfen von Elementen, Durchklicken von Abläufen, Ausfüllen von Formularen, Erstellen von Screenshots, Mocken von Requests und Generieren von Testcode aus echten Interaktionen. Nutze sie für wiederholbare Browser-Automatisierung und UI-Tests.

Browser Automation

Favoriten 0GitHub 8.5k

windows-vm

von obra

Nutze die windows-vm Skill, um eine headless Windows 11 VM in Docker mit KVM-Beschleunigung zu erstellen, zu verwalten und per SSH darauf zuzugreifen. Sie eignet sich für Desktop-Automation, das Einrichten von Windows-Apps und wiederholbare Agent-Workflows, wenn du eine echte Windows-Umgebung ohne manuelles RDP brauchst.

Desktop Automation

Favoriten 0GitHub 323

notebooklm

von PleasePrompto

Nutze die notebooklm-Skill, um Google NotebookLM-Notizbücher direkt aus Claude Code abzufragen und Antworten zu erhalten, die auf Quellen basieren und zitierfähig sind. Entwickelt für notebooklm-Einsätze in dokumentenzentrierten Workflows – mit Browser-Automatisierung, persistenter Authentifizierung und Notizbuchverwaltung für NotebookLM-Guide- und Workflow-Automation-Aufgaben.

Workflow Automation

Favoriten 0GitHub 0

playwright

von openai

Nutze die playwright-Skill, um einen echten Browser vom Terminal aus mit einem Wrapper-Skript und `playwright-cli` zu automatisieren. Sie eignet sich für Browserautomatisierungsaufgaben wie Navigation, Formularausfüllung, Screenshots, Snapshots, Extraktion und das Debuggen von UI-Abläufen. Prüfe `npx`, installiere die Skill, setze `PWCLI` und folge dann dem CLI-first-Workflow.

Browser Automation

Favoriten 0GitHub 0

canary-watch

von affaan-m

canary-watch ist ein Post-Deploy-Monitoring-Skill, mit dem sich eine Live-URL nach Releases, Merges oder Dependency-Updates auf Regressionen prüfen lässt – in Staging oder Production.

Monitoring

Favoriten 0GitHub 156.1k