open-source

von browser-use

Dokumentationssuche für die browser-use-Python-Bibliothek. Das open-source-Skill unterstützt bei Installation, Einrichtung, Agent- und Browser-Code, Modell-Umgebungsvariablen, Tools, MCP-Integrationen, Monitoring und Hinweisen zur älteren Actor API.

Stars84.9k

Favoriten0

Kommentare0

Hinzugefügt29. März 2026

KategorieCode Generation

Installationsbefehl

npx skills add browser-use/browser-use --skill open-source

Kurationswert

Dieses Skill erreicht 82/100 und ist damit ein solider Kandidat für ein Directory-Listing: Agents erhalten eine klar abgegrenzte Einsatzbedingung, eine brauchbare Zuordnung von Themen zu Dateien und umfangreiche Referenzinhalte für die Arbeit mit der browser-use-open-source-Bibliothek. Nutzer sollten es jedoch eher als Dokumentationssuche denn als eng geführten End-to-End-Workflow verstehen.

82/100

Stärken

Hohe Auslösbarkeit: SKILL.md erklärt ausdrücklich, wann dieses Skill verwendet werden soll und wann stattdessen die cloud- oder browser-use-Skills passender sind.
Gute operative Tiefe: Die Referenzdateien decken Installation/Quickstart, Modelle, Agent-Konfiguration, Browser-Konfiguration, Tools, Integrationen, Monitoring und Beispiele ab.
Verlässliche, konkrete Details: Die Dokumentation enthält Python-Snippets, Parametererklärungen, Umgebungsvariablen sowie Konfigurationsbeispiele für MCP und Clients.

Hinweise

Das Skill auf oberster Ebene ist größtenteils ein Routing-Dokument; Agents müssen also weiterhin die passende Referenzdatei auswählen und lesen, statt einem einheitlichen Workflow zu folgen.
In SKILL.md selbst erscheint kein Installationsbefehl, daher hängt das grundlegende Setup davon ab, das verlinkte Quickstart-Material zu öffnen.

Python MCP MCP Server Automation Browser Automation Documentation

Überblick

Überblick über den open-source-Skill

Wofür der open-source-Skill gedacht ist

Der open-source-Skill ist der Skill für die Dokumentationsrecherche zur Python-Bibliothek browser-use. Er hilft einem Agenten dabei, Implementierungsfragen zu Agent, Browser, Tools, Model-Setup, MCP-Integrationen, Monitoring und der älteren Actor API zu beantworten, ohne auf allgemeine Muster aus der Browser-Automatisierung raten zu müssen.

Besonders nützlich ist das für Entwickler, die Code schreiben oder reviewen, der browser_use importiert, ein Runtime-Setup auswählen oder Konfigurationsdetails debuggen müssen, die man aus dem Gedächtnis leicht falsch erinnert.

Für wen der Skill am besten passt und welche Aufgaben er löst

Nutze den open-source-Skill, wenn du:

die Open-Source-Python-Bibliothek browser-use installieren und konfigurieren willst
ein LLM-Backend und die passenden Umgebungsvariablen auswählen musst
Agent(...)- oder Browser(...)-Code mit gültigen Parametern schreiben willst
eigene Tools, Hooks oder strukturierte Ausgaben hinzufügen möchtest
browser-use mit MCP, Skills, Doku-Tooling oder Observability verbinden willst
die ältere Low-Level-Actor-API verstehen musst

Die eigentliche Aufgabe ist nicht „das Repo zusammenfassen“. Es geht darum: „Hilf mir, korrekten browser_use-Code und die passende Konfiguration schneller zu erstellen, als wenn ich mich manuell durch Referenzdateien arbeiten müsste.“

Was diesen Skill von einem generischen Prompt unterscheidet

Ein generischer Prompt kennt Browser-Automatisierung vielleicht grundsätzlich, aber dieser Skill ist an den repositoryeigenen Referenzsatz gebunden:

references/quickstart.md
references/models.md
references/agent.md
references/browser.md
references/tools.md
references/actor.md
references/integrations.md
references/monitoring.md
references/examples.md

Das ist wichtig, weil browser-use produktspezifische Klassen, Parameternamen, Umgebungsvariablen, Cloud-Grenzen und Integrationspfade hat, die nicht einfach mit Playwright, Selenium oder reinen Browser Use Cloud APIs austauschbar sind.

Wichtige Abgrenzung vor der Installation

Dieser open-source-Skill ist für die Open-Source-Python-Bibliothek gedacht, nicht für jede Browser Use-Produktoberfläche.

Nutze ihn für:

lokale Nutzung oder die Python-Bibliothek
Code-Generierung für browser_use
Setup-Fragen zu Modellen, Tools, Hooks, Browser-Sessions und Monitoring

Nutze ihn nicht für:

Preise von Cloud APIs oder SDKs und Cloud-Produkt-Workflows
direkte CLI-Anfragen zur Browser-Automatisierung, die besser vom separaten browser-use-Skill abgedeckt werden

Wenn deine Aufgabe lautet „Schreib Python-Code mit from browser_use import ...“, ist das hier die richtige Wahl.

So verwendest du den open-source-Skill

Installationskontext für die open-source-Nutzung

Installiere den Skill in einer Umgebung mit aktivierten Skills und rufe ihn auf, wenn deine Aufgabe die Python-Bibliothek browser_use betrifft.

Ein typisches Muster für den Add-Befehl ist:

npx skills add https://github.com/browser-use/browser-use --skill open-source

Nach der Installation solltest du den Skill als Referenzschicht beim Generieren von Code verwenden, nicht als eigenständige App. Er ist dafür ausgelegt, Entscheidungen beim Schreiben von Code und bei der Konfiguration zu steuern.

Lies diese Dateien zuerst, bevor du nach Code fragst

Wenn du open-source schnell und präzise nutzen willst, starte mit der Datei, die zu deiner Aufgabe passt, statt das ganze Repo zu lesen:

Installation oder erster Lauf: references/quickstart.md
Model-Provider auswählen: references/models.md
einen Agent schreiben: references/agent.md
Browser-Sessions konfigurieren: references/browser.md
Tools hinzufügen: references/tools.md
Low-Level-Kontrolle mit deterministischem Verhalten nötig: references/actor.md
MCP oder Skills anbinden: references/integrations.md
Tracing oder Cost Tracking ergänzen: references/monitoring.md
funktionierende Muster übernehmen: references/examples.md

Der Skill liefert die besten Ergebnisse, wenn dein Prompt das Thema ausdrücklich benennt.

Welche Eingaben der open-source-Skill braucht

Gib genug Kontext mit, damit der Skill die richtige Referenzdatei auswählt und lauffähigen Code erzeugen kann. Besonders wertvoll sind:

dein Ziel in einem Satz
ob du Agent, Browser, Tools oder die Actor API willst
dein Model-Provider, falls bekannt
ob die Ausführung lokal, über Remote CDP oder cloudverbunden erfolgt
alle Einschränkungen wie Headless-Modus, Auth, erlaubte Domains, strukturierte Ausgabe oder Observability

Schwache Eingabe:

„Use browser-use for automation.“

Starke Eingabe:

„Write Python code using browser_use.Agent with ChatOpenAI(model="gpt-4.1-mini"), a non-headless Browser, allowed domains limited to example.com, and a Pydantic output schema.”

Aus einem groben Ziel einen starken Prompt machen

Für bessere Ergebnisse mit open-source für die Code-Generierung solltest du eine vage Anfrage in einen Prompt mit vier Bausteinen verwandeln:

Ziel-API-Oberfläche
Runtime-Annahmen
Ausgabeform
Einschränkungen

Beispiel:

Use the open-source skill to write a Python example with `browser_use.Agent`.
Model: `ChatGoogle(model="gemini-flash-latest")`.
Browser: headless, custom window size, keep browser alive after run.
Task: log in, navigate to a dashboard, extract three metrics.
Return complete code plus required env vars and pip installs.

Warum das funktioniert:

es lenkt den Skill auf agent.md, browser.md und models.md
es vermeidet Verwechslungen mit Cloud/API-Themen
es fordert Code, Setup und operative Details in einem Durchgang an

Minimaler open-source-Installationspfad, nach dem du fragen solltest

Wenn du noch prüfst, ob du das Projekt übernehmen willst, frag zuerst nach dem kürzesten funktionierenden Setup:

Python-Installationsschritte
das kleinste lauffähige Agent-Beispiel
eine unterstützte LLM-Option und ihre Umgebungsvariable
alle Browser-/Runtime-Annahmen

Die Referenzen im Repo zeigen, dass das Model-Setup je nach Provider variiert. „Install browser-use“ reicht deshalb allein nicht aus. Du brauchst auch die richtige Chat-Klasse und die passende API-Key-Variable, etwa BROWSER_USE_API_KEY, GOOGLE_API_KEY oder OPENAI_API_KEY.

Praktische open-source-Anwendungsfälle, die gut unterstützt werden

Der Skill ist besonders stark in diesen Workflows:

ein erstes Agent(...)-Script generieren
Modellklassen wie ChatBrowserUse, ChatGoogle, ChatOpenAI oder ChatAnthropic vergleichen
Browser(...)-Optionen wie headless, window_size, cdp_url oder Domain-Beschränkungen konfigurieren
eigene Tools hinzufügen und ActionResult verstehen
strukturierte Ausgabe mit output_model_schema aktivieren
Timeouts, Retries, Fallback-LLMs oder Hooks setzen
Laminar- oder OpenLIT-Monitoring ergänzen
die ältere Actor API für Low-Level-Steuerung von Seiten und Elementen einsetzen

Wichtige Einschränkungen, die die Ausgabequalität beeinflussen

Der open-source-Skill hat einige Einschränkungen, die für die Entscheidung wichtig sind:

Die Actor API ist ausdrücklich veraltet und nicht dasselbe wie Playwright.
Browser ist ein Alias von BrowserSession, was beim Lesen von Beispielen hilfreich ist.
Domain-Kontrolle nutzt Muster mit allowed_domains und prohibited_domains samt spezifischer Matching-Regeln.
Einige Funktionen, etwa das Laden von Skills über skills oder skill_ids, benötigen BROWSER_USE_API_KEY.
Cloud-MCP-Setup existiert, ist aber nicht dasselbe wie der Workflow der Open-Source-Python-Bibliothek.

Genau an solchen Details scheitern generische Prompts oft.

Bester Workflow für open-source-Codegenerierung

Ein praxistauglicher Workflow ist:

Bitte um das kleinste funktionierende Beispiel für deinen konkreten Provider und deine Aufgabe.
Bitte den Skill, jeden hinzugefügten Nicht-Standard-Parameter zu kommentieren.
Führe das Beispiel lokal aus.
Wenn es fehlschlägt, füge den Traceback und deinen aktuellen Code ein.
Bitte um eine überarbeitete Version auf Basis der passenden Referenzdatei.

Das funktioniert besser, als direkt nach einer „vollständigen Produktionsimplementierung“ zu fragen, weil viele Fehler eher aus einem unpassenden Setup als aus fehlender Business-Logik entstehen.

Beispiel-Prompt, der den open-source-Skill gut aufruft

Use the open-source skill for browser-use.
I need Python code, not cloud API usage.
Please build a script that uses `Agent` with `ChatBrowserUse()`, runs headless,
extracts structured output into a Pydantic model, and tracks cost.
Also list the env vars, pip packages, and which reference docs you used.

Dieser Prompt gibt dem Skill genug Signale, um agent.md, models.md und monitoring.md sinnvoll zu kombinieren.

Wann du die Actor API statt Agent verwenden solltest

Nutze Agent, wenn du zielgesteuertes Browsing mit LLM-Planung willst.

Nutze die Actor API, wenn du deterministische Low-Level-Aktionen brauchst und das Timing selbst steuern kannst. Die Referenzen weisen auf wichtige Unterschiede zu Playwright hin, darunter sofortige Element-Rückgaben und strengere Formatvorgaben für evaluate(). Wenn dein Code von Playwright-Semantik ausgeht, bitte den Skill ausdrücklich darum, das Beispiel für das Verhalten der Actor API anzupassen.

FAQ zum open-source-Skill

Ist open-source nur für Installationshilfe gedacht?

Nein. open-source deckt Installation, Setup, Code-Generierung, Konfiguration, Integrationen und Debugging für die Python-Bibliothek browser_use ab. Die Installation ist nur der erste Schritt; der größere Mehrwert liegt in korrekten Parameternamen, passendem Provider-Setup und API-spezifischen Beispielen.

Ist der open-source-Skill gut für Einsteiger?

Ja, wenn du nach einem minimalen Einstiegspfad fragst. Einsteiger sollten anfordern:

einen Provider
eine kurze Aufgabe
ein vollständiges Script
Umgebungsvariablen und Installationsbefehle
eine Erklärung zu jedem Import

Vermeide es, im ersten Prompt gleich nach Tools, Hooks, Monitoring und MCP zu fragen, sofern du nicht schon weißt, dass du das brauchst.

Worin unterscheidet sich das von einem normalen Prompt zur Browser-Automatisierung?

Ein normaler Prompt fällt oft auf Annahmen aus Playwright oder Selenium zurück. Der open-source-Skill ist besser, wenn du repositorygenaue browser_use-Details brauchst, etwa zu ChatBrowserUse, output_model_schema, Domain-Beschränkungen, Fallback-LLM-Verhalten, der Grenze zwischen Cloud und Open Source oder Besonderheiten der Actor API.

Wann sollte ich open-source nicht verwenden?

Nutze ihn nicht, wenn deine Aufgabe betrifft:

Browser Use Cloud-Preise oder Hinweise zum Cloud SDK
allgemeine Browser-Automatisierung ohne browser_use
direkte befehlsartige Browser-Steuerung, die besser zu einem anderen Skill passt

Wenn sich deine Anfrage nicht auf die Python-Bibliothek oder die Browser Use-Dokumentation bezieht, ist dieser Skill wahrscheinlich das falsche Werkzeug.

Hilft open-source bei der Modellauswahl?

Ja. Die Referenzen enthalten unterstützte Model-Provider und Umgebungsvariablen für Browser Use, Google Gemini, OpenAI, Anthropic, Azure OpenAI, Bedrock, Groq, Ollama und OpenAI-kompatible APIs. Das ist einer der praktischsten Gründe, den Skill vor dem Coding zu verwenden.

Kann open-source auch bei produktionsnahen Anforderungen helfen?

Ja, innerhalb des Bibliotheksumfangs. Er kann bei Retries, Fallback-LLMs, Browser-Persistenz, Remote-Browser-Verbindungen über cdp_url, Monitoring mit Laminar oder OpenLIT sowie performanceorientierten Beispielmustern wie Fast Mode oder parallelen Browsern helfen.

So verbesserst du den open-source-Skill

Gib open-source ein konkretes Implementierungsziel

Der schnellste Weg zu besseren Ergebnissen ist, genau anzugeben, welches Code-Objekt du möchtest:

„write an Agent example”
„configure a Browser with cdp_url”
„add a custom tool”
„return structured output”
„show Actor API page interaction”

Das reduziert Drift zwischen Referenzdateien und vermeidet vermischte Antworten.

Nenne Runtime- und Provider-Details direkt am Anfang

Viele schwache Ausgaben entstehen durch fehlende Annahmen zur Umgebung. Nenne deshalb:

Python-Kontext
gewählte Modellklasse
Quelle des API-Keys
headless vs. sichtbarer Browser
lokaler Browser vs. Remote CDP
ob Skills oder MCP benötigt werden

Ohne diese Angaben kann der Skill einen plausiblen Snippet liefern, der in deinem Setup trotzdem nicht läuft.

Bitte zuerst um ein lauffähiges Beispiel, dann erst um Abstraktionen

Wenn du eine wiederverwendbare Architektur willst, frag trotzdem zuerst nach einem lauffähigen Script. Iteriere danach in Richtung:

Hilfsfunktionen
Auslagerung der Konfiguration
robustere Schemata
Tool-Registrierung
Monitoring-Hooks

So erkennst du Installations- und Importfehler frühzeitig — und genau dort entsteht meistens die Reibung bei der Einführung.

Nenne die Referenzdatei, auf der die Antwort basieren soll

Ein besonders wirksames Prompt-Muster ist:

Use the open-source skill and ground the answer in `references/agent.md` and `references/browser.md`.

Nutze das, wenn Genauigkeit wichtiger ist als Breite. So bleibt der Skill näher an der tatsächlichen API-Oberfläche des Repositories.

Häufige Fehlerbilder, auf die du achten solltest

Die wichtigsten Hürden bei der Einführung sind:

Cloud-Produkt-Hinweise mit Open-Source-Bibliothekscode zu vermischen
in Actor-API-Beispielen von Playwright-Verhalten auszugehen
fehlende Provider-Umgebungsvariablen
nach fortgeschrittenen Features zu fragen, ohne das Basissetup zu nennen
„browser-use“-Hilfe anzufordern, ohne zu sagen, ob Agent, Browser, Tools oder die Actor API gemeint sind

Wenn die erste Antwort zu breit wirkt, grenze lieber die API-Oberfläche ein, statt einfach nach „mehr Details“ zu fragen.

Liefere stärkere Eingaben für bessere Code-Generierung

Besserer Prompt:

Use the open-source skill to generate Python code with:
- `from browser_use import Agent, Browser, ChatOpenAI`
- model `gpt-4.1-mini`
- headless browser
- `allowed_domains=["example.com"]`
- structured output via Pydantic
- cost tracking enabled
Return install steps, env vars, and a short explanation of each parameter.

Das funktioniert, weil jedes gewünschte Feature sauber auf dokumentierte Referenzen abgebildet werden kann.

Nach der ersten Ausgabe gezielt iterieren

Sobald du eine erste Antwort hast, kannst du sie mit einer dieser Nachfragen verbessern:

„Remove everything non-essential and keep it runnable.”
„Adapt this to ChatBrowserUse() instead of OpenAI.”
„Add a custom tool and explain where it plugs into the agent.”
„Switch from Agent to Actor API for deterministic control.”
„Add monitoring with OpenLIT only.”

Solche gezielten Überarbeitungen liefern meist bessere Ergebnisse als ein einzelner riesiger Prompt.

Nutze open-source als Doku-Router, nicht nur als Zusammenfassungstool

Der beste Einsatz von open-source ist als Routing-Schicht zu den richtigen internen Docs. Betrachte ihn als schnellen Weg zur exakt passenden Referenz und frage dann nach Code, der auf dieser Datei basiert. Genau dort liefert der Skill echten Mehrwert gegenüber einem generischen Prompt oder einem schnellen Repo-Überflug.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

dart-flutter-patterns

von affaan-m

dart-flutter-patterns ist ein praxisnahes Dart- und Flutter-Skill für die Frontend-Entwicklung und deckt Null Safety, immutable Zustände, asynchrone Komposition, Widget-Struktur, State Management, GoRouter-Navigation, Dio-Netzwerkzugriffe, Tests und Clean Architecture ab. Nutze den dart-flutter-patterns-Guide, um produktionsreife Patterns für neue Features und Refactorings auszuwählen.

Frontend Development

Favoriten 0GitHub 156.1k

vercel-react-native-skills

von vercel-labs

vercel-react-native-skills ist ein React-Native- und Expo-Skill für performanceorientierte Frontend-Entwicklung. Nutze ihn, um Listen-Rendering, Animationen, Navigation, UI-Patterns, State Management und das Setup nativer Module zu verbessern. Er bietet praxisnahe Regeln, Installationshinweise und Nutzungsmuster, um Mobile-App-Engpässe mit weniger Rätselraten zu lösen.

Frontend Development

Favoriten 0GitHub 25.9k

chatgpt-apps

von openai

chatgpt-apps ist das Skill für das Erstellen oder Reparieren von ChatGPT Apps SDK-Projekten, die einen MCP-Server mit einer Widget-UI kombinieren. Verwenden Sie es für docs-konforme Einrichtung, Tool-Design, Bridge-Verdrahtung, Resource-Registrierung, Metadata, CSP und Repo-Validierung. Es unterstützt außerdem chatgpt-apps für Backend Development, wenn Backend und UI gemeinsam entworfen werden müssen.

Backend Development

Favoriten 0GitHub 18.6k

gsap-frameworks

von greensock

gsap-frameworks ist das GSAP-Skill für Vue, Nuxt, Svelte, SvelteKit und andere Nicht-React-Frameworks. Es behandelt lifecycle-sichere Einrichtung von Animationen, scoped Selektoren und Cleanup beim Unmount, damit Komponentenanimationen in der Frontend-Entwicklung korrekt funktionieren.

Frontend Development

Favoriten 0GitHub 3.2k

gsap-react

von greensock

gsap-react ist der offizielle GSAP Skill für React und Next.js. Er behandelt useGSAP(), refs, gsap.context(), scoped selectors und Cleanup, damit du React-sichere Animationen ohne Re-render- oder Unmount-Bugs bauen kannst. Nutze diesen gsap-react-Guide, wenn du Hilfe bei Installation und Anwendung für die Frontend-Entwicklung brauchst.

Frontend Development

Favoriten 0GitHub 3.2k

azure-ai-projects-ts

von microsoft

Erstellen Sie Azure AI Foundry-Apps mit azure-ai-projects-ts und @azure/ai-projects in TypeScript. Nutzen Sie dieses Skill für Projekt-Clients, Agents, Verbindungen, Deployments, Datasets, Indizes, Evaluierungen und den Zugriff auf OpenAI. Es ist ein praxisnaher Leitfaden für die API-Entwicklung mit Azure-Projektressourcen und Anmeldedaten.

API Development

Favoriten 0GitHub 2.3k

terraform-style-guide

von hashicorp

terraform-style-guide hilft beim Erstellen und Prüfen von Terraform HCL nach HashiCorp-Styleguide, sinnvoller Dateistruktur und sicherheitsbewussten Standardwerten. Verwenden Sie es für Terraform-nahen Code, Modulaufbau, Variablen, Outputs und sicherere Konfigurationen in realen Repositories.

Code Generation

Favoriten 0GitHub 583

swift

von Joannis

Das swift skill hilft dir, besseren Swift-Code mit weniger Rätselraten zu schreiben. Nutze es für Swift-Konfiguration, Logging, Observability, Testing, plattformübergreifende Muster, API-Design, Zugriffskontrolle und Speichersicherheitsfunktionen. Besonders nützlich ist es für Swift for Backend Development, wo praxisnahe swift-Nutzung, Installationshinweise und repo-bewusste Implementierungsdetails zählen.

Backend Development

Favoriten 0GitHub 57

wp-block-development

von WordPress

Die wp-block-development Skill hilft dir dabei, WordPress-Gutenberg-Blöcke mit weniger Rätselraten zu erstellen, zu aktualisieren und zu debuggen. Verwende sie für block.json-Metadaten, register_block_type(_from_metadata), Attribute und Serialisierung, Supports, dynamisches Rendering, Deprecations und Build-Tooling. Besonders nützlich ist sie für Frontend-Development-Aufgaben, bei denen Editor- und Frontend-Parität wichtig ist.

Frontend Development

Favoriten 0GitHub 0

remotion-video-creation

von affaan-m

remotion-video-creation ist eine Remotion-fokussierte Skill für React-Videoarbeit. Sie hilft, Renderfehler zu reduzieren – mit 29 Regeln zu Animationen, Assets, Audio, Untertiteln, Charts, Compositions und Übergängen. Geeignet für Video-Editing-Workflows, Vorlagen-Erklärvideos, Social Clips und datengetriebene Motion Graphics.

Video Editing

Favoriten 0GitHub 156.2k

terraform-test

von hashicorp

terraform-test ist ein praxisnaher Leitfaden zum Schreiben und Ausführen von Terraform-Tests mit `.tftest.hcl`-Dateien, `run`-Blöcken, Assertions, Mocks und CI-tauglichen Workflows. Nutzen Sie ihn, um Modul-Outputs, Resource-Argumente, bedingte Logik sowie `plan`- oder `apply`-Verhalten vor dem Merge zu validieren.

Code Generation

Favoriten 0GitHub 583

agentic-development

von alinaqi

Die agentic-development-Skill hilft dir dabei, KI-Agenten für mehrstufige Orchestrierung mit Pydantic AI in Python oder dem Claude Agent SDK in Node.js zu bauen. Nutze sie, um ein Framework auszuwählen, Tools zu definieren und typisierte, produktionsreife Agenten-Workflows zu gestalten.

Agent Orchestration

Favoriten 0GitHub 0

source-driven-development

von addyosmani

Die source-driven-development Skill verankert frameworkspezifische Entwicklung in offiziellen Dokumentationen und hilft dabei, Patterns vor der Implementierung zu verifizieren. Sie eignet sich besonders für den Einsatz von source-driven-development in React, Vue, Next.js, Svelte, Angular und ähnlichen Stacks, wenn Korrektheit, belastbare Quellen und versionssensible Entscheidungen wichtig sind.

Code Generation

Favoriten 0GitHub 18.8k

huggingface-llm-trainer

von huggingface

huggingface-llm-trainer hilft dir, Sprach- und Vision-Modelle auf Hugging Face Jobs mit TRL oder Unsloth zu trainieren oder feinzujustieren. Nutze diese huggingface-llm-trainer Skill für SFT, DPO, GRPO, Reward Modeling, Dataset-Checks, GPU-Auswahl, Speichern auf dem Hub, Trackio-Monitoring und GGUF-Export in Backend-Entwicklungs-Workflows.

Backend Development

Favoriten 0GitHub 10.4k

azure-ai-voicelive-ts

von microsoft

azure-ai-voicelive-ts hilft Ihnen, Echtzeit-Voice-AI-Apps mit dem Azure AI Voice Live TypeScript SDK zu entwickeln. Nutzen Sie es für Node.js- oder Browser-Projekte, die bidirektionales Audio, Streaming-Antworten, Session-Setup und Function Calling benötigen. Diese Anleitung zu azure-ai-voicelive-ts ist hilfreich, wenn Sie praktische Unterstützung bei Installation, Nutzung und Codegenerierung suchen.

Code Generation

Favoriten 0GitHub 2.3k

azure-ai-openai-dotnet

von microsoft

azure-ai-openai-dotnet hilft .NET-Entwicklern dabei, Azure OpenAI praxisnah zu integrieren – mit klaren Hinweisen zu Einrichtung, Authentifizierung, Client-Auswahl und der Nutzung für Chat, Embeddings, Bilder, Audio und Assistenten. Das ist besonders nützlich für API-Entwicklung, wenn Sie einen funktionsfähigen Einstiegspunkt mit Azure.AI.OpenAI suchen und nicht nur eine konzeptionelle Zusammenfassung.

API Development

Favoriten 0GitHub 2.2k