baoyu-danger-gemini-web

von JimLiu

baoyu-danger-gemini-web ist ein Gemini-Web-Client-Wrapper für Text, Bildgenerierung, Vision mit Referenzbildern und mehrturnige Chats. Er läuft aus dem lokalen Skill-Repo mit bun oder npx, nutzt Skripte unter `scripts/` und erfordert vor Installation und Nutzung beim ersten Einsatz eine Zustimmungskontrolle.

Stars13.2k

Favoriten0

Kommentare0

Hinzugefügt5. Apr. 2026

KategorieImage Generation

Installationsbefehl

npx skills add JimLiu/baoyu-skills --skill baoyu-danger-gemini-web

Kurationswert

Dieser Skill erreicht 74/100. Damit ist er grundsätzlich listbar und voraussichtlich nützlich für Agents, die Gemini-gestützte Text- oder Bildgenerierung benötigen. Verzeichnisnutzer sollten aber mit etwas Einrichtungsaufwand und policiesensibler Handhabung rechnen. Das Repository zeigt echte Workflow-Substanz: ein umfangreiches SKILL.md, klare Trigger-Phrasen, Consent-Gating für die Nutzung einer reverse-engineerten API sowie eine nicht triviale TypeScript-Implementierung mit CLI-Einstiegspunkt und Gemini-Web-Client-Bibliothek.

74/100

Stärken

Gute Triggerbarkeit: Die Beschreibung nennt die Einsatzfälle klar, darunter Gemini-Textgenerierung, Bildgenerierung, Vision-/Referenzbild-Eingaben und mehrturnige Konversationen.
Echte operative Substanz: Das Repo enthält ein umfangreicheres `scripts`-Verzeichnis mit `main.ts` sowie einen vollständigen `gemini-webapi`-Client, Typen, Utilities und Fehlerbehandlung statt nur eines dünnen Prompt-Wrappers.
Vertrauenssignal für einen risikoreichen Workflow: `SKILL.md` verlangt vor der ersten Nutzung ausdrücklich eine Zustimmung des Nutzers für die reverse-engineerte API.

Hinweise

Es bleibt Reibung bei der Einführung: `SKILL.md` enthält Hinweise zur Runtime-Auflösung, aber keinen direkten Installationsbefehl, und der Workflow hängt vermutlich von externer Umgebungs- bzw. Browser-Cookie-Konfiguration ab, die hier nur teilweise sichtbar ist.
Dies ist eine reverse-engineerte „danger“-Integration; Zuverlässigkeit und Policy-Fit können daher fragiler sein als bei offiziellen APIs.

Gemini Google Ai Cli TypeScript Node.js Workflow

Überblick

Überblick über den baoyu-danger-gemini-web Skill

Was der baoyu-danger-gemini-web Skill macht

Der baoyu-danger-gemini-web Skill ist ein Gemini-Web-Client-Wrapper, mit dem ein Agent Texte generieren, Bilder erstellen, Referenzbilder verwenden und mehrstufige Chats fortsetzen kann — über einen per Reverse Engineering nachgebildeten Web-Flow statt über eine offizielle API. Der eigentliche Nutzen ist sehr praktisch: Wenn du in einem Skill-Workflow Gemini-ähnliche Bildgenerierung oder vision-fähige Prompts brauchst, bekommst du hier einen lokal lauffähigen Weg, statt selbst fragile Web-Requests zusammenzubauen.

Für wen sich die Installation lohnt

Am besten geeignet ist der Skill für Nutzer, die bereits mit lokalen AI-Skills arbeiten, bun oder npx -y bun problemlos ausführen können und gezielt baoyu-danger-gemini-web for Image Generation oder Vision-Eingaben nutzen möchten. Weniger passend ist er für Teams, die offiziellen Vendor-Support, stabile API-Verträge oder einfache Cloud-Bereitstellung brauchen. Das Repository selbst verlangt vor der ersten Nutzung eine Consent-Prüfung — ein klares Signal, dass sich das Ganze an informierte, praxisnahe Anwender richtet.

Warum man ihn statt eines einfachen Prompts wählt

Ein normaler Prompt liefert dir weder Transport-Layer, Cookie-Handling, Upload-Flow, Token-Refresh-Verhalten noch die Struktur für Chat- und Bildanfragen. Der baoyu-danger-gemini-web skill kapselt diese Details in scripts/main.ts und im Client-Code unter scripts/gemini-webapi/. Das reduziert Rätselraten, wenn die Aufgabe nicht einfach „einen guten Prompt schreiben“ lautet, sondern konkret „Gemini Web als Backend verwenden“.

Zentrale Abwägungen vor der Einführung

Das wichtigste Unterscheidungsmerkmal ist die Breite der Fähigkeiten: Text, Bildgenerierung, Referenzbild-Eingabe, Chat-Kontinuität und gem-bezogener Client-Support in einem einzigen Codepfad. Der zentrale Nachteil liegt schon im Namen und im Code offen zutage: Das Ganze hängt von per Reverse Engineering erschlossenem Gemini-Web-Verhalten ab. Brüche, Auth-Reibung, Rate Limits und temporäre Sperren sind daher realistische Risiken. Wenn das für deinen Anwendungsfall nicht akzeptabel ist, solltest du den Skill nicht installieren.

So nutzt du den baoyu-danger-gemini-web Skill

Installationskontext und Laufzeitvoraussetzungen

baoyu-danger-gemini-web install setzt das Skill-Repo plus eine JS-Laufzeit voraus. Das Frontmatter des Skills erwartet entweder bun oder npx. In der Praxis solltest du zuerst diese Dateien lesen:

SKILL.md
scripts/package.json
scripts/main.ts
scripts/gemini-webapi/client.ts
scripts/gemini-webapi/constants.ts
scripts/gemini-webapi/exceptions.ts

Laut Repository liegt die gesamte ausführbare Logik unter scripts/. Wenn bun installiert ist, nutze es; andernfalls unterstützt der Skill ausdrücklich npx -y bun. Überspringe nicht den in SKILL.md beschriebenen Consent-Schritt, denn die Zustimmung bei der Erstnutzung ist Teil des vorgesehenen Workflows.

Welche Eingaben baoyu-danger-gemini-web braucht

Für eine gute baoyu-danger-gemini-web usage solltest du Folgendes mitgeben:

einen klaren Aufgabentyp: text, image generation, vision with reference image oder multi-turn chat
das eigentliche Nutzerziel in einem Satz
Ausgabevorgaben wie Stil, Seitenverhältnis, Format, Zielgruppe oder Anzahl der Varianten
einen Referenzbild-Pfad oder bisherigen Gesprächskontext
die Fehlertoleranz: ob du einen besten Einzelversuch willst oder iterative Verfeinerung

Eine schwache Anfrage wäre: „Make an image with Gemini.“
Eine stärkere Anfrage wäre: „Use baoyu-danger-gemini-web to generate 3 product-hero concepts for a matte black coffee grinder on a white seamless background, premium e-commerce style, front 3/4 angle, soft studio shadows, no text overlays.“

Aus einem groben Ziel eine brauchbare baoyu-danger-gemini-web Invocation machen

Der Skill funktioniert am besten, wenn du eine Absicht in ein ausführbares Briefing übersetzt. Eine praxistaugliche Vorlage:

Modus nennen: image, text oder vision.
Motiv und Zweck definieren.
Stil und Einschränkungen ergänzen.
Referenzen oder Chat-Verlauf hinzufügen.
Benennen, woran Erfolg erkennbar ist.

Beispiel-Prompt für baoyu-danger-gemini-web for Image Generation:
“Generate an image. Subject: futuristic hiking backpack for a landing page hero. Style: outdoor editorial photography, sunrise rim light, realistic materials. Constraints: no people, centered composition, 16:9, high detail, brand-safe. Return the best result plus a short revision note if the scene looks too cluttered.”

Für die Nutzung mit Referenzbild:
“Analyze the attached product photo and generate a cleaner marketing version that preserves silhouette, zipper placement, and color blocking, but improves lighting and background.”

Empfohlener Workflow und Debugging-Pfad

Starte einfach: zunächst nur Text oder eine einzelne Bildanfrage, danach erst Referenzen und Chat-Kontinuität ergänzen, sobald der Transport funktioniert. Wenn etwas fehlschlägt, prüfe die wahrscheinliche Ebene in dieser Reihenfolge:

SKILL.md für Consent- und Runtime-Regeln
scripts/main.ts für das CLI-Verhalten
scripts/gemini-webapi/utils/load-browser-cookies.ts und cookie-file.ts für Auth-/Cookie-Handling
get-access-token.ts und rotate-1psidts.ts bei Problemen mit dem Token-Refresh
exceptions.ts für typische Fehlerklassen wie AuthError, UsageLimitExceeded, TemporarilyBlocked oder ImageGenerationError

Dieses Repo lässt sich leichter einführen, wenn du es als operativen Connector verstehst und nicht als generisches Prompt-Paket.

FAQ zum baoyu-danger-gemini-web Skill

Ist der baoyu-danger-gemini-web Skill gut für Einsteiger?

Nur wenn du dich damit wohlfühlst, TypeScript zu lesen und lokale Runtime-Probleme zu beheben. Der baoyu-danger-gemini-web guide ist konzeptionell nicht besonders schwer, aber er ist nicht einsteigerfreundlich im Sinn von „einmal klicken und los“. Möglicherweise musst du Cookies, Browser-Session-Status oder Modellverhalten selbst debuggen.

Wann ist das besser als offizielle APIs oder normales Prompting?

Nutze den baoyu-danger-gemini-web skill, wenn du gezielt Gemini-Web-Verhalten, Bildgenerierung über genau diesen Pfad oder einen lokalen Skill brauchst, der Text, Bilder und Chat in einem Ablauf kombiniert. Greife zu offiziellen APIs, wenn du Supportfähigkeit, Verträge, klarere Quoten oder Produktionszuverlässigkeit benötigst. Normales Prompting reicht nur dann, wenn du keine ausführbare Integration brauchst.

Was sind die größten Risiken vor der Installation?

Die größten Risiken sind Auth-Ausfälle, service-seitige Änderungen, Nutzungslimits und temporäre IP- oder Account-Beschränkungen. Die Codebasis definiert dafür bereits Fehlerfälle, was hilfreich ist — aber zugleich bestätigt, dass es sich nicht um seltene Randfälle, sondern um erwartbare Realitäten handelt.

Wann sollte ich baoyu-danger-gemini-web for Image Generation vermeiden?

Vermeide den Skill, wenn deine Umgebung keinen per Reverse Engineering erschlossenen Webzugriff zulässt, dein Compliance-Team ausschließlich offizielle Endpunkte erlaubt oder dein Workflow auf sehr verlässliche Verfügbarkeit angewiesen ist. Ebenfalls ungeeignet ist er, wenn du nur einfache Textgenerierung brauchst, die ein offizielles SDK ohnehin sauber abdeckt.

So verbesserst du den baoyu-danger-gemini-web Skill

Gib für baoyu-danger-gemini-web reichhaltigere Task-Briefings statt nur längerer Prompts

Der schnellste Qualitätsgewinn bei baoyu-danger-gemini-web usage kommt durch strukturierte Eingaben. Bei Bildaufgaben solltest du Motiv, Szene, Komposition, Licht, Realismusgrad, Ausschlüsse und Einsatzzweck benennen. Bei Vision-Aufgaben solltest du klar sagen, was unverändert bleiben muss und was neu gestaltet werden darf. Das reduziert Drift und macht Ergebnisse im ersten Durchlauf deutlich brauchbarer.

Häufige Fehlerquellen gezielt reduzieren

Typische Fehler sind vage Prompts, fehlende Referenzvorgaben und der Versuch, in einem einzigen Turn zu viel zu erledigen. Teile die Arbeit in Stufen auf:

zuerst generieren oder analysieren
danach Komposition/Stil verfeinern
anschließend das finale Cleanup anfordern

Wenn die Bildausgabe nicht zur Marke passt, ergänze klare Negatives wie „no text, no watermark, no extra objects, no exaggerated stylization.“ Wenn der Chat-Kontext unscharf wird, formuliere das aktuelle Ziel erneut, statt davon auszugehen, dass die Session es schon richtig abgeleitet hat.

Repo-Interna nutzen, um intelligenter zu debuggen

Um Ergebnisse mit dem baoyu-danger-gemini-web skill zu verbessern, solltest du den Code dort lesen, wo das Verhalten tatsächlich definiert ist. constants.ts zeigt Endpunkte und Modelldefinitionen. client.ts enthält Logik zu Retry, Timeout, Upload und Parsing. exceptions.ts macht sichtbar, wie das Tool Fehler klassifiziert. Das ist deutlich hilfreicher, als denselben Prompt einfach immer wieder neu auszuführen.

Nach der ersten Ausgabe gezielt iterieren

Bewerte den Skill nicht nach nur einem Durchlauf. Fordere gezielte Überarbeitungen an:

“keep composition, reduce background clutter”
“preserve product shape, improve material realism”
“same scene, but cleaner color palette and softer shadows”

Das funktioniert besser als „make it better“, weil baoyu-danger-gemini-web dann am stärksten ist, wenn sowohl das Ziel als auch der Änderungswunsch explizit formuliert sind.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

baoyu-imagine

von JimLiu

baoyu-imagine ist ein Skill zur Bildgenerierung mit mehreren Anbietern, typisierter CLI, verpflichtender EXTEND.md-Einrichtung, Unterstützung für Referenzbilder, Seitenverhältnis-Steuerung und Batch-Läufen über OpenAI, Azure OpenAI, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream und Replicate.

Image Generation

Favoriten 0GitHub 13.2k

baoyu-comic

von JimLiu

baoyu-comic ist ein Skill, der Quelltexte in Lehrcomics oder biografische Comics umwandelt – mit Storyboard-Planung, konsistenten Figuren, Panel-Layouts und stufenweiser Bildgenerierung. Er unterstützt die Nutzung über eine installierbare CLI, bietet Stil- und Layoutoptionen und deckt auch Teilabläufe wie `--storyboard-only`, `--prompts-only` und `--regenerate` für eine kontrollierte Comic-Produktion ab.

Image Generation

Favoriten 0GitHub 13.2k

videoagent-video-studio

von pexoai

videoagent-video-studio ist ein Skill zur Erstellung kurzer KI-Videos aus Text, Bildern und Referenzen. Er eignet sich, um Text-zu-Video- und Bild-zu-Video-Workflows zu testen, unterstützte Modelle zu vergleichen und den gehosteten Proxy oder ein Self-Hosted-Setup mit Node 18+ zu nutzen.

Video Editing

Favoriten 0GitHub 456

baoyu-xhs-images

von JimLiu

baoyu-xhs-images verwandelt Artikel oder Notizen in Xiaohongshu-Infografik-Karussells mit Presets, Stilen, Layouts und Hinweisen zur Einrichtung. Der Skill hilft bei Installation, Eingabeauswahl und der Nutzung von `/baoyu-xhs-images` für strukturierte Social-Posts mit mehreren Slides.

UI Design

Favoriten 0GitHub 13.2k

baoyu-cover-image

von JimLiu

baoyu-cover-image unterstützt Agenten dabei, strukturierte Prompts für Artikel-Coverbilder anhand von Typ, Farbpalette, Rendering, Text und Stimmung zu erstellen. Es unterstützt die Formate 2.35:1, 16:9 und 1:1, enthält Regeln zur automatischen Auswahl sowie Hinweise zur Kompatibilität und eignet sich für wiederholbare redaktionelle Workflows und UI-Design-Coverprozesse.

UI Design

Favoriten 0GitHub 13.2k

meme-factory

von softaworks

meme-factory hilft Agents, vorlagenbasierte Memes mit der kostenlosen `memegen.link`-API sowie Markdown-taugliche Text-Memes zu erstellen. Damit lassen sich teilbare Meme-URLs erzeugen, passende Templates auswählen, Texte korrekt formatieren und Ausgaben mit dem enthaltenen Python-Helfer automatisieren.

Image Generation

Favoriten 0GitHub 1.3k

logo-creator

von ReScienceLab

logo-creator ist ein KI-Workflow für Logos, mit dem sich Konzepte erstellen, Varianten vergleichen, Motive zuschneiden, Hintergründe entfernen und SVG-Assets exportieren lassen. Er nutzt Stilreferenzen, Beispiel-Prompts und Hilfsskripte für die Erstellung von Logos, Icons, Favicons und Brand Marks in ReScienceLab/opc-skills.

Branding

Favoriten 0GitHub 0

banner-creator

von ReScienceLab

banner-creator unterstützt bei der Erstellung von Bannern, Headern und Hero-Bildern mit einem strukturierten Workflow: Anforderungen erfassen, Varianten erzeugen, per Feedback verfeinern und mit dem enthaltenen Script auf passende Plattformformate zuschneiden.

UI Design

Favoriten 0GitHub 0

baoyu-article-illustrator

von JimLiu

baoyu-article-illustrator hilft Agents dabei, aus Artikelentwürfen strukturierte Illustrations-Prompts, passende Platzierungen sowie konsistente Entscheidungen zu Typ und Stil für Erklärstücke, Tutorials, Diagramme und Beiträge mit mehreren Bildern abzuleiten.

Image Generation

Favoriten 0GitHub 13.2k

nanobanana

von ReScienceLab

nanobanana ist eine Python-CLI-Skill für Google Gemini 3 Pro Image und unterstützt Text-zu-Bild, Bildbearbeitung, Seitenverhältnisse, 2K-/4K-Ausgabe sowie Batch-Generierung mit einfachen lokalen Skripten.

Image Generation

Favoriten 0GitHub 654

videoagent-image-studio

von pexoai

videoagent-image-studio ist ein einheitlicher Skill zur Bildgenerierung für Node-basierte Agents. Er bietet einen einzigen CLI-Ablauf für Midjourney, Flux, Ideogram, Recraft, SDXL und weitere Modelle – mit proxy-gestütztem Setup, Orientierung bei der Modellauswahl und vereinheitlichten Ausgaben für die Automatisierung.

Image Generation

Favoriten 0GitHub 456

algorithmic-art

von anthropics

algorithmic-art unterstützt bei originärer generativer Kunst in p5.js mit einem zweistufigen Workflow: erst eine algorithmische Gestaltungslogik formulieren, dann lauffähige .html- und .js-Ausgaben mit Seed-Zufall, Parametersteuerung und interaktivem Viewer erstellen.

Image Generation

Favoriten 0GitHub 105k

canvas-design

von anthropics

canvas-design unterstützt originale statische Visuals in zwei Schritten: erst eine Designphilosophie in Markdown formulieren, dann als .png oder .pdf ausgeben. Am besten für Poster, Cover-Art, Konzeptvisuals und kampagnennahe UI-Grafiken mit wenig Text.

UI Design

Favoriten 0GitHub 105k

frontend-design

von anthropics

frontend-design verwandelt vage UI-Ideen in markante, produktionsreife Interfaces mit echtem Frontend-Code, klarer Designrichtung und weniger generischem AI-Look.

UI Design

Favoriten 0GitHub 105.2k

create-colleague

von titanwings

create-colleague macht aus Dokumenten, Chats, E-Mails, Screenshots, Feishu- und DingTalk-Daten von Kolleg:innen ein bearbeitbares AI-Skill mit getrennten Ausgaben für Arbeitsweise und Persona sowie Update-Abläufen für die laufende Verfeinerung.

Skill Authoring

Favoriten 1GitHub 747

skill-creator

von anthropics

skill-creator ist eine Meta-Skill zur Skill-Erstellung: neue Skills entwerfen, bestehende `SKILL.md` überarbeiten, Evals ausführen, Varianten vergleichen und Trigger-Beschreibungen mit Repo-Skripten und Review-Tools verbessern.

Skill Authoring

Favoriten 0GitHub 105.1k