videoagent-image-studio

von pexoai

videoagent-image-studio ist ein einheitlicher Skill zur Bildgenerierung für Node-basierte Agents. Er bietet einen einzigen CLI-Ablauf für Midjourney, Flux, Ideogram, Recraft, SDXL und weitere Modelle – mit proxy-gestütztem Setup, Orientierung bei der Modellauswahl und vereinheitlichten Ausgaben für die Automatisierung.

Stars456

Favoriten0

Kommentare0

Hinzugefügt31. März 2026

KategorieImage Generation

Installationsbefehl

npx skills add pexoai/pexo-skills --skill videoagent-image-studio

Kurationswert

Dieser Skill erreicht 78/100 und ist damit ein solider Verzeichniseintrag: Das Repository gibt Agents einen klaren Auslöser, einen konkreten Workflow zur Bildgenerierung und echten Ausführungsnutzen über einen generischen Prompt hinaus. Nutzer eines Verzeichnisses können sich guten Gewissens für die Installation entscheiden, wenn sie einen einzigen CLI-Einstiegspunkt für mehrere Bildmodelle suchen, sollten aber die gewisse Unstimmigkeit zwischen dem Zero-Setup-Versprechen und der breiter gefassten Repo-Dokumentation beachten.

78/100

Stärken

Hohe Auslösbarkeit: In SKILL.md steht ausdrücklich, dass der Skill verwendet werden soll, wenn ein Nutzer Bilder, Artwork, Logos, Icons oder Illustrationen generieren oder erstellen möchte.
Gute operative Anleitung: Der Skill enthält eine Tabelle zur Modellauswahl, einen Schritt zur Prompt-Optimierung und eine echte Node-CLI (`tools/generate.js`) mit dokumentierten Argumenten und vereinheitlichter Ausgabebehandlung.
Spürbarer Mehrwert für Agents: Er bündelt den Zugriff auf mehrere Modelle, darunter Midjourney, Flux, Ideogram, Recraft, SDXL und Nano Banana, und übernimmt das Midjourney-Polling intern.

Hinweise

Das Vertrauenssignal ist uneinheitlich: SKILL.md und package.json betonen die Nutzung ohne Schlüssel über einen Hosted Proxy, aber CONTRIBUTING.md und `.env.example` verweisen für die lokale Entwicklung auf API-Keys der Anbieter.
Die Klarheit zur Einführung ist nur mittelmäßig: In SKILL.md gibt es keinen expliziten Installationsbefehl, und das Begleitmaterial beschränkt sich auf ein einzelnes Skript ohne weitere Referenzen oder Assets.

Video Cli Node.js JavaScript Vercel OpenClaw

Überblick

Überblick über die videoagent-image-studio-Skill

Was videoagent-image-studio macht

Die videoagent-image-studio-Skill ist ein einheitlicher Wrapper für Bildgenerierung für Agents, die Bilder erzeugen müssen, ohne mehrere Provider-APIs manuell parallel zu handhaben. Sie stellt einen einzigen CLI-Workflow bereit, der Modelle wie midjourney, flux-pro, flux-dev, flux-schnell, ideogram, recraft, sdxl und nano-banana ansteuern kann und dabei ein konsistentes Ergebnisformat zurückgibt.

Für wen sich die Installation lohnt

Diese Skill passt zu Nutzerinnen und Nutzern, die regelmäßig Bilder aus konversationellen Anfragen erzeugen und dabei weniger operativen Aufwand als bei direkten Provider-Integrationen möchten. Besonders nützlich ist sie für Agent-Builder, Content-Teams und Workflow-Automatisierer, die lieber einen wiederholbaren Befehl statt modellspezifischer Einrichtung verwenden.

Der eigentliche Job-to-be-done

Die meisten wollen nicht einfach „ein Bildmodell“, sondern einen verlässlichen Weg, um aus einer vagen Anfrage wie „make a cinematic product shot“ oder „create a logo with readable text“ einen tatsächlich ausführbaren Generierungsschritt zu machen. videoagent-image-studio hilft dabei, indem es Hinweise zur Prompt-Verbesserung, Empfehlungen zur Modellauswahl und einen einheitlichen Ausführungspfad kombiniert.

Warum videoagent-image-studio heraussticht

Das zentrale Unterscheidungsmerkmal ist nicht nur der reine Zugriff auf Modelle. Der Mehrwert von videoagent-image-studio liegt darin, dass es:

per One-Call-Zugriff mehrere Bildmodelle erreichbar macht
die asynchrone Komplexität von Midjourney-artigen Abläufen im Skript verbirgt
Ausgaben für nachgelagerte Automatisierung normalisiert
die Einstiegshürde senkt, weil sich der gehostete Proxy ohne eigene Provider-Keys nutzen lässt

Was vor der Einführung wichtig ist

Die wichtigste Installationsentscheidung ist, ob dir Komfort wichtiger ist als direkte Provider-Kontrolle. Wenn du eine einfache, agent-freundliche Schicht für Bildgenerierung mit minimalem Setup suchst, ist videoagent-image-studio eine starke Wahl. Wenn du tiefgehende provider-native Optionen, eigene Safety-Einstellungen oder fortgeschrittene Batch-Orchestrierung brauchst, kannst du der Abstraktion später entwachsen.

Beste Einsatzfälle für videoagent-image-studio bei der Bildgenerierung

Nutze videoagent-image-studio for Image Generation, wenn die Anfrage klar auf die Erstellung von Visuals zielt: Illustrationen, Poster, Logos, Produkt-Renderings, Social Images, Concept Art, Anime-Szenen oder stilisierte Marketing-Assets. Weniger überzeugend ist es für aufwendige Bildbearbeitungspipelines oder komplexe multimodale Workflows, die Masken, Compositing oder umfangreiche Nachbearbeitung erfordern.

So nutzt du die videoagent-image-studio-Skill

Installationskontext und Laufzeitvoraussetzungen

Das Repository signalisiert node >=18 und enthält mit tools/generate.js genau einen ausführbaren Pfad. In den meisten Fällen ist die praktische Entscheidung für eine videoagent-image-studio install unkompliziert: Wenn deine Umgebung Node-CLI-Tools ausführen kann, kannst du die Skill schnell testen.

Lies zuerst diese Dateien:

SKILL.md
tools/generate.js
.env.example
CHANGELOG.md

Darin steht, wodurch die Skill ausgelöst wird, welche Argumente verfügbar sind, wie die Ausgabe strukturiert ist und ob du Umgebungsvariablen setzen musst.

Wie der Befehl konkret aussieht

Das Grundmuster ist ein direkter Node-Aufruf:

node tools/generate.js --model flux-dev --prompt "a modern ceramic mug on a clean studio table, soft window light" --aspect-ratio 1:1

Das Skript unterstützt unter anderem diese wichtigen Argumente:

--model
--prompt
--aspect-ratio
--num-images
--negative-prompt
--seed

Zusätzlich gibt es aktionsartige Argumente für Workflows wie Midjourney-Follow-ups:

--action
--index
--job-id
--upscale-type
--variation-type

Das richtige Modell wählen, bevor du den Prompt schreibst

Die Modellwahl beeinflusst die Qualität stärker als kleine Formulierungsänderungen. Die Routing-Hinweise der Skill selbst sind praxisnah:

midjourney: künstlerische, cineastische, malerische Szenen
flux-pro: fotorealistische Porträts und produktartige Outputs
flux-dev: ausgewogener Standard für allgemeine Nutzung
flux-schnell: schnelle Entwürfe und Iteration
ideogram: Poster, Logos, Text-im-Bild
recraft: Icons, Vektoren, Flat Design
sdxl: Anime und stilisierte Illustration
nano-banana: auf Konsistenz ausgelegte Generierung mit Referenzbildern

Wenn dein erster Output danebenliegt, wechsle zuerst das Modell, bevor du den Prompt überarbeitest.

So wird aus einer groben Anfrage ein brauchbarer Prompt

Schwacher Input:
make a nice cafe image

Stärkerer Input:
cozy Paris-style street cafe at blue hour, warm interior glow, wet cobblestone reflections, cinematic composition, medium-wide shot, realistic photography, subtle steam from coffee cups, no people blocking storefront signage

Warum das besser funktioniert:

Motiv und Setting sind konkret benannt
Kamera- und Kompositionshinweise sind enthalten
Stil und Realismusgrad werden beschrieben
Unklarheiten über den Bildfokus werden reduziert

Mit klaren Constraints schlechte Outputs vermeiden

Für eine stärkere videoagent-image-studio usage solltest du möglichst angeben:

Motiv
Umgebung
visueller Stil
Komposition oder Bildausschnitt
Licht
Seitenverhältnis
unverzichtbare Elemente
Elemente, die vermieden werden sollen

Beispiel:

node tools/generate.js \
  --model ideogram \
  --prompt "minimal tech conference poster, bold readable headline area, geometric background, blue and black palette, modern Swiss design, high contrast, clean spacing" \
  --aspect-ratio 4:5 \
  --negative-prompt "blurry text, crowded layout, ornate illustration"

Das ist deutlich verlässlicher, als einfach nach „a cool poster“ zu fragen.

Negative Prompts nutzen, wenn Qualitätsdrift vorhersehbar ist

Das Skript akzeptiert --negative-prompt. Das ist hilfreich, wenn das Modell wiederholt den falschen Stil oder unnötige Unordnung hinzufügt. Gute Negative sind konkret und visuell:

extra fingers, distorted hands, deformed face
blurry text, illegible letters
busy background, low contrast
cartoonish, oversaturated, plastic skin

Vermeide überladene Negative mit Dutzenden generischen Fehlern, wenn du diese konkreten Probleme nicht tatsächlich beobachtet hast.

Das Ausgabeformat für Automatisierung verstehen

Laut Changelog gibt es eine normalisierte Ausgabestruktur ähnlich zu:

success
model
imageUrl
images
jobId

Das ist wichtig, wenn du Ergebnisse an einen nachgelagerten Agent-Schritt weiterreichen willst. Ein generischer Prompt liefert dir diese Integrationssicherheit nicht; videoagent-image-studio schon.

Midjourney-Aktionen ohne Rätselraten verwenden

Der Usage-Header des Skripts zeigt ein zweites Befehlsmuster für Folgeaktionen:

node tools/generate.js --model midjourney --action upscale --index 2 --job-id <id>

Das ist relevant, weil manche Bild-Workflows mehrstufig sind. Wenn dein Agent ein Upscale oder eine Variation aus einem ausgewählten Panel erzeugen soll, nutze die expliziten Action-Argumente, statt alles von Grund auf neu zu generieren.

Referenzbilder für Konsistenz nutzen, wenn sie unterstützt werden

Im Changelog ist --reference-images für nano-banana als kommaseparierte URL-Liste dokumentiert. Das ist besonders nützlich für konsistente Charaktere, wiederkehrende Stilwelten oder serielle Kampagnen-Assets. Wenn dein Use Case von „gleiche Person, gleiche Markenanmutung, neue Szene“ abhängt, ist das eine der wertvollsten Funktionen, die du früh prüfen solltest.

Lesepfad durchs Repository für die schnellste Einführung

Für einen praxisnahen videoagent-image-studio guide empfiehlt sich diese Reihenfolge:

SKILL.md für Trigger-Bedingungen und die Tabelle zur Modellauswahl
tools/generate.js für die tatsächlichen CLI-Argumente
CHANGELOG.md für Verhaltensänderungen wie Ausgabeformat und Async-Handling
.env.example für optionale Umgebungs-Konfiguration

Dieser Pfad liefert mehr Entscheidungsgrundlage, als zuerst Contributor-Dokumentation zu lesen.

Gehosteter Proxy vs. lokale Keys

Die Skill bewirbt einen gehosteten Proxy-Pfad, bei dem Nutzer keine Provider-Keys mitbringen müssen. Das ist der einfachste Einstieg. Gleichzeitig enthält das Repo auch .env.example und Contributor-Hinweise mit Variablen wie IMAGE_STUDIO_PROXY_URL, IMAGE_STUDIO_TOKEN sowie ältere lokale Testbeispiele mit Provider-Keys. Für die Installationsentscheidung heißt das:

einfachster Weg: den standardmäßigen proxygestützten Workflow nutzen
fortgeschrittener Weg: die Env-Konfiguration prüfen, wenn dein Deployment eigenes Routing oder Auth benötigt

Ein praxistauglicher Workflow mit videoagent-image-studio

Ein sinnvoller Real-World-Workflow für die videoagent-image-studio-Skill sieht so aus:

Anfrage nach Output-Typ einordnen
wahrscheinlich bestes Modell wählen
Prompt mit konkreten visuellen Constraints umschreiben
zuerst nur ein Bild generieren
Fehlerbild prüfen
Modell oder Prompt ändern, aber nicht beides gleichzeitig
erst danach Bildanzahl erhöhen oder in Upscales/Variationen gehen

So bleibt Iteration günstig und Prompt-Debugging deutlich einfacher.

FAQ zur videoagent-image-studio-Skill

Ist videoagent-image-studio gut für Einsteiger?

Ja, wenn dein Hauptziel ist, schnell Bilder aus einem Agent oder per Terminal-Befehl zu erzeugen. Die Skill nimmt viel provider-spezifische Komplexität ab. Einsteiger müssen trotzdem lernen, Bilder klar zu beschreiben, aber sie müssen keine Multi-Provider-Integration von Grund auf entwerfen.

Wann ist videoagent-image-studio besser als ein normaler Prompt?

Besser ist es immer dann, wenn du verlässliche Ausführung, Modellauswahl und strukturierte Ausgaben brauchst. Ein einfacher Prompt kann eine KI zwar bitten, „ein Bild zu machen“, aber videoagent-image-studio liefert einen ausführbaren Pfad mit expliziter Modellkontrolle und automationsfreundlichen Ergebnissen.

Wann sollte ich videoagent-image-studio nicht verwenden?

Lass es aus, wenn du fortgeschrittene provider-native Steuerungsmöglichkeiten brauchst, die der Wrapper nicht freilegt, oder wenn dein Workflow überwiegend Bildbearbeitung statt Neugenerierung ist. Auch für Teams, die direkte vertragliche Kontrolle über jeden zugrunde liegenden Provider-Call benötigen, ist es nicht die beste Wahl.

Braucht videoagent-image-studio API-Keys?

Die aktuelle Positionierung sagt: nein, nicht für den normalen Hosted-Proxy-Pfad. Das ist ein großer Vorteil bei der Einführung. Prüfe trotzdem .env.example und deine Deployment-Umgebung, wenn du privates Routing, Authentifizierung oder selbstverwaltetes Verhalten brauchst.

Mit welchem Modell sollte ich anfangen?

Starte mit:

flux-dev für allgemeine Generierung
flux-pro für fotorealistische Outputs
ideogram für textlastige Bilder
recraft für Icon- und Vektor-Anforderungen
midjourney für stilisierte cineastische Art

Wenn du unsicher bist, entscheide nach Output-Typ und nicht nach Markenbekanntheit.

Eignet sich videoagent-image-studio für produktive Agents?

Ja, mehr als die meisten ad-hoc Prompting-Setups, weil Invocation und Ausgabeformat standardisiert sind. Die entscheidende Produktionsfrage ist weniger die Fähigkeit als das operative Vertrauen: Teste Latenz, Konsistenz der Outputs, Auth-Setup und Fallback-Verhalten in deiner eigenen Umgebung.

So verbesserst du die videoagent-image-studio-Skill

Prompts verbessern, indem du Entscheidungen vorgibst, die das Modell nicht selbst ableiten kann

Der schnellste Weg zu besseren videoagent-image-studio-Ergebnissen ist, Details zu liefern, die das Modell sonst erraten müsste:

exaktes Motiv
Stilziel
Szenenkontext
Bildausschnitt
Licht
gewünschter Realismus
Textanforderungen
Ausschlüsse

Je weniger das Modell erfinden muss, desto weniger Nacharbeit brauchst du.

Den häufigsten Fehler beheben: falsche Modellwahl

Wenn Text schlecht aussieht, wechsle zu ideogram.
Wenn Vektor-/Icon-Stil matschig wirkt, wechsle zu recraft.
Wenn Realismus künstlich aussieht, probiere flux-pro.
Wenn der Szene Dramatik fehlt, probiere midjourney.
Prompt-Edits helfen, aber die falsche Engine setzt der Qualität oft eine harte Grenze.

Immer nur eine Variable gleichzeitig ändern

Schreibe zwischen zwei Durchläufen nicht alles neu. Halte den Prompt weitgehend stabil und ändere nur eines davon:

Modell
Seitenverhältnis
Negative Prompt
Licht-/Stilformulierung
Referenzbild-Eingabe

So wird sofort sichtbar, was das Ergebnis tatsächlich verbessert hat.

Prompts in Ebenen schreiben

Ein starkes Muster ist:

Kernmotiv
Setting
Stil
Komposition
Licht
Ausschlüsse

Beispiel:
premium black running shoe on reflective studio floor, minimalist luxury ad set, photorealistic product photography, low-angle three-quarter composition, dramatic rim lighting, no extra props, no text

Diese geschichtete Struktur ist vagen, nur beschreibenden Formulierungen konsistent überlegen.

Das Seitenverhältnis als kreativen Hebel nutzen

Viele Beschwerden über „schlechte Komposition“ sind in Wahrheit Fehler beim Seitenverhältnis. Lege das Ausgabeformat früh fest:

1:1 für Produktkacheln und Avatare
16:9 für cineastische Szenen und Thumbnails
9:16 für mobile Story-Layouts
4:5 für Social-Feed-Creatives

Ein geändertes Verhältnis kann beengte oder leere Kompositionen lösen, ohne den Prompt neu zu schreiben.

Konsistenz mit Referenzen und Seeds verbessern

Wenn es um wiederkehrende Charaktere, Kampagnenvarianten oder Stilkontinuität geht, nutze nach Möglichkeit dieselben unterstützenden Signale erneut:

--reference-images für Modelle, die das unterstützen
--seed, wenn du kontrollierte Variation möchtest

Sobald du von einmaliger Art zu wiederholbarer Produktion wechselst, ist das wichtiger als zusätzliche Adjektive.

Fehlstarts im ersten Durchlauf gezielt korrigieren

Wenn der erste Output nah dran ist, aber noch falsch:

falsche Stimmung: Licht- und Stilformulierungen ändern
falsches Layout: Bildausschnitt und Seitenverhältnis ändern
schlechte Lesbarkeit: zu ideogram wechseln
zu generisch: Marke, Material, Epoche oder Kamera-Details ergänzen
zu unruhig: Negative Prompts gegen visuelle Unordnung ergänzen

Gezielte Korrekturen erhalten, was bereits funktioniert.

Vor der Fehlersuche zuerst das Changelog lesen

CHANGELOG.md enthält relevante operative Änderungen, darunter vereinfachtes Midjourney-Handling, vereinheitlichte Outputs und Support-Hinweise wie die Nutzung von Referenzbildern. Wenn sich das Verhalten anders anfühlt als in älteren Beispielen, ist das Changelog der schnellste Weg zur Ursache.

Was fortgeschrittene Nutzer mit videoagent-image-studio früh testen sollten

Wenn die videoagent-image-studio-Skill in einer größeren Automatisierungspipeline laufen soll, teste früh:

Latenz je Modell
Fehlerantworten
Parsing des Output-JSON
Auth-Verhalten mit Proxy-Einstellungen
ob dein gewähltes Modell deine Konsistenzanforderungen unterstützt

Diese Checks sind wichtiger als ein Dutzend Beispielgenerierungen, weil sie darüber entscheiden, ob die Skill im größeren Maßstab zuverlässig ist.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

openclaw-persona-forge

von affaan-m

openclaw-persona-forge ist ein workfloworientierter Skill zum Erstellen kompletter OpenClaw-Persona-Pakete von Grund auf. Er erzeugt Identitätsspannung, SOUL.md-artige Rahmung, Grenzregeln, Namensoptionen und optionale Hinweise für Avatar-Prompts. Am besten geeignet für OpenClaw-Charakterdesign, Rollenspiel-Agents und persona-nahe UI-Design-Arbeit, nicht für kleinere Änderungen an einer bestehenden Persona.

UI Design

Favoriten 0GitHub 156.2k

baoyu-imagine

von JimLiu

baoyu-imagine ist ein Skill zur Bildgenerierung mit mehreren Anbietern, typisierter CLI, verpflichtender EXTEND.md-Einrichtung, Unterstützung für Referenzbilder, Seitenverhältnis-Steuerung und Batch-Läufen über OpenAI, Azure OpenAI, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream und Replicate.

Image Generation

Favoriten 0GitHub 13.2k

baoyu-comic

von JimLiu

baoyu-comic ist ein Skill, der Quelltexte in Lehrcomics oder biografische Comics umwandelt – mit Storyboard-Planung, konsistenten Figuren, Panel-Layouts und stufenweiser Bildgenerierung. Er unterstützt die Nutzung über eine installierbare CLI, bietet Stil- und Layoutoptionen und deckt auch Teilabläufe wie `--storyboard-only`, `--prompts-only` und `--regenerate` für eine kontrollierte Comic-Produktion ab.

Image Generation

Favoriten 0GitHub 13.2k

shader-dev

von MiniMax-AI

shader-dev ist ein praxisnaher GLSL-Shader-Skill für Echtzeit-Visuals im ShaderToy-Stil. Nutze den shader-dev Skill, um Ray Marching, SDF-Szenen, Beleuchtung, Partikel, Flüssigkeitsbewegungen, Post-Processing und shader-dev für UI-Design mit weniger Rätselraten als bei einem generischen Prompt umzusetzen oder zu debuggen.

UI Design

Favoriten 0GitHub 11.7k

videoagent-video-studio

von pexoai

videoagent-video-studio ist ein Skill zur Erstellung kurzer KI-Videos aus Text, Bildern und Referenzen. Er eignet sich, um Text-zu-Video- und Bild-zu-Video-Workflows zu testen, unterstützte Modelle zu vergleichen und den gehosteten Proxy oder ein Self-Hosted-Setup mit Node 18+ zu nutzen.

Video Editing

Favoriten 0GitHub 456

seo-image-gen

von AgriciDaniel

seo-image-gen ist ein GitHub-Skill, der Anfragen für SEO-Bilder in produktionsreife Prompts und Einstellungen für OG-Bilder, Social Previews, Hero-Banner, Produktvisuals, Infografiken und Thumbnails verwandelt. Es nutzt Gemini über nanobanana-mcp und setzt voraus, dass die Banana-Erweiterung installiert ist, um einen praxisnahen seo-image-gen-Guide und Workflow bereitzustellen.

Image Generation

Favoriten 0GitHub 0

baoyu-xhs-images

von JimLiu

baoyu-xhs-images verwandelt Artikel oder Notizen in Xiaohongshu-Infografik-Karussells mit Presets, Stilen, Layouts und Hinweisen zur Einrichtung. Der Skill hilft bei Installation, Eingabeauswahl und der Nutzung von `/baoyu-xhs-images` für strukturierte Social-Posts mit mehreren Slides.

UI Design

Favoriten 0GitHub 13.2k

baoyu-cover-image

von JimLiu

baoyu-cover-image unterstützt Agenten dabei, strukturierte Prompts für Artikel-Coverbilder anhand von Typ, Farbpalette, Rendering, Text und Stimmung zu erstellen. Es unterstützt die Formate 2.35:1, 16:9 und 1:1, enthält Regeln zur automatischen Auswahl sowie Hinweise zur Kompatibilität und eignet sich für wiederholbare redaktionelle Workflows und UI-Design-Coverprozesse.

UI Design

Favoriten 0GitHub 13.2k

meme-factory

von softaworks

meme-factory hilft Agents, vorlagenbasierte Memes mit der kostenlosen `memegen.link`-API sowie Markdown-taugliche Text-Memes zu erstellen. Damit lassen sich teilbare Meme-URLs erzeugen, passende Templates auswählen, Texte korrekt formatieren und Ausgaben mit dem enthaltenen Python-Helfer automatisieren.

Image Generation

Favoriten 0GitHub 1.3k

logo-creator

von ReScienceLab

logo-creator ist ein KI-Workflow für Logos, mit dem sich Konzepte erstellen, Varianten vergleichen, Motive zuschneiden, Hintergründe entfernen und SVG-Assets exportieren lassen. Er nutzt Stilreferenzen, Beispiel-Prompts und Hilfsskripte für die Erstellung von Logos, Icons, Favicons und Brand Marks in ReScienceLab/opc-skills.

Branding

Favoriten 0GitHub 0

scientific-schematics

von K-Dense-AI

scientific-schematics wandelt natürlichsprachliche Prompts in wissenschaftliche Diagramme in Publikationsqualität um – mit intelligenter, iterativer Verfeinerung. Für die Generierung nutzt es Nano Banana 2, für die Prüfung Gemini 3.1 Pro Preview und erzeugt Ergebnisse nur dann neu, wenn die Ausgabe den Schwellenwert für deinen Dokumenttyp unterschreitet. Gedacht für neuronale Netzarchitekturen, Systemdiagramme, Flussdiagramme, biologische Signalwege und andere komplexe wissenschaftliche Visualisierungen.

Image Generation

Favoriten 0GitHub 0

banner-creator

von ReScienceLab

banner-creator unterstützt bei der Erstellung von Bannern, Headern und Hero-Bildern mit einem strukturierten Workflow: Anforderungen erfassen, Varianten erzeugen, per Feedback verfeinern und mit dem enthaltenen Script auf passende Plattformformate zuschneiden.

UI Design

Favoriten 0GitHub 0

baoyu-article-illustrator

von JimLiu

baoyu-article-illustrator hilft Agents dabei, aus Artikelentwürfen strukturierte Illustrations-Prompts, passende Platzierungen sowie konsistente Entscheidungen zu Typ und Stil für Erklärstücke, Tutorials, Diagramme und Beiträge mit mehreren Bildern abzuleiten.

Image Generation

Favoriten 0GitHub 13.2k

nanobanana

von ReScienceLab

nanobanana ist eine Python-CLI-Skill für Google Gemini 3 Pro Image und unterstützt Text-zu-Bild, Bildbearbeitung, Seitenverhältnisse, 2K-/4K-Ausgabe sowie Batch-Generierung mit einfachen lokalen Skripten.

Image Generation

Favoriten 0GitHub 654

sound-fx

von NoizAI

Nutze die sound-fx-Skill, um Textprompts in Soundeffekte, Foley, Ambient-Betten, Kreaturengeräusche und UI-Geräusche umzuwandeln. Sie eignet sich für Audio Editing mit sound-fx, schnelles Prototyping und herunterladbare Audio-Assets. Installation über NoizAI/skills, anschließend der skriptbasierte Workflow mit einem gültigen Noiz API-Schlüssel. Nicht für Sprache, Lyrics, Melodien oder Voice Cloning.

Audio Editing

Favoriten 0GitHub 498

chat-with-anyone

von NoizAI

chat-with-anyone hilft dir, die Stimme einer echten Person aus öffentlichem Audio zu klonen oder aus einem Bild eine passende Stimme zu entwerfen und anschließend mit TTS synthetische Antworten zu erzeugen. Der Skill unterstützt praxisnahe Workflows für Rollenspiel, Narration und Stimmgenerierung und bietet Hinweise zu Installation, Quellenauswahl und sicherer Nutzung.

Voice Generation

Favoriten 0GitHub 498