baoyu-imagine

por JimLiu

baoyu-imagine es una skill de generación de imágenes con múltiples proveedores, CLI tipada, configuración obligatoria en EXTEND.md, soporte para imágenes de referencia, controles de relación de aspecto y ejecuciones por lotes con OpenAI, Azure OpenAI, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream y Replicate.

Estrellas13.2k

Favoritos0

Comentarios0

Agregado5 abr 2026

CategoríaImage Generation

Comando de instalación

npx skills add JimLiu/baoyu-skills --skill baoyu-imagine

Puntuación editorial

Esta skill obtiene 84/100, lo que la convierte en una candidata sólida para el directorio: los agentes tienen un activador claro, una ruta de ejecución real y suficiente evidencia en el repositorio para usarla con bastante menos incertidumbre que con un prompt genérico de generación de imágenes. Aun así, los usuarios del directorio deben contar con cierta carga de configuración inicial en torno a Bun, las credenciales de proveedor y las preferencias antes de lograr el primer uso con éxito.

84/100

Puntos fuertes

Alta capacidad de activación: la descripción del frontmatter deja claro cuándo usarla y qué admite, incluida la generación de texto a imagen, imágenes de referencia, relaciones de aspecto y generación por lotes.
Sólida sustancia operativa: `SKILL.md` apunta a una ruta ejecutable concreta (`scripts/main.ts`), define un flujo bloqueante de Step 0 para cargar preferencias, y el repositorio incluye 21 scripts además de implementaciones y pruebas específicas por proveedor.
Buen valor para decidir la instalación: el soporte abarca varios proveedores reales (OpenAI, Azure, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream, Replicate), con un esquema de preferencias y documentación de configuración inicial que deja claro que es más que un contenedor provisional.

Puntos a tener en cuenta

La adopción no es tan simple como ejecutar un solo comando: `SKILL.md` no incluye un comando de instalación, y el uso correcto depende de Bun o `npx bun`, de la configuración del entorno del proveedor y de las preferencias en EXTEND.md.
La skill es completa, pero densa: la documentación extensa y las múltiples rutas por proveedor pueden ralentizar la comprensión inicial para quienes solo buscan un ejemplo mínimo de primera ejecución.

OpenAI Google Azure API Workflow Batch Jobs Json TypeScript

Resumen

Visión general de la skill baoyu-imagine

Qué hace baoyu-imagine

La skill baoyu-imagine es un flujo de generación de imágenes basado en API para agentes que necesitan crear imágenes de forma fiable, no solo sugerir prompts. Admite varios proveedores, entre ellos OpenAI, Azure OpenAI, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream y Replicate, con opciones de texto a imagen, imágenes de referencia, relaciones de aspecto, tamaño de imagen y ejecuciones por lotes.

Quién debería instalar la skill baoyu-imagine

baoyu-imagine encaja mejor con quienes buscan una canalización de imágenes reutilizable, respaldada por scripts, con elección de proveedor y valores predeterminados repetibles. Es una buena opción para equipos que ya cuentan con claves de API, necesitan más control que un prompt aislado en chat o quieren generar varias imágenes a partir de archivos de prompts guardados sin volver a introducir la configuración manualmente cada vez.

Por qué los usuarios la eligen frente a prompts normales

La principal diferencia está en la disciplina de ejecución. La skill obliga a cargar preferencias mediante EXTEND.md y después ejecuta una CLI tipada con manejo específico por proveedor, reintentos, nombres de salida y controles por lotes. Eso hace que baoyu-imagine for Image Generation sea más predecible que pedirle a un asistente general “haz una imagen” y esperar que elija el modelo y los parámetros correctos.

Principales limitaciones de adopción

El mayor freno es la configuración inicial: necesitas acceso a bun o npx, credenciales del proveedor y un archivo de preferencias EXTEND.md válido o pasar por el flujo de primera ejecución. No es la mejor opción si solo quieres generar imágenes de forma ocasional y casual dentro de una interfaz de chat, o si no quieres gestionar APIs de proveedores y modelos predeterminados.

Cómo usar la skill baoyu-imagine

Contexto de instalación y primeros archivos que conviene leer

Para baoyu-imagine install, añade la skill desde el repositorio JimLiu/baoyu-skills en tu entorno de skills y lee primero SKILL.md. Después, los archivos más útiles son references/config/first-time-setup.md, references/config/preferences-schema.md, scripts/main.ts y scripts/main.test.ts. Esos archivos explican mejor que una revisión rápida del repositorio el paso obligatorio de preferencias, el esquema de configuración, los argumentos de la CLI y el comportamiento esperado en la ejecución.

Entradas obligatorias antes de la primera ejecución

Antes de usar la baoyu-imagine skill, completa la carga obligatoria de preferencias. La skill busca .baoyu-skills/baoyu-imagine/EXTEND.md en ubicaciones de configuración del proyecto o del usuario. En la práctica, necesitas:

un proveedor predeterminado
un modelo predeterminado específico para ese proveedor
credenciales de API para ese proveedor
valores predeterminados opcionales como relación de aspecto, calidad, tamaño de imagen y límites de workers por lotes

Sin eso, la generación de imágenes debería detenerse y pedir la configuración, en lugar de adivinar.

Cómo invocar baoyu-imagine correctamente

Un buen baoyu-imagine usage empieza con una solicitud completa, no con una idea vaga. Las entradas sólidas suelen incluir:

sujeto: “a ceramic teapot on a wooden table”
estilo: “clean product photography” o “anime concept art”
composición: “three-quarter view, centered”
fondo: “soft gray studio backdrop”
restricciones de salida: 16:9, 1:1, 2k o 4K
referencias: una o más rutas de imagen si la consistencia importa

Un objetivo débil sería “draw a teapot”. Un objetivo más sólido sería: “Generate a 1:1 hero image of a matte white ceramic teapot, minimal studio lighting, soft shadow, premium ecommerce style, no text, no extra props.” Eso le da al proveedor suficiente estructura como para producir un resultado útil en la primera pasada.

Flujo de trabajo práctico y recomendaciones para lotes

Usa generación secuencial de una sola imagen para trabajo exploratorio y el modo por lotes cuando ya tengas prompts finalizados. El código admite promptFiles, referenceImages, batchFile y jobs, con límites de tasa por proveedor incorporados. Una baoyu-imagine guide práctica sería:

Configura los valores predeterminados en EXTEND.md.
Prueba un prompt con un proveedor.
Añade restricciones de relación de aspecto y tamaño de imagen.
Introduce imágenes de referencia solo cuando necesites consistencia.
Pasa a archivos por lotes cuando vayas a generar una serie de conceptos ya aprobados.

Este flujo evita malgastar tokens en borradores paralelos de baja calidad.

Preguntas frecuentes sobre la skill baoyu-imagine

¿Es baoyu-imagine una buena opción para principiantes?

Sí, si te sientes cómodo con claves de API y archivos de configuración. La skill está organizada, probada y deja claro el proceso de setup, lo que ayuda a los principiantes a evitar valores predeterminados ocultos. Pero no es “zero-config”; el paso obligatorio de EXTEND.md implica que los usuarios nuevos necesitan dedicar unos minutos a la configuración antes de generar la primera imagen.

¿Cuándo encaja mejor baoyu-imagine que un prompt normal en chat?

Usa baoyu-imagine cuando necesites control sobre el proveedor, repetibilidad, preferencias guardadas, soporte para imágenes de referencia o generación por lotes. Un prompt normal sirve para experimentar de forma casual. La baoyu-imagine skill es mejor cuando la calidad de salida depende de modelos consistentes, tamaños definidos y ajustes de flujo de trabajo reutilizables.

¿baoyu-imagine ofrece un buen soporte para varios proveedores de imagen?

Sí. El repositorio tiene módulos de proveedor separados y pruebas para Azure, OpenAI, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream y Replicate. Eso importa porque el comportamiento de cada proveedor y la validación de argumentos cambian. La estructura de la skill reduce el ensayo y error al cambiar de proveedor o depurar problemas del entorno.

¿Cuándo no deberías instalar baoyu-imagine?

Omite baoyu-imagine install si solo generas imágenes de vez en cuando en una app de chat alojada, no quieres gestionar credenciales o no necesitas archivos por lotes ni valores predeterminados estructurados. También encaja mal si tu flujo de trabajo depende de una edición visual manual intensiva en lugar de generación guiada por prompts.

Cómo mejorar la skill baoyu-imagine

Dale a baoyu-imagine restricciones creativas más ricas

La forma más rápida de mejorar los resultados de baoyu-imagine for Image Generation es especificar desde el principio la intención, el encuadre y las exclusiones. Incluye medio, iluminación, ángulo de cámara, tono y lo que quieres evitar. Si buscas consistencia entre imágenes, repite exactamente los atributos no negociables en lugar de reformularlos entre ejecuciones.

Usa imágenes de referencia con criterio

Las imágenes de referencia ayudan cuando necesitas mantener identidad de personaje, forma de producto, paleta o composición, pero también pueden restringir demasiado el resultado. Empieza con una única imagen de referencia clara antes de añadir varias. Si las salidas se vuelven rígidas o demasiado derivativas, elimina las referencias más débiles y refuerza el briefing textual.

Corrige fallos habituales después de la primera salida

Si la primera imagen se acerca a lo que quieres pero falla, cambia una sola variable cada vez:

composición incorrecta: reescribe el encuadre y el ángulo de cámara
estilo incorrecto: nombra el estilo objetivo de forma más directa
proporciones incorrectas: añade indicaciones sobre escala del sujeto y disposición
demasiado genérica: añade material, época, entorno y tono
resultados inestables por lotes: reduce jobs o mantén fijo el proveedor/modelo

Esto suele funcionar mejor que reescribir todo el prompt desde cero.

Ajusta la configuración y el rendimiento para cargas reales

Para un baoyu-imagine usage repetido, mejora los valores predeterminados en EXTEND.md en lugar de repetirlos cada vez. Define una vez tu proveedor predeterminado, tu modelo predeterminado y tu relación de aspecto preferida. Para cargas por lotes, revisa batch.max_workers y provider_limits en references/config/preferences-schema.md; un paralelismo agresivo puede perjudicar la fiabilidad más rápido de lo que mejora la velocidad.

Calificaciones y reseñas

Aún no hay calificaciones

Comparte tu reseña

Inicia sesión para dejar una calificación y un comentario sobre esta skill.

0/10000

Reseñas más recientes

Guardando...

Más skills de esta categoría

openclaw-persona-forge

por affaan-m

openclaw-persona-forge es un skill orientado a flujos de trabajo para crear desde cero paquetes completos de personajes de OpenClaw. Genera tensión de identidad, marcos al estilo SOUL.md, reglas de límites, opciones de nombre y, de forma opcional, orientación para prompts de avatar. Es ideal para diseño de personajes de OpenClaw, agentes de roleplay y trabajo de personaje cercano a UI Design; no está pensado para pequeñas ediciones de un personaje ya existente.

UI Design

Favoritos 0GitHub 156.2k

baoyu-comic

por JimLiu

baoyu-comic es una skill para transformar texto fuente en cómics educativos o de estilo biográfico, con planificación de storyboard, consistencia de personajes, diseño de viñetas y generación de imágenes por etapas. Admite uso instalable por CLI, opciones de estilo y maquetación, y flujos parciales como `--storyboard-only`, `--prompts-only` y `--regenerate` para una producción de cómics más controlada.

Image Generation

Favoritos 0GitHub 13.2k

shader-dev

por MiniMax-AI

shader-dev es un skill práctico de shaders GLSL para efectos visuales en tiempo real al estilo ShaderToy. Usa el skill shader-dev para crear o depurar ray marching, escenas SDF, iluminación, partículas, movimiento de fluidos, postprocesado y shader-dev para diseño de interfaces, con menos conjeturas que con un prompt genérico.

UI Design

Favoritos 0GitHub 11.7k

videoagent-video-studio

por pexoai

videoagent-video-studio es una skill para generar videos cortos con IA a partir de texto, imágenes y referencias. Úsala para probar flujos de text-to-video e image-to-video, comparar los modelos compatibles y ejecutar el proxy alojado o una configuración autohospedada con Node 18+.

Video Editing

Favoritos 0GitHub 456

seo-image-gen

por AgriciDaniel

seo-image-gen es una skill de GitHub para convertir solicitudes de imágenes SEO en prompts y ajustes listos para producción para imágenes OG, vistas previas para redes sociales, banners hero, visuales de producto, infografías y miniaturas. Usa Gemini a través de nanobanana-mcp y asume que la extensión banana está instalada, ofreciendo una guía práctica y un flujo de trabajo de seo-image-gen.

Image Generation

Favoritos 0GitHub 0

baoyu-xhs-images

por JimLiu

baoyu-xhs-images convierte artículos o notas en carruseles infográficos para Xiaohongshu con presets, estilos, diseños y orientación de configuración. Ayuda a instalar la skill, elegir las entradas adecuadas y ejecutar `/baoyu-xhs-images` para crear publicaciones sociales estructuradas de varias diapositivas.

UI Design

Favoritos 0GitHub 13.2k

baoyu-cover-image

por JimLiu

baoyu-cover-image ayuda a los agentes a generar prompts estructurados para imágenes de portada de artículos mediante tipo, paleta, renderizado, texto y tono. Admite formatos 2.35:1, 16:9 y 1:1, incluye reglas de selección automática y guías de compatibilidad, y encaja en flujos repetibles de portadas editoriales y de UI Design.

UI Design

Favoritos 0GitHub 13.2k

meme-factory

por softaworks

meme-factory ayuda a los agentes a crear memes basados en plantillas con la API gratuita de memegen.link, además de memes de texto compatibles con Markdown. Úsala para generar URLs de memes listas para compartir, elegir plantillas adecuadas, dar el formato correcto al texto y automatizar la salida con el helper de Python incluido.

Image Generation

Favoritos 0GitHub 1.3k

logo-creator

por ReScienceLab

logo-creator es un flujo de trabajo de IA para crear conceptos de logos, comparar variaciones, recortar, eliminar fondos y exportar recursos en SVG. Usa referencias de estilo, prompts de ejemplo y scripts auxiliares para crear logos, iconos, favicons y elementos de marca en ReScienceLab/opc-skills.

Branding

Favoritos 0GitHub 0

scientific-schematics

por K-Dense-AI

scientific-schematics convierte prompts en lenguaje natural en diagramas científicos de calidad de publicación con refinamiento iterativo inteligente. Usa Nano Banana 2 para la generación y Gemini 3.1 Pro Preview para la revisión, y solo regenera cuando el resultado queda por debajo del umbral definido para tu tipo de documento. Está pensado para arquitecturas de redes neuronales, diagramas de sistemas, diagramas de flujo, rutas biológicas y otros visuales científicos complejos.

Image Generation

Favoritos 0GitHub 0

banner-creator

por ReScienceLab

banner-creator ayuda a crear banners, encabezados e imágenes hero con un flujo de trabajo estructurado: recopila requisitos, genera variaciones, ajusta según la retroalimentación y recorta a proporciones de cada plataforma con el script incluido.

UI Design

Favoritos 0GitHub 0

baoyu-article-illustrator

por JimLiu

baoyu-article-illustrator ayuda a los agentes a convertir borradores de artículos en prompts de ilustración estructurados, ubicaciones de imágenes y decisiones coherentes de tipo y estilo para explainers, tutoriales, diagramas y publicaciones con varias imágenes.

Image Generation

Favoritos 0GitHub 13.2k

nanobanana

por ReScienceLab

nanobanana es una skill de CLI en Python para Google Gemini 3 Pro Image que permite generar imágenes desde texto, editar imágenes, definir relaciones de aspecto, obtener salida en 2K/4K y realizar generación por lotes con scripts locales sencillos.

Image Generation

Favoritos 0GitHub 654

sound-fx

por NoizAI

Usa la skill sound-fx para convertir instrucciones de texto en efectos de sonido, foley, ambientes, sonidos de criaturas y ruidos de interfaz. Encaja bien para edición de audio con sound-fx, prototipado rápido y activos de audio descargables. Se instala con NoizAI/skills y luego se usa el flujo de trabajo basado en scripts con una clave válida de Noiz API. No sirve para voz hablada, letras, melodías ni clonación de voz.

Audio Editing

Favoritos 0GitHub 498

chat-with-anyone

por NoizAI

chat-with-anyone te ayuda a clonar la voz de una persona real a partir de audio público o a diseñar una voz parecida desde una imagen, y luego generar respuestas sintéticas con TTS. Admite flujos prácticos para roleplay, narración y generación de voz, con orientación sobre instalación, चयन de fuentes y uso seguro.

Voice Generation

Favoritos 0GitHub 498

videoagent-image-studio

por pexoai

videoagent-image-studio es un skill unificado de generación de imágenes para agentes basados en Node. Ofrece un único flujo CLI para Midjourney, Flux, Ideogram, Recraft, SDXL y más, con configuración mediante proxy, guía para elegir modelos y salidas normalizadas para automatización.

Image Generation

Favoritos 0GitHub 456