baoyu-imagine

por JimLiu

baoyu-imagine é uma skill de geração de imagens com múltiplos provedores, CLI tipada, configuração obrigatória via EXTEND.md, suporte a imagens de referência, controle de proporção e execuções em lote com OpenAI, Azure OpenAI, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream e Replicate.

Estrelas13.2k

Favoritos0

Comentários0

Adicionado5 de abr. de 2026

CategoriaImage Generation

Comando de instalação

npx skills add JimLiu/baoyu-skills --skill baoyu-imagine

Pontuação editorial

Esta skill recebe 84/100, o que a torna uma boa candidata para listagem no diretório: agentes têm um gatilho de uso claro, um caminho real de execução e evidências suficientes no repositório para utilizá-la com bem menos tentativa e erro do que em um prompt genérico de geração de imagens. Ainda assim, usuários do diretório devem esperar alguma sobrecarga inicial de configuração com Bun, credenciais dos provedores e preferências antes do primeiro uso bem-sucedido.

84/100

Pontos fortes

Alta acionabilidade: a descrição no frontmatter deixa claro quando usar a skill e o que ela oferece, incluindo text-to-image, imagens de referência, proporções e geração em lote.
Boa profundidade operacional: `SKILL.md` aponta para um caminho executável concreto (`scripts/main.ts`), define um fluxo obrigatório de carregamento de preferências na Etapa 0, e o repositório inclui 21 scripts, além de implementações e testes específicos por provedor.
Bom valor para decisão de instalação: o suporte abrange vários provedores reais (OpenAI, Azure, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream, Replicate), com esquema de preferências e documentação de configuração inicial que mostram que isto vai muito além de um wrapper placeholder.

Pontos de atenção

A adoção não é simples em um único comando: `SKILL.md` não traz um comando de instalação, e o uso bem-sucedido depende de Bun ou `npx bun`, configuração de ambiente dos provedores e preferências em EXTEND.md.
A skill é completa, mas densa: a documentação extensa e os muitos caminhos por provedor podem dificultar o entendimento rápido para quem só quer um exemplo mínimo de primeira execução.

OpenAI Google Azure API Workflow Batch Jobs Json TypeScript

Visão geral

Visão geral da skill baoyu-imagine

O que a baoyu-imagine faz

A skill baoyu-imagine é um fluxo de geração de imagens orientado por API para agentes que precisam criar imagens com confiabilidade, e não apenas sugerir prompts. Ela oferece suporte a vários provedores, incluindo OpenAI, Azure OpenAI, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream e Replicate, com opções de texto para imagem, imagens de referência, proporções, tamanho de imagem e execuções em lote.

Quem deve instalar a skill baoyu-imagine

A baoyu-imagine é mais indicada para usuários que querem um pipeline de imagens reutilizável, apoiado por scripts, com liberdade de escolha de provedor e padrões repetíveis. Ela se encaixa bem em equipes que já têm chaves de API, precisam de mais controle do que um prompt avulso em chat ou querem gerar várias imagens a partir de arquivos de prompt salvos sem reconfigurar tudo manualmente a cada vez.

Por que os usuários escolhem a baoyu-imagine em vez de prompts comuns

O principal diferencial está na disciplina de execução. A skill impõe uma etapa de carregamento de preferências via EXTEND.md e depois executa uma CLI tipada com tratamento específico por provedor, retries, nomeação de saída e controles de lote. Isso torna baoyu-imagine for Image Generation mais previsível do que pedir a um assistente genérico para “fazer uma imagem” e torcer para que ele escolha o modelo e os parâmetros certos.

Principais limitações para adoção

O maior obstáculo é a configuração inicial: você precisa de acesso a bun ou npx, credenciais do provedor e um arquivo de preferências EXTEND.md válido ou seguir o fluxo de configuração da primeira execução. Não é a melhor opção se você só quer gerar imagens ocasionalmente dentro de uma interface de chat, ou se não quer gerenciar APIs de provedores e modelos padrão.

Como usar a skill baoyu-imagine

Contexto de instalação e primeiros arquivos para ler

Para fazer baoyu-imagine install, adicione a skill a partir do repositório JimLiu/baoyu-skills no seu ambiente de skills e leia primeiro o SKILL.md. Depois disso, os arquivos mais úteis são references/config/first-time-setup.md, references/config/preferences-schema.md, scripts/main.ts e scripts/main.test.ts. Esses arquivos explicam melhor do que uma passada rápida no repositório a etapa obrigatória de preferências, o schema de configuração, os argumentos da CLI e o comportamento esperado de execução.

Entradas obrigatórias antes da primeira execução

Antes de usar a skill baoyu-imagine, conclua o carregamento obrigatório de preferências. A skill procura por .baoyu-skills/baoyu-imagine/EXTEND.md nos locais de configuração do projeto ou do usuário. Na prática, você vai precisar de:

um provedor padrão
um modelo padrão específico desse provedor
credenciais de API para esse provedor
padrões opcionais, como proporção, qualidade, tamanho de imagem e limites de workers em lote

Sem isso, a geração de imagens deve parar e pedir a configuração, em vez de tentar adivinhar.

Como acionar a baoyu-imagine da forma certa

Um bom baoyu-imagine usage começa com um pedido completo, não com uma ideia vaga. Entradas de qualidade normalmente incluem:

assunto: “a ceramic teapot on a wooden table”
estilo: “clean product photography” ou “anime concept art”
composição: “three-quarter view, centered”
fundo: “soft gray studio backdrop”
restrições de saída: 16:9, 1:1, 2k ou 4K
referências: um ou mais caminhos de imagem se consistência for importante

Um objetivo fraco seria “draw a teapot.” Um objetivo mais forte seria: “Generate a 1:1 hero image of a matte white ceramic teapot, minimal studio lighting, soft shadow, premium ecommerce style, no text, no extra props.” Isso dá ao provedor estrutura suficiente para produzir algo aproveitável já na primeira tentativa.

Fluxo de trabalho prático e orientação para lotes

Use geração sequencial de imagem única para exploração e modo em lote quando você já tiver prompts finalizados. A base de código oferece suporte a promptFiles, referenceImages, batchFile e jobs, com limites de taxa por provedor já considerados. Um baoyu-imagine guide prático é:

Definir os padrões em EXTEND.md.
Testar um prompt com um provedor.
Adicionar restrições de proporção e tamanho de imagem.
Introduzir imagens de referência só quando precisar de consistência.
Passar para arquivos em lote ao gerar uma série de conceitos já aprovados.

Esse fluxo evita desperdiçar tokens com rascunhos paralelos de baixa qualidade.

FAQ da skill baoyu-imagine

A skill baoyu-imagine é boa para iniciantes?

Sim, desde que você tenha familiaridade com chaves de API e arquivos de configuração. A skill é organizada, testada e explícita sobre a configuração, o que ajuda iniciantes a evitar padrões ocultos. Mas ela não é “zero-config”: a etapa obrigatória com EXTEND.md faz com que usuários de primeira viagem precisem dedicar alguns minutos de setup antes da primeira imagem.

Quando a baoyu-imagine é uma escolha melhor do que prompts normais em chat?

Use a baoyu-imagine quando você precisar de controle sobre o provedor, repetibilidade, preferências salvas, suporte a imagens de referência ou geração em lote. Um prompt comum basta para experimentação casual. A skill baoyu-imagine é melhor quando a qualidade da saída depende de modelos, tamanhos e configurações de workflow consistentes e reutilizáveis.

A baoyu-imagine oferece bom suporte a vários provedores de imagem?

Sim. O repositório tem módulos de provedor separados e testes para Azure, OpenAI, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream e Replicate. Isso importa porque o comportamento dos provedores e a validação de argumentos variam. A estrutura da skill reduz tentativa e erro ao trocar de provedor ou depurar problemas de ambiente.

Quando você não deve instalar a baoyu-imagine?

Evite baoyu-imagine install se você só gera imagens ocasionalmente em um app de chat hospedado, não quer gerenciar credenciais ou não precisa de arquivos em lote nem de padrões estruturados. Ela também é uma escolha ruim se o seu fluxo depende mais de edição visual manual pesada do que de geração orientada por prompt.

Como melhorar a skill baoyu-imagine

Dê à baoyu-imagine restrições criativas mais ricas

A forma mais rápida de melhorar os resultados de baoyu-imagine for Image Generation é especificar intenção, enquadramento e exclusões logo de início. Inclua mídia, iluminação, ângulo de câmera, clima e o que deve ser evitado. Se você quer consistência entre imagens, repita exatamente os atributos inegociáveis em vez de paráfraseá-los entre execuções.

Use imagens de referência com critério na baoyu-imagine

Imagens de referência ajudam ao alinhar identidade de personagem, forma de produto, paleta ou composição, mas também podem restringir demais o resultado. Comece com uma única imagem de referência clara antes de adicionar várias. Se as saídas ficarem engessadas ou derivativas demais, remova as referências mais fracas e fortaleça o briefing textual.

Corrija falhas comuns depois da primeira saída

Se a primeira imagem estiver próxima do ideal, mas ainda errada, mude uma variável por vez:

composição errada: reescreva o enquadramento e o ângulo de câmera
estilo errado: nomeie o estilo desejado de forma mais direta
proporções erradas: adicione pistas sobre escala do assunto e layout
genérica demais: acrescente material, época, ambiente e clima
resultados instáveis em lote: reduza jobs ou mantenha provedor/modelo fixos

Em geral, isso funciona melhor do que reescrever o prompt inteiro do zero.

Ajuste configuração e throughput para cargas reais

Para baoyu-imagine usage recorrente, melhore os padrões em EXTEND.md em vez de repetir tudo a cada execução. Defina uma vez seu provedor padrão, modelo padrão e proporção preferida. Para cargas em lote, revise batch.max_workers e provider_limits em references/config/preferences-schema.md; paralelismo agressivo pode prejudicar a confiabilidade mais rápido do que melhora a velocidade.

Avaliações e comentários

Ainda não há avaliações

Compartilhe sua avaliação

Faça login para deixar uma nota e um comentário sobre esta skill.

0/10000

Avaliações mais recentes

Salvando...

Mais skills nesta categoria

openclaw-persona-forge

por affaan-m

openclaw-persona-forge é uma skill orientada a fluxo de trabalho para criar do zero pacotes completos de persona OpenClaw. Ela gera tensão de identidade, framing no estilo SOUL.md, regras de limite, opções de nomes e, opcionalmente, orientações para prompts de avatar. É ideal para design de personagens OpenClaw, agentes de roleplay e trabalhos de persona próximos de UI Design, mas não para ajustes pequenos em uma persona já existente.

UI Design

Favoritos 0GitHub 156.2k

baoyu-comic

por JimLiu

baoyu-comic é uma skill que transforma textos-fonte em quadrinhos educativos ou biográficos, com planejamento de storyboard, consistência de personagens, layouts de painéis e geração de imagens em etapas. Oferece uso via CLI com instalação local, opções de estilo e layout, além de fluxos parciais como `--storyboard-only`, `--prompts-only` e `--regenerate` para uma produção de quadrinhos mais controlada.

Image Generation

Favoritos 0GitHub 13.2k

shader-dev

por MiniMax-AI

shader-dev é uma skill prática de shaders GLSL para visuais em tempo real no estilo ShaderToy. Use a skill shader-dev para criar ou depurar ray marching, cenas com SDF, iluminação, partículas, movimento de fluidos, pós-processamento e shader-dev para UI Design com menos tentativa e erro do que com um prompt genérico.

UI Design

Favoritos 0GitHub 11.7k

videoagent-video-studio

por pexoai

videoagent-video-studio é uma skill para gerar vídeos curtos com IA a partir de texto, imagens e referências. Use para testar fluxos de text-to-video e image-to-video, comparar os modelos compatíveis e executar pela proxy hospedada ou em uma configuração self-hosted com Node 18+.

Video Editing

Favoritos 0GitHub 456

seo-image-gen

por AgriciDaniel

seo-image-gen é uma skill do GitHub para transformar pedidos de imagens SEO em prompts e configurações prontos para produção, cobrindo OG images, prévias para redes sociais, hero banners, visuais de produto, infográficos e thumbnails. Usa Gemini via nanobanana-mcp e pressupõe que a extensão banana já esteja instalada, oferecendo um guia prático e um fluxo de trabalho para seo-image-gen.

Image Generation

Favoritos 0GitHub 0

baoyu-xhs-images

por JimLiu

baoyu-xhs-images transforma artigos ou notas em carrosséis infográficos para Xiaohongshu, com presets, estilos, layouts e orientações de configuração. Ajuda o usuário a instalar a skill, escolher os inputs e executar `/baoyu-xhs-images` para criar posts sociais estruturados em vários slides.

UI Design

Favoritos 0GitHub 13.2k

baoyu-cover-image

por JimLiu

baoyu-cover-image ajuda agentes a gerar prompts estruturados para imagens de capa de artigos usando tipo, paleta, renderização, texto e clima. Suporta formatos 2.35:1, 16:9 e 1:1, inclui regras de seleção automática e orientações de compatibilidade, e se encaixa bem em fluxos repetíveis de capa para editorial e UI Design.

UI Design

Favoritos 0GitHub 13.2k

meme-factory

por softaworks

meme-factory ajuda agentes a criar memes baseados em templates com a API gratuita memegen.link, além de memes de texto compatíveis com Markdown. Use para gerar URLs de memes prontas para compartilhar, escolher templates adequados, formatar o texto corretamente e automatizar a saída com o helper em Python incluído.

Image Generation

Favoritos 0GitHub 1.3k

logo-creator

por ReScienceLab

logo-creator é um fluxo de trabalho com IA para criar conceitos de logo, comparar variações, recortar imagens, remover fundos e exportar ativos em SVG. Usa referências de estilo, prompts de exemplo e scripts auxiliares para criar logos, ícones, favicons e marcas no repositório ReScienceLab/opc-skills.

Branding

Favoritos 0GitHub 0

scientific-schematics

por K-Dense-AI

A scientific-schematics transforma prompts em linguagem natural em diagramas científicos com qualidade de publicação, com refinamento iterativo inteligente. Ela usa Nano Banana 2 para geração e Gemini 3.1 Pro Preview para revisão, regenerando apenas quando o resultado fica abaixo do limite esperado para o tipo de documento. Foi feita para arquiteturas de redes neurais, diagramas de sistema, fluxogramas, vias biológicas e outros visuais científicos complexos.

Image Generation

Favoritos 0GitHub 0

banner-creator

por ReScienceLab

banner-creator ajuda a criar banners, cabeçalhos e hero images com um fluxo estruturado: levantar requisitos, gerar variações, refinar com feedback e cortar nos formatos de cada plataforma usando o script incluído.

UI Design

Favoritos 0GitHub 0

baoyu-article-illustrator

por JimLiu

baoyu-article-illustrator ajuda agentes a transformar rascunhos de artigos em prompts de ilustração estruturados, pontos de inserção e decisões consistentes de tipo e estilo para conteúdos explicativos, tutoriais, diagramas e posts com várias imagens.

Image Generation

Favoritos 0GitHub 13.2k

nanobanana

por ReScienceLab

nanobanana é uma skill de CLI em Python para Google Gemini 3 Pro Image que oferece geração de imagem por texto, edição de imagens, proporções de aspecto, saída em 2K/4K e geração em lote com scripts locais simples.

Image Generation

Favoritos 0GitHub 654

sound-fx

por NoizAI

Use a skill sound-fx para transformar prompts de texto em efeitos sonoros, foley, camas ambiênciais, sons de criaturas e ruídos de interface. Ela é ideal para sound-fx em Edição de Áudio, prototipagem rápida e criação de ativos de áudio para download. Instale com NoizAI/skills e, em seguida, use o fluxo de trabalho baseado em script com uma chave Noiz API válida. Não serve para fala, letras, melodia ou clonagem de voz.

Audio Editing

Favoritos 0GitHub 498

chat-with-anyone

por NoizAI

chat-with-anyone ajuda você a clonar a voz de uma pessoa real a partir de áudio público ou criar uma voz equivalente com base em uma imagem e, depois, gerar respostas sintéticas com TTS. Ele oferece suporte a fluxos práticos para roleplay, narração e geração de voz, com orientações sobre instalação, seleção de fontes e uso seguro.

Voice Generation

Favoritos 0GitHub 498

videoagent-image-studio

por pexoai

videoagent-image-studio é uma skill unificada de geração de imagens para agentes baseados em Node. Oferece um único fluxo de CLI para Midjourney, Flux, Ideogram, Recraft, SDXL e outros modelos, com configuração via proxy, orientação para escolha de modelos e saídas padronizadas para automação.

Image Generation

Favoritos 0GitHub 456