baoyu-danger-gemini-web

por JimLiu

baoyu-danger-gemini-web é um wrapper cliente do Gemini Web para geração de texto, geração de imagens, visão com imagem de referência e chat em múltiplas interações. Ele roda a partir do repositório local da skill com bun ou npx, usa scripts em `scripts/` e exige uma verificação de consentimento no primeiro uso antes da instalação e da utilização.

Estrelas13.2k

Favoritos0

Comentários0

Adicionado5 de abr. de 2026

CategoriaImage Generation

Comando de instalação

npx skills add JimLiu/baoyu-skills --skill baoyu-danger-gemini-web

Pontuação editorial

Esta skill recebeu 74/100, o que significa que pode ser listada e tende a ser útil para agentes que precisam de geração de texto ou imagem com base no Gemini, mas usuários do diretório devem esperar alguma configuração e cuidados com políticas. O repositório mostra conteúdo real de workflow: um SKILL.md substancial, frases de gatilho explícitas, bloqueio por consentimento para uso de API com engenharia reversa e uma implementação relevante em TypeScript com ponto de entrada de CLI e biblioteca cliente do Gemini web.

74/100

Pontos fortes

Boa acionabilidade: a descrição cita com clareza casos de uso como geração de texto com Gemini, geração de imagens, entrada de visão/imagem de referência e conversas em múltiplas interações.
Substância operacional real: o repositório inclui um diretório `scripts` robusto com `main.ts`, além de um cliente completo `gemini-webapi`, tipos, utilitários e tratamento de erros, em vez de apenas um wrapper simples de prompt.
Sinal de confiança para um workflow arriscado: o SKILL.md exige explicitamente uma verificação de consentimento do usuário antes do primeiro uso da API com engenharia reversa.

Pontos de atenção

Ainda há atrito na adoção: o SKILL.md traz orientações sobre resolução de runtime, mas não oferece um comando de instalação direto, e o workflow provavelmente depende de configuração externa de ambiente/cookies do navegador que aqui aparece apenas parcialmente.
Trata-se de uma integração 'danger' com engenharia reversa, então a confiabilidade e a adequação a políticas podem ser mais frágeis do que em APIs oficiais.

Gemini Google Ai Cli TypeScript Node.js Workflow

Visão geral

Visão geral da skill baoyu-danger-gemini-web

O que a skill baoyu-danger-gemini-web faz

A skill baoyu-danger-gemini-web é um wrapper cliente do Gemini Web que permite a um agente gerar texto, criar imagens, usar imagens de referência e continuar chats com múltiplas interações por meio de um fluxo web obtido por engenharia reversa, em vez de uma API oficial. O valor real dela é prático: se você precisa de geração de imagens no estilo Gemini ou de prompting com visão dentro de um workflow de skills, ela oferece um caminho local executável, em vez de obrigar você a escrever manualmente requisições web frágeis.

Quem deve instalar

A melhor opção é para quem já trabalha com skills locais de IA, tem familiaridade com bun ou npx -y bun, e quer especificamente baoyu-danger-gemini-web for Image Generation ou suporte a entrada visual. Ela é menos indicada para equipes que precisam de suporte oficial do fornecedor, contratos de API estáveis ou implantação simples em nuvem. O próprio repositório exige uma verificação de consentimento antes do primeiro uso, o que já sinaliza claramente que a proposta é voltada a usuários informados e mais hands-on.

Por que as pessoas escolhem isso em vez de um prompt simples

Um prompt comum não entrega a camada de transporte, o tratamento de cookies, o fluxo de upload, o comportamento de renovação de token nem a estrutura de requisições de chat/imagem. A baoyu-danger-gemini-web skill empacota esses detalhes em scripts/main.ts e no código cliente em scripts/gemini-webapi/. Isso reduz a adivinhação quando a tarefa é “usar Gemini Web como backend”, e não apenas “escrever um prompt que soe bem”.

Principais tradeoffs de adoção

O principal diferencial é a amplitude de capacidades: texto, geração de imagem, entrada com imagem de referência, continuidade de chat e suporte ao cliente relacionado a gem no mesmo caminho de execução. O principal tradeoff fica evidente no nome e no código: isso depende de comportamentos do Gemini Web obtidos por engenharia reversa, então quebra de compatibilidade, atrito de autenticação, rate limits e bloqueios temporários são riscos reais. Se isso torna seu caso de uso inviável, não instale.

Como usar a skill baoyu-danger-gemini-web

Contexto de instalação e requisitos de runtime

A instalação de baoyu-danger-gemini-web começa com o repositório da skill e um runtime JS. O frontmatter da skill espera bun ou npx. Na prática, leia estes arquivos primeiro:

SKILL.md
scripts/package.json
scripts/main.ts
scripts/gemini-webapi/client.ts
scripts/gemini-webapi/constants.ts
scripts/gemini-webapi/exceptions.ts

O repositório informa que toda a lógica executável fica em scripts/. Se bun estiver instalado, use-o; caso contrário, a skill dá suporte explicitamente a npx -y bun. Não pule a etapa de consentimento descrita em SKILL.md, porque esse consentimento no primeiro uso faz parte do workflow pretendido.

Quais entradas a baoyu-danger-gemini-web precisa

Para um baoyu-danger-gemini-web usage de boa qualidade, forneça:

um tipo de tarefa claro: text, image generation, vision with reference image ou multi-turn chat
o objetivo real do usuário em uma frase
restrições de saída, como estilo, proporção, formato, público ou número de variações
qualquer caminho de imagem de referência ou contexto de conversa anterior
tolerância a falhas: se você quer uma única melhor tentativa ou refinamento iterativo

Um pedido fraco seria: “Make an image with Gemini.”
Um pedido melhor seria: “Use baoyu-danger-gemini-web to generate 3 product-hero concepts for a matte black coffee grinder on a white seamless background, premium e-commerce style, front 3/4 angle, soft studio shadows, no text overlays.”

Como transformar um objetivo vago em uma invocação utilizável

A skill funciona melhor quando você transforma a intenção em um briefing pronto para execução. Um modelo prático:

Informe o modo: image, text ou vision.
Defina o assunto e o objetivo.
Adicione estilo e restrições.
Inclua referências ou histórico de chat.
Diga como será um resultado bem-sucedido.

Exemplo de prompt para baoyu-danger-gemini-web for Image Generation:
“Generate an image. Subject: futuristic hiking backpack for a landing page hero. Style: outdoor editorial photography, sunrise rim light, realistic materials. Constraints: no people, centered composition, 16:9, high detail, brand-safe. Return the best result plus a short revision note if the scene looks too cluttered.”

Para uso com imagem de referência:
“Analyze the attached product photo and generate a cleaner marketing version that preserves silhouette, zipper placement, and color blocking, but improves lighting and background.”

Workflow sugerido e caminho de depuração

Comece pelo simples: texto puro ou um único pedido de imagem; depois adicione referências e continuidade de chat quando o transporte já estiver funcionando. Se algo falhar, investigue a camada provável nesta ordem:

SKILL.md para regras de consentimento e runtime
scripts/main.ts para o comportamento da CLI
scripts/gemini-webapi/utils/load-browser-cookies.ts e cookie-file.ts para tratamento de autenticação/cookies
get-access-token.ts e rotate-1psidts.ts para problemas de renovação de token
exceptions.ts para classes prováveis de falha, como AuthError, UsageLimitExceeded, TemporarilyBlocked ou ImageGenerationError

Este repositório é mais fácil de adotar se você o tratar como um conector operacional, e não como um pacote genérico de prompts.

FAQ da skill baoyu-danger-gemini-web

A skill baoyu-danger-gemini-web é boa para iniciantes?

Só se você tiver conforto para ler TypeScript e lidar com problemas de runtime local. O baoyu-danger-gemini-web guide não é difícil no plano conceitual, mas não é amigável para iniciantes no sentido de “clicar uma vez e sair usando”. Você talvez precise depurar cookies, estado de sessão do navegador ou comportamento do modelo.

Quando ela é melhor do que APIs oficiais ou prompting comum?

Use a baoyu-danger-gemini-web skill quando você precisar especificamente de comportamentos do Gemini Web, geração de imagem por esse caminho ou de uma skill local que combine texto, imagens e chat em um único fluxo. Prefira APIs oficiais quando precisar de suporte, contratos, cotas mais claras ou confiabilidade de produção. Prefira prompting comum apenas quando você não precisar de integração executável.

Quais são os principais riscos antes de instalar?

Os maiores riscos são quebra na autenticação, mudanças do lado do serviço, limites de uso e restrições temporárias de IP ou conta. A base de código já define casos de erro para tudo isso, o que é útil, mas também confirma que essas situações são realidades esperadas, e não casos extremos.

Quando devo evitar baoyu-danger-gemini-web for Image Generation?

Evite se o seu ambiente não puder usar acesso web obtido por engenharia reversa, se sua equipe de compliance exigir apenas endpoints oficiais ou se seu workflow depender de uptime altamente previsível. Também não é uma boa opção se você só precisa de geração básica de texto que um SDK oficial já resolve bem.

Como melhorar a skill baoyu-danger-gemini-web

Forneça briefings de tarefa mais ricos, não apenas prompts mais longos

O ganho de qualidade mais rápido em baoyu-danger-gemini-web usage vem de entradas estruturadas. Para tarefas de imagem, especifique assunto, cena, composição, iluminação, nível de realismo, exclusões e uso pretendido. Para tarefas de visão, deixe claro o que deve permanecer inalterado e o que pode ser redesenhado. Isso reduz deriva e torna os resultados da primeira tentativa mais aproveitáveis.

Reduza os modos de falha mais comuns

Falhas típicas incluem prompts vagos, ausência de restrições para imagens de referência e tentativas de fazer coisa demais em uma única interação. Divida o trabalho em etapas:

primeiro gere ou analise
depois refine composição/estilo
por fim peça a limpeza final

Se a saída de imagem estiver fora da identidade da marca, adicione negativas explícitas como “no text, no watermark, no extra objects, no exaggerated stylization.” Se o contexto do chat ficar confuso, reafirme o objetivo atual em vez de presumir que a sessão o inferiu.

Use os detalhes internos do repositório para depurar de forma mais inteligente

Para melhorar os resultados com a baoyu-danger-gemini-web skill, leia o código onde o comportamento realmente está. constants.ts revela endpoints e definições de modelo. client.ts mostra a lógica de retry, timeout, upload e parsing. exceptions.ts explica como a ferramenta classifica falhas. Isso é muito mais acionável do que simplesmente repetir o mesmo prompt várias vezes.

Faça iterações depois da primeira saída

Não julgue a skill com base em uma única tentativa. Peça revisões direcionadas:

“keep composition, reduce background clutter”
“preserve product shape, improve material realism”
“same scene, but cleaner color palette and softer shadows”

Isso funciona melhor do que “make it better”, porque baoyu-danger-gemini-web rende mais quando tanto o objetivo quanto o pedido de mudança estão explícitos.

Avaliações e comentários

Ainda não há avaliações

Compartilhe sua avaliação

Faça login para deixar uma nota e um comentário sobre esta skill.

0/10000

Avaliações mais recentes

Salvando...

Mais skills nesta categoria

baoyu-imagine

por JimLiu

baoyu-imagine é uma skill de geração de imagens com múltiplos provedores, CLI tipada, configuração obrigatória via EXTEND.md, suporte a imagens de referência, controle de proporção e execuções em lote com OpenAI, Azure OpenAI, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream e Replicate.

Image Generation

Favoritos 0GitHub 13.2k

baoyu-comic

por JimLiu

baoyu-comic é uma skill que transforma textos-fonte em quadrinhos educativos ou biográficos, com planejamento de storyboard, consistência de personagens, layouts de painéis e geração de imagens em etapas. Oferece uso via CLI com instalação local, opções de estilo e layout, além de fluxos parciais como `--storyboard-only`, `--prompts-only` e `--regenerate` para uma produção de quadrinhos mais controlada.

Image Generation

Favoritos 0GitHub 13.2k

videoagent-video-studio

por pexoai

videoagent-video-studio é uma skill para gerar vídeos curtos com IA a partir de texto, imagens e referências. Use para testar fluxos de text-to-video e image-to-video, comparar os modelos compatíveis e executar pela proxy hospedada ou em uma configuração self-hosted com Node 18+.

Video Editing

Favoritos 0GitHub 456

baoyu-xhs-images

por JimLiu

baoyu-xhs-images transforma artigos ou notas em carrosséis infográficos para Xiaohongshu, com presets, estilos, layouts e orientações de configuração. Ajuda o usuário a instalar a skill, escolher os inputs e executar `/baoyu-xhs-images` para criar posts sociais estruturados em vários slides.

UI Design

Favoritos 0GitHub 13.2k

baoyu-cover-image

por JimLiu

baoyu-cover-image ajuda agentes a gerar prompts estruturados para imagens de capa de artigos usando tipo, paleta, renderização, texto e clima. Suporta formatos 2.35:1, 16:9 e 1:1, inclui regras de seleção automática e orientações de compatibilidade, e se encaixa bem em fluxos repetíveis de capa para editorial e UI Design.

UI Design

Favoritos 0GitHub 13.2k

meme-factory

por softaworks

meme-factory ajuda agentes a criar memes baseados em templates com a API gratuita memegen.link, além de memes de texto compatíveis com Markdown. Use para gerar URLs de memes prontas para compartilhar, escolher templates adequados, formatar o texto corretamente e automatizar a saída com o helper em Python incluído.

Image Generation

Favoritos 0GitHub 1.3k

logo-creator

por ReScienceLab

logo-creator é um fluxo de trabalho com IA para criar conceitos de logo, comparar variações, recortar imagens, remover fundos e exportar ativos em SVG. Usa referências de estilo, prompts de exemplo e scripts auxiliares para criar logos, ícones, favicons e marcas no repositório ReScienceLab/opc-skills.

Branding

Favoritos 0GitHub 0

banner-creator

por ReScienceLab

banner-creator ajuda a criar banners, cabeçalhos e hero images com um fluxo estruturado: levantar requisitos, gerar variações, refinar com feedback e cortar nos formatos de cada plataforma usando o script incluído.

UI Design

Favoritos 0GitHub 0

baoyu-article-illustrator

por JimLiu

baoyu-article-illustrator ajuda agentes a transformar rascunhos de artigos em prompts de ilustração estruturados, pontos de inserção e decisões consistentes de tipo e estilo para conteúdos explicativos, tutoriais, diagramas e posts com várias imagens.

Image Generation

Favoritos 0GitHub 13.2k

nanobanana

por ReScienceLab

nanobanana é uma skill de CLI em Python para Google Gemini 3 Pro Image que oferece geração de imagem por texto, edição de imagens, proporções de aspecto, saída em 2K/4K e geração em lote com scripts locais simples.

Image Generation

Favoritos 0GitHub 654

videoagent-image-studio

por pexoai

videoagent-image-studio é uma skill unificada de geração de imagens para agentes baseados em Node. Oferece um único fluxo de CLI para Midjourney, Flux, Ideogram, Recraft, SDXL e outros modelos, com configuração via proxy, orientação para escolha de modelos e saídas padronizadas para automação.

Image Generation

Favoritos 0GitHub 456

algorithmic-art

por anthropics

algorithmic-art ajuda a criar arte generativa original em p5.js com um fluxo em duas etapas: definir uma filosofia algorítmica e depois gerar arquivos .html e .js executáveis com aleatoriedade controlada por seed, parâmetros ajustáveis e visualizador interativo.

Image Generation

Favoritos 0GitHub 105k

canvas-design

por anthropics

canvas-design ajuda a criar peças visuais estáticas originais em duas etapas: definir uma filosofia de design em Markdown e depois renderizar em .png ou .pdf. Indicado para pôsteres, capas, visuais conceituais e gráficos de campanha próximos de UI, com pouco texto.

UI Design

Favoritos 0GitHub 105k

frontend-design

por anthropics

frontend-design transforma ideias vagas de UI em interfaces marcantes e prontas para produção, com código frontend real, direção estética clara e menos visual genérico de IA.

UI Design

Favoritos 0GitHub 105.2k

create-colleague

por titanwings

create-colleague transforma documentos, chats, emails, capturas de tela, dados do Feishu e do DingTalk de colegas em uma skill de IA editável, com saídas separadas de trabalho e persona, além de fluxos de atualização para refinamento contínuo.

Skill Authoring

Favoritos 1GitHub 747

skill-creator

por anthropics

skill-creator é uma meta-skill de criação de Skills para rascunhar novas skills, revisar arquivos SKILL.md, rodar evals, comparar variantes e melhorar descrições de trigger com scripts e ferramentas de revisão do repositório.

Skill Authoring

Favoritos 0GitHub 105.1k