baoyu-danger-gemini-web

por JimLiu

baoyu-danger-gemini-web es un wrapper de cliente de Gemini Web para texto, generación de imágenes, visión con imágenes de referencia y chat multi-turno. Se ejecuta desde el repositorio local de la skill con bun o npx, usa scripts dentro de `scripts/` y exige una comprobación de consentimiento en el primer uso antes de instalarlo y utilizarlo.

Estrellas13.2k

Favoritos0

Comentarios0

Agregado5 abr 2026

CategoríaImage Generation

Comando de instalación

npx skills add JimLiu/baoyu-skills --skill baoyu-danger-gemini-web

Puntuación editorial

Esta skill obtiene una puntuación de 74/100, lo que significa que puede incluirse en el directorio y probablemente resulte útil para agentes que necesiten generación de texto o imágenes con Gemini, aunque los usuarios del directorio deben contar con cierta configuración y con un manejo sensible a políticas. El repositorio muestra un flujo de trabajo real: un `SKILL.md` sustancial, frases de activación explícitas, una barrera de consentimiento para el uso de una API obtenida por ingeniería inversa y una implementación en TypeScript no trivial con punto de entrada CLI y biblioteca cliente de Gemini web.

74/100

Puntos fuertes

Buena capacidad de activación: la descripción menciona con claridad casos de uso como generación de texto con Gemini, generación de imágenes, entrada visual con imágenes de referencia y conversaciones de varios turnos.
Sustancia operativa real: el repositorio incluye un directorio `scripts` amplio con `main.ts`, además de un cliente `gemini-webapi` completo, tipos, utilidades y manejo de errores, en lugar de limitarse a un wrapper ligero de prompts.
Señal de confianza para un flujo de trabajo delicado: `SKILL.md` exige explícitamente comprobar el consentimiento del usuario antes del primer uso de la API obtenida por ingeniería inversa.

Puntos a tener en cuenta

Sigue habiendo fricción de adopción: `SKILL.md` ofrece orientación para resolver la ejecución, pero no incluye un comando de instalación directo, y es probable que el flujo dependa de configuración externa del entorno o de cookies del navegador que aquí solo se ve de forma parcial.
Se trata de una integración "danger" basada en ingeniería inversa, por lo que su fiabilidad y encaje con políticas pueden ser más frágiles que en las APIs oficiales.

Gemini Google Ai Cli TypeScript Node.js Workflow

Resumen

Visión general de la skill baoyu-danger-gemini-web

Qué hace la skill baoyu-danger-gemini-web

La skill baoyu-danger-gemini-web es un wrapper cliente de Gemini Web que permite a un agente generar texto, crear imágenes, usar imágenes de referencia y continuar chats de varios turnos mediante un flujo web obtenido por ingeniería inversa en lugar de una API oficial. Su valor real es práctico: si necesitas generación de imágenes al estilo Gemini o prompting con capacidad de visión dentro de un flujo de skills, esto te da una vía local ejecutable en vez de tener que escribir a mano solicitudes web frágiles.

Quién debería instalarla

Encaja mejor con usuarios que ya trabajan con skills de IA locales, se sienten cómodos ejecutando bun o npx -y bun, y buscan específicamente baoyu-danger-gemini-web for Image Generation o soporte para entradas de visión. Es menos adecuada para equipos que necesitan soporte oficial del proveedor, contratos de API estables o despliegue sencillo en la nube. El propio repositorio exige una comprobación de consentimiento antes del primer uso, una señal clara de que está pensado para usuarios informados y con un enfoque práctico.

Por qué la gente la elige frente a un prompt simple

Un prompt normal no te da la capa de transporte, la gestión de cookies, el flujo de subida, el comportamiento de refresco de tokens ni la estructura de solicitudes de chat e imagen. La baoyu-danger-gemini-web skill empaqueta esos detalles en scripts/main.ts y en el código cliente de scripts/gemini-webapi/. Eso reduce la incertidumbre cuando la tarea es “usar Gemini Web como backend” y no solo “escribir un prompt que suene bien”.

Principales compensaciones al adoptarla

Su principal rasgo diferencial es la amplitud de capacidades: texto, generación de imágenes, entrada con imagen de referencia, continuidad conversacional y soporte cliente relacionado con gem, todo dentro de una misma ruta de código. La contrapartida también es evidente por el nombre y por el código: esto depende del comportamiento de Gemini Web obtenido por ingeniería inversa, así que las roturas, la fricción de autenticación, los límites de uso y los bloqueos temporales son riesgos reales. Si eso hace inviable tu caso de uso, no la instales.

Cómo usar la skill baoyu-danger-gemini-web

Contexto de instalación y requisitos de ejecución

La baoyu-danger-gemini-web install parte del repositorio de la skill más un runtime de JS. El frontmatter de la skill espera bun o npx. En la práctica, conviene leer primero estos archivos:

SKILL.md
scripts/package.json
scripts/main.ts
scripts/gemini-webapi/client.ts
scripts/gemini-webapi/constants.ts
scripts/gemini-webapi/exceptions.ts

El repositorio indica que toda la lógica ejecutable vive bajo scripts/. Si tienes bun instalado, úsalo; en caso contrario, la skill admite explícitamente npx -y bun. No te saltes el paso de consentimiento descrito en SKILL.md, porque ese consentimiento inicial forma parte del flujo previsto.

Qué entrada necesita baoyu-danger-gemini-web

Para un uso sólido de baoyu-danger-gemini-web, proporciona:

un tipo de tarea claro: text, image generation, vision with reference image o multi-turn chat
el objetivo real del usuario en una sola frase
restricciones de salida como estilo, proporción, formato, audiencia o número de variantes
cualquier ruta de imagen de referencia o contexto de conversación previo
tolerancia al fallo: si quieres un único mejor intento o refinamiento iterativo

Una solicitud débil sería: “Haz una imagen con Gemini”.
Una solicitud más sólida sería: “Use baoyu-danger-gemini-web to generate 3 product-hero concepts for a matte black coffee grinder on a white seamless background, premium e-commerce style, front 3/4 angle, soft studio shadows, no text overlays.”

Convierte un objetivo difuso en una invocación utilizable con baoyu-danger-gemini-web

La skill funciona mejor cuando transformas la intención en un brief listo para ejecutar. Una plantilla práctica:

Indica el modo: image, text o vision.
Define el sujeto y el propósito.
Añade estilo y restricciones.
Añade referencias o historial del chat.
Explica cómo se ve un resultado exitoso.

Ejemplo de prompt para baoyu-danger-gemini-web for Image Generation:
“Generate an image. Subject: futuristic hiking backpack for a landing page hero. Style: outdoor editorial photography, sunrise rim light, realistic materials. Constraints: no people, centered composition, 16:9, high detail, brand-safe. Return the best result plus a short revision note if the scene looks too cluttered.”

Para usar una imagen de referencia:
“Analyze the attached product photo and generate a cleaner marketing version that preserves silhouette, zipper placement, and color blocking, but improves lighting and background.”

Flujo de trabajo recomendado y ruta de depuración

Empieza por lo simple: solo texto o una sola solicitud de imagen, y añade referencias y continuidad de chat una vez que el transporte funcione. Si algo falla, inspecciona la capa más probable en este orden:

SKILL.md para reglas de consentimiento y runtime
scripts/main.ts para el comportamiento de la CLI
scripts/gemini-webapi/utils/load-browser-cookies.ts y cookie-file.ts para autenticación y manejo de cookies
get-access-token.ts y rotate-1psidts.ts para problemas de refresco de tokens
exceptions.ts para clases de fallo probables como AuthError, UsageLimitExceeded, TemporarilyBlocked o ImageGenerationError

Este repositorio resulta más fácil de adoptar si lo tratas como un conector operativo, no como un paquete genérico de prompts.

Preguntas frecuentes sobre la skill baoyu-danger-gemini-web

¿La skill baoyu-danger-gemini-web es buena para principiantes?

Solo si te sientes cómodo leyendo TypeScript y resolviendo problemas de runtime local. La baoyu-danger-gemini-web guide no es difícil a nivel conceptual, pero no es apta para principiantes en el sentido de “hacer clic una vez y listo”. Puede que tengas que diagnosticar cookies, estado de sesión del navegador o comportamiento del modelo.

¿Cuándo es mejor que las APIs oficiales o que el prompting convencional?

Usa la baoyu-danger-gemini-web skill cuando necesites específicamente comportamientos de Gemini Web, generación de imágenes por esta vía o una skill local que combine texto, imágenes y chat en un solo flujo. Elige APIs oficiales cuando necesites soporte, contratos, cuotas más claras o fiabilidad de producción. Elige prompting convencional solo cuando no necesites integración ejecutable.

¿Cuáles son los principales riesgos antes de instalarla?

Los mayores riesgos son fallos de autenticación, cambios del lado del servicio, límites de uso y restricciones temporales de IP o cuenta. El código ya define casos de error para estas situaciones, lo cual es útil, pero también confirma que son realidades esperables y no casos extremos.

¿Cuándo debería evitar baoyu-danger-gemini-web for Image Generation?

Evítala si tu entorno no puede usar acceso web obtenido por ingeniería inversa, si tu equipo de compliance exige exclusivamente endpoints oficiales o si tu flujo depende de una disponibilidad muy predecible. También encaja mal si solo necesitas generación básica de texto que un SDK oficial ya resuelve bien.

Cómo mejorar la skill baoyu-danger-gemini-web

Da briefs de tarea más ricos, no solo prompts más largos

La mejora de calidad más rápida en el uso de baoyu-danger-gemini-web viene de entradas estructuradas. Para tareas de imagen, especifica sujeto, escena, composición, iluminación, nivel de realismo, exclusiones y uso previsto. Para tareas de visión, indica qué debe permanecer intacto y qué puede rediseñarse. Esto reduce la deriva y hace que las salidas iniciales sean más aprovechables.

Reduce los modos de fallo más comunes

Los fallos típicos son prompts vagos, restricciones de referencia ausentes e intentar hacer demasiado en un solo turno. Divide el trabajo en etapas:

primero genera o analiza
luego refina composición/estilo
después pide la limpieza final

Si la salida de imagen no encaja con la marca, añade negativos explícitos como “no text, no watermark, no extra objects, no exaggerated stylization.” Si el contexto del chat se vuelve confuso, reformula el objetivo actual en vez de asumir que la sesión lo dedujo.

Usa los detalles internos del repo para depurar mejor la skill baoyu-danger-gemini-web

Para mejorar los resultados de la baoyu-danger-gemini-web skill, lee el código donde realmente vive el comportamiento. constants.ts revela endpoints y definiciones de modelo. client.ts muestra la lógica de reintentos, timeout, subida y parseo. exceptions.ts te dice cómo clasifica la herramienta los fallos. Eso es más accionable que volver a ejecutar el mismo prompt una y otra vez.

Itera después de la primera salida

No juzgues la skill por una sola pasada. Pide revisiones concretas:

“keep composition, reduce background clutter”
“preserve product shape, improve material realism”
“same scene, but cleaner color palette and softer shadows”

Esto funciona mejor que “make it better”, porque baoyu-danger-gemini-web rinde más cuando tanto el objetivo como la solicitud de cambio están explicitados.

Calificaciones y reseñas

Aún no hay calificaciones

Comparte tu reseña

Inicia sesión para dejar una calificación y un comentario sobre esta skill.

0/10000

Reseñas más recientes

Guardando...

Más skills de esta categoría

baoyu-imagine

por JimLiu

baoyu-imagine es una skill de generación de imágenes con múltiples proveedores, CLI tipada, configuración obligatoria en EXTEND.md, soporte para imágenes de referencia, controles de relación de aspecto y ejecuciones por lotes con OpenAI, Azure OpenAI, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream y Replicate.

Image Generation

Favoritos 0GitHub 13.2k

baoyu-comic

por JimLiu

baoyu-comic es una skill para transformar texto fuente en cómics educativos o de estilo biográfico, con planificación de storyboard, consistencia de personajes, diseño de viñetas y generación de imágenes por etapas. Admite uso instalable por CLI, opciones de estilo y maquetación, y flujos parciales como `--storyboard-only`, `--prompts-only` y `--regenerate` para una producción de cómics más controlada.

Image Generation

Favoritos 0GitHub 13.2k

videoagent-video-studio

por pexoai

videoagent-video-studio es una skill para generar videos cortos con IA a partir de texto, imágenes y referencias. Úsala para probar flujos de text-to-video e image-to-video, comparar los modelos compatibles y ejecutar el proxy alojado o una configuración autohospedada con Node 18+.

Video Editing

Favoritos 0GitHub 456

baoyu-xhs-images

por JimLiu

baoyu-xhs-images convierte artículos o notas en carruseles infográficos para Xiaohongshu con presets, estilos, diseños y orientación de configuración. Ayuda a instalar la skill, elegir las entradas adecuadas y ejecutar `/baoyu-xhs-images` para crear publicaciones sociales estructuradas de varias diapositivas.

UI Design

Favoritos 0GitHub 13.2k

baoyu-cover-image

por JimLiu

baoyu-cover-image ayuda a los agentes a generar prompts estructurados para imágenes de portada de artículos mediante tipo, paleta, renderizado, texto y tono. Admite formatos 2.35:1, 16:9 y 1:1, incluye reglas de selección automática y guías de compatibilidad, y encaja en flujos repetibles de portadas editoriales y de UI Design.

UI Design

Favoritos 0GitHub 13.2k

meme-factory

por softaworks

meme-factory ayuda a los agentes a crear memes basados en plantillas con la API gratuita de memegen.link, además de memes de texto compatibles con Markdown. Úsala para generar URLs de memes listas para compartir, elegir plantillas adecuadas, dar el formato correcto al texto y automatizar la salida con el helper de Python incluido.

Image Generation

Favoritos 0GitHub 1.3k

logo-creator

por ReScienceLab

logo-creator es un flujo de trabajo de IA para crear conceptos de logos, comparar variaciones, recortar, eliminar fondos y exportar recursos en SVG. Usa referencias de estilo, prompts de ejemplo y scripts auxiliares para crear logos, iconos, favicons y elementos de marca en ReScienceLab/opc-skills.

Branding

Favoritos 0GitHub 0

banner-creator

por ReScienceLab

banner-creator ayuda a crear banners, encabezados e imágenes hero con un flujo de trabajo estructurado: recopila requisitos, genera variaciones, ajusta según la retroalimentación y recorta a proporciones de cada plataforma con el script incluido.

UI Design

Favoritos 0GitHub 0

baoyu-article-illustrator

por JimLiu

baoyu-article-illustrator ayuda a los agentes a convertir borradores de artículos en prompts de ilustración estructurados, ubicaciones de imágenes y decisiones coherentes de tipo y estilo para explainers, tutoriales, diagramas y publicaciones con varias imágenes.

Image Generation

Favoritos 0GitHub 13.2k

nanobanana

por ReScienceLab

nanobanana es una skill de CLI en Python para Google Gemini 3 Pro Image que permite generar imágenes desde texto, editar imágenes, definir relaciones de aspecto, obtener salida en 2K/4K y realizar generación por lotes con scripts locales sencillos.

Image Generation

Favoritos 0GitHub 654

videoagent-image-studio

por pexoai

videoagent-image-studio es un skill unificado de generación de imágenes para agentes basados en Node. Ofrece un único flujo CLI para Midjourney, Flux, Ideogram, Recraft, SDXL y más, con configuración mediante proxy, guía para elegir modelos y salidas normalizadas para automatización.

Image Generation

Favoritos 0GitHub 456

algorithmic-art

por anthropics

algorithmic-art ayuda a crear arte generativo original en p5.js con un flujo de dos pasos: definir una filosofía algorítmica y luego generar archivos .html y .js ejecutables con aleatoriedad con semilla, controles de parámetros y un visor interactivo.

Image Generation

Favoritos 0GitHub 105k

canvas-design

por anthropics

canvas-design ayuda a crear piezas visuales estáticas originales con un flujo de dos pasos: redactar una filosofía de diseño en Markdown y luego renderizarla como .png o .pdf. Encaja mejor para pósters, portadas, visuales conceptuales y gráficos de campaña cercanos a UI con poco texto.

UI Design

Favoritos 0GitHub 105k

frontend-design

por anthropics

frontend-design convierte ideas vagas de UI en interfaces distintivas y listas para producción, con código frontend real, una dirección estética clara y menos estilo genérico de IA.

UI Design

Favoritos 0GitHub 105.2k

create-colleague

por titanwings

create-colleague convierte documentos de compañeros, chats, correos, capturas de pantalla, datos de Feishu y DingTalk en una habilidad de IA editable, con salidas separadas de trabajo y persona, además de flujos de actualización para seguir refinándola.

Skill Authoring

Favoritos 1GitHub 747

skill-creator

por anthropics

skill-creator es una metahabilidad de creación de Skills para redactar nuevas skills, revisar archivos SKILL.md, ejecutar evaluaciones, comparar variantes y mejorar descripciones de activación con scripts del repositorio y herramientas de revisión.

Skill Authoring

Favoritos 0GitHub 105.1k