baoyu-danger-gemini-web

作者 JimLiu

baoyu-danger-gemini-web 是一个 Gemini Web 客户端封装，支持文本生成、图像生成、参考图视觉输入和多轮对话。它可在本地 skill 仓库中通过 bun 或 npx 运行，依赖 `scripts/` 目录下的脚本，并且在首次安装和使用前必须先完成用户同意确认。

Stars13.2k

收录时间2026年4月5日

分类图像生成

安装命令

npx skills add JimLiu/baoyu-skills --skill baoyu-danger-gemini-web

编辑评分

该 skill 评分为 74/100，表示它可以收录，也很可能对需要基于 Gemini 进行文本或图像生成的 agent 有用；但目录用户应预期存在一定的配置成本，以及对策略较敏感的使用要求。仓库本身体现出较完整的工作流基础：包含内容较扎实的 SKILL.md、明确的触发短语、针对逆向 API 使用的同意门槛，以及带有 CLI 入口和 Gemini Web 客户端库的非简单 TypeScript 实现。

74/100

亮点

触发性良好：描述中明确点出了 Gemini 文本生成、图像生成、视觉/参考图输入和多轮对话等使用场景。
具备真实的工程实现：仓库包含较完整的 scripts 目录、main.ts，以及完整的 gemini-webapi 客户端、类型、工具函数和错误处理，而不只是一个轻量的 prompt 封装。
对高风险工作流有一定信任信号：SKILL.md 明确要求在首次使用这个逆向 API 前先进行用户同意确认。

注意点

接入门槛仍然存在：SKILL.md 提供了运行时解析指引，但没有直接的安装命令，而且该工作流很可能依赖额外的环境或浏览器 cookie 配置，这里只能看到部分信息。
这是一个通过逆向方式实现的“danger”集成，因此其稳定性和策略适配性可能比官方 API 更脆弱。

Gemini Google Ai Cli TypeScript Node.js 工作流

概览

baoyu-danger-gemini-web skill 概览

baoyu-danger-gemini-web skill 能做什么

baoyu-danger-gemini-web skill 是一个 Gemini Web 客户端封装层，让 agent 可以通过逆向出来的 Web 流程，而不是官方 API，来生成文本、创建图片、使用参考图，并延续多轮对话。它真正的价值在于实用性：如果你想在 skill 工作流里接入类似 Gemini 的图片生成或带视觉能力的提示，这个项目提供的是一条可本地运行的现成路径，而不是让你自己去手写那些脆弱的网页请求。

谁适合安装 baoyu-danger-gemini-web skill

最适合的人群：已经在本地使用 AI skills、能接受运行 bun 或 npx -y bun，并且明确需要 baoyu-danger-gemini-web for Image Generation 或视觉输入支持的用户。它不太适合那些需要官方厂商支持、稳定 API 契约，或希望轻松部署到云端的团队。仓库本身在首次使用前还要求进行 consent check，这已经很明确地说明：它面向的是知情、愿意动手排查问题的用户。

为什么有人会选它，而不是只写一个普通 prompt

普通 prompt 解决不了传输层、cookie 处理、上传流程、token 刷新行为，或者聊天/图片请求结构这些问题。baoyu-danger-gemini-web skill 把这些细节封装在 scripts/main.ts 和 scripts/gemini-webapi/ 客户端代码里。当你的目标是“把 Gemini Web 当成后端接入”，而不只是“写一段效果不错的提示词”时，这能明显减少试错和猜测成本。

采用 baoyu-danger-gemini-web skill 的关键权衡

它最大的差异化优势是能力范围广：同一套代码路径里同时支持文本、图片生成、参考图输入、对话连续性，以及 gem 相关的客户端支持。代价也从名字和代码里写得很直白：它依赖的是逆向得到的 Gemini Web 行为，所以接口失效、认证摩擦、速率限制、临时封禁，都是真实存在的风险。如果这些风险对你的场景不可接受，就不要安装它。

如何使用 baoyu-danger-gemini-web skill

安装环境与运行时要求

baoyu-danger-gemini-web install 的前提，是 skill 仓库本体加上一个 JS 运行时。这个 skill 的 frontmatter 预期你使用 bun 或 npx。实际操作上，建议先读这几个文件：

SKILL.md
scripts/package.json
scripts/main.ts
scripts/gemini-webapi/client.ts
scripts/gemini-webapi/constants.ts
scripts/gemini-webapi/exceptions.ts

仓库说明所有可执行逻辑都在 scripts/ 目录下。如果本机已经装了 bun，优先用它；否则这个 skill 也明确支持 npx -y bun。不要跳过 SKILL.md 里描述的 consent 步骤，因为首次使用的授权确认本来就是预期工作流的一部分。

baoyu-danger-gemini-web skill 需要什么输入

想让 baoyu-danger-gemini-web usage 更稳定、更高质量，建议提供：

明确的任务类型：text、image generation、vision with reference image 或 multi-turn chat
用一句话说清用户目标
输出约束，比如风格、宽高比、格式、受众或候选数量
任何参考图片路径，或之前的对话上下文
失败容忍度：你是要一次最佳尝试，还是希望迭代优化

一个较弱的请求是：“Make an image with Gemini.”

更强的请求是：“Use baoyu-danger-gemini-web to generate 3 product-hero concepts for a matte black coffee grinder on a white seamless background, premium e-commerce style, front 3/4 angle, soft studio shadows, no text overlays.”

如何把模糊目标整理成可执行调用

这个 skill 在“把意图整理成可执行 brief”之后效果最好。一个实用模板是：

先说明模式：image、text 或 vision
定义主体和用途
补充风格与约束
加入参考资料或聊天历史
说明什么结果算成功

适用于 baoyu-danger-gemini-web for Image Generation 的示例 prompt：
“Generate an image. Subject: futuristic hiking backpack for a landing page hero. Style: outdoor editorial photography, sunrise rim light, realistic materials. Constraints: no people, centered composition, 16:9, high detail, brand-safe. Return the best result plus a short revision note if the scene looks too cluttered.”

用于参考图场景时，可以这样写：
“Analyze the attached product photo and generate a cleaner marketing version that preserves silhouette, zipper placement, and color blocking, but improves lighting and background.”

baoyu-danger-gemini-web skill 常见问题

baoyu-danger-gemini-web skill 适合新手吗？

只适合那些愿意读 TypeScript、也能处理本地运行时问题的新手。baoyu-danger-gemini-web guide 在概念上不算复杂，但绝不是“点一下就能跑”的那种 beginner-friendly 工具。你很可能需要自己排查 cookies、浏览器会话状态，或者模型行为本身带来的问题。

什么情况下它比官方 API 或普通 prompting 更合适？

当你明确需要 Gemini Web 的行为、需要通过这条路径做图片生成，或者需要一个本地 skill 在同一流程里组合文本、图片和聊天时，就该考虑 baoyu-danger-gemini-web skill。如果你需要的是可支持性、接口契约、更清晰的配额规则，或更适合生产环境的稳定性，那就选官方 API。只有在你完全不需要可执行集成时，普通 prompting 才是更合适的选择。

安装前最需要注意哪些风险？

最大的风险是认证失效、服务端行为变化、使用限制，以及临时的 IP 或账号限制。代码库里已经为这些情况定义了错误类型，这一点当然有帮助，但它同时也说明：这些不是边角异常，而是应该预期会遇到的现实问题。

什么情况下应该避免用 baoyu-danger-gemini-web 做 Image Generation？

如果你的环境不能接受逆向 Web 访问、合规团队要求只能使用官方 endpoint，或者你的工作流高度依赖可预测 uptime，就不应该选它。如果你只是需要基础文本生成，而官方 SDK 已经能稳定满足需求，它同样不是一个划算的选择。

如何改进 baoyu-danger-gemini-web skill 的使用效果

提供更丰富的任务 brief，而不只是更长的 prompt

想提升 baoyu-danger-gemini-web usage 的质量，最快的方法不是把 prompt 写得更长，而是把输入结构化。对于图片任务，要明确主体、场景、构图、光线、写实程度、排除项和用途。对于视觉任务，要说清哪些部分必须保持不变，哪些部分可以重新设计。这样能明显减少结果跑偏，也更容易让第一轮输出就达到可用水位。

降低常见失败模式

典型失败原因包括：提示过于模糊、缺少参考约束、以及试图在单轮里做太多事。更稳妥的做法是分阶段推进：

先生成或分析
再细化构图/风格
最后再要求最终清理和润色

如果图片结果不符合品牌要求，可以加入更明确的否定约束，比如 “no text, no watermark, no extra objects, no exaggerated stylization.” 如果聊天上下文开始变浑，不要默认会话自己能理解当前目标，而是主动重述这一步到底要完成什么。

利用仓库内部实现做更聪明的排查

想提高 baoyu-danger-gemini-web skill 的实际效果，就要去看行为真正发生在哪里。constants.ts 能看出 endpoints 和 model 定义；client.ts 展示了 retry、timeout、upload 和 parsing 逻辑；exceptions.ts 则告诉你这个工具如何分类失败原因。和反复重跑同一条 prompt 相比，这些信息更直接，也更可操作。

不要只看第一次输出，继续迭代

不要因为一轮结果就给这个 skill 下结论。更有效的做法是提出有针对性的修订要求：

“keep composition, reduce background clutter”
“preserve product shape, improve material realism”
“same scene, but cleaner color palette and softer shadows”

这比一句笼统的 “make it better” 更有效，因为 baoyu-danger-gemini-web 最擅长的场景，就是目标明确、修改方向也明确的任务。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

openclaw-persona-forge

作者 affaan-m

openclaw-persona-forge 是一款以工作流驱动的技能，用于从零开始构建完整的 OpenClaw persona 套件。它会生成身份张力、SOUL.md 风格框架、边界规则、名字备选，以及可选的头像 prompt 指引。适合 OpenClaw 角色设计、roleplay agents 和偏 UI Design 的 persona 工作，不适合对现有 persona 做小幅修改。

UI 设计

收藏 0GitHub 156.2k

baoyu-imagine

作者 JimLiu

baoyu-imagine 是一款支持多家服务商的图像生成技能，提供类型化 CLI、必需的 EXTEND.md 配置、参考图支持、宽高比控制，以及可在 OpenAI、Azure OpenAI、Google、OpenRouter、DashScope、MiniMax、Jimeng、Seedream 和 Replicate 之间进行批量运行。

图像生成

收藏 0GitHub 13.2k

baoyu-comic

作者 JimLiu

baoyu-comic 是一项可将源文本转成教育类或传记风格漫画的技能，覆盖分镜规划、角色一致性、分格布局以及分阶段图像生成。它支持可安装的 CLI 用法，提供风格与版式选项，也支持 `--storyboard-only`、`--prompts-only`、`--regenerate` 等局部流程，便于更可控地完成漫画生产。

图像生成

收藏 0GitHub 13.2k

shader-dev

作者 MiniMax-AI

shader-dev 是一个面向 ShaderToy 风格实时视觉效果的实用 GLSL 着色器技能。使用 shader-dev 技能可以更少靠猜测地构建或调试 ray marching、SDF 场景、光照、粒子、流体运动、后期处理，以及用于 UI Design 的 shader-dev。

UI 设计

收藏 0GitHub 11.7k

videoagent-video-studio

作者 pexoai

videoagent-video-studio 是一款可根据文本、图片和参考素材生成短篇 AI 视频的技能。你可以用它测试 text-to-video 与 image-to-video 工作流，对比支持的模型，并在 Node 18+ 环境下使用托管代理或自托管方案运行。

视频编辑

收藏 0GitHub 456

seo-image-gen

作者 AgriciDaniel

seo-image-gen 是一个 GitHub skill，用于把 SEO 图片需求转化为可直接用于生产的 prompts 和设置，覆盖 OG images、社交预览图、hero banners、产品视觉图、信息图和 thumbnails。它通过 nanobanana-mcp 调用 Gemini，并默认已安装 banana extension，适合用作一份实用的 seo-image-gen 安装与工作流指南。

图像生成

收藏 0GitHub 0

baoyu-xhs-images

作者 JimLiu

baoyu-xhs-images 可将文章或笔记转换成小红书信息图轮播，提供预设、风格、版式与配置指引，帮助用户完成安装、选择输入内容，并运行 `/baoyu-xhs-images` 生成结构化的多页社交内容。

UI 设计

收藏 0GitHub 13.2k

baoyu-cover-image

作者 JimLiu

baoyu-cover-image 帮助 agent 按类型、配色、渲染、文字和氛围等维度，生成结构化的文章封面图提示词。它支持 2.35:1、16:9 和 1:1 格式，内置自动选择规则与兼容性说明，适合可重复执行的 editorial 和 UI Design 封面工作流。

UI 设计

收藏 0GitHub 13.2k

meme-factory

作者 softaworks

meme-factory 可帮助 agent 基于模板生成 meme，调用免费的 memegen.link API，也支持适合 Markdown 的文字类 meme。你可以用它生成可分享的 meme URL、选择合适模板、正确格式化文本，并借助随附的 Python helper 自动化输出。

图像生成

收藏 0GitHub 1.3k

logo-creator

作者 ReScienceLab

logo-creator 是一套面向 AI logo 设计的工作流，可用于生成创意方向、对比不同变体、裁剪图像、移除背景并导出 SVG 资产。它结合风格参考、示例提示词和辅助脚本，在 ReScienceLab/opc-skills 中支持 logo、icon、favicon 和品牌标记的创建。

品牌设计

收藏 0GitHub 0

scientific-schematics

作者 K-Dense-AI

scientific-schematics 可将自然语言提示转化为适合发表的科学图表，并通过智能迭代优化持续提升质量。它使用 Nano Banana 2 生成图像，并用 Gemini 3.1 Pro Preview 进行审阅；只有当输出低于你的文档类型阈值时才会重新生成。适用于神经网络架构、系统示意图、流程图、生物通路及其他复杂科学可视化内容。

图像生成

收藏 0GitHub 0

banner-creator

作者 ReScienceLab

banner-creator 提供结构化流程，帮助创建横幅、页眉和 hero 图片：先收集需求，再生成多个方案，结合反馈迭代优化，并使用自带脚本按平台比例裁切。

UI 设计

收藏 0GitHub 0

baoyu-article-illustrator

作者 JimLiu

baoyu-article-illustrator 可帮助 agent 将文章草稿转成结构化插图提示词、插入位置建议，以及统一的题材与风格决策，适用于解读型内容、教程、图解和多图文章。

图像生成

收藏 0GitHub 13.2k

nanobanana

作者 ReScienceLab

nanobanana 是一款面向 Google Gemini 3 Pro Image 的 Python CLI 技能，支持文生图、图像编辑、宽高比设置、2K/4K 输出，以及通过简单本地脚本进行批量生成。

图像生成

收藏 0GitHub 654

sound-fx

作者 NoizAI

使用 sound-fx 技能，把文本提示词转换成音效、拟音、环境底噪、怪物声音和 UI 音效。它适合用于音效编辑、快速原型验证和可下载音频素材制作。先通过 NoizAI/skills 安装，然后使用基于脚本的工作流，并准备有效的 Noiz API key。它不适用于语音、歌词、旋律或声音克隆。

音频编辑

收藏 0GitHub 498

chat-with-anyone

作者 NoizAI

chat-with-anyone 可从公开音频克隆真实人物的声音，或根据图片设计匹配的声音，再通过 TTS 生成合成回复。它支持角色扮演、旁白和语音生成等实用工作流，并提供安装、素材选择和安全使用方面的指导。

语音生成

收藏 0GitHub 498

baoyu-danger-gemini-web

baoyu-danger-gemini-web skill 概览

baoyu-danger-gemini-web skill 能做什么

谁适合安装 baoyu-danger-gemini-web skill

为什么有人会选它，而不是只写一个普通 prompt

采用 baoyu-danger-gemini-web skill 的关键权衡

如何使用 baoyu-danger-gemini-web skill

安装环境与运行时要求

baoyu-danger-gemini-web skill 需要什么输入

如何把模糊目标整理成可执行调用

推荐工作流与排错路径

baoyu-danger-gemini-web skill 常见问题

baoyu-danger-gemini-web skill 适合新手吗？

什么情况下它比官方 API 或普通 prompting 更合适？

安装前最需要注意哪些风险？

什么情况下应该避免用 baoyu-danger-gemini-web 做 Image Generation？

如何改进 baoyu-danger-gemini-web skill 的使用效果

提供更丰富的任务 brief，而不只是更长的 prompt

降低常见失败模式

利用仓库内部实现做更聪明的排查

不要只看第一次输出，继续迭代

评分与评论