baoyu-danger-gemini-web

作成者 JimLiu

baoyu-danger-gemini-web は、Gemini Web を使ってテキスト生成、画像生成、参照画像を用いた画像認識、マルチターン会話を行うためのクライアントラッパーです。ローカルのスキルリポジトリから `bun` または `npx` で実行し、`scripts/` 配下のスクリプトを利用します。インストールおよび利用前に、初回は同意確認が必要です。

スター13.2k

お気に入り0

追加日2026年4月5日

カテゴリーImage Generation

インストールコマンド

npx skills add JimLiu/baoyu-skills --skill baoyu-danger-gemini-web

編集スコア

このスキルの評価は 74/100 です。Gemini ベースのテキスト生成や画像生成を必要とするエージェントには掲載価値があり、実用性も見込めますが、ディレクトリ利用者は一定のセットアップ負荷とポリシー面に配慮した運用を想定しておくべきです。リポジトリには実際のワークフローに足る中身があり、充実した SKILL.md、明示的なトリガーフレーズ、リバースエンジニアリングされた API 利用に対する同意ゲート、さらに CLI エントリポイントと Gemini web client library を含む、薄いラッパーにとどまらない TypeScript 実装が確認できます。

74/100

強み

起動条件がわかりやすい: 説明内で、Gemini によるテキスト生成、画像生成、vision/reference-image input、マルチターン会話といった用途が明確に示されています。
実装面の実体がある: リポジトリには `main.ts` を含む大きめの scripts ディレクトリがあり、簡素なプロンプトラッパーではなく、完全な `gemini-webapi` client、types、utilities、error handling まで含まれています。
リスクのあるワークフローに対する信頼材料: SKILL.md に、リバースエンジニアリングされた API を使うため初回利用前にユーザー同意確認が必要であることが明記されています。

注意点

導入時のハードルは残ります: SKILL.md にはランタイム解決の案内はあるものの、直接的な install command はなく、ワークフローは外部環境やブラウザ cookie の設定に依存する可能性があります。その点はここで確認できる情報が一部に限られます。
これはリバースエンジニアリングによる "danger" 系の統合であり、公式 API と比べると信頼性やポリシー適合性が不安定になりやすい点に注意が必要です。

Gemini Google Ai Cli TypeScript Node.js Workflow

概要

baoyu-danger-gemini-web skill の概要

baoyu-danger-gemini-web skill でできること

baoyu-danger-gemini-web skill は、Gemini Web を公式 API ではなくリバースエンジニアリングされた Web フロー経由で扱うためのクライアントラッパーです。エージェントからテキスト生成、画像生成、参照画像の利用、複数ターンの会話継続まで実行できます。実用面での価値は明確で、skill ワークフローの中で Gemini 系の画像生成や画像理解付きのプロンプト処理を使いたい場合に、壊れやすい Web リクエストを手書きせずに済む、ローカルで動かせる実行経路を提供してくれます。

どんな人に向いているか

相性がよいのは、普段からローカルの AI skill を扱っていて、bun または npx -y bun の実行に抵抗がなく、特に baoyu-danger-gemini-web for Image Generation や vision 入力対応を必要としているユーザーです。逆に、ベンダーの正式サポート、安定した API 契約、簡単なクラウド配備を重視するチームにはあまり向きません。実際、このリポジトリは初回利用前に同意確認が必要で、その時点で「仕組みを理解した上で手を動かせる人向け」の設計だと分かります。

なぜ普通のプロンプトではなくこれを選ぶのか

通常のプロンプトだけでは、通信レイヤー、cookie 処理、アップロードフロー、トークン更新の挙動、チャットや画像生成のリクエスト構造までは手に入りません。baoyu-danger-gemini-web skill は、それらの実装を scripts/main.ts と scripts/gemini-webapi/ 配下のクライアントコードにまとめています。つまり「それっぽいプロンプトを書く」のではなく、「Gemini Web をバックエンドとして実際に使う」ための土台が欲しいときに、推測や試行錯誤を大きく減らせます。

導入前に把握したい主なトレードオフ

最大の差別化ポイントは、1 つの実装経路でテキスト、画像生成、参照画像入力、会話継続、gem 関連のクライアント対応までカバーしていることです。一方で、名前とコードから分かる通り、これはリバースエンジニアリングされた Gemini Web の挙動に依存します。つまり、動作破綻、認証の面倒さ、レート制限、一時ブロックといったリスクは現実的に起こりえます。そこが許容できないユースケースなら、導入は避けるべきです。

baoyu-danger-gemini-web skill の使い方

インストール前提と実行環境の要件

baoyu-danger-gemini-web install を進めるには、skill リポジトリに加えて JS ランタイムが必要です。skill の frontmatter では bun か npx の利用が前提になっています。実際の判断材料として、まず次のファイルを読むのがおすすめです。

SKILL.md
scripts/package.json
scripts/main.ts
scripts/gemini-webapi/client.ts
scripts/gemini-webapi/constants.ts
scripts/gemini-webapi/exceptions.ts

リポジトリの説明では、実行ロジックはすべて scripts/ 配下にあります。bun が入っているならそれを使い、なければ skill 側で明示的にサポートされている npx -y bun を使ってください。SKILL.md にある同意ステップは、初回利用時の想定フローそのものなので、省略しないほうが安全です。

baoyu-danger-gemini-web に必要な入力

baoyu-danger-gemini-web usage の精度を上げるには、少なくとも次を明確に渡すと効果的です。

タスク種別: text、image generation、vision with reference image、または multi-turn chat
ユーザーの目的を 1 文で表したもの
スタイル、アスペクト比、形式、対象読者、バリエーション数などの出力条件
参照画像のパス、またはそれまでの会話コンテキスト
失敗許容度: まず 1 回の最良案が欲しいのか、反復的に詰めたいのか

弱い依頼の例:
“Make an image with Gemini.”

より強い依頼の例:
“Use baoyu-danger-gemini-web to generate 3 product-hero concepts for a matte black coffee grinder on a white seamless background, premium e-commerce style, front 3/4 angle, soft studio shadows, no text overlays.”

曖昧な依頼を実行しやすい指示に変える

この skill は、意図をそのまま投げるより、実行可能なブリーフに変換してから使うほうが安定します。実務的には次の形が扱いやすいです。

モードを明示する: image、text、vision
対象と目的を定義する
スタイルと制約を足す
参照情報や会話履歴を加える
何をもって成功とするかを書く

baoyu-danger-gemini-web for Image Generation 向けの例:
“Generate an image. Subject: futuristic hiking backpack for a landing page hero. Style: outdoor editorial photography, sunrise rim light, realistic materials. Constraints: no people, centered composition, 16:9, high detail, brand-safe. Return the best result plus a short revision note if the scene looks too cluttered.”

参照画像を使う場合の例:
“Analyze the attached product photo and generate a cleaner marketing version that preserves silhouette, zipper placement, and color blocking, but improves lighting and background.”

baoyu-danger-gemini-web skill の推奨ワークフローとデバッグ手順

最初はシンプルに、テキストのみ、または画像 1 件のリクエストから始め、通信まわりが通ることを確認してから参照画像や会話継続を足すのが無難です。失敗した場合は、次の順で原因の層を切り分けると追いやすくなります。

SKILL.md で同意とランタイム要件を確認する
scripts/main.ts で CLI の挙動を見る
scripts/gemini-webapi/utils/load-browser-cookies.ts と cookie-file.ts で認証・cookie 処理を確認する
get-access-token.ts と rotate-1psidts.ts でトークン更新まわりを確認する
exceptions.ts で AuthError、UsageLimitExceeded、TemporarilyBlocked、ImageGenerationError など想定される失敗分類を確認する

このリポジトリは、汎用的なプロンプト集としてではなく、運用用の接続レイヤーとして見ると導入しやすくなります。

baoyu-danger-gemini-web skill の FAQ

baoyu-danger-gemini-web skill は初心者向き？

TypeScript を読めて、ローカル実行時の問題に対応できるなら候補になります。baoyu-danger-gemini-web guide 自体の考え方は極端に難しくありませんが、「クリック一発で使える」タイプの初心者向けツールではありません。cookie、ブラウザのセッション状態、モデル側の挙動を自分で切り分ける場面は出てきます。

公式 API や普通のプロンプトより向いているのはどんなとき？

baoyu-danger-gemini-web skill を選ぶべきなのは、Gemini Web 特有の挙動、この経路での画像生成、あるいはテキスト・画像・チャットを 1 つのローカル skill フローでまとめて扱いたいときです。サポート体制、契約の明確さ、クォータの把握しやすさ、本番運用の安定性が必要なら公式 API のほうが適しています。単に実行可能な統合が不要で、文章としての指示だけで足りるなら、普通のプロンプトで十分です。

インストール前に知っておくべき主なリスクは？

大きいのは、認証の破綻、サービス側の仕様変更、利用上限、一時的な IP またはアカウント制限です。コードベースにこれらのエラーケースがすでに定義されているのは対処の助けになりますが、同時に「例外的な事故」ではなく「起こりうる前提条件」だとも読み取れます。

baoyu-danger-gemini-web for Image Generation を避けたほうがよいのはいつ？

リバースエンジニアリングされた Web アクセスを使えない環境、コンプライアンス上公式エンドポイントしか認められない組織、あるいは高い稼働予測性が前提のワークフローでは避けるべきです。公式 SDK で十分に処理できる基本的なテキスト生成しか必要ないなら、これを選ぶ理由は薄いです。

baoyu-danger-gemini-web skill を改善する方法

長いプロンプトより、情報の詰まったタスクブリーフを渡す

baoyu-danger-gemini-web usage で最も手早く品質を上げやすいのは、構造化された入力にすることです。画像タスクなら、被写体、シーン、構図、ライティング、写実度、除外条件、用途まで指定すると結果が安定します。vision タスクでは、絶対に変えてはいけない要素と、再設計してよい要素を分けて書くのが有効です。これだけでブレが減り、初回出力の使いやすさがかなり上がります。

よくある失敗パターンを減らす

典型的な失敗は、曖昧な指示、参照画像への制約不足、1 ターンでやりすぎることです。作業は段階に分けると改善しやすくなります。

まず生成または解析を行う
次に構図やスタイルを詰める
最後に仕上げのクリーンアップを依頼する

画像がブランドとずれるなら、“no text, no watermark, no extra objects, no exaggerated stylization.” のような明示的なネガティブ条件を足してください。チャットの文脈がぼやけてきたら、セッションが察してくれる前提で進めず、その時点の目的を明示的に言い直すほうが安定します。

リポジトリ内部を見て、より的確にトラブルシュートする

baoyu-danger-gemini-web skill の結果や挙動を改善したいなら、実際の振る舞いが定義されているコードを読むのが近道です。constants.ts ではエンドポイントやモデル定義が分かります。client.ts ではリトライ、タイムアウト、アップロード、レスポンス解析の実装が追えます。exceptions.ts を見れば、ツールがどのように失敗を分類しているか把握できます。同じプロンプトを何度も投げ直すより、こちらのほうがはるかに実用的です。

最初の出力のあとに改善を重ねる

1 回目の出力だけでこの skill を評価しないほうが得策です。修正依頼は、次のように変更点を絞って出すと効果が出やすくなります。

“keep composition, reduce background clutter”
“preserve product shape, improve material realism”
“same scene, but cleaner color palette and softer shadows”

“make it better” のような曖昧な言い方より、このほうが機能します。baoyu-danger-gemini-web は、目的と変更内容の両方がはっきりしているときに最も力を発揮します。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

baoyu-imagine

作成者 JimLiu

baoyu-imagine は、型付き CLI を備えたマルチプロバイダー対応の画像生成スキルです。必須の EXTEND.md 設定、参照画像のサポート、アスペクト比の調整、バッチ実行に対応し、OpenAI、Azure OpenAI、Google、OpenRouter、DashScope、MiniMax、Jimeng、Seedream、Replicate を横断して利用できます。

Image Generation

お気に入り 0GitHub 13.2k

baoyu-comic

作成者 JimLiu

baoyu-comic は、元テキストを教育漫画や伝記風コミックへ段階的に変換するためのスキルです。ストーリーボード設計、キャラクターの一貫性維持、コマ割り、画像生成を含む制作フローに対応し、CLI として導入して使えます。スタイルやレイアウトの指定に加え、`--storyboard-only`、`--prompts-only`、`--regenerate` などの部分実行にも対応しており、工程をコントロールしながらコミック制作を進められます。

Image Generation

お気に入り 0GitHub 13.2k

videoagent-video-studio

作成者 pexoai

videoagent-video-studioは、テキスト、画像、参照素材から短いAI動画を生成できるスキルです。text-to-videoやimage-to-videoのワークフロー検証、対応モデルの比較、Hosted ProxyまたはNode 18+でのセルフホスト構成の実行に向いています。

Video Editing

お気に入り 0GitHub 456

baoyu-xhs-images

作成者 JimLiu

baoyu-xhs-imagesは、記事やメモをXiaohongshu向けのインフォグラフィックカルーセルに変換できるスキルです。プリセット、スタイル、レイアウト、セットアップの案内がまとまっており、スキルの導入方法を確認し、入力内容を選び、`/baoyu-xhs-images`で構成化された複数枚のSNS投稿を作成する際に役立ちます。

UI Design

お気に入り 0GitHub 13.2k

baoyu-cover-image

作成者 JimLiu

baoyu-cover-image は、記事のカバー画像向けに、タイプ・配色・レンダリング・テキスト・ムードを整理した構造化プロンプトをエージェントで生成できるスキルです。2.35:1、16:9、1:1 の各フォーマットに対応し、自動選択ルールや互換性ガイドも備えているため、再現性の高い編集ワークフローや UI Design のカバー制作に適しています。

UI Design

お気に入り 0GitHub 13.2k

meme-factory

作成者 softaworks

meme-factory は、無料の memegen.link API を使ったテンプレートベースのミーム作成と、Markdown で扱いやすいテキストミーム生成をエージェント向けに支援するスキルです。共有しやすいミーム URL の生成、内容に合うテンプレート選定、正しいテキスト整形、付属の Python helper を使った出力自動化までまとめて行えます。

Image Generation

お気に入り 0GitHub 1.3k

logo-creator

作成者 ReScienceLab

logo-creator は、コンセプト作成、バリエーション比較、トリミング、背景除去、SVG アセット書き出しまでを一連で進められる AI ロゴ制作ワークフローです。ReScienceLab/opc-skills で、スタイル参照、プロンプト例、補助スクリプトを活用しながら、ロゴ、アイコン、favicon、ブランドマーク制作に対応します。

Branding

お気に入り 0GitHub 0

banner-creator

作成者 ReScienceLab

banner-creator は、バナー、ヘッダー、ヒーロー画像を構造化された手順で作成できるスキルです。要件整理からバリエーション生成、フィードバックを踏まえた調整、付属スクリプトを使った各プラットフォーム比率へのトリミングまで、一連の流れを進められます。

UI Design

お気に入り 0GitHub 0

baoyu-article-illustrator

作成者 JimLiu

baoyu-article-illustrator は、記事ドラフトを構造化されたイラスト用プロンプト、配置案、そして解説記事・チュートリアル・図解・複数画像を使う投稿向けの一貫したタイプ×スタイル設計へと落とし込むためのスキルです。

Image Generation

お気に入り 0GitHub 13.2k

nanobanana

作成者 ReScienceLab

nanobanana は、Google Gemini 3 Pro Image 向けの Python CLI スキルです。シンプルなローカルスクリプトで、テキストからの画像生成、画像編集、アスペクト比指定、2K/4K 出力、バッチ生成に対応します。

Image Generation

お気に入り 0GitHub 654

videoagent-image-studio

作成者 pexoai

videoagent-image-studioは、Nodeベースのエージェント向けに画像生成を一元化したスキルです。Midjourney、Flux、Ideogram、Recraft、SDXL などを1つのCLIフローで扱え、プロキシ経由のセットアップ、モデル選定のガイダンス、自動化しやすい統一出力を備えています。

Image Generation

お気に入り 0GitHub 456

algorithmic-art

作成者 anthropics

algorithmic-artは、p5.jsでオリジナルの生成アートを作るためのスキルです。まずアルゴリズムの思想を書き出し、その後 seeded randomness、パラメータ操作、インタラクティブビューア付きの実行可能な .html と .js を組み立てる2段階ワークフローを提供します。

Image Generation

お気に入り 0GitHub 105k

canvas-design

作成者 anthropics

canvas-design は、まず Markdown でデザイン哲学を定義し、その後 .png または .pdf に落とし込む2段階フローで、オリジナルの静的ビジュアル制作を支援します。ポスター、カバーアート、コンセプトビジュアル、テキスト少なめのUI周辺キャンペーングラフィックに向いています。

UI Design

お気に入り 0GitHub 105k

frontend-design

作成者 anthropics

frontend-designは、曖昧なUIアイデアから、汎用的でないスタイリングと明確な美的指針を備えた、個性的なプロダクション品質のフロントエンド実装を生成するのに役立つスキルです。

UI Design

お気に入り 0GitHub 105.2k

create-colleague

作成者 titanwings

create-colleague は、同僚に関するドキュメント、チャット、メール、スクリーンショット、Feishu、DingTalk のデータをもとに、編集可能な AI スキルを生成します。業務面と人物像を分けて出力でき、継続的に磨き込むための更新フローにも対応しています。

Skill Authoring

お気に入り 1GitHub 747

skill-creator

作成者 anthropics

skill-creator は、新規スキル作成、既存の SKILL.md 改訂、eval 実行、バリアント比較、トリガー説明の改善を支援する Skill Authoring 向けメタスキルです。リポジトリ内のスクリプトやレビュー補助を使った実務的な運用に向いています。

Skill Authoring

お気に入り 0GitHub 105.1k