open-source

作成者 browser-use

browser-use Pythonライブラリのドキュメント参照に使える skill。open-source skill では、インストール、セットアップ、Agent と Browser のコード、モデル用の環境変数、tools、MCP連携、モニタリング、旧Actor APIの案内まで確認できます。

スター84.9k

お気に入り0

追加日2026年3月29日

カテゴリーCode Generation

インストールコマンド

npx skills add browser-use/browser-use --skill open-source

編集スコア

この skill の評価は 82/100 で、ディレクトリ掲載候補として十分に堅実です。エージェントが使いどころを判断しやすく、トピックごとの参照先ファイルも整理されており、browser-use の open-source ライブラリで実装する際の参考情報も充実しています。一方で、これは一貫したエンドツーエンド手順というより、あくまでドキュメント検索・参照用の skill と捉えるのが適切です。

82/100

強み

トリガー条件が明確です。SKILL.md に、この skill を使う場面と、cloud または browser-use の skill に切り替えるべき場面がはっきり書かれています。
実務で使いやすい深さがあります。参照ファイルには、install/quickstart、models、agent config、browser config、tools、integrations、monitoring、examples まで幅広く含まれています。
具体性が高く信頼しやすい内容です。docs には Python のスニペット、パラメータの説明、環境変数、MCP / client 設定例が含まれています。

注意点

トップレベルの skill は主にルーティング用の文書です。エージェントは統一された単一フローに従うのではなく、適切な参照ファイルを自分で選んで読む必要があります。
インストールコマンドは SKILL.md 自体には記載されていないため、基本セットアップは参照先の quickstart を開いて確認する前提になります。

Python MCP MCP Server Automation Browser Automation Documentation

概要

open-sourceスキルの概要

open-sourceスキルは何に使うものか

open-sourceスキルは、Pythonの browser-use ライブラリ向けドキュメント参照スキルです。Agent、Browser、tools、モデル設定、MCP連携、モニタリング、そして旧来の Actor API について、一般的なブラウザ自動化の知識に頼って推測するのではなく、実装に即した回答を返せるようにします。

特に、browser_use を import するコードを書いている・レビューしている開発者や、実行環境の構成を決めたい人、うろ覚えだと間違えやすい設定をデバッグしたい人に向いています。

向いているユーザーと解決したい仕事

次のような場面では、open-sourceスキルを使うのが適しています。

オープンソース版 browser-use Pythonライブラリをインストールして設定したい
LLMバックエンドと必要な環境変数を選びたい
正しいパラメータで Agent(...) や Browser(...) のコードを書きたい
カスタムツール、hooks、structured output を追加したい
browser-use を MCP、skills、ドキュメント系ツール、observability と接続したい
低レベルな旧 Actor API を理解したい

ここでの本当の役割は「リポジトリを要約すること」ではありません。
「参照ファイルを手で探し回るより速く、正しい browser_use のコードと設定を作れるようにすること」です。

一般的なプロンプトと何が違うのか

汎用プロンプトでもブラウザ自動化全般の知識は持っているかもしれませんが、このスキルはリポジトリ内の公式リファレンス群に根ざしています。

references/quickstart.md
references/models.md
references/agent.md
references/browser.md
references/tools.md
references/actor.md
references/integrations.md
references/monitoring.md
references/examples.md

これが重要なのは、browser-use には Playwright や Selenium、あるいはクラウド専用の Browser Use API とそのまま置き換えられない、固有のクラス名・パラメータ名・環境変数・クラウドとの境界・統合パスがあるからです。

インストール前に知っておくべき重要な境界

この open-sourceスキル は、オープンソースの Python ライブラリ向けであり、Browser Use のあらゆるプロダクト面をカバーするものではありません。

使ってよいケース:

ローカル実行や Python ライブラリ利用
browser_use 向けのコード生成
models、tools、hooks、browser session、monitoring まわりの設定相談

使わないほうがよいケース:

Cloud API / SDK の料金やクラウド製品のワークフロー
別の browser-use スキルのほうが適している、CLI的なブラウザ自動化リクエスト

タスクが「from browser_use import ... を使う Python コードを書きたい」であれば、このスキルが適任です。

open-sourceスキルの使い方

open-source利用時のインストール前提

skills 対応環境にこのスキルをインストールし、タスクが browser_use Python ライブラリに関わるときに呼び出します。

よくある追加コマンドの形は次のとおりです。

npx skills add https://github.com/browser-use/browser-use --skill open-source

インストール後は、単体アプリとして使うのではなく、コード生成時の参照レイヤーとして使うのが基本です。設計上、コード記述や設定判断を導くためのスキルになっています。

コードを頼む前に、まず読むべきファイル

オープンソース版の使い方を速く正確に押さえたいなら、リポジトリ全体を読むのではなく、まず自分の作業に合うファイルから入るのが近道です。

インストールや初回実行: references/quickstart.md
モデルプロバイダ選定: references/models.md
agent を書く: references/agent.md
browser session の設定: references/browser.md
tools を追加する: references/tools.md
低レベルで決定的な制御が必要: references/actor.md
MCP や skills をつなぐ: references/integrations.md
tracing や cost tracking を入れる: references/monitoring.md
動くパターンを真似する: references/examples.md

このスキルは、プロンプト内で扱いたいトピックが明示されていると最も力を発揮します。

open-sourceスキルに必要な入力

スキルが適切な参照ファイルを選び、実行可能なコードを生成できるよう、十分な文脈を渡してください。特に価値が高い入力は次のとおりです。

目的を1文で
Agent、Browser、tools、Actor API のどれが必要か
分かっているならモデルプロバイダ
実行が local / remote CDP / cloud-connected のどれか
headless mode、auth、allowed domains、structured output、observability などの制約

弱い入力:

“Use browser-use for automation.”

強い入力:

“Write Python code using browser_use.Agent with ChatOpenAI(model="gpt-4.1-mini"), a non-headless Browser, allowed domains limited to example.com, and a Pydantic output schema.”

あいまいな要件を強いプロンプトに変える

コード生成向けの open-source をうまく使うには、曖昧な依頼を次の4要素に分けたプロンプトへ変えるのが有効です。

対象の API 面
実行前提
出力形式
制約条件

例:

Use the open-source skill to write a Python example with `browser_use.Agent`.
Model: `ChatGoogle(model="gemini-flash-latest")`.
Browser: headless, custom window size, keep browser alive after run.
Task: log in, navigate to a dashboard, extract three metrics.
Return complete code plus required env vars and pip installs.

これが機能する理由:

スキルを agent.md、browser.md、models.md に自然に誘導できる
cloud/API との取り違えを防げる
コード、セットアップ、運用上の前提を一度に要求できる

採用判断時にまず確認したい最小 open-source導入パス

まだ導入するか迷っている段階なら、まずは最短で動くセットアップをスキルに求めるのがおすすめです。

Python のインストール手順
最小の実行可能な Agent サンプル
サポートされる LLM を1つと、その環境変数
ブラウザ / ランタイムの前提条件

リポジトリのリファレンスを見ると、モデル設定はプロバイダごとに異なります。つまり、「browser-use をインストールする」だけでは不十分です。BROWSER_USE_API_KEY、GOOGLE_API_KEY、OPENAI_API_KEY のように、正しい chat class と API key 用の変数まで揃える必要があります。

open-sourceが特に得意な実践パターン

このスキルは、次のようなワークフローで特に強みがあります。

最初の Agent(...) スクリプトを生成する
ChatBrowserUse、ChatGoogle、ChatOpenAI、ChatAnthropic などの model class を比較する
headless、window_size、cdp_url、ドメイン制限といった Browser(...) オプションを設定する
カスタム tools を追加し、ActionResult を理解する
output_model_schema で structured output を有効化する
timeout、retry、fallback LLM、hooks を設定する
Laminar や OpenLIT の monitoring を追加する
より低レベルな page / element 制御のために旧 Actor API を使う

出力品質に影響する重要な制約

open-sourceスキルには、導入判断に直結する重要な制約がいくつかあります。

Actor API は明確に legacy 扱いで、Playwright と同一ではありません。
Browser は BrowserSession の alias なので、サンプルを読むときの助けになります。
ドメイン制御は allowed_domains と prohibited_domains のパターンで行われ、マッチングには固有のルールがあります。
skills や skill_ids で skills を読み込むような一部機能には BROWSER_USE_API_KEY が必要です。
Cloud MCP のセットアップは存在しますが、それはオープンソースの Python ライブラリの使い方とは別物です。

こうした点こそ、汎用プロンプトでは誤りやすい部分です。

open-sourceでコード生成する最適な進め方

実践的な進め方は次のとおりです。

自分のプロバイダとタスクにぴったり合う、最小の動作例を頼む。
追加されている非デフォルト引数すべてに注釈を付けてもらう。
ローカルでその例を実行する。
失敗したら traceback と現在のコードを貼る。
関連する参照ファイルに基づいた修正版を依頼する。

最初から「本番用のフル実装」を求めるより、こちらのほうがうまくいきます。多くの失敗は業務ロジック不足ではなく、セットアップの食い違いから起こるためです。

open-sourceスキルをうまく呼び出せるプロンプト例

Use the open-source skill for browser-use.
I need Python code, not cloud API usage.
Please build a script that uses `Agent` with `ChatBrowserUse()`, runs headless,
extracts structured output into a Pydantic model, and tracks cost.
Also list the env vars, pip packages, and which reference docs you used.

このプロンプトなら、スキルは agent.md、models.md、monitoring.md を組み合わせるべきだと判断しやすくなります。

Agent ではなく Actor API を使うべき場面

ゴール指向のブラウジングを LLM に計画させたいなら Agent を使います。

一方、決定的な低レベル操作が必要で、タイミング管理も自分で持てるなら Actor API が向いています。リファレンスでは、Playwright との重要な違いとして、element が即時に返ることや、evaluate() の書式がより厳密であることが挙げられています。コードが Playwright 前提になっているなら、Actor API の挙動に合わせてサンプルを調整するよう明示的に依頼してください。

open-sourceスキル FAQ

open-sourceはインストール支援専用ですか？

いいえ。open-source は、browser_use Python ライブラリに関する install、setup、code generation、configuration、integrations、debugging までをカバーします。インストールは入り口にすぎず、真価は正しいパラメータ名、プロバイダ設定、API 固有の実例を素早く押さえられる点にあります。

open-sourceスキルは初心者にも向いていますか？

はい。特に、最小構成で依頼するなら有効です。初心者は次の内容を絞って依頼すると進めやすくなります。

provider を1つ
短いタスクを1つ
完全なスクリプトを1本
環境変数とインストールコマンド
各 import の説明

すでに必要性が分かっているのでなければ、最初のプロンプトで tools、hooks、monitoring、MCP まで一気に求めないほうが無難です。

ブラウザ自動化について普通に聞くのと何が違いますか？

普通のプロンプトは Playwright や Selenium 前提に寄りがちです。open-sourceスキル は、ChatBrowserUse、output_model_schema、ドメイン制限、fallback LLM の挙動、cloud と open-source の境界、Actor API 特有の癖といった、リポジトリ準拠の browser_use 情報が必要なときにより適しています。

どんなときに open-source を使わないほうがよいですか？

次のようなタスクでは使わないでください。

Browser Use Cloud の料金や cloud SDK の案内
browser_use を使わない一般的なブラウザ自動化
別スキルのほうが適した、コマンド指向の直接的なブラウザ操作

Python ライブラリや Browser Use のドキュメントが関係しない依頼なら、このスキルはおそらく適切ではありません。

open-sourceはモデル選定にも役立ちますか？

はい。リファレンスには、Browser Use、Google Gemini、OpenAI、Anthropic、Azure OpenAI、Bedrock、Groq、Ollama、OpenAI互換 API にまたがる、対応モデルプロバイダと環境変数がまとまっています。コードを書き始める前にこのスキルを使う実利の大きい理由のひとつです。

open-sourceは本番運用の観点にも対応できますか？

はい。ライブラリの範囲内であれば対応できます。retry、fallback LLM、browser の永続化、cdp_url による remote browser 接続、Laminar や OpenLIT を使った monitoring、さらに fast mode や parallel browsers のような性能重視パターンまで案内できます。

open-sourceスキルを改善するには

open-sourceに具体的な実装対象を渡す

結果を最も速く改善する方法は、欲しいコードの対象をはっきり指定することです。

“write an Agent example”
“configure a Browser with cdp_url”
“add a custom tool”
“return structured output”
“show Actor API page interaction”

これにより参照ファイルのブレが減り、話題が混ざった回答も避けやすくなります。

実行環境とプロバイダ情報を最初に入れる

質の低い出力の多くは、環境前提が省略されていることから起きます。少なくとも次は明示してください。

Python の文脈
選ぶ model class
API key の取得元
headless か可視ブラウザか
local browser か remote CDP か
skills や MCP が必要かどうか

これがないと、一見もっともらしくても、自分の環境では動かない断片が返ってくることがあります。

抽象化より先に、まず動く例を求める

再利用しやすい設計が欲しい場合でも、最初は実行可能なスクリプトを求めるのが得策です。その後で次の方向へ段階的に広げていきます。

helper functions
config extraction
より厳密な schema
tool registration
monitoring hooks

この順番なら、導入時につまずきやすい install や import のミスを早い段階で拾えます。実際、採用時の摩擦の多くはここで起こります。

回答の根拠にしたい参照ファイル名を指定する

効果の高いプロンプトの形として、次のような指定があります。

Use the open-source skill and ground the answer in `references/agent.md` and `references/browser.md`.

網羅性より正確さを優先したいときは、この指定が有効です。スキルをリポジトリの実際の API 面に沿わせやすくなります。

よくある失敗パターンを把握しておく

導入を妨げやすい主な要因は次のとおりです。

クラウド製品の案内と open-source ライブラリのコードを混同する
Actor API の例で Playwright の挙動を前提にしてしまう
provider 用の環境変数が抜けている
ベース構成を示さずに高度な機能を要求する
“browser-use” の支援を頼みつつ、Agent / Browser / tools / Actor API のどれかを明示していない

最初の回答が広すぎると感じたら、「もっと詳しく」ではなく、対象の API 面を絞り込むほうが改善につながります。

より良いコード生成のために入力を強くする

より良いプロンプト:

Use the open-source skill to generate Python code with:
- `from browser_use import Agent, Browser, ChatOpenAI`
- model `gpt-4.1-mini`
- headless browser
- `allowed_domains=["example.com"]`
- structured output via Pydantic
- cost tracking enabled
Return install steps, env vars, and a short explanation of each parameter.

これが機能するのは、要求した各機能がドキュメント化されたリファレンスにきれいに対応しているからです。

最初の出力のあとに改善をかける

最初の回答を得たら、次のような依頼で精度を上げていけます。

“Remove everything non-essential and keep it runnable.”
“Adapt this to ChatBrowserUse() instead of OpenAI.”
“Add a custom tool and explain where it plugs into the agent.”
“Switch from Agent to Actor API for deterministic control.”
“Add monitoring with OpenLIT only.”

こうした焦点の絞られた修正依頼は、巨大な一発プロンプトより良い結果になりやすいです。

open-sourceは要約ツールではなく、ドキュメントのルーターとして使う

open-source の最もよい使い方は、適切な内部ドキュメントへ最短でたどり着くルーティング層として使うことです。まず必要な参照先を引かせ、そのファイルに基づくコード生成を依頼してください。汎用プロンプトや軽い repo 読みより、このスキルの価値が最も出るのはそこです。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

dart-flutter-patterns

作成者 affaan-m

dart-flutter-patterns は、フロントエンド開発向けの実践的な Dart と Flutter のスキルです。null safety、immutable state、async composition、widget の構成、state management、GoRouter によるナビゲーション、Dio を使ったネットワーク、testing、clean architecture まで幅広くカバーします。新機能の追加やリファクタリングで、実運用に耐えるパターンを選ぶために dart-flutter-patterns ガイドを活用してください。

Frontend Development

お気に入り 0GitHub 156.1k

vercel-react-native-skills

作成者 vercel-labs

vercel-react-native-skills は、パフォーマンス重視のフロントエンド開発に役立つ React Native / Expo 向けスキルです。リスト描画、アニメーション、ナビゲーション、UI パターン、状態管理、ネイティブモジュールのセットアップ改善に活用できます。モバイルアプリのボトルネックを、迷いを減らしながら解消するための実践的なルール、導入ガイド、運用パターンが含まれています。

Frontend Development

お気に入り 0GitHub 25.9k

chatgpt-apps

作成者 openai

chatgpt-apps は、MCP サーバーとウィジェット UI を組み合わせた ChatGPT Apps SDK プロジェクトの構築・修正に使うスキルです。ドキュメント準拠のセットアップ、ツール設計、ブリッジ配線、リソース登録、メタデータ、CSP、リポジトリ検証まで対応します。バックエンドと UI を同時に設計する必要がある Backend Development の chatgpt-apps にも対応します。

Backend Development

お気に入り 0GitHub 18.6k

gsap-frameworks

作成者 greensock

gsap-frameworks は、Vue、Nuxt、Svelte、SvelteKit などの非 React フレームワーク向けの GSAP スキルです。ライフサイクルを安全に扱うアニメーション初期化、スコープ付きセレクタ、アンマウント時のクリーンアップまでカバーしており、Frontend Development でコンポーネントのアニメーションを正しく動かせます。

Frontend Development

お気に入り 0GitHub 3.2k

gsap-react

作成者 greensock

gsap-reactは、ReactとNext.js向けのGSAP公式skillです。`useGSAP()`、refs、`gsap.context()`、スコープ付きセレクタ、クリーンアップまでカバーしており、再レンダーやアンマウントに起因する不具合を避けながら、Reactで安全にアニメーションを構築できます。フロントエンド開発でgsap-reactの導入方法や使い方を確認したいときに、このガイドを使ってください。

Frontend Development

お気に入り 0GitHub 3.2k

azure-ai-projects-ts

作成者 microsoft

TypeScriptで `azure-ai-projects-ts` と `@azure/ai-projects` を使って Azure AI Foundry アプリを構築します。プロジェクトクライアント、エージェント、接続、デプロイ、データセット、インデックス、評価、OpenAI アクセスまで、このスキルを活用できます。Azure のプロジェクトリソースと資格情報を使った API 開発に役立つ実践ガイドです。

API Development

お気に入り 0GitHub 2.3k

terraform-style-guide

作成者 hashicorp

terraform-style-guide は、HashiCorp のスタイル規約、ファイル構成、セキュリティを意識したデフォルトを踏まえて Terraform HCL の生成とレビューを支援します。Terraform ネイティブなコード生成、モジュール構成、variables、outputs、そして実運用リポジトリでより安全な設定を行う用途に向いています。

Code Generation

お気に入り 0GitHub 583

swift

作成者 Joannis

swift skill を使うと、Swiftのコードをより少ない推測で書けるようになります。Swiftの設定、ログ、可観測性、テスト、クロスプラットフォームのパターン、API設計、アクセス制御、メモリ安全性の機能に役立ちます。特に Swift for Backend Development で効果的で、実践的なSwiftの使い方、導入の考え方、repoを踏まえた実装のポイントが重要な場面に向いています。

Backend Development

お気に入り 0GitHub 57

wp-block-development

作成者 WordPress

wp-block-development は、WordPress の Gutenberg ブロックをより少ない試行錯誤で作成・更新・デバッグできるようにするスキルです。`block.json` のメタデータ、`register_block_type(_from_metadata)`、attributes と serialization、supports、dynamic rendering、deprecations、build tooling に使えます。特に、エディターとフロントエンドの一致に影響する Frontend Development タスクで効果を発揮します。

Frontend Development

お気に入り 0GitHub 0

remotion-video-creation

作成者 affaan-m

remotion-video-creation は、React での動画制作に特化した Remotion 向けスキルです。アニメーション、素材、音声、キャプション、チャート、コンポジション、トランジションまで、29 のルールでレンダリングミスを減らすのに役立ちます。Video Editing のワークフロー、テンプレート型の解説動画、SNS 用の短尺クリップ、データ駆動のモーショングラフィックスに最適です。

Video Editing

お気に入り 0GitHub 156.2k

terraform-test

作成者 hashicorp

terraform-test は、`.tftest.hcl` ファイル、`run` ブロック、assertion、mock、CI に組み込みやすいワークフローを使って Terraform テストを記述・実行するための実践ガイドです。モジュールの出力、リソース引数、条件分岐ロジック、そして merge 前の plan / apply の挙動を検証する際に役立ちます。

Code Generation

お気に入り 0GitHub 583

agentic-development

作成者 alinaqi

agentic-development は、Python の Pydantic AI または Node.js の Claude Agent SDK を使って、複数ステップのオーケストレーションに対応した AI エージェントを構築するためのスキルです。フレームワークの選定、ツールの定義、型付きで本番運用を見据えたエージェントワークフローの設計に役立ちます。

Agent Orchestration

お気に入り 0GitHub 0

source-driven-development

作成者 addyosmani

source-driven-development スキルは、フレームワーク固有のコーディングを公式ドキュメントに基づいて進めるためのもので、実装前にパターンを確認できます。React、Vue、Next.js、Svelte、Angular などのスタックで、正確性、出典の明確さ、バージョン差に左右される判断が重要な場合に最適です。

Code Generation

お気に入り 0GitHub 18.8k

huggingface-llm-trainer

作成者 huggingface

huggingface-llm-trainer は、Hugging Face Jobs 上で TRL または Unsloth を使い、言語モデルや視覚モデルを学習・ファインチューニングするのに役立ちます。この huggingface-llm-trainer スキルは、SFT、DPO、GRPO、reward modeling、データセット検証、GPU 選定、Hub への保存、Trackio 監視、さらにバックエンド開発ワークフロー向けの GGUF 書き出しまでカバーします。

Backend Development

お気に入り 0GitHub 10.4k

azure-ai-voicelive-ts

作成者 microsoft

azure-ai-voicelive-ts は、Azure AI Voice Live TypeScript SDK を使ってリアルタイム音声 AI アプリを構築するのに役立ちます。双方向音声、ストリーミング応答、セッション設定、関数呼び出しが必要な Node.js やブラウザ向けプロジェクトに最適です。この azure-ai-voicelive-ts ガイドは、実践的な導入、使い方、コード生成のヒントを探しているときに役立ちます。

Code Generation

お気に入り 0GitHub 2.3k

azure-ai-openai-dotnet

作成者 microsoft

azure-ai-openai-dotnet は、.NET 開発者が Azure OpenAI を実装するための実践的なガイドを提供します。セットアップ、認証、クライアント選定に加え、チャット、埋め込み、画像、音声、アシスタントの使い方までカバーしています。概念整理だけでなく、Azure.AI.OpenAI の動き出しをすぐ作りたい API 開発に役立ちます。

API Development

お気に入り 0GitHub 2.2k