geniml

作成者 K-Dense-AI

genimlは、BEDファイル、scATAC-seq出力、クロマチンアクセシビリティデータを対象にしたゲノム区間の機械学習向けスキルです。Region2Vec、BEDspace、scEmbed、コンセンサスピークなど、領域レベルのMLワークフローで使えます。埋め込み、クラスタリング、ゲノム領域の前処理方針を知りたいときに適しています。

スター0

お気に入り0

追加日2026年5月14日

カテゴリーData Analysis

インストールコマンド

npx skills add K-Dense-AI/claude-scientific-skills --skill geniml

編集スコア

このスキルのスコアは78/100で、ディレクトリ利用者にとって十分有力な候補です。ゲノム区間MLに明確に焦点があり、具体的なワークフローも示されていて、導入を判断するのに足る運用情報があります。一方で、完全にパッケージ化されたスキルと比べると、セットアップ面や定着面の補助はまだやや不足しています。

78/100

強み

BED/ゲノム区間MLタスク向けのトリガーが明確で、Region2Vec、scEmbed、universes、コンセンサスピークまでカバーしている。
複数の見出し、コードフェンス、repo/file参照を含む実質的なワークフロー情報があり、一般的なプロンプトよりもエージェントが実行しやすい。
インストールコマンドとパッケージの識別情報があり、ゲノムデータのワークフローに合うかを評価しやすい。

注意点

スクリプト、参考文献、リソース、rulesファイルが含まれていないため、実装の詳細は本文から推測する必要がある場合がある。
GitHub経由のインストール手順とPythonパッケージの導入は示されているが、セットアップの迷いを減らすためのクイックスタートや検証チェックリストはない。

Python Genomics Bioinformatics Bed Single Cell Machine Learning Scikit Learn

概要

geniml スキルの概要

geniml は何に使うのか

geniml スキルは、ゲノムの区間データを機械学習の入力として扱う作業を助けます。特に BED ファイル、scATAC-seq の出力、クロマチンアクセシビリティ領域の取り扱いに向いています。単に注釈を付けたり可視化したりするのではなく、生のゲノム区間を埋め込み、クラスタ、その他の ML 向け特徴量に変換したい人に最適です。

どんな場面に向いているか

geniml スキルを使うのは、領域表現を作る、区間集合を比較する、コンセンサスピークを定義する、あるいは区間コレクションを使って下流のモデリングを行う、といった仕事です。特に geniml for Data Analysis のワークフロー、つまり Region2Vec、BEDspace、scEmbed、universes ベースのピーク処理を中心に進める場合に適しています。

インストール前に最も重要な判断ポイント

一番大事なのは、必要なのが汎用的な Python プロンプトではなく、ゲノム区間に特化した ML ワークフローかどうかです。単に BED ファイルをフィルタする、ピークを呼び出す、標準的なバイオインフォマティクスの QC をするだけなら、geniml はおそらく専門的すぎます。埋め込みや領域レベルの ML 特徴量が必要なら、geniml install には十分な価値があります。

geniml スキルの使い方

スキルをインストールしてパスを確認する

プロジェクトの skill manager を使ってエージェント環境にスキルをインストールし、ワークフローの参照先をリポジトリパス scientific-skills/geniml に向けます。インストール後は、geniml に依存するプロンプトを作る前に、geniml スキルが利用可能になっていることを確認してください。

まず読むべきファイルを正しく選ぶ

最初に SKILL.md を読み、その中で案内されているインストール、主要機能、そして実際に必要な手法の各セクションを確認します。このリポジトリには追加の scripts/、rules/、resources/ フォルダはないため、主な価値はスキル本体と、そこに埋め込まれたリンクにあります。

モデルに渡す入力の形を整える

geniml の良いプロンプトは、どんな区間データを持っているのか、その形式は何か、何を出力してほしいのかを明確にします。例えば、「この BED ファイルを使って領域埋め込みを作り、クラスタリングに使いたい。前処理で何を前提にするべきかも教えてください」のように書きます。「私のゲノムデータを解析して」よりずっと良く、スキルに具体的な着地点を与えられます。

より良い出力を得るための実践的な流れ

geniml usage は3段階で考えると使いやすくなります。まず区間のソースを定義し、次に手法を選び、最後に結果の条件を絞ります。生物種、ファイル数、領域の定義、そして埋め込み、コンセンサスピーク、細胞レベル表現のどれが欲しいかを含めてください。タスクに ML 依存関係があるなら、早い段階でそれを伝えると、geniml[ml] や PyTorch 系のセットアップを前提にした出力にできます。

geniml スキル FAQ

geniml は BED ファイル専用ですか？

ほぼその通りです。geniml スキルはゲノム区間を中心にしているため、BED ファイルや関連する領域テーブルが自然な対象です。他の入力に触れることはあっても、データが区間ベースでないなら、別のツールのほうが合っています。

使うのに機械学習の経験は必要ですか？

いいえ、ただし明確な目的は必要です。データと欲しい出力を平易な言葉で説明できるなら、初心者でも geniml のガイドを使えます。難しいのは構文ではなく、適切な領域学習ワークフローを選ぶことです。

geniml は通常のプロンプトと何が違いますか？

通常のプロンプトは、一般的な説明を求めることが多いです。geniml スキルが力を発揮するのは、区間データの準備方法、どのモデル系を使うべきか、下流の埋め込みやクラスタリングに影響する前提条件は何か、といったワークフロー固有のガイダンスが必要なときです。そのため、再現可能な解析により役立ちます。

どんなときに geniml を使うべきではありませんか？

単純な BED 編集、ゲノムブラウザ作業、区間を扱わない ML 問題には geniml を使わないでください。ゲノム領域から表現学習をしたいわけではないなら、このスキルは余計な手間になるだけで、大きな利点はありません。

geniml スキルの改善方法

解析対象を具体的に指定する

geniml の出力を最も早く良くする方法は、Region2Vec の埋め込み、BEDspace の比較、scEmbed の解析、universes の構築など、やりたい作業を正確に名前で示すことです。類似度、クラスタリング、細胞レベル特徴量、コンセンサス領域のどれが欲しいのかが分かると、スキルの精度が上がります。

データ制約を最初に伝える

ファイル数、区間が bulk 由来か single-cell 由来か、領域が fixed-width か variable-width かを先に伝えてください。こうした情報で前処理の選択が変わり、geniml スキルがあいまいな助言を出しにくくなります。

結果だけでなくワークフローを求める

良い geniml usage の依頼は、手順、必要な入力、起こりやすい落とし穴まで求めます。例えば、「BED ファイルから埋め込みを学習するための geniml ガイドを示し、学習前に標準化しておくべき点も書いてください」のように聞くと、一文要約よりずっと実用的な出力が得られます。

手法ごとのフィードバックで反復する

最初の回答が広すぎるなら、具体的な手法と、まだ決められていないポイントに絞って再質問します。geniml for Data Analysis では、通常、universe の選び方、tokenization の前提、埋め込みの目的、そして続行前に ML 依存関係のインストールが必要かどうかを明確にするのが効果的です。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

clickhouse-best-practices

作成者 ClickHouse

clickhouse-best-practicesは、Database Engineering向けのClickHouseベストプラクティス skill です。スキーマ設計、クエリチューニング、insert戦略、エージェント接続を、ルールベースの推奨で整理して案内します。clickhouse-best-practices の使いどころを見極めやすく、レビューや引用にもつなげやすいので、ClickHouse のワークフローで活用しやすいのが特長です。

Database Engineering

お気に入り 0GitHub 412

chdb-datastore

作成者 ClickHouse

chdb-datastore は、ClickHouse バックエンドの DataStore API を使って高速なデータ分析を行うための pandas 互換スキルです。ファイル、データベース、クラウドの各コネクタ、異なるソースをまたぐ join、そして pandas 風ワークフローをほとんど変えずに使える点が特長です。大きめのデータセットに対して、そのまま使える分析レイヤーを求めるなら、この chdb-datastore ガイドが役立ちます。

Data Analysis

お気に入り 0GitHub 0

sympy

作成者 K-Dense-AI

sympyスキルを使って、Pythonでの厳密なシンボリック計算を行えます。代数、微積分、行列、物理式、数論、幾何、コード生成まで幅広く対応。式を厳密に保ち、適切なSymPyモジュールを選び、浮動小数点中心の誤りを避けるのに役立ちます。シンボリックなワークフローやData Analysisでのsympy活用を実践的に学びたい人に最適です。

Data Analysis

お気に入り 0GitHub 21.4k

interpreting-culture-index

作成者 trailofbits

interpreting-culture-index は、Culture Index のサーベイ、プロフィール書き出し、関連する採用・コーチングメモの解釈を支援します。役割適合、チームの力学、バーンアウトリスク、候補者の振り返り、オンボーディング計画、対立の仲裁にこの interpreting-culture-index skill を使ってください。矢印の相対関係を基準に読む考え方、アンチパターンの確認、データ分析と意思決定支援につながる実践的な出力を重視しています。

Data Analysis

お気に入り 0GitHub 5k

azure-search-documents-py

作成者 microsoft

azure-search-documents-py は、Python 向けの Azure AI Search スキルです。バックエンド開発を対象に、インストール、認証、インデックス設計、ベクトル検索、ハイブリッド検索、セマンティックランキング、エージェント的検索までをカバーします。セットアップから実用的なクエリパターンまで、具体的な指針が必要なときにこの azure-search-documents-py スキルを使ってください。

Backend Development

お気に入り 0GitHub 2.3k

gget

作成者 K-Dense-AI

ggetは、CLIまたはPythonから20以上のゲノムデータベースと解析ツールへ高速かつ統一的にアクセスできる生物情報学スキルです。遺伝子情報、BLAST関連の検索、AlphaFold構造、発現データ、疾患関連、エンリッチメント系の解析に使えます。素早い探索や、ggetを使ったData Analysisワークフローに向いています。

Data Analysis

お気に入り 0GitHub 0

torch-geometric

作成者 K-Dense-AI

PyTorch Geometric のグラフニューラルネットワーク向け torch-geometric スキルガイドです。torch-geometric のインストール支援、torch-geometric の使い方、グラフ分類、ノード分類、リンク予測、異種グラフ、カスタム MessagePassing レイヤー、Machine Learning ワークフローでの GNN のスケーリングに役立ちます。

Machine Learning

お気に入り 0GitHub 21.4k

rdkit

作成者 K-Dense-AI

rdkit skill は、SMILES、SDF、MOL、PDB、InChI の解析、記述子の計算、フィンガープリント生成、部分構造検索、反応処理、2D/3D 座標の生成など、精密な化学情報ワークフローを支援します。高度な制御、カスタムサニタイズ、Data Analysis ワークフローでの rdkit 活用を確認したい場合に使えるガイドです。

Data Analysis

お気に入り 0GitHub 21.4k

huggingface-vision-trainer

作成者 huggingface

huggingface-vision-trainer は、物体検出、画像分類、SAM/SAM2 のセグメンテーションといった Hugging Face のビジョントレーニングジョブを導入・活用するためのスキルです。データセット準備、クラウド GPU のセットアップ、評価、Trackio ロギング、結果の Hub へのプッシュまでをカバーします。バックエンド自動化や再現性の高い学習ワークフローに最適です。

Backend Development

お気に入り 0GitHub 10.4k

seo-dataforseo

作成者 AgriciDaniel

seo-dataforseo は、DataForSEO MCP サーバーを通じて Claude をライブの SEO データにつなぎ、SERP 確認、キーワード調査、被リンク、オンページ分析、競合調査、ビジネスリスティング、AI 可視性トラッキングを可能にします。実際の検索根拠が必要で、導入判断をしやすい明確な手順と、実務に使える seo-dataforseo の活用法を求めるデータ重視のワークフローに最適です。

Keyword Research

お気に入り 0GitHub 6.2k

pymc

作成者 K-Dense-AI

PyMCは、Pythonでベイズモデルを構築・推定・検証・比較するためのスキルです。pymcは、階層回帰、マルチレベル分析、時系列、欠損データ、測定誤差、LOOやWAICによるモデル比較に使えます。

Data Analysis

お気に入り 0GitHub 0

pymatgen

作成者 K-Dense-AI

pymatgen は、結晶構造、相図、電子構造、ファイル変換を扱う Python の材料科学向けツールキットです。この pymatgen スキルは、CIF、POSCAR、VASP、Materials Project のデータを使う科学ワークフローを支援します。

Scientific

お気に入り 0GitHub 0

geopandas

作成者 K-Dense-AI

Pythonでのgeopandasによる地理空間ベクターデータ分析向けスキルです。shapefiles、GeoJSON、GeoPackageファイルを扱えます。空間データの読み込み、整形、結合、バッファ作成、クリップ、再投影、書き出しを、迷いを少なく進められます。

Data Analysis

お気に入り 0GitHub 0

analyzing-threat-intelligence-feeds

作成者 mukul975

analyzing-threat-intelligence-feeds は、CTI フィードの取り込み、インジケーターの正規化、フィード品質の評価、STIX 2.1 ワークフロー向けの IOC 強化を支援します。脅威インテリジェンス運用とデータ分析向けに設計された analyzing-threat-intelligence-feeds スキルで、TAXII、MISP、商用フィードを使う実務に役立つガイドが含まれています。

Data Analysis

お気に入り 0GitHub 0

azure-ai-textanalytics-py

作成者 microsoft

azure-ai-textanalytics-py は、Python で Azure AI Text Analytics を扱うための skill です。感情分析、エンティティ認識、キーフレーズ抽出、言語判定、PII 検出、医療分野の NLP に対応します。Azure クライアントのセットアップ、認証、実践的なテキスト分析を、アプリ、ノートブック、データ分析ワークフローですばやく始めたいときに向いています。

Data Analysis

お気に入り 0GitHub 0

chdb-sql

作成者 ClickHouse

chdb-sql は、サーバーなしで Python から ClickHouse SQL を実行するための GitHub スキルです。`chdb.query()`、`Session`、DB-API 接続、`file()` や `s3()` などのテーブル関数、パラメータ化クエリ、ローカルファイルや外部データソースを使ったバックエンド開発ワークフローをカバーします。

Backend Development

お気に入り 0GitHub 0