Data Processing

Data Processing taxonomy generated by the site skill importer.

15 件のスキル
A
regex-vs-llm-structured-text

作成者 affaan-m

regex-vs-llm-structured-text は、構造化テキスト抽出で regex と LLM のどちらを使うかを判断するためのスキルです。まずは決定論的なパースから始め、信頼度の低い例外ケースには LLM による検証を追加。文書、フォーム、請求書、データ分析では、より安価で信頼性の高いパイプラインを構築できます。

Data Analysis
お気に入り 0GitHub 156.2k
K
omero-integration

作成者 K-Dense-AI

バックエンド開発で OMERO の Python ワークフローを扱うための omero-integration スキルです。OMERO に接続し、プロジェクト、データセット、画像、ROI、注釈、テーブルを取得して、バッチスクリプトもより少ない推測で実行できます。

Backend Development
お気に入り 0GitHub 21.3k
K
hypogenic

作成者 K-Dense-AI

hypogenic は、LLM の支援で表形式データやテキスト由来データセットの仮説を生成・検証するためのスキルです。データ分析における hypogenic を、経験的な問いを分類解釈、コンテンツ分析、欺瞞検出向けの構造化された検証可能なワークフローへと落とし込みます。単なるブレストではなく、根拠に基づく仮説が必要な場面で使ってください。

Data Analysis
お気に入り 0GitHub 21.3k
K
dnanexus-integration

作成者 K-Dense-AI

dnanexus-integration は、DNAnexus のクラウドゲノミクス作業に役立つ実践的なスキルです。アプリやアプレットの作成、アップロード/ダウンロードの管理、ワークフローの実行、`dxpy` を使ったパイプラインの自動化に活用できます。dnanexus-integration のガイドは、FASTQ、BAM、VCF ファイルを扱う Backend 開発タスクに加え、プラットフォーム固有の設定やジョブ実行もサポートします。

Backend Development
お気に入り 0GitHub 21.3k
H
huggingface-datasets

作成者 huggingface

huggingface-datasets スキルは、Hugging Face Dataset Viewer API のワークフローでデータセットの検証、split の解決、行のプレビューとページネーション、テキスト検索、フィルタ適用、parquet リンクや統計情報の取得を行うために使います。読み取り専用のデータセット探索に適した、実用的な huggingface-datasets ガイドです。

Web Scraping
お気に入り 0GitHub 10.4k
V
Workspace Data Analyst

作成者 VoltAgent

Workspace Data Analyst は、ワークスペース内のデータ分析に使える軽量な skill です。CSV ファイルを解析し、ヘッダーを確認して、合計・平均・外れ値を要約し、簡潔な次のアクションにつながる示唆を返します。深いモデリングに進む前に、ファイル内容を素早く把握したいときに最適です。

Data Analysis
お気に入り 0GitHub 8.5k
M
azure-storage-file-datalake-py

作成者 microsoft

azure-storage-file-datalake-py は、Azure Data Lake Storage Gen2 向けの Python スキルです。バックエンド開発者やエージェントが、Azure SDK を使ってインストール、認証、階層型ファイルシステムの操作を行えるようにします。たとえば、一覧表示、アップロード、ダウンロード、ディレクトリやファイルの管理などです。

Backend Development
お気に入り 0GitHub 2.3k
M
azure-cosmos-py

作成者 microsoft

azure-cosmos-pyスキルは、Azure Cosmos DB Python SDK をインストール・設定・活用するためのガイドです。NoSQL の CRUD、クエリ、コンテナー作成、パーティション分割、認証までカバーします。特に、パーティションキーやクエリコストが重要になる Database Engineering のワークフローで役立ちます。

Database Engineering
お気に入り 0GitHub 2.2k
C
clickhouse-best-practices

作成者 ClickHouse

clickhouse-best-practicesは、Database Engineering向けのClickHouseベストプラクティス skill です。スキーマ設計、クエリチューニング、insert戦略、エージェント接続を、ルールベースの推奨で整理して案内します。clickhouse-best-practices の使いどころを見極めやすく、レビューや引用にもつなげやすいので、ClickHouse のワークフローで活用しやすいのが特長です。

Database Engineering
お気に入り 0GitHub 412
T
tinybird

作成者 tinybirdco

Tinybirdのプロジェクトファイル、SQLルール、最適化パターン、ファイルベースのワークフローに関するベストプラクティスをまとめた skill です。datasource、pipe、endpoint、materialized view、そしてリポジトリのルールに基づいたデプロイ安全な指針が必要な Backend Development で、この tinybird skill を活用してください。

Backend Development
お気に入り 0GitHub 16
K
pymatgen

作成者 K-Dense-AI

pymatgen は、結晶構造、相図、電子構造、ファイル変換を扱う Python の材料科学向けツールキットです。この pymatgen スキルは、CIF、POSCAR、VASP、Materials Project のデータを使う科学ワークフローを支援します。

Scientific
お気に入り 0GitHub 0
K
exploratory-data-analysis

作成者 K-Dense-AI

exploratory-data-analysis スキルは、科学系ファイルを形式に応じた EDA レポートへ変換します。ファイル形式を判別し、構造と品質を要約し、主要メタデータを抽出して、次の分析候補まで提案します。化学、生物情報学、顕微鏡画像、分光、プロテオミクス、メタボロミクスなど、さまざまな科学ファイル形式に対する exploratory-data-analysis を使ったデータ分析に適しています。

Data Analysis
お気に入り 0GitHub 0
K
astropy

作成者 K-Dense-AI

astropy は、天文学・天体物理学のワークフロー向け Python ツールキットです。この astropy スキルでは、天球座標、単位、FITS ファイル、時間スケール、テーブル、WCS、宇宙論、そしてデータ分析のための astropy を扱えます。座標変換、単位変換、データ処理など、実務的な天文学タスクに役立ちます。

Data Analysis
お気に入り 0GitHub 0
K
aeon

作成者 K-Dense-AI

aeonは、scikit-learn互換のPythonスキルで、時系列機械学習に使えます。分類、回帰、クラスタリング、予測、異常検知、セグメンテーション、類似検索など、時間情報を含むデータのワークフローに対応します。汎用的な表形式MLでは足りず、単変量・多変量の時系列分析で専門的な手法が必要な場合に適しています。

Data Analysis
お気に入り 0GitHub 0
S
postgres

作成者 sanjay3290

postgresスキルを使うと、読み取り専用SQLでライブのPostgreSQLデータベースを確認できます。スキーマの把握、テーブルの確認、複数接続をまたぐSELECTベースの分析に使えます。説明文ベースの自動選択にも対応しており、Database Engineering向けのワークフローに適した設計です。安全性のため、INSERT、UPDATE、DELETE、DROPなどの書き込み操作はブロックされます。

Database Engineering
お気に入り 0GitHub 0
Data Processing