scanpy

por K-Dense-AI

skill de scanpy para análise de dados de RNA-seq de célula única em Python. Use para QC, normalização, PCA, UMAP/t-SNE, clustering, descoberta de genes marcadores, análise de trajetória e gráficos com qualidade de publicação. É mais indicado para fluxos exploratórios de scRNA-seq centrados em AnnData, com orientações claras de uso e instalação do scanpy.

Estrelas0

Favoritos0

Comentários0

Adicionado14 de mai. de 2026

CategoriaData Analysis

Comando de instalação

npx skills add K-Dense-AI/claude-scientific-skills --skill scanpy

Pontuação editorial

Este skill tem nota 78/100, o que o torna um candidato sólido para usuários do diretório que querem um fluxo de trabalho pronto em Scanpy em vez de um prompt genérico. O repositório mostra um skill substancial, não genérico, para RNA-seq de célula única, com casos de uso claros, etapas concretas de workflow e estrutura suficiente para ajudar um agente a acionar e aplicar a solução com menos adivinhação.

78/100

Pontos fortes

Delimitado de forma explícita para tarefas padrão de scRNA-seq, como QC, normalização, PCA/UMAP/t-SNE, clustering, genes marcadores e análise de trajetória.
Conteúdo robusto em SKILL.md, com frontmatter válido, corpo longo, várias seções e exemplos de código que apoiam o uso operacional.
Inclui limites de uso e orientação sobre skills relacionados, ajudando agentes a escolher Scanpy para análise exploratória de célula única e encaminhar dúvidas mais profundas de deep learning ou específicas de AnnData para outros contextos.

Pontos de atenção

Não há comando de instalação, arquivos de suporte nem referências externas, então a adoção depende principalmente das instruções escritas no skill.
O repositório parece ser apenas documentação, portanto os usuários devem esperar orientação de workflow, e não automação empacotada ou scripts testados.

Scanpy Python Scientific Single Cell Bioinformatics Genomics Jupyter

Visão geral

Visão geral do skill scanpy

Para que serve o scanpy

O skill scanpy é voltado para análise de RNA-seq de célula única em Python: controle de ხარისხ, normalização, seleção de variáveis, PCA, UMAP/t-SNE, clusterização, descoberta de marcadores e análise exploratória no estilo de trajetórias. Ele funciona melhor quando você já tem, ou consegue criar, um objeto AnnData e quer um guia prático de scanpy para Data Analysis, não um fluxo de trabalho de modelo de deep learning.

Quem deve usar

Use o skill scanpy se você estiver trabalhando com dados de scRNA-seq, convertendo contagens brutas em um objeto pronto para análise ou preparando figuras e anotações de clusters para interpretação ou publicação. Ele é ideal para analistas que querem um pipeline exploratório padrão e já sabem que precisam de etapas de install e uso do scanpy, não de uma introdução geral à bioinformática.

O que o diferencia

Este repositório concentra o fluxo de trabalho mais comum do Scanpy em vez de uma visão ampla de teoria: carregamento de dados, pré-processamento, embeddings, clusterização e visualização. Ele também deixa os limites mais claros — se você precisa de modelos generativos profundos, procure scvi-tools; se o seu principal problema é a estrutura do AnnData ou formatos de arquivo, anndata é um ponto de partida melhor.

Como usar o skill scanpy

Instale e verifique o skill

Instale o skill scanpy no fluxo normal do diretório e, antes de fazer perguntas, abra o arquivo do skill:

npx skills add K-Dense-AI/claude-scientific-skills --skill scanpy

Depois da instalação, leia primeiro scientific-skills/scanpy/SKILL.md e só então siga as seções vinculadas dentro do arquivo. Não há scripts auxiliares nem pastas de referência extras aqui, então o próprio texto do skill é a principal fonte de verdade.

Forneça entradas prontas para análise

As melhores solicitações para uso do scanpy especificam formato, estrutura e objetivo dos dados. Inclua se a entrada é .h5ad, saída do 10X ou uma matriz de contagens; quantas amostras ou batches você tem; se precisa de thresholds de QC, integração, clusterização ou gráficos; e qual saída deseja. Um prompt fraco diz “analise meus dados de scRNA-seq”; um melhor diz “use scanpy para carregar dois datasets 10X, filtrar células de baixa qualidade, normalizar, calcular PCA/UMAP, clusterizar em múltiplas resoluções e identificar genes marcadores para cada cluster”.

Siga um fluxo de trabalho prático

Na maioria das tarefas, trabalhe nesta ordem: carregar os dados, inspecionar obs/var, filtrar células e genes de baixa qualidade, normalizar/aplicar log, selecionar genes altamente variáveis, escalar e executar PCA, construir vizinhos, calcular UMAP, clusterizar e então ranquear marcadores ou visualizar conjuntos de genes. Se você já tem um AnnData processado, diga isso; assim o skill não repete etapas de configuração e mantém a resposta focada nas decisões de análise que faltam.

Leia primeiro as partes certas

Comece pelo topo de SKILL.md e depois vá direto às seções de uso que cobrem configuração, carregamento, pré-processamento, plotagem e análise downstream. Se o repositório mencionar formatos de entrada ou convenções específicas, reproduza exatamente isso no seu prompt. O objetivo é reduzir a margem de adivinhação antes que o modelo escreva código ou etapas de análise.

FAQ do skill scanpy

O scanpy é só para scRNA-seq?

Sim, principalmente. O skill scanpy é centrado em fluxos de trabalho de transcriptômica de célula única, especialmente análise exploratória de matrizes de expressão gênica. Ele não é a melhor escolha para RNA-seq bulk nem para tarefas de modelagem que ficam melhor em ferramentas especializadas de deep learning para single-cell.

Preciso do skill se já sei fazer prompts para um modelo?

Se você já conhece o fluxo completo e os objetos exatos, um prompt simples pode bastar. O skill scanpy é mais útil quando você quer um caminho de análise consistente, menos etapas faltando e melhores padrões para QC, pré-processamento, clusterização e visualização.

Ele é amigável para iniciantes?

É amigável para iniciantes no sentido de que o pipeline é padrão e o skill foca no uso prático do scanpy. Ainda assim, ele pressupõe que você entenda Python básico, conceitos de single-cell e a diferença entre contagens brutas, dados normalizados e metadados anotados.

Quando eu não devo usá-lo?

Não use scanpy como skill principal se o seu problema for sobretudo conversão de arquivos, design do esquema de AnnData ou criação de modelos neurais para inferência de estado celular. Nesses casos, outra skill ou ferramenta tende a entregar resultados melhores do que tentar fazer o scanpy cobrir todas as partes do fluxo.

Como melhorar o skill scanpy

Forneça os inputs que mudam decisões

Os maiores ganhos de qualidade vêm de informar tamanho do dataset, organismo, plataforma, estrutura de batches e em que etapa da análise você já está. No uso de scanpy, inclua também se há preocupação com RNA ambiente, necessidade de filtragem de doublets ou um conjunto conhecido de genes marcadores, porque esses detalhes afetam QC e interpretação.

Peça entregáveis, não só etapas

Em vez de pedir “análise em scanpy”, peça algo concreto: um notebook de pré-processamento, um fluxo de clusterização, uma tabela de genes marcadores ou um bloco de plotagem com UMAP e violin plots. Objetivos de saída claros ajudam o modelo a escolher a estrutura certa do guia de scanpy e evitam explicações demais sobre o básico que você não precisa.

Fique atento aos erros mais comuns

Os erros mais frequentes são pular o contexto de QC, misturar camadas brutas e normalizadas, clusterizar antes de verificar vizinhos e escolhas de escala e pedir resultados sem definir a pergunta biológica. Se a primeira versão ficar genérica demais, revise com o objeto de entrada exato, os nomes das variáveis e a decisão que você quer que a análise apoie.

Itere adicionando uma restrição por vez

Depois do primeiro rascunho, melhore a saída do skill scanpy acrescentando uma restrição: “use apenas h5ad”, “evite integração”, “faça gráficos prontos para publicação” ou “preserve os rótulos de batch em obs”. Normalmente isso é melhor do que reescrever tudo de forma ampla, porque mantém o fluxo estável enquanto aperta os pontos que importam para sua tarefa de scanpy para Data Analysis.

Avaliações e comentários

Ainda não há avaliações

Compartilhe sua avaliação

Faça login para deixar uma nota e um comentário sobre esta skill.

0/10000

Avaliações mais recentes

Salvando...

Mais skills nesta categoria

clickhouse-best-practices

por ClickHouse

clickhouse-best-practices é uma skill de melhores práticas para ClickHouse voltada para Engenharia de Banco de Dados. Ela orienta o desenho de schema, a otimização de queries, a estratégia de inserts e a conectividade com agentes por meio de recomendações baseadas em regras, deixando o uso de clickhouse-best-practices mais fácil de acionar, revisar e citar em fluxos de trabalho do ClickHouse.

Database Engineering

Favoritos 0GitHub 412

chdb-datastore

por ClickHouse

O chdb-datastore é um skill compatível com pandas para análise de dados rápida, com uma API DataStore baseada em ClickHouse. Ele oferece suporte a conectores de arquivos, banco de dados e nuvem, joins entre fontes diferentes e mudanças mínimas de código em fluxos de trabalho no estilo pandas. Use este guia do chdb-datastore quando você quiser uma camada de análise plug-and-play para conjuntos de dados maiores.

Data Analysis

Favoritos 0GitHub 0

sympy

por K-Dense-AI

Use a skill do SymPy para matemática simbólica exata em Python, incluindo álgebra, cálculo, matrizes, fórmulas de física, teoria dos números, geometria e geração de código. Ela ajuda você a manter expressões exatas, escolher os módulos certos do SymPy e evitar erros comuns com floats. É ideal para quem quer um guia prático de SymPy para fluxos simbólicos e para usar SymPy em análise de dados.

Data Analysis

Favoritos 0GitHub 21.4k

interpreting-culture-index

por trailofbits

A skill interpreting-culture-index ajuda a interpretar pesquisas Culture Index, exportações de perfil e notas relacionadas de contratação ou coaching. Use esta skill interpreting-culture-index para avaliar aderência a funções, dinâmica de equipe, risco de burnout, debriefs de candidatos, planos de onboarding e mediação de conflitos. Ela enfatiza leitura relativa das setas, checagem de anti-patterns e entregas práticas para análise de dados e apoio à decisão.

Data Analysis

Favoritos 0GitHub 5k

azure-search-documents-py

por microsoft

azure-search-documents-py é a skill em Python para Azure AI Search voltada a desenvolvimento backend, cobrindo instalação, autenticação, design de índices, busca vetorial, busca híbrida, ranking semântico e recuperação agentic. Use a skill azure-search-documents-py quando precisar de orientação prática, da configuração aos padrões de consulta que realmente funcionam.

Backend Development

Favoritos 0GitHub 2.3k

gget

por K-Dense-AI

gget é uma skill de bioinformática para acesso rápido e unificado a mais de 20 bancos de dados genômicos e ferramentas de análise via CLI ou Python. Use para informações de genes, buscas relacionadas a BLAST, estruturas do AlphaFold, dados de expressão, associações com doenças e análises no estilo enrichment. É uma boa opção para exploração rápida e fluxos de trabalho de análise de dados com gget.

Data Analysis

Favoritos 0GitHub 0

channel-economics

por alirezarezvani

channel-economics ajuda líderes de RevOps e comerciais a comparar canais diretos, de parceiros, marketplace, revendedores ou OEM com cost-to-serve completo, lentes de ROI e recomendações de mix de canais sob restrições. Inclui scripts Python, templates de dados e orientações de uso para channel-economics.

Revenue Operations

Favoritos 0GitHub 22.1k

torch-geometric

por K-Dense-AI

Guia do skill torch-geometric para redes neurais gráficas com PyTorch Geometric. Use para ajuda na instalação do torch-geometric, uso do torch-geometric, classificação de grafos, classificação de nós, previsão de links, grafos heterogêneos, camadas customizadas de MessagePassing e escalabilidade de GNNs em fluxos de Machine Learning.

Machine Learning

Favoritos 0GitHub 21.4k

rdkit

por K-Dense-AI

O skill rdkit ajuda em fluxos de trabalho precisos de quimioinformática: análise de SMILES, SDF, MOL, PDB e InChI; cálculo de descritores; geração de fingerprints; busca por subestruturas; tratamento de reações; e criação de coordenadas 2D/3D. Use este guia do rdkit para controle avançado, sanitização personalizada e fluxos de trabalho de rdkit para análise de dados.

Data Analysis

Favoritos 0GitHub 21.4k

huggingface-vision-trainer

por huggingface

A skill huggingface-vision-trainer ajuda você a instalar e usar uma skill do Hugging Face para jobs de treinamento em visão: detecção de objetos, classificação de imagens e segmentação com SAM/SAM2. Cobre preparação de datasets, configuração de GPU na nuvem, avaliação, logging com Trackio e envio dos resultados para o Hub. É ideal para automação de backend e fluxos de treinamento repetíveis.

Backend Development

Favoritos 0GitHub 10.4k

seo-dataforseo

por AgriciDaniel

A skill seo-dataforseo conecta o Claude a dados de SEO em tempo real por meio do servidor MCP da DataForSEO para checagens de SERP, pesquisa de palavras-chave, backlinks, análise on-page, pesquisa de concorrentes, listagens de negócios e monitoramento de visibilidade em IA. É mais indicada para fluxos orientados por dados quando você precisa de evidências reais de busca, instruções claras de instalação e uso prático da seo-dataforseo.

Keyword Research

Favoritos 0GitHub 6.2k

pymc

por K-Dense-AI

PyMC é uma skill de modelagem bayesiana para construir, ajustar, verificar e comparar modelos probabilísticos em Python. Use pymc para regressão hierárquica, análise multivariada, séries temporais, dados ausentes, erro de medição e comparação de modelos com LOO ou WAIC.

Data Analysis

Favoritos 0GitHub 0

pymatgen

por K-Dense-AI

pymatgen é um toolkit em Python para ciência dos materiais, voltado a estruturas cristalinas, diagramas de fase, estrutura eletrônica e conversão de arquivos. Esta skill de pymatgen ajuda em fluxos de trabalho científicos com CIF, POSCAR, VASP e dados do Materials Project.

Scientific

Favoritos 0GitHub 0

geopandas

por K-Dense-AI

skill geopandas para análise de dados vetoriais geoespaciais em Python, incluindo arquivos shapefile, GeoJSON e GeoPackage. Use para ler, limpar, fazer joins, criar buffers, recortar, reprojetar e exportar dados espaciais com menos suposições.

Data Analysis

Favoritos 0GitHub 0

analyzing-threat-intelligence-feeds

por mukul975

O analyzing-threat-intelligence-feeds ajuda você a ingerir feeds de CTI, normalizar indicadores, avaliar a qualidade dos feeds e enriquecer IOCs para fluxos de trabalho com STIX 2.1. Este skill analyzing-threat-intelligence-feeds foi criado para operações de threat intel e análise de dados, com orientações práticas para TAXII, MISP e feeds comerciais.

Data Analysis

Favoritos 0GitHub 0

azure-ai-textanalytics-py

por microsoft

azure-ai-textanalytics-py é uma skill para Azure AI Text Analytics em Python. Ela ajuda com análise de sentimento, reconhecimento de entidades, extração de frases-chave, detecção de idioma, detecção de PII e NLP para saúde. Use-a quando precisar de um caminho rápido para configurar o cliente Azure, autenticação e uso prático de análise de texto em apps, notebooks ou fluxos de análise de dados.

Data Analysis

Favoritos 0GitHub 0