rag-implementation

por wshobson

rag-implementation é uma skill prática para planejar sistemas de RAG com bancos de dados vetoriais, embeddings, padrões de recuperação e fluxos de resposta ancorada em fontes. Use para comparar opções de stack, orientar decisões de arquitetura e guiar instalação e uso em Q&A sobre documentos, assistentes de conhecimento e busca semântica.

Estrelas32.6k

Favoritos0

Comentários0

Adicionado30 de mar. de 2026

CategoriaRAG Workflows

Comando de instalação

npx skills add wshobson/agents --skill rag-implementation

Pontuação editorial

Esta skill recebeu 68/100, o que indica que pode ser listada para usuários do diretório, mas deve ser tratada mais como um guia de conceitos e padrões do que como um recurso pronto para implementação. O repositório traz um gatilho de uso claro e uma cobertura temática relevante para trabalhos com RAG, então um agente provavelmente conseguirá acioná-la nas situações certas. Ainda assim, os usuários devem contar com a necessidade de definir os detalhes de execução por conta própria, já que a skill não inclui arquivos de apoio, passos concretos de instalação nem restrições operacionais mais robustas.

68/100

Pontos fortes

Alta acionabilidade: a descrição e a seção 'When to Use This Skill' se alinham com tarefas comuns de RAG, como Q&A sobre documentos, busca semântica e chatbots com respostas ancoradas em fontes.
Boa profundidade de conteúdo: o SKILL.md extenso aborda componentes centrais de RAG, como bancos de dados vetoriais, embeddings e considerações de implementação, sendo mais útil do que um template mínimo de prompt.
Sinal útil para decisão de instalação: cita várias opções concretas de tecnologia, como Pinecone, Weaviate, Chroma, Qdrant, pgvector e modelos de embedding, ajudando o usuário a avaliar a aderência ao ecossistema.

Pontos de atenção

A clareza operacional é limitada pela falta de recursos de apoio: não há scripts, referências, resources, rules nem arquivos de metadados que reduzam as lacunas na implementação.
A adoção é menos pronta para uso do que o tema sugere: o SKILL.md não traz comando de instalação, nem referências a repo/arquivos, e oferece poucos sinais estruturais sobre restrições e orientação prática de execução.

RAG Llm Ai Semantic Search Embedding Vector Databases Workflow

Visão geral

Visão geral da skill rag-implementation

O que a skill rag-implementation ajuda você a fazer

A skill rag-implementation é um guia prático para projetar sistemas de Retrieval-Augmented Generation: aplicações que recuperam conhecimento externo relevante antes de pedir que um LLM responda. Ela é mais indicada para equipes que estão criando Q&A sobre documentos, assistentes de conhecimento interno, bots de suporte, ferramentas de pesquisa ou qualquer fluxo em que respostas fundamentadas importem mais do que respostas puramente generativas.

Quem deve instalar a skill rag-implementation

A skill rag-implementation é ideal para desenvolvedores, engenheiros de IA e builders de produto com perfil técnico que já sabem qual problema querem resolver, mas precisam de um caminho de implementação mais claro. Ela é especialmente útil se você está decidindo entre bancos vetoriais, modelos de embedding, abordagens de chunking e padrões de retrieval para fluxos reais de RAG.

O trabalho real que precisa ser resolvido

A maioria dos usuários não precisa de uma definição de RAG; precisa de ajuda para tomar decisões de arquitetura que afetam a qualidade das respostas, a latência, o custo e a manutenção. A skill rag-implementation ganha valor quando você quer sair do “devemos usar RAG” para “qual stack, configuração de retrieval e estratégia de indexação devemos implementar para este perfil de dados e tráfego?”

O que diferencia esta skill de um prompt genérico sobre RAG

Um prompt genérico pode até entregar um checklist de alto nível sobre RAG. A rag-implementation skill é melhor como apoio à decisão nas principais partes móveis do sistema: vector stores, embeddings, chunking, retrieval, reranking, padrões de citação e avaliação. O valor prático está em ajudar um agente a raciocinar sobre tradeoffs de implementação, em vez de gerar um diagrama de arquitetura vago.

Casos em que ela encaixa bem — e em que não encaixa

Use rag-implementation for RAG Workflows quando:

você precisa de respostas fundamentadas sobre documentos ou bases de conhecimento
seu LLM precisa citar ou refletir conteúdo proprietário e atual
busca por palavras-chave, sozinha, não basta
reduzir hallucinations é importante

Não comece por aqui se:

seu problema é principalmente uso de ferramentas ou orquestração transacional de APIs
você ainda não tem um corpus recuperável
busca simples ou consultas diretas ao banco já resolvem a tarefa

Como usar a skill rag-implementation

Como instalar a skill rag-implementation

Instale a skill a partir do repositório com:

npx skills add https://github.com/wshobson/agents --skill rag-implementation

Como este repositório expõe a skill principalmente por meio de SKILL.md, a instalação é simples. Não há scripts auxiliares extras nem arquivos de referência complementares que você precise aprender antes.

O que ler primeiro após instalar

Para este rag-implementation guide, comece por:

SKILL.md

Esse arquivo concentra as orientações de implementação, incluindo quando usar RAG, os componentes centrais e as opções de tecnologia. Como a skill não traz resources/, rules/ nem scripts auxiliares, ler o documento principal é o caminho mais rápido para entender o escopo dela.

Quais informações a skill precisa de você

A qualidade de uso de rag-implementation depende muito do contexto que você fornece. Antes de acioná-la, reúna:

o tipo de corpus: PDFs, docs, tickets, código, páginas de wiki, conteúdo misto
a escala: quantidade de documentos, quantidade de chunks, crescimento esperado
a necessidade de atualização: estático, atualizações diárias, quase em tempo real
o padrão de tráfego: ferramenta interna, chatbot em produção, busca com picos, fluxos em batch
restrições de infraestrutura: SaaS gerenciado, self-hosted, preferências de cloud
requisitos da resposta: citações, filtros, controle de acesso, suporte multilíngue
metas de latência e orçamento

Sem essas informações, a skill ainda consegue sugerir opções, mas a saída tende a ficar ampla demais em vez de pronta para implementação.

Como transformar um objetivo vago em um bom prompt para rag-implementation

Prompt fraco:

Help me build RAG for our docs.

Prompt melhor:

Use the rag-implementation skill to propose a RAG architecture for 80k internal support articles and product manuals. We need cited answers in a web chat app, under 3 seconds median latency, with daily reindexing, metadata filters by product line and region, and preference for managed infrastructure. Compare Pinecone, Weaviate, Qdrant, and pgvector, then recommend chunking, embedding model class, retrieval strategy, and evaluation metrics.

Por que isso funciona:

informa tamanho e tipo do corpus
adiciona restrições operacionais
exige comparação antes da recomendação
pede decisões de implementação, não teoria

Um padrão de prompt que costuma gerar respostas melhores com rag-implementation

Uma boa solicitação de uso de rag-implementation normalmente inclui quatro blocos:

Caso de uso
Que tarefa do usuário final você está tentando atender?
Formato dos dados
Que documentos existem, quão limpos eles estão e com que frequência mudam?
Restrições operacionais
Custo, hospedagem, latência, privacidade, compliance e nível técnico da equipe.
Formato de saída
Peça um plano concreto: recomendação de stack, fluxo de ingestão, desenho de retrieval, checklist de avaliação e primeiros marcos de implementação.

Exemplo:

Use the rag-implementation skill. I need a first-pass design for a legal research assistant over 500k documents with strong metadata filtering and source traceability. Recommend vector store options, embedding strategy, chunking rules, retrieval pipeline, reranking need, and a staged rollout plan.

Fluxo de trabalho recomendado para usar bem a skill rag-implementation

Um fluxo prático:

Defina o problema de retrieval, e não apenas a interface de chatbot.
Peça à skill para comparar opções de stack com base nas suas restrições.
Reduza para uma arquitetura.
Peça decisões sobre ingestão e indexação.
Peça decisões sobre retrieval e composição da resposta.
Peça critérios de avaliação antes de implementar.
Use o resultado para criar tickets ou um plano de protótipo.

Esse fluxo mantém a rag-implementation skill focada nas decisões que realmente mudam a qualidade da construção, em vez de deixá-la derivar para explicações genéricas sobre RAG.

O que esta skill cobre especialmente bem

O material-fonte é mais forte quando você precisa se orientar sobre os blocos centrais de um sistema RAG:

escolhas de banco vetorial
seleção de modelo de embedding
fundamentos de retrieval semântico
casos de uso com respostas fundamentadas

Isso a torna útil no início do planejamento de arquitetura, especialmente se sua equipe estiver comparando abordagens gerenciadas e self-hosted.

O que a skill aparentemente não entrega

Esta skill é mais leve em ativos de execução específicos de repositório. Ela não parece incluir:

scripts prontos de indexação
harnesses de benchmark
árvores de decisão ou arquivos de regras
starter code específico de framework

Isso significa que a instalação de rag-implementation é fácil, mas a adoção ainda exige que você traduza as recomendações para a sua própria stack e base de código.

Dicas práticas que melhoram de forma real a qualidade da saída

Ao usar rag-implementation, especifique estes pontos se forem relevantes:

Variação no tamanho dos documentos: afeta a estratégia de chunking
Metadados estruturados: afetam o desenho dos filtros
Necessidade de trechos exatos: afeta profundidade de retrieval e reranking
Controle de acesso por usuário ou equipe: afeta o particionamento do índice
Conteúdo de código vs. prosa: afeta a escolha do modelo de embedding
Frequência esperada de atualização: afeta o desenho da ingestão

São esses detalhes que normalmente separam uma boa resposta de RAG de uma solução cara, mas pouco confiável.

Melhor caminho de leitura do repositório para tomar decisões de implementação

Se você quer extrair o máximo de informação do arquivo da skill, leia nesta ordem:

When to Use This Skill
Core Components
opções de banco vetorial
seção de embeddings
quaisquer seções sobre padrões de retrieval mais adiante em SKILL.md

Esse caminho ajuda você a decidir primeiro se a skill é adequada, depois as escolhas de stack e, por fim, os detalhes de implementação. É uma ordem de leitura melhor do que simplesmente percorrer tudo de cima a baixo sem uma pergunta de decisão em mente.

FAQ da skill rag-implementation

A skill rag-implementation é boa para iniciantes?

Sim, se você já entende os conceitos básicos de apps com LLM e quer uma forma estruturada de pensar os componentes de RAG. Ela é menos ideal para quem precisa de um tutorial completo com código, partindo do zero, porque os indícios do repositório apontam mais para orientação do que para ativos prontos de implementação.

Quando devo usar rag-implementation em vez de um prompt normal de arquitetura?

Use rag-implementation quando a pergunta for especificamente sobre design de sistemas RAG: vector stores, embeddings, estratégia de retrieval e fluxos de respostas fundamentadas. Um prompt comum pode explicar RAG, mas esta skill é mais direcionada para decisões de implementação dentro de projetos de RAG.

A rag-implementation serve só para chatbots sobre documentos?

Não. A rag-implementation skill também se encaixa em busca semântica, assistentes de pesquisa, ferramentas internas de conhecimento, ajudantes de documentação e outras aplicações em que retrieval vem antes da geração. O fio condutor é a recuperação de conhecimento externo antes da geração.

A rag-implementation ajuda a escolher um banco vetorial?

Sim. Pelo material de origem, comparação de bancos vetoriais é uma das forças mais claras da skill. Ela é útil quando você precisa raciocinar sobre opções como Pinecone, Weaviate, Milvus, Chroma, Qdrant ou pgvector dentro das suas restrições.

Posso usar rag-implementation para planejamento de produção?

Sim, com uma ressalva. Ela pode apoiar o planejamento de produção ao ajudar na escolha de padrões de arquitetura e tradeoffs. Ainda assim, você vai precisar do seu próprio trabalho operacional para ingestão, monitoramento, avaliação, segurança e deploy.

Quando rag-implementation é a escolha errada?

Ignore esta skill se sua principal necessidade for:

tool calling de agentes em vez de retrieval
consulta exata a banco de dados em vez de busca semântica
um projeto inicial de copiar e colar
uma implementação específica de framework com código pronto

Nesses casos, uma skill mais opinativa ou mais carregada de código tende a ser mais adequada.

Como melhorar a skill rag-implementation

Dê restrições à skill, não apenas objetivos

A forma mais rápida de melhorar a saída de rag-implementation é fornecer restrições concretas. “Build a RAG app” é aberto demais. “Build a RAG app over 2 million product docs with private deployment and metadata filtering under 2-second p95 latency” dá à skill algo real para otimizar.

Peça tabelas explícitas de tradeoffs

Se a primeira resposta vier ampla demais, peça à rag-implementation skill uma tabela comparativa com:

opção
pontos fortes
pontos fracos
cenário em que melhor se encaixa
custo operacional
por que faz sentido no seu caso

Isso empurra a resposta de algo descritivo para algo pronto para decisão.

Forneça documentos de exemplo e o formato dos metadados

Um modo comum de falha é receber recomendações que ignoram o seu conteúdo real. Para melhorar os resultados, compartilhe:

um documento curto de exemplo
um documento longo de exemplo
campos de metadados típicos
consultas esperadas dos usuários

Isso ajuda a skill a sugerir padrões mais realistas de chunking, filtragem e retrieval.

Separe perguntas de ingestão das perguntas de retrieval

Não pergunte tudo de uma vez se a qualidade importa. Divida o trabalho:

escolha de arquitetura e armazenamento
desenho de ingestão e chunking
desenho de retrieval e ranking
síntese da resposta e formato de citação
plano de avaliação

Isso torna rag-implementation for RAG Workflows mais útil, porque cada rodada pode aprofundar em uma superfície de falha específica.

Peça à skill para otimizar para o seu principal risco

Sistemas de RAG falham de maneiras diferentes. Diga à skill qual é o seu maior risco:

hallucinations
conteúdo desatualizado
baixa recall no retrieval
alta latência
custo
complexidade operacional

O plano resultante será materialmente melhor do que uma resposta genérica de “boas práticas”.

Modos de falha comuns para observar

Ao usar rag-implementation, fique atento a saídas que:

recomendam um banco vetorial sem considerar restrições de hospedagem
sugerem chunking sem referência à estrutura do documento
ignoram necessidades de filtragem por metadados
assumem que busca semântica sozinha é suficiente
pulam requisitos de avaliação e citação

Essas são razões comuns pelas quais protótipos iniciais de RAG parecem bons em demo, mas falham em produção.

Como iterar depois da primeira resposta

Depois da primeira resposta, faça perguntas de continuação como:

Revise this design for stricter access control.
Now optimize the same plan for lower cost.
Replace managed services with self-hosted options.
Adapt the retrieval approach for code and API docs.
Add an evaluation plan with failure cases and acceptance thresholds.

Essas iterações direcionadas melhoram a saída do rag-implementation guide muito mais do que simplesmente pedir “mais detalhes”.

Peça um plano de rollout em fases

Uma das melhores formas de melhorar a qualidade da decisão é pedir à skill um plano por fases:

protótipo
piloto
endurecimento para produção

Isso força recomendações mais claras sobre o que construir agora versus depois e reduz overengineering na adoção inicial de RAG.

Use a skill para eliminar opções, não só escolher

Um uso forte de rag-implementation não é apenas selecionar ferramentas, mas descartar as que não se encaixam. Pergunte:

Which parts of this stack are overkill for my workload, and what simpler option would you choose first?

Essa pergunta muitas vezes gera mais valor do que pedir, em abstrato, a “melhor” arquitetura.

Avaliações e comentários

Ainda não há avaliações

Compartilhe sua avaliação

Faça login para deixar uma nota e um comentário sobre esta skill.

0/10000

Avaliações mais recentes

Salvando...

Mais skills nesta categoria

iterative-retrieval

por affaan-m

iterative-retrieval é um padrão de trabalho para refinar progressivamente a recuperação de contexto em fluxos de trabalho agenticos. Ele ajuda subagentes a evitar contexto demais ou de menos, sendo útil para uso de iterative-retrieval, decisões de instalação e iterative-retrieval para Automação de Fluxos de Trabalho.

Workflow Automation

Favoritos 0GitHub 156.2k

azure-ai-contentunderstanding-py

por microsoft

azure-ai-contentunderstanding-py é a skill em Python para o Azure AI Content Understanding. Ela extrai conteúdo estruturado de documentos, imagens, áudio e vídeo para fluxos de trabalho de RAG e automação. Use-a quando precisar de extração multimodal confiável, autenticação com Azure e saídas repetíveis prontas para pipeline.

RAG Workflows

Favoritos 0GitHub 2.2k

azure-search-documents-ts

por microsoft

A azure-search-documents-ts ajuda desenvolvedores de backend a criar soluções com o Azure AI Search usando o SDK @azure/search-documents. Use-a para criação de índices, upload de documentos, buscas por palavra-chave, vetoriais, híbridas e semânticas, além de configuração de credenciais e ambiente. É um guia prático de azure-search-documents-ts para desenvolvimento backend.

Backend Development

Favoritos 0GitHub 2.3k

vector-index-tuning

por wshobson

vector-index-tuning ajuda a ajustar índices de busca vetorial para latência, recall e uso de memória. Use a skill para escolher tipos de índice, configurar parâmetros de HNSW e comparar opções de quantização em fluxos de RAG.

RAG Workflows

Favoritos 0GitHub 32.6k

hybrid-search-implementation

por wshobson

A skill hybrid-search-implementation mostra como combinar recuperação vetorial e por palavras-chave com RRF, fusão linear, reranking e padrões em cascata para sistemas de busca e RAG.

RAG Workflows

Favoritos 0GitHub 32.6k

embedding-strategies

por wshobson

embedding-strategies ajuda você a escolher e otimizar modelos de embedding para busca semântica e fluxos de RAG, com orientações práticas sobre chunking, trade-offs entre modelos, conteúdo multilíngue e avaliação de recuperação.

RAG Workflows

Favoritos 0GitHub 32.6k

langchain-architecture

por wshobson

langchain-architecture é um guia de arquitetura para criar aplicações com LangChain 1.x e LangGraph. Use para decidir entre chains, agents, retrieval, memory e padrões de orquestração com estado antes da implementação.

Agent Orchestration

Favoritos 0GitHub 32.6k

similarity-search-patterns

por wshobson

similarity-search-patterns ajuda você a escolher métricas de distância, tipos de índice e padrões de recuperação híbrida para busca semântica e fluxos de trabalho de RAG. Use a skill para planejar os trade-offs da busca vetorial em produção entre recall, latência e escala.

RAG Workflows

Favoritos 0GitHub 32.6k

frontend-design

por anthropics

frontend-design transforma ideias vagas de UI em interfaces marcantes e prontas para produção, com código frontend real, direção estética clara e menos visual genérico de IA.

UI Design

Favoritos 1GitHub 105.2k

create-colleague

por titanwings

create-colleague transforma documentos, chats, emails, capturas de tela, dados do Feishu e do DingTalk de colegas em uma skill de IA editável, com saídas separadas de trabalho e persona, além de fluxos de atualização para refinamento contínuo.

Skill Authoring

Favoritos 1GitHub 747

hyperframes

por heygen-com

hyperframes é uma skill de fluxo de trabalho para criar composições de vídeo baseadas em HTML no HyperFrames. Use-a para cards de título, sobreposições, legendas, narração, movimento reativo ao áudio e transições de cena quando precisar de hyperframes estruturados e orientados por código para Edição de Vídeo. Ela prioriza decisões de layout, tempo e animação em vez de pedidos genéricos de vídeo só com prompt.

Video Editing

Favoritos 0GitHub 2.7k

kreuzberg

por kreuzberg-dev

A skill kreuzberg ajuda você a instalar e usar o Kreuzberg para extração de documentos em mais de 91 formatos, incluindo PDFs, arquivos do Office, imagens, HTML, e-mail e arquivos compactados. Ela cobre fluxos de trabalho em Python, Node.js/TypeScript, Rust e CLI para OCR, tabelas, metadados, processamento em lote e orientações práticas de parsing.

PDF Processing

Favoritos 0GitHub 0

skill-creator

por anthropics

skill-creator é uma meta-skill de criação de Skills para rascunhar novas skills, revisar arquivos SKILL.md, rodar evals, comparar variantes e melhorar descrições de trigger com scripts e ferramentas de revisão do repositório.

Skill Authoring

Favoritos 2GitHub 105.1k

azure-identity-py

por microsoft

azure-identity-py ajuda a configurar autenticação Azure em Python com o Microsoft Entra ID. Use-o para escolher entre `DefaultAzureCredential`, managed identity ou autenticação por service principal, configurar variáveis de ambiente e resolver problemas de controle de acesso e da cadeia de credenciais. As orientações de instalação, os padrões de uso e as notas práticas de configuração são baseados no arquivo de skill do repositório.

Access Control

Favoritos 0GitHub 2.2k

claude-api

por anthropics

claude-api é uma skill prática para instalar e usar a Claude API e os SDKs da Anthropic. Ajuda desenvolvedores a escolher entre o SDK certo ou HTTP bruto, encontrar a documentação por linguagem e implementar streaming, tool use, arquivos, batches e tratamento de erros com menos tentativa e erro.

API Development

Favoritos 0GitHub 105k

wrangler

por cloudflare

A skill wrangler ajuda você a encontrar os comandos corretos de CLI, os formatos de configuração e as etapas de deploy para Cloudflare Workers. Use-a para uso do wrangler, checagens de instalação do wrangler e um guia prático de wrangler ao criar ou publicar Workers para Backend Development.

Backend Development

Favoritos 0GitHub 1.3k