rag-implementation

por wshobson

rag-implementation es una skill práctica para planificar sistemas RAG con bases de datos vectoriales, embeddings, patrones de recuperación y flujos de respuestas fundamentadas. Úsala para comparar opciones del stack, orientar decisiones de arquitectura y guiar la instalación y el uso en Q&A sobre documentos, asistentes de conocimiento y búsqueda semántica.

Estrellas32.6k

Favoritos0

Comentarios0

Agregado30 mar 2026

CategoríaRAG Workflows

Comando de instalación

npx skills add wshobson/agents --skill rag-implementation

Puntuación editorial

Esta skill obtiene una puntuación de 68/100, lo que significa que es aceptable incluirla en el directorio, pero conviene tratarla como una guía de conceptos y patrones más que como una ayuda de implementación lista para usar. El repositorio ofrece un activador claro y una cobertura temática amplia para trabajo con RAG, por lo que un agente probablemente pueda invocarla en las situaciones adecuadas, pero los usuarios deben contar con aportar por su cuenta los detalles de ejecución, ya que la skill carece de archivos de apoyo, pasos de instalación concretos y restricciones operativas más sólidas.

68/100

Puntos fuertes

Alta capacidad de activación: la descripción y la sección 'When to Use This Skill' se alinean claramente con tareas habituales de RAG como Q&A sobre documentos, búsqueda semántica y chatbots con respuestas fundamentadas.
Buena profundidad de contenido: el extenso SKILL.md cubre componentes centrales de RAG como bases de datos vectoriales, embeddings y consideraciones de implementación, lo que resulta más útil que una plantilla mínima de prompt.
Señal útil para decidir la instalación: menciona varias opciones tecnológicas concretas como Pinecone, Weaviate, Chroma, Qdrant, pgvector y modelos de embeddings, lo que ayuda a evaluar el encaje dentro del ecosistema.

Puntos a tener en cuenta

La claridad operativa es limitada por la falta de recursos de apoyo: no hay scripts, referencias, recursos, reglas ni archivos de metadatos que reduzcan la incertidumbre de implementación.
La adopción es menos directa de lo que el tema sugiere: SKILL.md no incluye ningún comando de instalación, referencias a repositorios o archivos, y ofrece pocas señales estructurales sobre restricciones y orientación práctica para la ejecución.

RAG Llm Ai Semantic Search Embedding Vector Databases Workflow

Resumen

Visión general de la skill rag-implementation

Para qué te ayuda la skill rag-implementation

La skill rag-implementation es una guía práctica para diseñar sistemas de Retrieval-Augmented Generation: aplicaciones que recuperan conocimiento externo relevante antes de pedirle a un LLM que responda. Encaja especialmente bien para equipos que están creando soluciones de preguntas y respuestas sobre documentos, asistentes de conocimiento interno, bots de soporte, herramientas de investigación o cualquier flujo donde las respuestas fundamentadas importan más que una respuesta puramente generativa.

Quién debería instalar rag-implementation

Esta skill rag-implementation está pensada para desarrolladores, ingenieros de IA y builders de producto técnico que ya tienen claro el problema que quieren resolver, pero necesitan una ruta de implementación más precisa. Resulta especialmente útil si estás decidiendo entre bases de datos vectoriales, modelos de embeddings, enfoques de chunking y patrones de retrieval para flujos RAG reales.

El trabajo real que resuelve

La mayoría de los usuarios no necesitan una definición de RAG; necesitan ayuda para tomar decisiones de arquitectura que afectan la calidad de las respuestas, la latencia, el coste y la mantenibilidad. La skill rag-implementation aporta valor cuando quieres pasar de “deberíamos usar RAG” a “qué stack, qué configuración de retrieval y qué estrategia de indexación deberíamos implementar para estos datos y este perfil de tráfico”.

Qué hace distinta a esta skill frente a un prompt genérico de RAG

Un prompt genérico puede darte un checklist de alto nivel sobre RAG. La skill rag-implementation funciona mejor como apoyo a la toma de decisiones en las piezas clave: vector stores, embeddings, chunking, retrieval, reranking, patrones de citación y aspectos de evaluación. Su valor práctico está en ayudar a un agente a razonar sobre tradeoffs de implementación, en lugar de devolver un diagrama de arquitectura vago.

Casos donde mejor encaja y casos donde no

Usa rag-implementation for RAG Workflows cuando:

necesitas respuestas fundamentadas sobre documentos o bases de conocimiento
tu LLM debe citar o reflejar contenido propietario y actualizado
la búsqueda por palabras clave por sí sola no es suficiente
reducir alucinaciones es importante

No empieces por aquí si:

tu problema es sobre todo uso de herramientas u orquestación transaccional de APIs
todavía no tienes un corpus recuperable
una búsqueda simple o consultas directas a base de datos ya resuelven la tarea

Cómo usar la skill rag-implementation

Cómo instalar rag-implementation

Instala la skill desde el repositorio con:

npx skills add https://github.com/wshobson/agents --skill rag-implementation

Como este repo expone la skill principalmente a través de SKILL.md, la instalación es directa. No hay scripts de soporte adicionales ni archivos de referencia complementarios que debas aprender primero.

Qué leer primero después de instalarla

Para esta guía rag-implementation, empieza por:

SKILL.md

Ese archivo reúne la guía de implementación, incluido cuándo usar RAG, cuáles son sus componentes principales y qué opciones tecnológicas evaluar. Como la skill no incluye resources/, rules/ ni scripts auxiliares, leer el documento principal es la vía más rápida para entender su alcance.

Qué información necesita de ti la skill

La calidad de uso de rag-implementation depende mucho del contexto que le des. Antes de invocarla, reúne esta información:

tipo de corpus: PDFs, documentación, tickets, código, páginas wiki, contenido mixto
escala: número de documentos, número de chunks, crecimiento esperado
necesidades de frescura: estático, actualizaciones diarias, casi en tiempo real
patrón de tráfico: herramienta interna, chatbot en producción, búsquedas con picos, flujos batch
restricciones de infraestructura: SaaS gestionado, self-hosted, preferencias de cloud
requisitos de respuesta: citas, filtros, control de acceso, soporte multilingüe
objetivos de latencia y presupuesto

Sin estos datos, la skill puede seguir proponiendo opciones, pero el resultado será amplio en vez de tener nivel de implementación.

Cómo convertir un objetivo difuso en un buen prompt para rag-implementation

Prompt débil:

Help me build RAG for our docs.

Mejor prompt:

Use the rag-implementation skill to propose a RAG architecture for 80k internal support articles and product manuals. We need cited answers in a web chat app, under 3 seconds median latency, with daily reindexing, metadata filters by product line and region, and preference for managed infrastructure. Compare Pinecone, Weaviate, Qdrant, and pgvector, then recommend chunking, embedding model class, retrieval strategy, and evaluation metrics.

Por qué funciona:

indica el tamaño y el tipo de corpus
añade restricciones operativas
obliga a comparar antes de recomendar
pide decisiones de implementación, no teoría

Patrón de prompt para obtener mejores resultados con rag-implementation

Una solicitud sólida de uso de rag-implementation suele incluir cuatro bloques:

Caso de uso
¿Qué tarea de usuario final estás intentando resolver?
Forma de los datos
¿Qué documentos existen, qué tan limpios están y con qué frecuencia cambian?
Restricciones operativas
Coste, hosting, latencia, privacidad, compliance y nivel técnico del equipo.
Formato de salida
Pide un plan concreto: recomendación de stack, flujo de ingesta, diseño de retrieval, checklist de evaluación y primeros hitos de implementación.

Ejemplo:

Use the rag-implementation skill. I need a first-pass design for a legal research assistant over 500k documents with strong metadata filtering and source traceability. Recommend vector store options, embedding strategy, chunking rules, retrieval pipeline, reranking need, and a staged rollout plan.

Flujo de trabajo recomendado para usar bien rag-implementation

Un flujo práctico sería:

Define el problema de retrieval, no solo la interfaz de chatbot.
Pide a la skill que compare opciones de stack frente a tus restricciones.
Reduce el espacio a una sola arquitectura.
Pide decisiones sobre ingesta e indexación.
Pide decisiones sobre retrieval y composición de respuesta.
Pide criterios de evaluación antes de implementar.
Usa el resultado para crear tickets o un plan de prototipo.

Este flujo mantiene la skill rag-implementation centrada en decisiones que de verdad cambian la calidad de lo que construyes, en vez de derivar hacia explicaciones genéricas sobre RAG.

Qué cubre especialmente bien esta skill

El material fuente es más sólido cuando necesitas orientarte sobre los bloques esenciales de un sistema RAG:

elección de base de datos vectorial
selección del modelo de embeddings
fundamentos del retrieval semántico
casos de uso de respuestas fundamentadas

Eso la hace especialmente útil en fases tempranas de planificación de arquitectura, sobre todo si tu equipo está comparando enfoques gestionados y self-hosted.

Qué no parece aportar esta skill

Esta skill es más ligera en activos de ejecución específicos del repositorio. No parece incluir:

scripts listos para indexación
harnesses de benchmark
árboles de decisión o archivos de reglas
starter code específico de frameworks

Eso significa que rag-implementation install es sencillo, pero adoptarla igualmente exige traducir sus recomendaciones a tu propio stack y a tu base de código.

Consejos prácticos que mejoran de forma real la calidad del resultado

Cuando invoques rag-implementation, especifica estos detalles si son relevantes:

Variación en la longitud de los documentos: afecta la estrategia de chunking
Metadatos estructurados: afecta el diseño de filtros
Necesidad de fragmentos exactos: afecta la profundidad de retrieval y el reranking
Control de acceso por usuario o equipo: afecta la partición del índice
Contenido de código vs. prosa: afecta la elección del modelo de embeddings
Frecuencia esperada de actualización: afecta el diseño de la ingesta

Estos son los detalles que suelen marcar la diferencia entre una buena respuesta RAG y otra cara pero poco fiable.

Ruta de lectura del repositorio para tomar decisiones de implementación

Si quieres extraer el máximo valor del archivo de la skill, léelo en este orden:

When to Use This Skill
Core Components
opciones de bases de datos vectoriales
sección de embeddings
cualquier sección sobre patrones de retrieval más avanzada dentro de SKILL.md

Esta ruta te ayuda a decidir primero si encaja, luego qué stack elegir y después cómo implementar. Es un mejor orden de lectura que recorrerlo de arriba abajo sin una pregunta de decisión clara en mente.

Preguntas frecuentes sobre la skill rag-implementation

¿rag-implementation es buena para principiantes?

Sí, siempre que ya entiendas los conceptos básicos de las apps con LLM y quieras una forma estructurada de pensar los componentes de RAG. Es menos ideal para alguien que necesita un tutorial completo con código desde cero, porque por lo que muestra el repositorio parece orientada a guía y criterio, no a assets de implementación listos para usar.

¿Cuándo debería usar rag-implementation en lugar de un prompt normal de arquitectura?

Usa rag-implementation cuando la pregunta trate específicamente del diseño de un sistema RAG: vector stores, embeddings, estrategia de retrieval y flujos de respuesta fundamentada. Un prompt normal puede explicar qué es RAG, pero esta skill está más enfocada a decisiones de implementación dentro de proyectos RAG.

¿rag-implementation sirve solo para chatbots sobre documentos?

No. La skill rag-implementation también encaja para búsqueda semántica, asistentes de investigación, herramientas de conocimiento interno, asistentes de documentación y otras aplicaciones donde el retrieval va primero. El hilo conductor es recuperar conocimiento externo antes de generar la respuesta.

¿rag-implementation me ayuda a elegir una base de datos vectorial?

Sí. Según el material fuente, la comparación de bases de datos vectoriales es una de las fortalezas más claras de la skill. Resulta útil cuando necesitas razonar sobre opciones como Pinecone, Weaviate, Milvus, Chroma, Qdrant o pgvector en función de tus restricciones.

¿Puedo usar rag-implementation para planificar producción?

Sí, pero con un matiz. Puede ayudarte en la planificación de producción al orientar la elección de patrones de arquitectura y tradeoffs. Aun así, seguirás necesitando tu propio trabajo operativo para pipelines de ingesta, monitorización, evaluación, seguridad y despliegue.

¿Cuándo no es adecuada rag-implementation?

Sáltatela si tu necesidad principal es:

tool calling de agentes en lugar de retrieval
consultas exactas a base de datos en lugar de búsqueda semántica
un proyecto starter para copiar y pegar
una implementación específica de framework con código listo

En esos casos, encajará mejor una skill más opinionada o más centrada en código.

Cómo mejorar la skill rag-implementation

Dale restricciones a la skill, no solo objetivos

La forma más rápida de mejorar la salida de rag-implementation es proporcionar restricciones duras. “Build a RAG app” es demasiado abierto. “Build a RAG app over 2 million product docs with private deployment and metadata filtering under 2-second p95 latency” le da a la skill algo concreto contra lo que optimizar.

Pide tablas explícitas de tradeoffs

Si la primera respuesta sale demasiado amplia, pídele a la skill rag-implementation una tabla comparativa con:

opción
fortalezas
debilidades
escenario donde mejor encaja
coste operativo
por qué encaja en tu caso

Esto empuja la respuesta desde lo descriptivo hacia algo listo para decidir.

Comparte documentos de ejemplo y la forma de los metadatos

Un fallo habitual es recibir recomendaciones que ignoran tu contenido real. Para mejorar resultados, comparte:

un documento corto de muestra
un documento largo de muestra
campos de metadatos habituales
consultas típicas de usuario

Esto ayuda a que la skill sugiera patrones de chunking, filtrado y retrieval mucho más realistas.

Separa las preguntas de ingesta de las preguntas de retrieval

No preguntes todo de una sola vez si la calidad importa. Divide el trabajo así:

elección de arquitectura y almacenamiento
diseño de ingesta y chunking
diseño de retrieval y ranking
síntesis de respuesta y formato de citación
plan de evaluación

Esto hace que rag-implementation for RAG Workflows sea más útil, porque cada iteración puede profundizar en una superficie de fallo concreta.

Pide a la skill que optimice para tu principal riesgo

Los sistemas RAG fallan de maneras distintas. Indica a la skill cuál es tu mayor riesgo:

alucinaciones
contenido desactualizado
mal recall en retrieval
alta latencia
coste
complejidad operativa

El plan resultante será sustancialmente mejor que una respuesta genérica de “best practices”.

Fallos comunes que conviene vigilar

Cuando uses rag-implementation, presta atención a respuestas que:

recomiendan una base de datos vectorial sin considerar restricciones de hosting
sugieren chunking sin referirse a la estructura de los documentos
ignoran la necesidad de filtrado por metadatos
asumen que la búsqueda semántica por sí sola basta
omiten evaluación y requisitos de citación

Estas son razones habituales por las que los primeros prototipos RAG se ven bien en demos pero fallan en producción.

Cómo iterar después de la primera respuesta

Después de la primera respuesta, haz preguntas de seguimiento como:

Revise this design for stricter access control.
Now optimize the same plan for lower cost.
Replace managed services with self-hosted options.
Adapt the retrieval approach for code and API docs.
Add an evaluation plan with failure cases and acceptance thresholds.

Estas iteraciones dirigidas mejoran mucho más la salida de la guía rag-implementation que simplemente pedir “más detalle”.

Pide un plan de despliegue por fases

Una de las mejores formas de mejorar la calidad de las decisiones es pedir a la skill que proponga fases:

prototipo
piloto
endurecimiento para producción

Esto obliga a recomendaciones más claras sobre qué construir ahora y qué dejar para después, y reduce el sobre-diseño en las primeras etapas de adopción de RAG.

Usa la skill para descartar opciones

Un uso especialmente potente de rag-implementation no es solo seleccionar herramientas, sino eliminar las que no encajan. Pregunta:

Which parts of this stack are overkill for my workload, and what simpler option would you choose first?

Esa pregunta suele sacar más valor que pedir “la mejor” arquitectura de forma abstracta.

Calificaciones y reseñas

Aún no hay calificaciones

Comparte tu reseña

Inicia sesión para dejar una calificación y un comentario sobre esta skill.

0/10000

Reseñas más recientes

Guardando...

Más skills de esta categoría

iterative-retrieval

por affaan-m

iterative-retrieval es un patrón de trabajo para refinar progresivamente la recuperación de contexto en tareas agentivas. Ayuda a los subagentes a no quedarse ni con demasiado contexto ni con muy poco, por lo que resulta útil para el uso de iterative-retrieval, las decisiones de instalación y iterative-retrieval para la automatización de flujos de trabajo.

Workflow Automation

Favoritos 0GitHub 156.2k

azure-ai-contentunderstanding-py

por microsoft

azure-ai-contentunderstanding-py es la skill de Python para Azure AI Content Understanding. Extrae contenido estructurado de documentos, imágenes, audio y video para flujos de trabajo RAG y automatización. Úsala cuando necesites extracción multimodal fiable, autenticación con Azure y resultados repetibles, listos para integrar en pipelines.

RAG Workflows

Favoritos 0GitHub 2.2k

azure-search-documents-ts

por microsoft

azure-search-documents-ts ayuda a los desarrolladores backend a crear soluciones de Azure AI Search con el SDK @azure/search-documents. Úsalo para crear índices, cargar documentos y ejecutar búsqueda por palabras clave, vectorial, híbrida y semántica, además de configurar credenciales y el entorno. Es una guía práctica de azure-search-documents-ts para desarrollo backend.

Backend Development

Favoritos 0GitHub 2.3k

vector-index-tuning

por wshobson

vector-index-tuning ayuda a ajustar índices de búsqueda vectorial para optimizar latencia, recall y uso de memoria. Úsala para elegir tipos de índice, ajustar la configuración de HNSW y comparar opciones de cuantización en flujos de trabajo RAG.

RAG Workflows

Favoritos 0GitHub 32.6k

hybrid-search-implementation

por wshobson

La skill hybrid-search-implementation muestra cómo combinar recuperación vectorial y por palabras clave con RRF, fusión lineal, reranking y patrones en cascada para sistemas de búsqueda y RAG.

RAG Workflows

Favoritos 0GitHub 32.6k

embedding-strategies

por wshobson

embedding-strategies te ayuda a elegir y optimizar modelos de embeddings para búsqueda semántica y flujos de trabajo RAG, con orientación práctica sobre chunking, compromisos entre modelos, contenido multilingüe y evaluación de recuperación.

RAG Workflows

Favoritos 0GitHub 32.6k

langchain-architecture

por wshobson

langchain-architecture es una guía de diseño para crear aplicaciones con LangChain 1.x y LangGraph. Úsala para decidir entre cadenas, agentes, retrieval, memoria y patrones de orquestación con estado antes de implementar.

Agent Orchestration

Favoritos 0GitHub 32.6k

similarity-search-patterns

por wshobson

similarity-search-patterns te ayuda a elegir métricas de distancia, tipos de índice y patrones de recuperación híbrida para búsqueda semántica y flujos de trabajo de RAG. Úsalo para planificar en producción los compromisos de la búsqueda vectorial entre recall, latencia y escalabilidad.

RAG Workflows

Favoritos 0GitHub 32.6k

frontend-design

por anthropics

frontend-design convierte ideas vagas de UI en interfaces distintivas y listas para producción, con código frontend real, una dirección estética clara y menos estilo genérico de IA.

UI Design

Favoritos 1GitHub 105.2k

create-colleague

por titanwings

create-colleague convierte documentos de compañeros, chats, correos, capturas de pantalla, datos de Feishu y DingTalk en una habilidad de IA editable, con salidas separadas de trabajo y persona, además de flujos de actualización para seguir refinándola.

Skill Authoring

Favoritos 1GitHub 747

hyperframes

por heygen-com

hyperframes es una skill de flujo de trabajo para crear composiciones de video basadas en HTML en HyperFrames. Úsala para tarjetas de título, superposiciones, subtítulos, locuciones, movimiento reactivo al audio y transiciones de escena cuando necesites hyperframes estructurados y orientados al código para edición de video. Prioriza decisiones de diseño, tiempo y animación por encima de solicitudes genéricas de video basadas solo en prompts.

Video Editing

Favoritos 0GitHub 2.7k

kreuzberg

por kreuzberg-dev

La skill de kreuzberg te ayuda a instalar y usar Kreuzberg para la extracción de documentos en más de 91 formatos, incluidos PDF, archivos de Office, imágenes, HTML, correo electrónico y archivos comprimidos. Cubre flujos de trabajo en Python, Node.js/TypeScript, Rust y CLI para OCR, tablas, metadatos, procesamiento por lotes y guía práctica de análisis y extracción.

PDF Processing

Favoritos 0GitHub 0

skill-creator

por anthropics

skill-creator es una metahabilidad de creación de Skills para redactar nuevas skills, revisar archivos SKILL.md, ejecutar evaluaciones, comparar variantes y mejorar descripciones de activación con scripts del repositorio y herramientas de revisión.

Skill Authoring

Favoritos 2GitHub 105.1k

azure-identity-py

por microsoft

azure-identity-py ayuda a configurar la autenticación en Azure con Python y Microsoft Entra ID. Úsalo para elegir entre `DefaultAzureCredential`, identidad administrada o autenticación con service principal, configurar variables de entorno y resolver problemas de control de acceso y de la cadena de credenciales. Las indicaciones de instalación, los patrones de uso y las notas prácticas de configuración se basan en el archivo de skill del repositorio.

Access Control

Favoritos 0GitHub 2.2k

claude-api

por anthropics

claude-api es una skill práctica para instalar y usar la Claude API y los SDKs de Anthropic. Ayuda a elegir entre el SDK adecuado o HTTP directo, localizar la documentación por lenguaje e implementar streaming, uso de herramientas, archivos, lotes y manejo de errores con menos prueba y error.

API Development

Favoritos 0GitHub 105k

wrangler

por cloudflare

La skill wrangler te ayuda a encontrar los comandos de CLI correctos, las estructuras de configuración y los pasos de despliegue para Cloudflare Workers. Úsala para el uso de wrangler, para comprobar la instalación de wrangler y como una guía práctica de wrangler al crear o publicar Workers para Backend Development.

Backend Development

Favoritos 0GitHub 1.3k