similarity-search-patterns

par wshobson

similarity-search-patterns vous aide à choisir les métriques de distance, les types d’index et les approches de récupération hybride pour la recherche sémantique et les workflows RAG. Utilisez-le pour arbitrer les compromis d’une recherche vectorielle en production entre rappel, latence et passage à l’échelle.

Étoiles32.6k

Favoris0

Commentaires0

Ajouté30 mars 2026

CatégorieRAG Workflows

Commande d’installation

npx skills add wshobson/agents --skill similarity-search-patterns

Score éditorial

Cette skill obtient un score de 67/100, ce qui signifie qu’elle peut être proposée dans l’annuaire comme ressource utile à visée de référence, mais pas comme skill fortement opérationnelle. Les éléments observés dans le dépôt montrent une bonne couverture conceptuelle des cas d’usage de la recherche de similarité et des déclencheurs d’usage clairs, mais peu de guidage pas à pas ou d’artefacts exécutables ; les agents devront donc encore déduire certains détails d’implémentation.

67/100

Points forts

Bonne capacité de déclenchement : la description et la section 'When to Use' renvoient clairement à la recherche sémantique, à la récupération pour le RAG, à la recommandation, à l’optimisation de la latence et à la recherche vectorielle à grande échelle.
Contenu rédactionnel conséquent : un long fichier `SKILL.md` avec plusieurs sections, tableaux et blocs de code fournit aux agents des schémas réutilisables au-delà d’un simple prompt générique d’un paragraphe.
Couvre les principales décisions de conception, comme les métriques de distance et les types d’index, ce qui aide les agents à raisonner sur les compromis courants de la recherche de similarité dans des systèmes en production.

Points de vigilance

La clarté opérationnelle reste limitée : les signaux structurels indiquent workflow 0 et practical 0, sans commande d’installation, scripts, références ni ressources d’appui.
Le niveau de confiance et la profondeur d’adoption sont modérés plutôt qu’élevés, car la skill semble se limiter à de la documentation, sans fichiers liés, exemples ni artefacts d’implémentation permettant de valider les détails d’exécution.

RAG Semantic Search Embedding Vector Databases Llm Ai Backend

Vue d’ensemble

Vue d’ensemble de la compétence similarity-search-patterns

Ce à quoi similarity-search-patterns aide réellement

La compétence similarity-search-patterns est un guide de décision et de mise en œuvre pour concevoir une récupération vectorielle qui tient en production, pas seulement en démo. Elle est surtout utile lorsque vous devez choisir une métrique de distance, sélectionner une stratégie d’indexation, arbitrer entre rappel et latence, et définir le comportement de récupération pour une recherche sémantique ou des systèmes RAG.

Utilisateurs et projets les plus adaptés

Cette compétence convient particulièrement à :

des ingénieurs qui développent des fonctionnalités de recherche sémantique ou de recommandation
des équipes qui conçoivent similarity-search-patterns for RAG Workflows
des développeurs qui passent du simple “on stocke des embeddings” à une vraie conception de récupération en production
des praticiens qui comparent les compromis entre recherche exacte, HNSW et approches de type IVF

Si vous maîtrisez déjà très bien votre base vectorielle et qu’il vous faut seulement des commandes propres à un fournisseur, cette compétence sera moins utile. Sa vraie force se situe dans le choix des patterns et la conception système, pas dans la configuration spécifique à une base de données.

Le vrai besoin métier auquel elle répond

La plupart des utilisateurs n’ont pas besoin d’une explication générique des embeddings. Ils doivent répondre à des questions concrètes comme :

Quelle métrique de distance correspond à mon modèle d’embedding ?
Dans quels cas la recherche exacte reste-t-elle acceptable ?
Quand faut-il utiliser HNSW ou une indexation de type IVF ?
Comment combiner récupération sémantique et recherche par mots-clés ?
Quel pattern de récupération correspond à mon échelle, à ma cible de latence et à mes besoins de rappel ?

La similarity-search-patterns skill est utile précisément parce qu’elle structure ces choix de manière directe.

Ce qui différencie cette compétence d’un prompt classique

Un prompt classique peut demander à un agent “d’implémenter une recherche vectorielle”. Cette compétence apporte plus de valeur quand la difficulté principale relève du jugement d’architecture. Elle donne à l’agent un cadre structuré pour raisonner sur :

les métriques de distance et leurs implications
les types d’index et leurs compromis rappel/latence
le passage de petits jeux de données à des millions de vecteurs
les patterns de récupération hybrides plutôt que de la recherche vectorielle pure partout

Elle est donc plus utile pour obtenir une sortie de qualité en conception qu’un simple prompt d’une ligne.

Limites importantes avant installation

Il ne s’agit pas d’un package d’intégration clé en main. Les éléments visibles dans le dépôt montrent uniquement un fichier SKILL.md, sans scripts, références ni exemples spécifiques à un fournisseur. Attendez-vous donc à des conseils conceptuels et architecturaux, pas à une configuration prête à copier-coller pour Pinecone, Weaviate, pgvector, FAISS, Milvus, Elasticsearch ou OpenSearch.

Installez-la si vous voulez prendre de meilleures décisions de récupération. Ne l’installez pas si vous attendez un socle d’implémentation complet.

Comment utiliser la compétence similarity-search-patterns

Contexte d’installation pour similarity-search-patterns

Installez la compétence depuis le dépôt wshobson/agents :

npx skills add https://github.com/wshobson/agents --skill similarity-search-patterns

Comme cette compétence est entièrement pilotée par la documentation, le fichier principal à lire est :

plugins/llm-application-dev/skills/similarity-search-patterns/SKILL.md

Il n’existe ni scripts de support ni fichiers de référence ; l’essentiel de la valeur dépend donc de la qualité avec laquelle vous formulez votre problème au moment de l’invoquer.

Commencez par lire ce fichier

Commencez par SKILL.md et concentrez-vous sur les sections qui traitent :

de quand utiliser la compétence
des métriques de distance
des types d’index

Ce sont probablement ces sections qui orienteront la majorité des décisions d’implémentation. Lisez-les avant de demander du code à un agent, sinon vous risquez d’obtenir une conception de récupération crédible en apparence, mais mal adaptée à votre besoin.

Les entrées nécessaires pour bien exploiter la compétence

La qualité d’utilisation de similarity-search-patterns dépend fortement du contexte que vous fournissez. Au minimum, indiquez :

votre cas d’usage : recherche sémantique, RAG, recommandation, déduplication
la taille approximative du corpus
le volume de requêtes attendu et la cible de latence
si le rappel ou la vitesse compte le plus
le modèle d’embedding, ou au moins le comportement des embeddings, si vous le connaissez
si vous avez besoin d’une recherche hybride mots-clés + sémantique
vos contraintes de stockage ou de base vectorielle

Sans cela, la compétence ne pourra fournir que des conseils génériques.

Transformer un objectif vague en invocation solide

Objectif faible :

“Aide-moi à construire une recherche vectorielle.”

Objectif plus solide :

“Conçois une approche de similarity search pour un système RAG sur 3 millions de documents de support. Nous utilisons des embeddings normalisés, avons besoin d’une récupération en moins de 200 ms, pouvons tolérer une légère perte de rappel, et voulons combiner récupération sémantique et filtrage par mots-clés pour des identifiants produit et des codes d’erreur.”

Cette version plus précise aide l’agent à choisir :

cosine plutôt qu’une autre métrique
HNSW plutôt qu’une approche de type IVF
si une récupération hybride est nécessaire
comment raisonner sur le filtrage et le passage à l’échelle

Un modèle de prompt pratique

Utilisez un prompt de ce type lorsque vous invoquez la similarity-search-patterns skill :

“Apply similarity-search-patterns to recommend a retrieval design for [use case]. Corpus size is [size]. Latency target is [target]. Priority is [recall/speed/cost]. Embeddings are [normalized/raw/unknown]. We need [pure semantic search / hybrid keyword+vector / metadata filtering]. Compare index options, recommend a metric, explain tradeoffs, and give an implementation plan.”

Dans la plupart des cas, cela produit de meilleurs résultats que de demander directement du code.

Comment utiliser similarity-search-patterns pour les workflows RAG

Pour similarity-search-patterns for RAG Workflows, demandez à l’agent de raisonner sur la qualité de récupération, pas uniquement sur l’indexation. Éléments utiles à ajouter :

la taille des chunks de document et leur chevauchement
la nécessité éventuelle de filtres sur les métadonnées
la cible top-k
la disponibilité d’un reranking
l’importance ou non des correspondances exactes de phrases
les cas d’échec attendus, comme les extraits de code, les identifiants ou les citations juridiques

Les systèmes RAG échouent souvent parce que les équipes utilisent une récupération purement sémantique là où une recherche hybride ou des contraintes de métadonnées plus strictes sont nécessaires. Cette compétence est particulièrement utile pour faire remonter ce décalage dès le départ.

Le choix de la métrique fait partie des sorties les plus utiles

Un frein courant à l’adoption est l’incertitude autour des métriques de distance. Cette compétence est la plus utile lorsque vous lui demandez de justifier le choix de la métrique en fonction du comportement de vos embeddings :

cosine pour des embeddings normalisés
Euclidean pour des embeddings bruts dans certains contextes
dot product lorsque la magnitude porte une information utile
Manhattan/L1 surtout dans des cas clairsemés ou spécialisés

Si vous ne savez pas si vos embeddings sont normalisés, dites-le explicitement et demandez à l’agent d’énoncer ses hypothèses.

Le choix de l’index doit correspondre à l’échelle et à votre tolérance

L’un des meilleurs usages de similarity-search-patterns install n’est pas l’installation elle-même, mais l’évitement d’un mauvais choix d’index :

recherche flat/exact pour des jeux de données plus petits ou une validation à fort rappel
HNSW pour de très bonnes performances pratiques sur des jeux de données moyens à grands
approches de type IVF+PQ lorsque l’échelle et la pression mémoire comptent davantage qu’un rappel parfait

Demandez à l’agent de recommander à la fois un choix de production par défaut et une base de référence plus simple pour les tests. Vous aurez ainsi une trajectoire de migration, au lieu d’une première décision fragile.

Workflow conseillé après la première réponse

Un bon workflow consiste à :

Demander une recommandation de conception de récupération.
Demander à l’agent de lister les hypothèses qu’il a faites.
Demander une option “fort rappel” et une option “faible latence”.
Demander les modes d’échec propres à votre corpus.
Demander seulement ensuite les étapes d’implémentation dans votre stack.

Cela permet de garder la compétence centrée sur la qualité de décision avant la génération de code.

Que demander ensuite à l’agent

Après un premier passage de conception, voici des demandes de suivi utiles :

“Compare HNSW vs IVF+PQ for my scale and memory budget.”
“When would hybrid search outperform pure semantic retrieval here?”
“What test queries should I use to evaluate recall?”
“What retrieval mistakes are likely with product codes, names, and abbreviations?”
“How should I benchmark latency vs recall before launch?”

Ces questions transforment la compétence en outil de planification concret plutôt qu’en simple glossaire.

FAQ sur la compétence similarity-search-patterns

similarity-search-patterns est-elle adaptée aux débutants ?

Oui, si vous comprenez déjà les embeddings à un niveau de base. La compétence explique clairement les grands choix de récupération, mais elle relève davantage de la conception système que d’un enseignement depuis les premiers principes. Les débutants peuvent l’utiliser, mais ils en tireront davantage de valeur avec un cas d’usage concret.

Cette compétence suffit-elle à implémenter une stack complète de recherche vectorielle ?

Non. Le similarity-search-patterns guide sert surtout à choisir des patterns et à arbitrer entre les compromis. Il n’inclut ni scripts, ni exemples, ni éléments d’intégration spécifiques à un fournisseur. Dans la pratique, vous l’utiliserez probablement en complément de la documentation de votre base de données et de votre framework applicatif.

Quand similarity-search-patterns est-elle meilleure qu’un prompt ordinaire ?

Elle est préférable lorsque votre principal risque consiste à choisir une mauvaise approche de récupération. Si vous demandez à un modèle général “du code de recherche vectorielle”, vous pouvez obtenir des détails d’implémentation sans raisonnement solide sur l’index, la métrique ou la recherche hybride. Cette compétence renforce précisément cette couche de raisonnement.

Quand ne faut-il pas utiliser similarity-search-patterns ?

Évitez-la si :

vous avez seulement besoin d’une petite démo rapide
votre fournisseur impose déjà une configuration de récupération fixe et très prescriptive
vous résolvez un problème de recherche purement par mots-clés
votre tâche relève de l’administration de base de données plutôt que de la conception de récupération

Est-ce qu’elle aide pour la recherche hybride ?

Oui. La source indique explicitement que la combinaison de recherche sémantique et de recherche par mots-clés est un cas d’usage valide. C’est particulièrement important dans les domaines où les identifiants, formulations exactes, codes ou noms comptent. Dans ces cas-là, une recherche fondée uniquement sur les embeddings ne suffit souvent pas.

Puis-je aussi l’utiliser pour des systèmes de recommandation ?

Oui. Les idées centrales se transposent bien aux systèmes de recommandation par plus proches voisins, en particulier lorsque vous devez choisir des structures d’index et optimiser la latence de recherche à grande échelle. Précisez simplement clairement votre objectif de similarité et vos contraintes de trafic.

Comment améliorer la compétence similarity-search-patterns

Donnez à la compétence des contraintes opérationnelles, pas juste une demande de fonctionnalité

Le moyen le plus rapide d’améliorer l’usage de similarity-search-patterns est d’inclure de vraies contraintes :

taille du corpus
fréquence de mise à jour
SLO de latence
budget mémoire
cible de rappel attendue
besoins de filtrage
importance ou non de l’indexation par lots versus l’ingestion temps réel

Cela fait passer la recommandation d’un conseil générique à quelque chose d’actionnable.

Énoncez explicitement vos hypothèses sur les embeddings

Beaucoup de mauvaises sorties viennent d’hypothèses implicites sur les embeddings. Pour améliorer les résultats, dites à l’agent :

le nom du modèle d’embedding si vous le connaissez
si les vecteurs sont normalisés
la dimension des embeddings si c’est pertinent
si la similarité sémantique seule est réellement fiable dans votre domaine

Cela aide la compétence à recommander une métrique adaptée et à éviter des calculs de similarité mal assortis.

Demandez les compromis dans un tableau de décision

Une très bonne manière d’utiliser la similarity-search-patterns skill consiste à demander un tableau comparatif compact avec des colonnes comme :

option
rappel
latence
coût mémoire
complexité d’implémentation
meilleur cas d’usage
risques

Cela force des décisions plus claires qu’une réponse purement narrative.

Poussez l’analyse vers les modes d’échec propres à votre corpus

Ne vous arrêtez pas à “quel index dois-je utiliser ?”. Demandez plutôt :

quels types de requêtes la recherche vectorielle risque de manquer ?
dans quels cas une recherche hybride devient-elle nécessaire ?
quels types de tokens devraient contourner la récupération sémantique ?
quelles requêtes faut-il utiliser dans l’évaluation hors ligne ?

C’est particulièrement important pour similarity-search-patterns for RAG Workflows, où les erreurs de récupération dégradent directement la qualité des réponses.

Modes d’échec fréquents à surveiller

Erreurs typiques :

choisir cosine sans vérifier la normalisation des embeddings
passer à la recherche approchée avant d’avoir établi une base exacte
attendre d’une récupération purement sémantique qu’elle gère des IDs ou une terminologie exacte
optimiser la latence avant d’avoir mesuré la qualité du rappel
sélectionner un index pour l’échelle actuelle en ignorant la croissance future

La compétence est la plus utile lorsque vous lui demandez de faire remonter explicitement ces risques.

Itérez après la première réponse

Après la recommandation initiale, améliorez la qualité de la sortie en demandant à l’agent de :

remettre en question sa propre recommandation d’index
proposer un plan d’évaluation
séparer les choix MVP des choix pour le passage à l’échelle
identifier ce qu’il faut tester avant de s’engager chez un fournisseur
réécrire le plan pour votre stack spécifique

Cela transforme similarity-search-patterns d’un simple explicateur ponctuel en véritable assistant de revue de conception.

Associez la compétence à des demandes de mesure

La meilleure amélioration consiste à demander des critères de mesure, pas seulement une architecture :

objectifs de recall@k
percentiles de latence
débit d’indexation
empreinte mémoire
gain de la récupération hybride sur les requêtes difficiles

Si l’agent n’est pas capable de vous dire comment évaluer la conception, alors la recommandation n’est pas encore assez solide pour être mise en œuvre.

Utilisez-la comme point de contrôle avant de construire

Pour beaucoup d’équipes, l’usage à plus forte valeur de similarity-search-patterns install intervient avant même le moindre code. Utilisez-la pour valider :

si la recherche vectorielle est bien la bonne approche
si une récupération hybride est nécessaire
si la recherche exacte suffit à l’échelle actuelle
si vos hypothèses sur les embeddings sont valides

Ce point de contrôle en amont évite des refontes coûteuses de l’architecture de récupération plus tard.

Notes et avis

Aucune note pour le moment

Partagez votre avis

Connectez-vous pour laisser une note et un commentaire sur cet outil.

0/10000

Derniers avis

Enregistrement...

Autres outils de cette catégorie

iterative-retrieval

par affaan-m

iterative-retrieval est un modèle de workflow qui permet d’affiner progressivement la récupération de contexte dans les tâches agentiques. Il aide les sous-agents à éviter d’avoir trop peu ou trop de contexte, ce qui le rend utile pour l’usage de iterative-retrieval, la prise de décision d’installation et iterative-retrieval pour l’automatisation de workflows.

Workflow Automation

Favoris 0GitHub 156.2k

azure-ai-contentunderstanding-py

par microsoft

azure-ai-contentunderstanding-py est le skill Python pour Azure AI Content Understanding. Il extrait du contenu structuré à partir de documents, d’images, d’audio et de vidéos pour les workflows RAG et l’automatisation. Utilisez-le lorsque vous avez besoin d’une extraction multimodale fiable, de l’authentification Azure et d’une sortie répétable, prête pour les pipelines.

RAG Workflows

Favoris 0GitHub 2.2k

azure-search-documents-ts

par microsoft

azure-search-documents-ts aide les développeurs backend à créer des solutions Azure AI Search avec le SDK @azure/search-documents. Utilisez-le pour la création d’index, l’import de documents, ainsi que la recherche par mots-clés, vectorielle, hybride et sémantique, sans oublier la configuration des identifiants et de l’environnement. C’est un guide pratique azure-search-documents-ts pour le développement backend.

Backend Development

Favoris 0GitHub 2.3k

vector-index-tuning

par wshobson

vector-index-tuning aide à optimiser les index de recherche vectorielle en termes de latence, de rappel et de mémoire. Utilisez cette skill pour choisir les types d’index, ajuster les paramètres HNSW et comparer les options de quantification pour les workflows RAG.

RAG Workflows

Favoris 0GitHub 32.6k

hybrid-search-implementation

par wshobson

La compétence hybrid-search-implementation montre comment combiner la recherche vectorielle et lexicale avec RRF, la fusion linéaire, le reranking et des schémas en cascade pour des systèmes de RAG et de recherche.

RAG Workflows

Favoris 0GitHub 32.6k

embedding-strategies

par wshobson

embedding-strategies vous aide à choisir et optimiser des modèles d’embedding pour la recherche sémantique et les workflows RAG, avec des conseils concrets sur le chunking, les compromis entre modèles, le contenu multilingue et l’évaluation de la récupération.

RAG Workflows

Favoris 0GitHub 32.6k

rag-implementation

par wshobson

rag-implementation est une skill pratique pour concevoir des systèmes RAG avec bases vectorielles, embeddings, schémas de retrieval et workflows de réponses fondées sur les sources. Utilisez-la pour comparer les options de stack, orienter les choix d’architecture et guider l’installation ainsi que l’usage pour la Q&A documentaire, les assistants de connaissance et la recherche sémantique.

RAG Workflows

Favoris 0GitHub 32.6k

langchain-architecture

par wshobson

langchain-architecture est un guide de conception pour créer des applications LangChain 1.x et LangGraph. Il aide à choisir entre les patterns de chaînes, d’agents, de retrieval, de mémoire et d’orchestration avec état avant l’implémentation.

Agent Orchestration

Favoris 0GitHub 32.6k

frontend-design

par anthropics

frontend-design transforme des idées d’interface floues en UIs distinctives, prêtes pour la prod, avec du vrai code frontend, une direction esthétique claire et moins de style IA générique.

UI Design

Favoris 1GitHub 105.2k

create-colleague

par titanwings

create-colleague transforme des documents de collègues, chats, e-mails, captures d’écran, ainsi que des données Feishu et DingTalk, en un skill IA modifiable avec des sorties séparées pour le travail et le persona, ainsi que des flux de mise à jour pour l’améliorer dans la durée.

Skill Authoring

Favoris 1GitHub 747

hyperframes

par heygen-com

hyperframes est un skill de workflow pour créer des compositions vidéo en HTML dans HyperFrames. Utilisez-le pour les cartes de titre, les superpositions, les sous-titres, les voix off, les mouvements réactifs à l'audio et les transitions de scène lorsque vous avez besoin de hyperframes structurés, pensés d'abord en code, pour le montage vidéo. Il privilégie les choix de mise en page, de timing et d'animation plutôt que de simples requêtes vidéo génériques basées sur du prompt.

Video Editing

Favoris 0GitHub 2.7k

kreuzberg

par kreuzberg-dev

La compétence kreuzberg vous aide à installer et utiliser Kreuzberg pour l’extraction de documents dans plus de 91 formats, dont les PDF, fichiers Office, images, HTML, e-mails et archives. Elle couvre les workflows Python, Node.js/TypeScript, Rust et CLI pour l’OCR, les tableaux, les métadonnées, le traitement par lots et des conseils pratiques d’analyse.

PDF Processing

Favoris 0GitHub 0

skill-creator

par anthropics

skill-creator est une méta-skill de création de skills pour rédiger de nouvelles skills, réviser des fichiers SKILL.md, lancer des évaluations, comparer des variantes et améliorer les descriptions de déclenchement avec les scripts du dépôt et des outils de revue.

Skill Authoring

Favoris 2GitHub 105.1k

azure-identity-py

par microsoft

azure-identity-py aide à configurer l’authentification Azure en Python avec Microsoft Entra ID. Utilisez-le pour choisir entre `DefaultAzureCredential`, l’identité managée ou l’authentification par principal de service, configurer les variables d’environnement et résoudre les problèmes de contrôle d’accès et de chaîne d’identifiants. Les conseils d’installation, les schémas d’utilisation et les notes de configuration pratiques s’appuient sur le fichier de skill du dépôt.

Access Control

Favoris 0GitHub 2.2k

claude-api

par anthropics

claude-api est une skill pratique pour installer et utiliser l’API Claude et les SDK Anthropic. Elle aide à choisir le bon SDK ou l’option HTTP brute, à repérer la documentation adaptée à chaque langage et à implémenter le streaming, l’usage d’outils, les fichiers, les batchs et la gestion des erreurs avec moins d’incertitude.

API Development

Favoris 0GitHub 105k

wrangler

par cloudflare

Le skill wrangler vous aide à trouver les bonnes commandes CLI, les bons schémas de configuration et les étapes de déploiement pour Cloudflare Workers. Utilisez-le pour l’usage de wrangler, les vérifications d’installation de wrangler et un guide pratique de wrangler lors de la création ou de la mise en ligne de Workers pour le développement backend.

Backend Development

Favoris 0GitHub 1.3k