similarity-search-patterns

similarity-search-patterns 可帮助你为语义搜索和 RAG 工作流选择合适的距离度量、索引类型与混合检索模式。适合用于规划生产级向量搜索在召回率、延迟和规模之间的取舍。

Stars32.6k

收录时间2026年3月30日

分类RAG 工作流

安装命令

npx skills add wshobson/agents --skill similarity-search-patterns

编辑评分

该技能评分为 67/100，说明它适合作为目录中的参考型技能收录，但并不是偏实操的高执行型技能。仓库内容表明，它对 similarity search 的典型使用场景有较扎实的概念覆盖，也提供了清晰的触发线索；不过缺少详细的分步流程指导和可直接运行的产物，因此代理在落地实现时仍可能需要自行补全不少细节。

67/100

亮点

触发场景清晰：描述和“何时使用”部分能明确对应语义搜索、RAG 检索、推荐、延迟优化以及大规模向量搜索等需求。
文档内容较充实：较长的 SKILL.md 包含多个章节、表格和代码块，相比通用的一段式提示词，能为代理提供更可复用的模式参考。
覆盖了距离度量、索引类型等核心设计决策，有助于代理理解生产系统中常见的 similarity search 取舍。

注意点

实操清晰度有限：从结构化信号看，workflow 为 0、practical 为 0，且没有 install 命令、脚本、参考资料或其他配套资源。
可信度和落地采用深度属中等而非很强：该技能看起来主要是文档型内容，缺少可交叉验证执行细节的关联文件、示例或实现产物。

RAG Semantic Search Embedding Vector Databases Llm Ai 后端

概览

similarity-search-patterns skill 概览

similarity-search-patterns 实际能解决什么问题

similarity-search-patterns skill 是一份面向生产环境的向量检索决策与实现指南，不是只适用于 demo 的那种说明。它最适合用在这些场景：你需要选择距离度量、确定索引策略、在召回率与延迟之间做权衡，或为语义搜索、RAG 系统设计合适的检索行为。

最适合哪些用户和项目

这个 skill 特别适合：

正在构建语义搜索或推荐功能的工程师
设计 similarity-search-patterns for RAG Workflows 的团队
想从“先把 embeddings 存起来再说”走向生产级检索设计的开发者
正在比较精确搜索、HNSW 和 IVF 类方案取舍的实践者

如果你已经非常熟悉自己的向量数据库，只需要厂商专属命令，那这个 skill 的价值就没那么高。它的强项是模式选择和系统设计，不是数据库级别的具体接入配置。

它真正要完成的任务

大多数用户并不需要一段泛泛而谈的 embeddings 科普。他们真正要回答的是这些实际问题：

哪种距离度量最适合我的 embedding 模型？
什么情况下精确搜索就够用了？
什么时候该上 HNSW 或 IVF 类索引？
语义检索和关键词检索该怎么结合？
在我的数据规模、延迟目标和召回需求下，哪种检索模式最合适？

similarity-search-patterns skill 的价值就在于，它会直接围绕这些选择来组织判断。

它和普通 prompt 有什么不同

普通 prompt 可能只是让 agent “实现向量搜索”。而这个 skill 更有价值的地方在于：当难点不在写代码，而在架构判断时，它能给 agent 一个结构化的思考框架，帮助其推理：

距离度量的差异及其含义
不同索引类型在召回率与延迟上的取舍
从小规模数据集扩展到数百万向量时该如何调整
何时应采用混合检索，而不是到处都硬上纯向量搜索

因此，相比一句话 prompt，它更适合产出设计质量更高的方案。

安装前需要知道的重要边界

这不是一个开箱即用的集成包。仓库内容显示它只有一个 SKILL.md 文件，没有脚本、参考资料，也没有厂商专属示例。所以你拿到的主要是概念和架构层面的指导，而不是 Pinecone、Weaviate、pgvector、FAISS、Milvus、Elasticsearch 或 OpenSearch 的可复制粘贴式配置。

如果你的目标是做出更好的检索决策，就值得安装。不要指望它提供完整实现脚手架。

如何使用 similarity-search-patterns skill

similarity-search-patterns 的安装上下文

从 wshobson/agents 仓库安装这个 skill：

npx skills add https://github.com/wshobson/agents --skill similarity-search-patterns

由于这个 skill 是以文档为核心驱动的，最需要阅读的资产是：

plugins/llm-application-dev/skills/similarity-search-patterns/SKILL.md

它没有配套脚本或参考文件，所以效果很大程度上取决于你在调用时能否把问题描述清楚。

先读这个文件

先从 SKILL.md 开始，重点看这些部分：

什么时候适合使用这个 skill
距离度量
索引类型

这些内容往往会决定大部分实现方向。最好在让 agent 写代码之前先读完，否则很容易得到一个看起来合理、实际上和需求不匹配的检索设计。

让 skill 发挥作用需要提供哪些输入

similarity-search-patterns usage 的输出质量，非常依赖你提供的上下文。至少应包括：

你的使用场景：semantic search、RAG、recommendation、deduplication
语料的大致规模
预期查询量和延迟目标
更看重召回还是速度
embedding 模型，或已知的 embedding 行为
是否需要关键词 + 语义的混合检索
你的存储或向量数据库约束

如果没有这些信息，这个 skill 只能给出比较泛的建议。

如何把模糊目标变成高质量调用

弱目标：

“Help me build vector search.”

更强的目标：

“Design a similarity search approach for a RAG system over 3 million support documents. We use normalized embeddings, need sub-200ms retrieval, can tolerate slight recall loss, and want to combine semantic retrieval with keyword filtering for product IDs and error codes.”

这种更具体的描述，能帮助 agent 判断：

应该用 cosine 还是其他度量
更适合 HNSW 还是 IVF 类方案
是否必须采用混合检索
该如何理解过滤条件和规模问题

一个实用的 prompt 模板

调用 similarity-search-patterns skill 时，可以用下面这种 prompt：

“Apply similarity-search-patterns to recommend a retrieval design for [use case]. Corpus size is [size]. Latency target is [target]. Priority is [recall/speed/cost]. Embeddings are [normalized/raw/unknown]. We need [pure semantic search / hybrid keyword+vector / metadata filtering]. Compare index options, recommend a metric, explain tradeoffs, and give an implementation plan.”

通常，这种写法比直接要求“给我代码”更容易得到高质量输出。

如何将 similarity-search-patterns 用于 RAG 工作流

对于 similarity-search-patterns for RAG Workflows，要让 agent 推理的是“检索质量”，而不只是“索引怎么建”。建议补充的信息包括：

文档切块大小与 overlap
是否需要 metadata filters
top-k 目标值
是否有 reranking
是否存在必须精确短语匹配的需求
预期失败场景，例如代码片段、ID、法律引用

很多 RAG 系统失败，并不是索引本身有问题，而是团队在本该使用混合检索或更强 metadata 约束的场景里，错误地用了纯语义检索。这个 skill 很适合在早期就暴露这种错配。

距离度量选择是它最有价值的输出之一

实际采用时，一个常见阻碍就是大家不确定距离度量该怎么选。这个 skill 最有价值的用法之一，就是要求它根据你的 embedding 行为来论证度量选择：

归一化 embeddings 通常用 cosine
某些设置下，原始 embeddings 更适合 Euclidean
当向量模长本身带有信号时可考虑 dot product
Manhattan/L1 主要用于稀疏或更特定的场景

如果你不确定 embeddings 是否已归一化，要明确写出来，并要求 agent 说明它做了哪些假设。

索引选择应匹配你的规模和容忍度

similarity-search-patterns install 的一个最佳用途，其实不是“安装”，而是避免一开始就选错索引：

flat/exact search：适合较小数据集，或作为高召回验证基线
HNSW：在中到大规模数据上通常有很强的实际表现
IVF+PQ 类方案：当规模和内存压力比“完美召回”更重要时更合适

建议让 agent 同时给出一个默认生产方案，以及一个更简单、适合测试的 baseline。这样你会有一条迁移路径，而不是在第一步就做出脆弱的单点决策。

首轮输出后的建议工作流

比较稳妥的 workflow 是：

先让 agent 给出检索设计建议。
再让它列出自己的假设。
再要一个“高召回”方案和一个“低延迟”方案。
再让它说明与你语料相关的失败模式。
最后才让它给出你所选技术栈下的实现步骤。

这样可以先把重点放在决策质量上，再进入代码生成。

接下来可以继续追问 agent 什么

完成第一轮设计后，下面这些追问很有用：

“Compare HNSW vs IVF+PQ for my scale and memory budget.”
“When would hybrid search outperform pure semantic retrieval here?”
“What test queries should I use to evaluate recall?”
“What retrieval mistakes are likely with product codes, names, and abbreviations?”
“How should I benchmark latency vs recall before launch?”

这些问题会让这个 skill 从术语说明，变成真正可用的规划工具。

similarity-search-patterns skill 常见问题

similarity-search-patterns 对新手友好吗？

友好，但前提是你至少已经对 embeddings 有基础理解。这个 skill 对主要检索选择的解释是清晰的，不过重点更偏系统设计，而不是从零教学。新手也能用，但如果能提供明确的使用场景，收获会更大。

这个 skill 足够实现完整的向量搜索技术栈吗？

不够。similarity-search-patterns guide 更适合用来选择模式和权衡取舍。它不附带脚本、示例或厂商专属集成资产。实际使用时，你大概率还需要结合数据库文档和自己的应用框架。

similarity-search-patterns 什么时候比普通 prompt 更好用？

当你的主要风险是“选错检索方案”时，它更有优势。如果你直接让通用模型生成“vector search code”，往往会得到实现细节，但缺少可靠的索引、距离度量或混合检索推理。这个 skill 提升的正是这层判断能力。

什么情况下不该用 similarity-search-patterns？

以下情况可以跳过：

你只需要一个很快做完的 toy demo
你的供应商已经提供固定且强约束的检索方案
你面对的是纯关键词搜索问题
你的任务重点是数据库管理，而不是检索设计

它对 hybrid search 有帮助吗？

有。源文档明确指出，将语义搜索与关键词搜索结合，本身就是一个有效使用场景。对于 ID、精确短语、代码或名称很重要的领域，这一点尤其关键。很多时候，纯 embedding 搜索并不够用。

也能用于推荐系统吗？

可以。它的核心思路同样适用于 nearest-neighbor recommendation，尤其是在你需要选择索引结构并在大规模下优化搜索延迟时。只要把相似性目标和流量约束说清楚即可。

如何改进 similarity-search-patterns skill 的使用效果

给出运行约束，而不只是提功能诉求

想提升 similarity-search-patterns usage 效果，最快的方法就是把真实约束一起告诉它：

语料规模
更新频率
latency SLO
内存预算
预期召回目标
过滤需求
更关注批量建索引还是实时写入

这样，建议才会从泛泛而谈变成可执行方案。

明确说明 embedding 相关假设

很多不理想的输出，根源都在于隐藏的 embedding 假设。想提高结果质量，可以主动告诉 agent：

embedding 模型名称（如果已知）
向量是否已归一化
embedding 维度（如果相关）
在你的领域里，是否能仅凭语义相似性进行可靠检索

这有助于 skill 推荐合适的度量方式，避免使用不匹配的相似度计算。

要求用决策表呈现取舍

使用 similarity-search-patterns skill 的一个高效方式，是直接要求它输出一张紧凑的对比表，列可以包括：

option
recall
latency
memory cost
implementation complexity
best fit
risks

相比纯叙述式回答，这样更容易逼出清晰判断。

追问与语料相关的失败模式

不要只停留在“我该用哪种索引？”继续追问：

哪些类型的查询最容易被向量搜索漏掉？
哪些场景必须使用 hybrid search？
哪些 token 应该绕过语义检索？
离线评估应该用哪些查询？

这对 similarity-search-patterns for RAG Workflows 尤其重要，因为检索错误会直接拖累最终回答质量。

需要重点关注的常见失败模式

典型错误包括：

没确认 embedding 是否归一化，就直接选 cosine
还没建立 exact baseline，就过早上 approximate search
误以为纯语义检索能处理 ID 或精确术语
在还没测清召回质量前，就先去优化延迟
索引只按当前规模选择，却忽略后续增长

当你明确要求它把这些风险直接指出来时，这个 skill 的价值最大。

在第一轮答案之后继续迭代

拿到初步建议后，可以这样进一步提升输出质量，让 agent：

反过来挑战它自己的索引推荐
给出评估计划
区分 MVP 方案与扩展后方案
指出在选定供应商前必须验证的事项
按你的具体技术栈重写方案

这样，similarity-search-patterns 就不再只是一次性说明，而会变成实用的设计评审助手。

把它和测量指标请求结合起来用

最有效的改进方式之一，是要求它给出衡量标准，而不只是讲架构：

recall@k 目标
延迟分位数
建索引吞吐
内存占用
hybrid retrieval 在困难查询上的提升幅度

如果 agent 说不清该如何评估设计，那这个推荐还不够成熟，暂时不适合直接落地。

把它当作编码前的检查点

对很多团队来说，similarity-search-patterns install 的最高价值，其实发生在任何编码开始之前。你可以用它来验证：

向量搜索是否真的是正确方向
是否必须采用混合检索
在当前规模下，精确搜索是否已经足够
你的 embedding 假设是否成立

这个前置检查点，能避免后续为检索架构返工付出高昂成本。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

iterative-retrieval

作者 affaan-m

iterative-retrieval 是一种工作流模式，用于在 agentic 工作中逐步优化上下文检索。它能帮助 subagents 避免获取过多或过少的上下文，因此适用于 iterative-retrieval 的使用场景、安装决策，以及 Workflow Automation 中的 iterative-retrieval。

工作流自动化

收藏 0GitHub 156.2k

azure-ai-contentunderstanding-py

作者 microsoft

azure-ai-contentunderstanding-py 是 Azure AI Content Understanding 的 Python 技能。它可从文档、图像、音频和视频中提取结构化内容，适用于 RAG 工作流和自动化场景。若你需要可靠的多模态提取、Azure 身份验证以及可重复、可直接接入流水线的输出，就适合使用它。

RAG 工作流

收藏 0GitHub 2.2k

azure-search-documents-ts

作者 microsoft

azure-search-documents-ts 可帮助后端开发者借助 @azure/search-documents SDK 构建 Azure AI Search 解决方案。它适用于索引创建、文档上传，以及关键词、向量、混合和语义搜索，还包括凭据与环境配置。对于后端开发来说，这是一本实用的 azure-search-documents-ts 指南。

后端开发

收藏 0GitHub 2.3k

vector-index-tuning

作者 wshobson

vector-index-tuning 可帮助优化向量检索索引，在延迟、召回率与内存占用之间取得平衡。可用于选择索引类型、调整 HNSW 参数，并比较适用于 RAG 工作流的量化方案。

RAG 工作流

收藏 0GitHub 32.6k

hybrid-search-implementation

作者 wshobson

hybrid-search-implementation 技能说明如何将向量检索与关键词检索结合，并使用 RRF、线性融合、重排和级联等模式，用于 RAG 和搜索系统。

RAG 工作流

收藏 0GitHub 32.6k

embedding-strategies

作者 wshobson

embedding-strategies 帮助你为语义搜索和 RAG 工作流选择并优化 embedding 模型，提供关于分块策略、模型取舍、多语言内容处理和检索评估的实用指导。

RAG 工作流

收藏 0GitHub 32.6k

rag-implementation

作者 wshobson

rag-implementation 是一项面向实践的技能，可用于规划包含 vector databases、embeddings、retrieval patterns 与 grounded-answer workflows 的 RAG 系统。你可以用它比较技术栈方案、明确架构决策，并指导 document Q&A、knowledge assistants 和 semantic search 场景下的安装与使用选择。

RAG 工作流

收藏 0GitHub 32.6k

langchain-architecture

作者 wshobson

langchain-architecture 是一份用于构建 LangChain 1.x 与 LangGraph 应用的架构设计指南。在开始实现之前，你可以用它判断应采用 chains、agents、retrieval、memory 还是有状态编排等模式。

Agent 编排

收藏 0GitHub 32.6k

frontend-design

作者 anthropics

frontend-design 帮你把模糊的 UI 想法，转化为有审美导向的量产级界面，实现真实可用的前端代码，而不是千篇一律的 AI 风格。

UI 设计

收藏 1GitHub 105.2k

create-colleague

作者 titanwings

create-colleague 可将同事文档、聊天记录、邮件、截图、Feishu 和 DingTalk 数据整理为可编辑的 AI 技能，并分别产出工作风格与人物画像内容，还提供持续迭代的更新流程。

Skill 编写

收藏 1GitHub 747

hyperframes

作者 heygen-com

hyperframes 是一项工作流技能，用于在 HyperFrames 中构建基于 HTML 的视频合成。适用于需要结构化、以代码为先的 hyperframes 视频编辑场景，比如标题卡、叠加层、字幕、配音、音频驱动动效和场景转场。它更强调布局、时序和动画决策，而不是泛泛的只靠提示词生成视频请求。

视频编辑

收藏 0GitHub 2.7k

kreuzberg

作者 kreuzberg-dev

kreuzberg 技能可帮助你安装并使用 Kreuzberg 进行文档抽取，支持 91+ 种格式，包括 PDF、Office 文件、图片、HTML、邮件和压缩包。它覆盖 Python、Node.js/TypeScript、Rust 和 CLI 工作流，适用于 OCR、表格、元数据、批量处理以及实用的解析指导。

PDF 处理

收藏 0GitHub 0

skill-creator

作者 anthropics

skill-creator 是一个用于 Skill 编写的元技能，可用于起草新技能、修改现有 `SKILL.md`、运行评测、对比不同方案，并借助仓库脚本和审查工具优化触发描述。

Skill 编写

收藏 2GitHub 105.1k

azure-identity-py

作者 microsoft

azure-identity-py 帮助你在 Python 中使用 Microsoft Entra ID 配置 Azure 身份验证。它适合用于选择 DefaultAzureCredential、managed identity 或 service principal 认证，配置环境变量，并排查访问控制和凭据链问题。安装说明、使用模式和实用的配置提示均基于 repo skill file。

访问控制

收藏 0GitHub 2.2k

claude-api

作者 anthropics

claude-api 是一项实用技能，帮助开发者安装并使用 Claude API 与 Anthropic SDK。它可协助选择合适的 SDK 或原生 HTTP 方案，识别对应语言文档，并更稳妥地实现流式输出、tool use、文件、批处理和错误处理，减少试错成本。

API 开发

收藏 0GitHub 105k

wrangler

作者 cloudflare

wrangler 技能可帮助你找到 Cloudflare Workers 的正确 CLI 命令、配置结构和部署步骤。可用于 wrangler 的使用、wrangler 安装检查，以及在构建或交付 Workers 时获取一份实用的 wrangler 指南，适合 Backend Development 场景。

后端开发

收藏 0GitHub 1.3k