W
vector-index-tuning
作者 wshobson
vector-index-tuning 可帮助优化向量检索索引,在延迟、召回率与内存占用之间取得平衡。可用于选择索引类型、调整 HNSW 参数,并比较适用于 RAG 工作流的量化方案。
RAG 工作流
收藏 0GitHub 32.6k
作者 wshobson
vector-index-tuning 可帮助优化向量检索索引,在延迟、召回率与内存占用之间取得平衡。可用于选择索引类型、调整 HNSW 参数,并比较适用于 RAG 工作流的量化方案。
作者 wshobson
similarity-search-patterns 可帮助你为语义搜索和 RAG 工作流选择合适的距离度量、索引类型与混合检索模式。适合用于规划生产级向量搜索在召回率、延迟和规模之间的取舍。
作者 wshobson
rag-implementation 是一项面向实践的技能,可用于规划包含 vector databases、embeddings、retrieval patterns 与 grounded-answer workflows 的 RAG 系统。你可以用它比较技术栈方案、明确架构决策,并指导 document Q&A、knowledge assistants 和 semantic search 场景下的安装与使用选择。
作者 wshobson
hybrid-search-implementation 技能说明如何将向量检索与关键词检索结合,并使用 RRF、线性融合、重排和级联等模式,用于 RAG 和搜索系统。
作者 wshobson
embedding-strategies 帮助你为语义搜索和 RAG 工作流选择并优化 embedding 模型,提供关于分块策略、模型取舍、多语言内容处理和检索评估的实用指导。