vector-index-tuning

bởi wshobson

vector-index-tuning giúp tinh chỉnh chỉ mục tìm kiếm vector để tối ưu độ trễ, recall và bộ nhớ. Dùng skill này để chọn loại chỉ mục, điều chỉnh thiết lập HNSW và so sánh các phương án quantization cho quy trình RAG.

Stars32.6k

Yêu thích0

Bình luận0

Đã thêm30 thg 3, 2026

Danh mụcRAG Workflows

Lệnh cài đặt

npx skills add wshobson/agents --skill vector-index-tuning

Điểm tuyển chọn

Skill này đạt 71/100, tức là vẫn phù hợp để đưa vào danh mục cho người dùng cần tài liệu hướng dẫn có thể tái sử dụng về tối ưu hóa chỉ mục vector, nhưng nên kỳ vọng đây thiên về tài liệu tham khảo hơn là một quy trình vận hành chặt chẽ. Bằng chứng từ repository cho thấy nội dung khá đầy đặn, với các chủ đề tinh chỉnh cụ thể như tham số HNSW, lựa chọn loại chỉ mục và đánh đổi khi dùng quantization, nên agent nhiều khả năng có thể kích hoạt đúng. Tuy vậy, việc thiếu các tệp hỗ trợ, hướng dẫn cài đặt và tín hiệu quy trình rõ ràng hơn đồng nghĩa người dùng vẫn có thể phải tự chuyển hóa hướng dẫn này vào stack của mình.

71/100

Điểm mạnh

Khả năng được kích hoạt đúng cao nhờ phần mô tả cụ thể, bao quát tinh chỉnh HNSW, quantization, độ trễ, recall và các tình huống scale.
Nội dung skill tương đối đầy đủ, có cấu trúc theo mục, bảng và code fence, vượt xa mức placeholder hoặc lớp prompt mỏng.
Cung cấp hướng dẫn ra quyết định hữu ích cho các lựa chọn phổ biến trong vector search, gồm phạm vi loại chỉ mục và các đánh đổi tham số.

Điểm cần lưu ý

Độ rõ ràng ở khía cạnh vận hành còn hạn chế do thiếu script, tài liệu tham chiếu hoặc ví dụ tích hợp repo/file, nên khi triển khai vẫn cần tự diễn giải.
Không thấy lệnh cài đặt hoặc lộ trình quick-start thực tế trong SKILL.md, nên mức độ tin cậy cho việc áp dụng nhanh bị giảm.

RAG Vector Databases Semantic Search Embedding Performance Ml Ai

Tổng quan

Tổng quan về skill vector-index-tuning

vector-index-tuning dùng để làm gì

Skill vector-index-tuning giúp bạn chọn và tinh chỉnh cấu hình index cho vector search theo đúng các đánh đổi trong môi trường production: độ trễ, recall, mức dùng bộ nhớ, thời gian build và khả năng mở rộng. Skill này đặc biệt hữu ích khi hệ thống RAG về cơ bản đã chạy được, nhưng chất lượng truy xuất, tốc độ query hoặc chi phí hạ tầng đã không còn chấp nhận được.

Ai nên dùng skill này

Skill vector-index-tuning phù hợp với:

kỹ sư đang vận hành semantic search hoặc RAG trong production
các team đang cân nhắc giữa Flat, HNSW, quantized HNSW, IVF+PQ hoặc index lưu trên disk
những người cần hướng dẫn tham số cụ thể thay vì kiểu lời khuyên chung chung như “hãy tối ưu embeddings”

Nếu bạn vẫn đang ở giai đoạn xác thực xem có cần vector search hay không, thì dùng skill này lúc này có thể còn quá sớm.

Bài toán thực tế mà skill này giải quyết

Người dùng thường không cần “lý thuyết về index”. Họ muốn câu trả lời cho những câu hỏi như:

Vì sao recall giảm sau khi quantization?
Nên thử setting HNSW nào trước?
Dữ liệu lớn đến mức nào thì nên ngừng dùng exact search?
Làm sao giảm RAM mà không khiến truy xuất RAG tệ đi rõ rệt?

vector-index-tuning for RAG Workflows phát huy hiệu quả nhất khi bạn đã nắm được kích thước corpus, số chiều vector, ngân sách độ trễ và mức suy giảm recall có thể chấp nhận.

Điểm khác biệt so với một prompt chung chung

Một prompt thông thường thường chỉ cho ra các gợi ý mơ hồ. vector-index-tuning hữu ích hơn vì nó cung cấp một khung ra quyết định thực tế:

chọn loại index theo quy mô tập dữ liệu
vai trò của các tham số HNSW (M, efConstruction, efSearch)
các lựa chọn quantization theo đánh đổi giữa bộ nhớ và chất lượng
tư duy thiên về production cho các collection lớn

Nhờ đó, bạn dễ chuyển từ cảm giác “retrieval của mình có vẻ chậm” sang một kế hoạch tuning cụ thể.

Cần biết gì trước khi cài

Skill này chỉ gồm một file hướng dẫn SKILL.md, không có script hỗ trợ hay benchmark harness đi kèm. Nghĩa là việc áp dụng khá nhẹ nhàng, nhưng hiệu quả thực thi sẽ phụ thuộc vào chất lượng metric và setup test của chính bạn. Hãy cài nếu bạn muốn có hướng dẫn tuning có cấu trúc; đừng kỳ vọng sẵn automation dùng ngay.

Cách dùng skill vector-index-tuning

Cài đặt vector-index-tuning

Cài từ repository bằng lệnh:

npx skills add https://github.com/wshobson/agents --skill vector-index-tuning

Vì skill chỉ tồn tại dưới dạng một file markdown hướng dẫn, bước cài đặt rất đơn giản. Phần việc thực tế nằm ở sau khi cài: bạn cần cung cấp đủ chi tiết hệ thống để model có thể đưa ra khuyến nghị tuning tốt.

Hãy đọc file này trước

Bắt đầu với:

SKILL.md

Ở đây không có script hỗ trợ, tài liệu tham chiếu hay thư mục rules, nên gần như toàn bộ hướng dẫn hữu dụng đều nằm trong file này. Điều đó thuận tiện cho việc đọc nhanh, nhưng cũng đồng nghĩa bạn nên tự chuẩn bị dữ liệu benchmark thay vì trông chờ sẵn asset kiểm thử trong repo.

vector-index-tuning cần dữ liệu đầu vào gì để hoạt động tốt

Để vector-index-tuning cho ra khuyến nghị chất lượng, hãy cung cấp cho model:

số lượng vector
số chiều embedding
loại index hiện tại
setting HNSW hiện tại nếu có
ngân sách bộ nhớ
mục tiêu độ trễ p95 hoặc p99
mục tiêu recall bắt buộc hoặc mức suy giảm chất lượng chấp nhận được
mô hình cập nhật dữ liệu: chủ yếu tĩnh, làm mới theo batch, hay ghi liên tục nhiều
setup retrieval của RAG: top-k, reranking, filtering, ràng buộc metadata

Nếu thiếu các đầu vào này, skill chỉ có thể trả về những khuyến nghị rất chung.

Biến một mục tiêu mơ hồ thành prompt dùng được

Prompt yếu:

Tune my vector index.

Prompt tốt hơn:

Use the vector-index-tuning skill. I have 18M vectors at 768 dimensions for a RAG system. Current index is HNSW with M=16, efConstruction=100, efSearch=40. p95 latency is 140ms, RAM is too high, and recall@10 versus brute-force is 0.91. I can tolerate recall@10 down to 0.88 if p95 falls below 80ms and RAM drops by 30%. Recommend index strategy, parameter changes, and a benchmark plan.

Prompt này hiệu quả hơn vì nó bộc lộ rõ mục tiêu tối ưu thực sự và ranh giới đánh đổi có thể chấp nhận.

Quy trình tốt nhất cho vector-index-tuning trong RAG Workflows

Một trình tự thực tế là:

Mô tả kích thước corpus và kiến trúc retrieval hiện tại.
Nêu rõ ràng ràng buộc kinh doanh trước: độ trễ, bộ nhớ hay recall.
Yêu cầu skill chọn họ index trước khi đi vào tuning tham số chi tiết.
Benchmark trên một tập query cố định và một phương pháp ground-truth cố định.
Lặp theo từng nhóm biến một lần.

Điều này quan trọng vì nhiều team lao ngay vào quét tham số mà chưa xác nhận xem loại index mình đang dùng có thực sự phù hợp với quy mô dữ liệu hay không.

Cách chọn họ index trước tiên

Bảng quyết định cốt lõi của skill rất hữu ích như một lớp lọc ban đầu:

dưới khoảng ~10K vector: Flat exact search thường đơn giản hơn và đã đủ tốt
khoảng ~10K đến 1M: HNSW thường là ứng viên mặc định
khoảng ~1M đến 100M: HNSW kết hợp quantization bắt đầu đáng cân nhắc
trên ~100M: các hướng như IVF+PQ hoặc DiskANN-style trở nên khả thi hơn

Hãy xem đây là điểm xuất phát chứ không phải luật cứng. Nếu vector của bạn có filtering nặng, cập nhật thường xuyên hoặc chạy trong ngân sách bộ nhớ rất chặt, lựa chọn tốt nhất có thể sẽ khác.

Cách tận dụng hướng dẫn HNSW của vector-index-tuning

Khi nhờ hỗ trợ về HNSW, hãy luôn cung cấp đủ cả ba núm chỉnh quan trọng:

M: độ kết nối của graph, thường recall tốt hơn nhưng tốn thêm bộ nhớ
efConstruction: chất lượng build so với chi phí build
efSearch: recall lúc query so với độ trễ

Một mẫu prompt hữu ích:

Use the vector-index-tuning skill to propose a minimal test matrix for M, efConstruction, and efSearch that fits my latency and recall targets, and explain which parameter I should lock first.

Cách này giúp bạn nhận được một kế hoạch tuning có thứ tự ưu tiên thay vì một danh sách giá trị rời rạc.

Cách tận dụng hướng dẫn quantization của vector-index-tuning

Nếu vấn đề lớn nhất là bộ nhớ, hãy yêu cầu skill so sánh:

FP32
FP16
INT8 scalar quantization
Product Quantization
biểu diễn nhị phân nếu phù hợp

Prompt tốt:

I need a 2-4x memory reduction for 50M vectors and can accept modest recall loss in first-stage retrieval because a reranker follows. Use the vector-index-tuning skill to compare FP16, INT8, and PQ for this RAG pipeline.

Cách hỏi này mạnh hơn nhiều so với chỉ hỏi “có nên quantize không?”, vì nó gắn mức chấp nhận nén với tầng reranking phía sau.

Bạn nên kỳ vọng output như thế nào

Kết quả tốt nhất không phải là một bộ tham số “thần kỳ” duy nhất. Thứ bạn nên nhận được là:

một lựa chọn index đã được thu hẹp
một lưới tham số ứng viên ngắn gọn
một kế hoạch đánh giá
giải thích rõ các đánh đổi để bạn kiểm chứng

Nếu model chỉ đưa ra một cấu hình duy nhất mà không kèm cách benchmark, hãy yêu cầu sửa lại theo hướng một kế hoạch thí nghiệm.

Lộ trình đọc repository thực tế

Vì chỉ có SKILL.md, hãy tập trung đọc các phần này theo thứ tự:

When to Use This Skill
Core Concepts
Index Type Selection
HNSW Parameters
Quantization Types
các code template ở gần cuối file

Lộ trình này giúp bạn nắm logic ra quyết định trước, rồi đến các núm tuning, sau đó mới đến mẫu triển khai.

Các điểm nghẽn phổ biến khi triển khai

Các team thường bị khựng lại vì một trong những lý do sau:

không có baseline recall so với exact search
không có tập query cố định để so sánh giữa các lần chạy
cố tối ưu đồng thời độ trễ và recall nhưng lại không có ngân sách bộ nhớ
dùng benchmark tổng hợp không giống query RAG ngoài thực tế

Skill này hỗ trợ ra quyết định tuning, nhưng không thể thay thế dữ liệu đánh giá mang tính đại diện.

Câu hỏi thường gặp về skill vector-index-tuning

vector-index-tuning có phù hợp cho người mới bắt đầu không

Có, nếu bạn đã hiểu vector index là gì. Không, nếu bạn vẫn còn đang phân vân giữa keyword search, hybrid search và dense retrieval. Skill này giả định rằng bạn đã qua giai đoạn chọn kiến trúc retrieval cơ bản và hiện cần hướng dẫn tuning.

Khi nào vector-index-tuning không phải công cụ phù hợp

Đừng bắt đầu với vector-index-tuning nếu vấn đề thực sự của bạn là:

chunking kém
embeddings kém chất lượng
tiền xử lý tài liệu yếu
thiếu metadata filters
không có reranking trong khi đáng ra cần có

Tuning index sẽ không sửa được các vấn đề relevance phát sinh từ những khâu phía trước.

Có tốt hơn việc hỏi trực tiếp một LLM không

Thường là có, vì vector-index-tuning skill giữ cuộc trao đổi bám sát các đánh đổi có thể đo lường và các đòn bẩy tham số đã biết, thay vì trôi sang lời khuyên tối ưu hóa chung chung. Giá trị tăng thêm nằm ở cấu trúc, không phải automation.

vector-index-tuning có hỗ trợ cụ thể cho RAG Workflows không

Có. Skill này đặc biệt phù hợp với first-stage retrieval trong RAG, nơi bạn thường phải cân bằng giữa recall và chi phí trước khi đến bước reranking. Nó càng hữu ích hơn khi bạn nói rõ có reranker hay không, đang dùng top-k bao nhiêu, và metadata filtering có đang thu hẹp candidate set hay không.

Skill có kèm công cụ benchmark chạy được không

Không. Dựa trên cấu trúc repository, đây là một skill thiên về tài liệu hướng dẫn. Bạn nên kỳ vọng vào hướng dẫn khái niệm và ví dụ code, chứ không phải một harness hoàn chỉnh để đo recall, thời gian build và độ trễ trong chính môi trường của bạn.

Nếu collection của tôi cập nhật thường xuyên thì sao

Vẫn nên dùng skill, nhưng hãy nêu rõ tần suất cập nhật. Có những lựa chọn index trông rất tốt với corpus tĩnh nhưng lại kém hấp dẫn hơn nhiều khi workload ghi nặng. Đây là một trong những cách dễ nhất khiến bạn nhận được câu trả lời nghe có vẻ thông minh nhưng lại sai về mặt vận hành.

Cách cải thiện skill vector-index-tuning

Đưa ra ràng buộc cứng, không chỉ là sở thích

Cách nhanh nhất để cải thiện kết quả từ vector-index-tuning là thay các mục tiêu mơ hồ bằng con số cụ thể:

“dưới 75ms p95”
“dưới 64GB RAM”
“recall@20 phải giữ trên 0.9”
“có thể chấp nhận rebuild hằng đêm”
“ingest diễn ra liên tục, không thể rebuild offline kéo dài”

Các ràng buộc định lượng sẽ buộc skill đưa ra khuyến nghị rõ ràng hơn.

Cung cấp baseline hiện tại và mức cải thiện mục tiêu

Input tốt hơn:

Current HNSW index uses 92GB RAM, p95 is 110ms, recall@10 is 0.93. Need 30% lower memory and under 85ms p95.

Nhờ vậy, skill có thể suy luận từ một điểm xuất phát thực tế. Nếu không có metric baseline, output của nó sẽ quá chung để có thể tin cậy.

Hãy yêu cầu một benchmark matrix, không phải một đáp án duy nhất

Một prompt giá trị cao là:

Use the vector-index-tuning skill to produce a 6-run benchmark matrix prioritized by information gain, not exhaustiveness.

Cách này thường đem lại kết quả thực tế tốt hơn so với việc hỏi “best settings”, vì hiệu năng vector index phụ thuộc rất mạnh vào phân phối dữ liệu và workload.

Tách chất lượng retrieval khỏi chất lượng câu trả lời cuối cùng

Trong RAG, người dùng thường đánh giá thay đổi ở index chỉ dựa trên chất lượng câu trả lời đầu ra. Muốn cải thiện kết quả, hãy yêu cầu skill tách riêng:

recall retrieval thô
độ trễ
mức dùng bộ nhớ
tác động của reranker phía sau
chất lượng ở tác vụ cuối

Điều này giúp tránh tuning quá mức cho một metric mà ứng dụng của bạn thực ra không tối ưu theo nó.

Nêu rõ filtering có làm thay đổi search space hay không

Nếu hệ thống của bạn áp dụng bộ lọc theo tenant, ngôn ngữ, ngày tháng hoặc sản phẩm trước hoặc trong lúc search, hãy nói rõ điều đó. Filtered search có thể làm thay đổi đáng kể quyết định chọn index tối ưu. Điều này đặc biệt quan trọng với vector-index-tuning for RAG Workflows trong các hệ thống multi-tenant.

Những failure mode phổ biến cần để ý

Các sai lầm hay gặp nhất là:

tăng efSearch mà không kiểm tra xem chất lượng graph HNSW mới có phải nút thắt thật sự hay không
nén quá mạnh trước khi xác lập ngưỡng recall tối thiểu
so sánh các index trên những tập query khác nhau
chọn IVF/PQ chỉ vì quy mô lớn mà không xác thực phân phối query
bỏ qua chi phí build và refresh

Đây chính là những trường hợp mà một cấu hình tưởng như nhanh hơn lại cho kết quả kém trong production.

Cách lặp tiếp sau output đầu tiên

Sau khuyến nghị đầu tiên, hãy phản hồi lại bằng một bảng ngắn gọn gồm:

cấu hình
RAM
thời gian build
độ trễ p95
recall@k
ghi chú về lỗi retrieval

Sau đó hỏi:

Revise the tuning plan using these measurements and eliminate dominated configurations.

Chính vòng lặp lần hai này là lúc skill cho thấy giá trị vượt trội so với một prompt hỏi một lần rồi thôi.

Tăng độ tin cậy bằng cách yêu cầu ngôn ngữ đánh đổi thật rõ

Hãy yêu cầu skill gắn nhãn cho từng khuyến nghị theo các mức:

likely win
risky but high upside
low effort
requires benchmark confirmation

Cách này giúp bạn ưu tiên thay đổi dễ hơn và giảm nguy cơ bê nguyên một gợi ý chỉ đúng trong điều kiện lý tưởng.

Kết hợp skill với ground truth exact-search của riêng bạn

Nâng cấp tốt nhất cho vector-index-tuning usage là có một benchmark exact-search nhỏ trên các query mang tính đại diện. Chỉ cần vài trăm query có nhãn hoặc được đánh giá bằng brute-force cũng đã cải thiện đáng kể chất lượng quyết định, vì mọi khuyến nghị tuning đều có thể kiểm tra lại trên một baseline recall đã biết.

Thành công trông như thế nào

Một lần dùng vector-index-tuning tốt nên kết thúc với:

một lựa chọn họ index có cơ sở
một danh sách tham số rút gọn
bằng chứng benchmark về recall, tốc độ và bộ nhớ
một quyết định triển khai phù hợp với workload RAG của bạn

Nếu sau cùng bạn vẫn chưa có một kế hoạch có thể kiểm chứng, hãy yêu cầu skill bớt mô tả chung và đi vào vận hành cụ thể hơn.

Đánh giá & nhận xét

Chưa có đánh giá nào

Chia sẻ nhận xét của bạn

Đăng nhập để chấm điểm và để lại nhận xét cho skill này.

0/10000

Nhận xét mới nhất

Đang lưu...

Thêm skill trong danh mục này

iterative-retrieval

bởi affaan-m

iterative-retrieval là một mẫu quy trình giúp tinh chỉnh dần việc truy xuất ngữ cảnh trong công việc theo kiểu tác nhân. Nó giúp subagents tránh lấy quá nhiều hoặc quá ít ngữ cảnh, nên đặc biệt hữu ích cho cách dùng iterative-retrieval, các quyết định cài đặt, và iterative-retrieval cho Workflow Automation.

Workflow Automation

Yêu thích 0GitHub 156.2k

azure-ai-contentunderstanding-py

bởi microsoft

azure-ai-contentunderstanding-py là skill Python cho Azure AI Content Understanding. Nó trích xuất nội dung có cấu trúc từ tài liệu, hình ảnh, âm thanh và video để phục vụ RAG và tự động hóa. Hãy dùng khi bạn cần trích xuất đa phương thức đáng tin cậy, xác thực Azure và đầu ra lặp lại, sẵn sàng cho pipeline.

RAG Workflows

Yêu thích 0GitHub 2.2k

azure-search-documents-ts

bởi microsoft

azure-search-documents-ts giúp lập trình viên backend xây dựng giải pháp Azure AI Search với SDK @azure/search-documents. Dùng nó cho tạo index, tải tài liệu lên, tìm kiếm theo từ khóa, vector, hybrid và semantic, cùng với cấu hình xác thực và biến môi trường. Đây là hướng dẫn azure-search-documents-ts thực tế dành cho phát triển backend.

Backend Development

Yêu thích 0GitHub 2.3k

hybrid-search-implementation

bởi wshobson

Skill hybrid-search-implementation hướng dẫn cách kết hợp truy xuất vector và từ khóa bằng RRF, linear fusion, reranking và các mẫu cascade cho hệ thống RAG và tìm kiếm.

RAG Workflows

Yêu thích 0GitHub 32.6k

embedding-strategies

bởi wshobson

embedding-strategies giúp bạn chọn và tối ưu mô hình embedding cho tìm kiếm ngữ nghĩa và quy trình RAG, với hướng dẫn thực tế về chia đoạn, đánh đổi giữa các mô hình, nội dung đa ngôn ngữ và đánh giá chất lượng truy xuất.

RAG Workflows

Yêu thích 0GitHub 32.6k

rag-implementation

bởi wshobson

rag-implementation là một skill thực tiễn để lập kế hoạch hệ thống RAG với vector database, embeddings, các mô hình retrieval và quy trình trả lời có căn cứ. Hãy dùng skill này để so sánh các lựa chọn trong stack, định hình quyết định kiến trúc, đồng thời định hướng cài đặt và sử dụng cho hỏi đáp tài liệu, trợ lý tri thức và tìm kiếm ngữ nghĩa.

RAG Workflows

Yêu thích 0GitHub 32.6k

langchain-architecture

bởi wshobson

langchain-architecture là hướng dẫn thiết kế để xây dựng ứng dụng LangChain 1.x và LangGraph. Hãy dùng skill này để chọn giữa chains, agents, retrieval, memory và các mẫu điều phối có trạng thái trước khi bắt tay vào triển khai.

Agent Orchestration

Yêu thích 0GitHub 32.6k

similarity-search-patterns

bởi wshobson

similarity-search-patterns giúp bạn chọn distance metric, loại index và các mẫu hybrid retrieval cho semantic search và quy trình RAG. Hãy dùng skill này để lên kế hoạch cho các đánh đổi của vector search trong môi trường production về recall, latency và khả năng mở rộng.

RAG Workflows

Yêu thích 0GitHub 32.6k

frontend-design

bởi anthropics

frontend-design giúp biến ý tưởng UI mơ hồ thành giao diện khác biệt, sẵn sàng production, với frontend code thực tế, định hướng thẩm mỹ rõ ràng và ít kiểu AI chung chung.

UI Design

Yêu thích 1GitHub 105.2k

create-colleague

bởi titanwings

create-colleague biến tài liệu đồng nghiệp, chat, email, ảnh chụp màn hình, dữ liệu Feishu và DingTalk thành một AI skill có thể chỉnh sửa, với đầu ra tách riêng phần công việc và chân dung, kèm các luồng cập nhật để tiếp tục tinh chỉnh theo thời gian.

Skill Authoring

Yêu thích 1GitHub 747

hyperframes

bởi heygen-com

hyperframes là một skill quy trình để xây dựng các bố cục video dựa trên HTML trong HyperFrames. Hãy dùng nó cho thẻ tiêu đề, lớp phủ, phụ đề, lồng tiếng, chuyển động phản ứng theo âm thanh và chuyển cảnh khi bạn cần hyperframes có cấu trúc, ưu tiên mã nguồn cho Video Editing. Skill này đề cao quyết định về bố cục, thời gian và hoạt ảnh hơn là các yêu cầu video chung chung chỉ dựa trên prompt.

Video Editing

Yêu thích 0GitHub 2.7k

kreuzberg

bởi kreuzberg-dev

Kreuzberg skill giúp bạn cài đặt và dùng Kreuzberg để trích xuất tài liệu trên hơn 91 định dạng, bao gồm PDF, file Office, hình ảnh, HTML, email và archive. Nội dung bao phủ các quy trình với Python, Node.js/TypeScript, Rust và CLI cho OCR, bảng biểu, metadata, xử lý hàng loạt và hướng dẫn phân tích cú pháp thực tế.

PDF Processing

Yêu thích 0GitHub 0

skill-creator

bởi anthropics

skill-creator là meta-skill soạn thảo skill, dùng để tạo skill mới, chỉnh sửa file SKILL.md hiện có, chạy eval, so sánh các biến thể và cải thiện mô tả trigger bằng script trong repo cùng công cụ review.

Skill Authoring

Yêu thích 2GitHub 105.1k

azure-identity-py

bởi microsoft

azure-identity-py giúp thiết lập xác thực Azure trong Python với Microsoft Entra ID. Hãy dùng skill này để chọn giữa DefaultAzureCredential, managed identity hoặc xác thực bằng service principal, cấu hình biến môi trường và xử lý các vấn đề về kiểm soát truy cập cũng như chuỗi credential. Hướng dẫn cài đặt, mẫu sử dụng và các lưu ý thiết lập thực tế đều được xây dựng dựa trên file skill của repo.

Access Control

Yêu thích 0GitHub 2.2k

claude-api

bởi anthropics

claude-api là kỹ năng thực tiễn để cài đặt và sử dụng Claude API cùng các Anthropic SDK. Nội dung giúp lập trình viên chọn đúng SDK hoặc dùng HTTP thô, tìm tài liệu theo ngôn ngữ, và triển khai streaming, tool use, files, batches cùng xử lý lỗi với ít phỏng đoán hơn.

API Development

Yêu thích 0GitHub 105k

wrangler

bởi cloudflare

wrangler skill giúp bạn tìm đúng lệnh CLI, cấu trúc cấu hình và các bước triển khai cho Cloudflare Workers. Hãy dùng nó khi cần tra cứu cách dùng wrangler, kiểm tra cài đặt wrangler, hoặc cần một hướng dẫn wrangler thực tế khi xây dựng hay phát hành Workers cho Backend Development.

Backend Development

Yêu thích 0GitHub 1.3k