Prompt Injection

Prompt Injection taxonomy generated by the site skill importer.

4 skills
A
security-scan

bởi affaan-m

Kỹ năng security-scan kiểm tra cấu hình .claude/ của Claude Code để phát hiện bí mật bị lộ, thiết lập MCP rủi ro, hướng dẫn dễ bị chèn lệnh, các cờ bypass nguy hiểm, và định nghĩa agent hoặc hook yếu bằng AgentShield. Dùng nó để kiểm tra bảo mật lặp lại được trước khi commit hoặc onboard.

Security Audit
Yêu thích 0GitHub 156.3k
M
caveman

bởi mattpocock

caveman là một skill giao tiếp siêu cô đọng dành cho các phản hồi kỹ thuật ngắn gọn, tóm tắt và hỗ trợ gỡ lỗi. Skill này giữ nguyên ý nghĩa kỹ thuật, lược bỏ phần thừa và vẫn ở chế độ chủ động sau khi được kích hoạt cho đến khi bạn nói stop caveman hoặc normal mode. Phù hợp nhất cho Technical Writing, ghi chú review code, cập nhật sự cố và trao đổi qua lại nhanh hơn khi bạn đã nắm rõ chủ đề.

Technical Writing
Yêu thích 0GitHub 66k
G
gws-modelarmor

bởi googleworkspace

gws-modelarmor giúp bạn làm việc với Google Model Armor trong hệ sinh thái googleworkspace/cli. Dùng nó để làm sạch prompt, làm sạch phản hồi của model và tạo template với ít phải đoán mò hơn so với một prompt chung chung. Kỹ năng này được thiết kế cho các quy trình sử dụng lặp lại, có nhận biết chính sách và cho các luồng công việc Security Audit.

Security Audit
Yêu thích 0GitHub 25.5k
M
detecting-ai-model-prompt-injection-attacks

bởi mukul975

detecting-ai-model-prompt-injection-attacks là một skill an ninh mạng dùng để sàng lọc văn bản không đáng tin cậy trước khi nội dung đó đến LLM. Skill này kết hợp regex nhiều lớp, chấm điểm theo heuristic và phân loại dựa trên DeBERTa để phát hiện các tấn công prompt injection trực tiếp lẫn gián tiếp. Hữu ích cho kiểm tra đầu vào chatbot, nạp tài liệu và Threat Modeling.

Threat Modeling
Yêu thích 0GitHub 0
Prompt Injection