ai-prompt-engineering-safety-review

bởi github

ai-prompt-engineering-safety-review là kỹ năng kiểm tra prompt giúp rà soát prompt LLM về độ an toàn, thiên lệch, điểm yếu bảo mật và chất lượng đầu ra trước khi đưa vào production, đánh giá hoặc dùng cho khách hàng.

Stars27.8k

Yêu thích0

Bình luận0

Đã thêm31 thg 3, 2026

Danh mụcModel Evaluation

Lệnh cài đặt

npx skills add github/awesome-copilot --skill ai-prompt-engineering-safety-review

Điểm tuyển chọn

Kỹ năng này đạt 68/100, nghĩa là đủ điều kiện xuất hiện trong thư mục như một prompt review thực tế, có thể tái sử dụng, nhưng phù hợp hơn với vai trò mẫu phân tích dài dạng hướng dẫn hơn là một kỹ năng vận hành chặt chẽ. Repository thể hiện lượng nội dung quy trình đáng kể và mục tiêu rõ ràng xoay quanh an toàn prompt, thiên lệch, bảo mật và hiệu quả, nhưng phần hỗ trợ triển khai thực tế ngoài khung diễn giải bằng văn bản vẫn còn hạn chế.

68/100

Điểm mạnh

Trường hợp sử dụng rõ ràng: phần mô tả và mục tiêu nêu trực tiếp đây là kỹ năng review độ an toàn và cải thiện prompt.
Nội dung quy trình phong phú: SKILL.md dài, có cấu trúc với nhiều phần bao quát an toàn, thiên lệch, bảo mật và các khung đánh giá.
Dễ kích hoạt cho các tác vụ review diện rộng: agent có thể gọi kỹ năng này hợp lý khi được yêu cầu audit hoặc cải thiện một prompt liên quan đến rủi ro AI có trách nhiệm.

Điểm cần lưu ý

Cách thực thi vẫn thiên về diễn giải: không có script, ví dụ, code fence hay file hỗ trợ để giảm sự mơ hồ về cách định dạng đầu ra.
Độ rõ ràng cho quyết định cài đặt còn hạn chế do thiếu thông tin quick-start như ví dụ input/output, hướng dẫn gọi kỹ năng hoặc các bản review prompt trước/sau cụ thể.

Copilot Ai Llm Security Audit

Tổng quan

Tổng quan về skill ai-prompt-engineering-safety-review

ai-prompt-engineering-safety-review là một quy trình rà soát và cải thiện prompt dành cho những ai cần kiểm tra prompt LLM trước khi đưa vào production, đánh giá mô hình, công cụ nội bộ hoặc trợ lý hướng đến khách hàng. Mục tiêu của skill này không phải là tạo mới một ứng dụng hay policy từ đầu. Nhiệm vụ của nó là kiểm tra một prompt sẵn có để tìm rủi ro về an toàn, thiên lệch, điểm yếu bảo mật và chất lượng đầu ra, sau đó đề xuất hướng chỉnh sửa rõ ràng và an toàn hơn.

Skill này phù hợp nhất với ai

Skill này đặc biệt phù hợp với:

prompt engineer đang rà soát system prompt hoặc các luồng người dùng có tác động cao
đội model evaluation cần xây dựng prompt baseline có thể kiểm thử
chủ sở hữu sản phẩm AI cần một bước safety review có cấu trúc trước khi rollout
developer muốn nhiều hơn một câu trả lời kiểu chung chung như “improve this prompt”

Nếu bạn đang cân nhắc giữa nhiều lựa chọn, ai-prompt-engineering-safety-review for Model Evaluation hữu ích nhất khi bạn đã có prompt nháp và muốn soi xét nó bằng một khung review chặt chẽ.

Skill này giúp bạn hoàn thành công việc gì

Phần lớn người dùng chọn ai-prompt-engineering-safety-review vì họ cần trả lời nhanh những câu hỏi rất thực tế:

Prompt này có khả năng tạo ra nội dung gây hại hoặc không tuân thủ yêu cầu không?
Nó có đưa vào các giả định thiên lệch, thiếu công bằng hoặc hành vi loại trừ không?
Người dùng có thể khai thác prompt này qua prompt injection hoặc chỉ dẫn mơ hồ không?
Nên viết lại prompt thế nào để vẫn giữ hiệu quả thực hiện tác vụ?

Vì vậy, skill này có giá trị hơn như một điểm kiểm tra trong quy trình review hơn là một công cụ brainstorm.

Điểm khác biệt so với một prompt rewrite thông thường

Một prompt rewrite thông thường thường chỉ tối ưu độ rõ ràng hoặc giọng điệu. ai-prompt-engineering-safety-review skill bổ sung một khung đánh giá đầy đủ hơn:

đánh giá an toàn
phát hiện và giảm thiểu thiên lệch
phân tích bảo mật và khả năng bị lạm dụng
xem xét hiệu quả song song với các yêu cầu về responsible AI
giải thích mang tính hướng dẫn, không chỉ đưa ra prompt đã viết lại

Khung đánh giá rộng hơn này đặc biệt quan trọng nếu prompt của bạn liên quan đến lĩnh vực có quy định chặt chẽ, trợ lý công khai cho người dùng, dữ liệu đầu vào nhạy cảm hoặc các tình huống có khả năng bị tấn công đối kháng.

Thực tế trong repository có gì

Về cấu trúc, skill này khá gọn: dấu hiệu từ repository cho thấy chỉ có một file SKILL.md, không có script hỗ trợ, rule hay tài liệu tham chiếu đi kèm. Điều đó giúp việc áp dụng trở nên đơn giản, nhưng cũng có nghĩa bạn nên kỳ vọng đây là một prompt review được tổ chức tốt, chứ không phải một framework đánh giá đóng gói sẵn với artifact, test hay automation.

Những đánh đổi chính khi áp dụng

Trước khi cài ai-prompt-engineering-safety-review, điểm đánh đổi chính khá rõ:

phù hợp cho review prompt có cấu trúc với con người trong vòng lặp
kém phù hợp hơn nếu bạn cần enforcement policy có thể tái lập, mã chấm điểm hoặc benchmark harness

Nói cách khác, skill này giúp giảm phỏng đoán trong lúc review, nhưng không thay thế hạ tầng red-teaming chính thức.

Cách dùng skill ai-prompt-engineering-safety-review

Bối cảnh cài đặt cho ai-prompt-engineering-safety-review

Cài skill từ repository bằng:

npx skills add github/awesome-copilot --skill ai-prompt-engineering-safety-review

Vì skill này dường như nằm trọn trong skills/ai-prompt-engineering-safety-review/SKILL.md, việc cài đặt chủ yếu là để đưa quy trình review đó vào agent của bạn, chứ không phải để kéo về các dependency cục bộ.

Hãy đọc file này trước

Bắt đầu với:

skills/ai-prompt-engineering-safety-review/SKILL.md

Không có file hỗ trợ nào hiện rõ trong thư mục skill này, nên chỉ cần đọc SKILL.md trước là đủ để nắm workflow dự kiến và các chiều review mà skill nhắm tới.

Skill cần đầu vào gì để hoạt động tốt

Chất lượng ai-prompt-engineering-safety-review usage phụ thuộc rất nhiều vào prompt bạn cung cấp. Hãy đưa vào:

nguyên văn prompt cần review
vai trò của prompt, chẳng hạn system prompt hay prompt tác vụ dùng lại nhiều lần
người dùng mục tiêu và use case
các ràng buộc về model hoặc platform nếu có liên quan
mức độ rủi ro, ví dụ sandbox nội bộ hay workflow public-facing
mọi yêu cầu bắt buộc mà prompt phải giữ nguyên

Nếu thiếu bối cảnh này, phần review rất dễ trở nên quá chung chung.

Cách tốt nhất để diễn đạt yêu cầu

Đừng chỉ nói:

“Review this prompt.”

Thay vào đó, hãy nêu mục tiêu và bối cảnh vận hành, ví dụ:

“Review this system prompt for a customer-support assistant used by the public. Focus on harmful advice risk, bias, prompt injection exposure, and places where refusal behavior is underspecified. Preserve the helpful troubleshooting behavior.”

Cách này tạo ra đầu ra có thể hành động tốt hơn vì skill có thể cân bằng giữa an toàn và hiệu quả thực hiện tác vụ.

Biến một mục tiêu thô thành yêu cầu review đầy đủ

Một yêu cầu sơ sài thường trông như sau:

“Make this prompt safer.”

Một yêu cầu tốt hơn theo ai-prompt-engineering-safety-review guide nên gồm:

đưa vào prompt hiện tại
nêu rõ tác vụ mà model phải hoàn thành
chỉ ra các failure mode rủi ro cao nhất
xác định điều gì tuyệt đối không được làm suy yếu
yêu cầu cả phần nhận xét lẫn prompt đã chỉnh sửa

Một mẫu thực tế:

Current prompt
Intended use
Audience
Top safety concerns
Known abuse cases
Required capabilities to preserve
Desired output format for recommendations

Workflow khuyến nghị trong thực tế

Một workflow thực tế cho ai-prompt-engineering-safety-review install và sử dụng hằng ngày:

Dán nguyên văn prompt hiện đang triển khai.
Nêu bối cảnh triển khai và kỳ vọng về hành vi của model.
Yêu cầu phân tích theo các chiều an toàn, thiên lệch, bảo mật và hiệu quả.
Yêu cầu một bản prompt đã chỉnh sửa với các thay đổi nêu rõ.
Chạy lượt review thứ hai trên prompt đã chỉnh sửa bằng chính skill này.
Kiểm thử prompt đã sửa với edge case và misuse case.

Lượt review thứ hai rất quan trọng vì các chỉnh sửa nhằm tăng an toàn có thể vô tình tạo ra điểm mơ hồ mới hoặc siết quá tay.

Những gì skill này review đặc biệt tốt

Dựa trên nội dung nguồn, skill này mạnh nhất khi bạn cần review có cấu trúc cho các vấn đề như:

nguy cơ phát sinh nội dung gây hại
rủi ro liên quan đến bạo lực, thù ghét và phân biệt đối xử
rủi ro thông tin sai lệch
nguy cơ hỗ trợ hoạt động phi pháp
vấn đề thiên lệch và công bằng
lỗ hổng bảo mật trong thiết kế prompt
hiệu quả của prompt sau khi áp dụng các chỉnh sửa về an toàn

Điều đó khiến skill này đặc biệt hữu ích cho system prompt, hướng dẫn agent, task template và các prompt dùng trong evaluation.

Khi prompt thông thường vẫn chưa đủ

Nếu bạn yêu cầu một model đa dụng “improve this prompt”, nó có thể chỉ viết lại cho mượt hơn mà bỏ sót:

các giả định rủi ro ngầm
chỉ dẫn quá mở, thiếu giới hạn
điều kiện từ chối mơ hồ
cách diễn đạt mang thiên kiến xã hội
bề mặt tấn công sinh ra từ cách viết quá dễ dãi

ai-prompt-engineering-safety-review skill đáng để dùng khi những thiếu sót đó có thể gây tổn thất đáng kể.

Ví dụ đầu vào mạnh

Hãy dùng đầu vào như sau:

“Review the following system prompt for an educational health chatbot. It should provide general wellness information, avoid diagnosis, avoid emergency triage mistakes, and respond safely to self-harm, medication, or illegal drug questions. Identify safety, bias, misinformation, and prompt-injection weaknesses. Then rewrite the prompt while keeping the educational tone.”

Vì sao ví dụ này hiệu quả:

lĩnh vực được nêu rõ
ranh giới hành vi rõ ràng
các chủ đề rủi ro cao được chỉ mặt
hành vi cần giữ nguyên được xác định
đầu ra yêu cầu có thể áp dụng ngay

Ví dụ đầu vào yếu

Đầu vào yếu thường kiểu:

“Can you optimize this prompt?”

Vì sao nó cho kết quả kém:

không có mô hình rủi ro
không có bối cảnh triển khai
không có yêu cầu nào cần được bảo toàn
không có các chiều review cụ thể
không kỳ vọng prompt sửa lại kèm lý do

Mẹo thực tế giúp cải thiện chất lượng đầu ra

Để có ai-prompt-engineering-safety-review usage tốt hơn, hãy yêu cầu skill tạo ra:

phần tóm tắt rủi ro trước
các nhóm vấn đề kèm mức độ nghiêm trọng
chính xác dòng hoặc cụm từ có vấn đề
cách viết lại cụ thể, không chỉ lời khuyên trừu tượng
một prompt cuối cùng đã được cải thiện
test case để kiểm tra bản sửa

Cách này biến skill từ một công cụ góp ý thành một workflow biên tập có thể dùng ngay.

Câu hỏi thường gặp về skill ai-prompt-engineering-safety-review

ai-prompt-engineering-safety-review có phù hợp cho người mới bắt đầu không

Có, miễn là bạn đã có prompt cần review. Skill này cung cấp cấu trúc mà người mới thường còn thiếu. Nó kém hữu ích hơn nếu bạn vẫn đang quyết định ứng dụng của mình nên làm gì, vì đây là công cụ thiên về review hơn là ideation.

Khi nào nên dùng skill này thay vì một công cụ hỗ trợ prompt chung chung

Hãy dùng ai-prompt-engineering-safety-review khi lỗi prompt có thể gây ra vấn đề về niềm tin, tuân thủ, thương hiệu hoặc tổn hại cho người dùng. Nếu bạn chỉ cần làm mượt câu chữ cho một tác vụ nội bộ rủi ro thấp, một prompt rewrite tổng quát có thể đã đủ.

Skill này có thay thế model evaluation không

Không. ai-prompt-engineering-safety-review for Model Evaluation nên được xem là một bước review chất lượng đầu vào và rủi ro của prompt. Nó giúp cải thiện prompt trước hoặc trong quá trình evaluation, nhưng không thay thế việc thiết kế benchmark, chấm điểm hay chạy kiểm thử đối kháng.

Có cần thiết lập gì đặc biệt ngoài bước cài đặt không

Hầu như không. Dấu hiệu từ repository cho thấy không có script hay tài sản hỗ trợ nào, nên phần setup khá đơn giản. Phần khó hơn là cung cấp đủ bối cảnh để skill tạo ra một bản review chất lượng.

Ranh giới của skill này là gì

Skill này có thể chỉ ra những điểm yếu tiềm tàng về an toàn, thiên lệch và bảo mật trong cách viết prompt. Nó không thể đảm bảo tuân thủ policy, đủ chắc về mặt pháp lý hoặc hành vi ổn định trên mọi model và môi trường triển khai.

Khi nào skill này là lựa chọn kém phù hợp

Nên bỏ qua hoặc dùng thêm công cụ khác nếu bạn cần:

automated policy linting
programmatic red-team suites
versioned scoring rubrics
review pháp lý hoặc lâm sàng theo miền chuyên biệt
eval pipeline có metric và khả năng tái lập

Có thể dùng skill này cho cả system prompt và user prompt không

Có. Skill này đặc biệt hữu ích với system prompt, task template tái sử dụng và các chỉ dẫn khác có ảnh hưởng rộng đến hành vi model. Với user prompt chỉ dùng một lần, công sức review chỉ thực sự đáng bỏ ra khi tác vụ nhạy cảm hoặc được lặp lại ở quy mô lớn.

Cách cải thiện skill ai-prompt-engineering-safety-review

Cung cấp bối cảnh vận hành đầy đủ hơn

Cách nhanh nhất để cải thiện kết quả từ ai-prompt-engineering-safety-review là cung cấp những bối cảnh mà bản thân prompt thô không thể tự thể hiện:

người dùng là ai
những lỗi nào là nghiêm trọng nhất
model bắt buộc phải từ chối điều gì
model vẫn cần làm tốt điều gì
prompt này hướng ra công khai hay chỉ dùng nội bộ

Nhờ vậy, skill có thể đưa ra các đánh đổi hợp lý hơn thay vì mặc định sang kiểu cẩn trọng chung chung.

Yêu cầu chẩn đoán theo từng dòng

Nhiều người chỉ yêu cầu một bản prompt viết lại. Kết quả thường tốt hơn nếu bạn yêu cầu:

cụm từ rủi ro
vì sao nó rủi ro
phương án thay thế an toàn hơn
tác động dự kiến đến chất lượng thực hiện tác vụ

Cách này giúp quá trình review có thể kiểm tra lại và dễ triển khai hơn.

Tách riêng vấn đề an toàn và vấn đề hiệu quả

Một failure mode phổ biến là trộn mọi góp ý vào cùng một danh sách. Hãy yêu cầu skill tách kết quả thành:

rủi ro an toàn và lạm dụng
rủi ro thiên lệch và công bằng
rủi ro bảo mật hoặc injection
vấn đề về độ rõ ràng và hiệu quả

Nhờ đó, các chỉnh sửa kiểu “an toàn hơn nhưng làm tệ hơn” sẽ khó lọt qua mà không bị phát hiện.

Cung cấp các abuse case đã biết

Nếu bạn đã biết trước những kiểu tấn công hoặc kết quả xấu có khả năng xảy ra, hãy đưa chúng vào. Ví dụ:

người dùng cố vượt qua cơ chế từ chối
yêu cầu chỉ dẫn gây hại
nỗ lực moi ra đầu ra mang tính phân biệt
prompt dụ model trả lời với độ chắc chắn sai lệch

Khi có các mẫu misuse cụ thể để đối chiếu, skill sẽ cho nhận xét sắc nét hơn nhiều.

Yêu cầu test prompt sau khi viết lại

Một prompt được cải thiện sẽ hữu ích hơn nếu skill đồng thời đưa ra các trường hợp kiểm chứng như:

yêu cầu người dùng bình thường
yêu cầu mơ hồ
nỗ lực jailbreak mang tính đối kháng
các biến thể câu chữ nhạy cảm về công bằng
các ca ở ranh giới policy

Đây là một trong những cách tốt nhất để biến đầu ra của ai-prompt-engineering-safety-review guide thành một vòng review thực sự.

Cẩn thận với việc sửa quá tay

Một vấn đề phổ biến sau khi chỉnh sửa để tăng an toàn là prompt trở nên:

từ chối quá rộng
quá mơ hồ về những hỗ trợ được phép
quá dè dặt nên không còn hoàn thành tốt tác vụ ban đầu

Khi gặp tình huống này, hãy yêu cầu một bản viết lại hẹp hơn: vẫn giữ các hành vi an toàn được phép, đồng thời chỉ siết chặt đúng những phần rủi ro.

Lặp lại trên prompt đã sửa, không chỉ prompt ban đầu

Sau lượt review đầu tiên, hãy gửi lại prompt đã sửa và hỏi:

có điểm mơ hồ mới nào được tạo ra không
có năng lực hữu ích nào bị mất đi không
những rủi ro nào vẫn chưa được xử lý
còn edge case nào cần kiểm thử thêm

Workflow review vòng hai này thường cho ra prompt cuối cùng tốt hơn so với một lần viết lại lớn duy nhất.

Dùng ràng buộc theo miền khi cần

Nếu prompt của bạn dùng cho healthcare, finance, education, legal, HR hoặc trust-and-safety, hãy nói rõ điều đó. ai-prompt-engineering-safety-review hoạt động hiệu quả hơn khi bối cảnh ngành làm thay đổi ý nghĩa thực tế của “safe” và “acceptable”.

Đặt kỳ vọng áp dụng cho đúng

Hãy dùng skill này như một người review có cấu trúc, không phải một thẩm quyền kết luận cuối cùng. Nó mạnh nhất khi đi cùng với:

yêu cầu sản phẩm của bạn
các ràng buộc policy của bạn
các trường hợp evaluation của bạn
review thủ công cho các triển khai rủi ro cao

Đặt kỳ vọng như vậy sẽ dẫn đến quyết định tốt hơn so với việc mong một lượt review duy nhất có thể chứng nhận prompt đã an toàn cho production.

Đánh giá & nhận xét

Chưa có đánh giá nào

Chia sẻ nhận xét của bạn

Đăng nhập để chấm điểm và để lại nhận xét cho skill này.

0/10000

Nhận xét mới nhất

Đang lưu...

Thêm skill trong danh mục này

evaluation-methodology

bởi wshobson

Skill evaluation-methodology giải thích cách chấm điểm PluginEval cho Model Evaluation, bao gồm các lớp đánh giá, rubric, điểm tổng hợp, ngưỡng badge và hướng dẫn thực tế để đọc kết quả cũng như cải thiện các khía cạnh còn yếu.

Model Evaluation

Yêu thích 0GitHub 32.6k

healthcare-eval-harness

bởi affaan-m

healthcare-eval-harness là một bộ đánh giá an toàn bệnh nhân cho các triển khai ứng dụng y tế. Nó giúp nhóm kiểm tra độ chính xác của CDSS, nguy cơ lộ PHI, tính toàn vẹn dữ liệu, hành vi quy trình lâm sàng và mức độ tuân thủ tích hợp trước khi phát hành. Các lỗi nghiêm trọng sẽ chặn triển khai, vì vậy healthcare-eval-harness hữu ích cho Model Evaluation và các cổng an toàn CI.

Model Evaluation

Yêu thích 0GitHub 156.2k

eval-harness

bởi affaan-m

Skill eval-harness là một khung đánh giá chính thức cho các phiên Claude Code và quy trình phát triển theo eval. Nó giúp bạn xác định tiêu chí đạt/không đạt, xây dựng các eval về năng lực và hồi quy, đồng thời đo độ tin cậy của agent trước khi triển khai các thay đổi về prompt hoặc workflow.

Model Evaluation

Yêu thích 0GitHub 156.1k

agent-eval

bởi affaan-m

agent-eval là skill dùng để benchmark các coding agent theo kiểu đối đầu trên những tác vụ có thể tái lập, so sánh tỷ lệ pass, chi phí, thời gian và độ ổn định. Hãy dùng skill agent-eval để đánh giá Claude Code, Aider, Codex hoặc agent khác ngay trong repo của bạn với cơ sở rõ ràng hơn nhiều so với cách prompt thủ công, rời rạc.

Model Evaluation

Yêu thích 0GitHub 156k

huggingface-community-evals

bởi huggingface

huggingface-community-evals giúp bạn chạy đánh giá model trên Hugging Face Hub ngay trên máy cục bộ với inspect-ai hoặc lighteval. Dùng khi cần chọn backend, chạy smoke test, và xem hướng dẫn thực tế cho vLLM, Transformers hoặc accelerate. Không phù hợp cho điều phối HF Jobs, tạo PR cho model card, xuất bản .eval_results, hay tự động hóa community-evals.

Model Evaluation

Yêu thích 0GitHub 10.4k

huggingface-best

bởi huggingface

Kỹ năng huggingface-best giúp bạn tìm model phù hợp nhất cho một tác vụ bằng cách kiểm tra bảng xếp hạng benchmark trên Hugging Face và lọc theo giới hạn thiết bị cũng như kích thước model. Hãy dùng khi cần gợi ý model cho lập trình, suy luận, chat, OCR, RAG, giọng nói, thị giác máy tính hoặc tác vụ đa phương thức, và bạn muốn một danh sách rút gọn thực dụng thay vì một danh sách model chung chung.

Model Evaluation

Yêu thích 0GitHub 10.4k

libafl

bởi trailofbits

Skill libafl giúp bạn lập kế hoạch và xây dựng các fuzzer mô-đun bằng LibAFL cho target tùy biến, chiến lược mutation riêng và quy trình kiểm thử bảo mật. Dùng hướng dẫn libafl này để đi từ thông tin target đến một harness thực tế, mô hình feedback và kế hoạch chạy với ít giả định hơn.

Security Audit

Yêu thích 0GitHub 5k

evaluation

bởi muratcankoylan

Skill evaluation giúp bạn thiết kế và chạy đánh giá agent cho các hệ thống không xác định. Dùng cho lập kế hoạch cài đặt evaluation, xây dựng rubric, kiểm tra hồi quy, thiết lập quality gate và evaluation cho Skill Testing. Skill này phù hợp với quy trình LLM-as-judge, chấm điểm đa chiều và các nhu cầu evaluation thực tế khi bạn cần kết quả có thể lặp lại.

Skill Testing

Yêu thích 0GitHub 0

judge-with-debate

bởi NeoLabHQ

judge-with-debate đánh giá các giải pháp thông qua tranh luận đa tác nhân có cấu trúc, sử dụng một đặc tả chung, phản biện dựa trên bằng chứng và tối đa 3 vòng để đi đến đồng thuận. Kỹ năng này rất phù hợp cho code review, đánh giá theo rubric, và quy trình judge-with-debate trong Multi-Agent Systems.

Multi-Agent Systems

Yêu thích 0GitHub 982

gws-modelarmor

bởi googleworkspace

gws-modelarmor giúp bạn làm việc với Google Model Armor trong hệ sinh thái googleworkspace/cli. Dùng nó để làm sạch prompt, làm sạch phản hồi của model và tạo template với ít phải đoán mò hơn so với một prompt chung chung. Kỹ năng này được thiết kế cho các quy trình sử dụng lặp lại, có nhận biết chính sách và cho các luồng công việc Security Audit.

Security Audit

Yêu thích 0GitHub 25.5k

analyzing-campaign-attribution-evidence

bởi mukul975

analyzing-campaign-attribution-evidence giúp analyst cân nhắc độ chồng lấn hạ tầng, mức độ nhất quán với ATT&CK, độ tương đồng của malware, thời điểm và dấu vết ngôn ngữ để đưa ra kết luận quy kết chiến dịch có cơ sở vững chắc. Dùng hướng dẫn analyzing-campaign-attribution-evidence này cho CTI, phân tích sự cố và rà soát Security Audit.

Security Audit

Yêu thích 0GitHub 6.1k

detecting-ai-model-prompt-injection-attacks

bởi mukul975

detecting-ai-model-prompt-injection-attacks là một skill an ninh mạng dùng để sàng lọc văn bản không đáng tin cậy trước khi nội dung đó đến LLM. Skill này kết hợp regex nhiều lớp, chấm điểm theo heuristic và phân loại dựa trên DeBERTa để phát hiện các tấn công prompt injection trực tiếp lẫn gián tiếp. Hữu ích cho kiểm tra đầu vào chatbot, nạp tài liệu và Threat Modeling.

Threat Modeling

Yêu thích 0GitHub 0

llm-evaluation

bởi wshobson

Dùng kỹ năng llm-evaluation để thiết kế kế hoạch đánh giá có thể lặp lại cho ứng dụng LLM, prompt, hệ thống RAG và các thay đổi mô hình với metric, đánh giá thủ công, benchmarking và kiểm tra hồi quy.

Model Evaluation

Yêu thích 0GitHub 32.6k

agentic-eval

bởi github

agentic-eval là một skill GitHub Copilot minh họa cách xây dựng các vòng lặp đánh giá cho đầu ra AI bằng reflection, phê bình theo rubric và các mô hình evaluator-optimizer.

Model Evaluation

Yêu thích 0GitHub 27.8k

ml-pipeline-workflow

bởi wshobson

ml-pipeline-workflow là hướng dẫn thực tiễn để thiết kế pipeline MLOps đầu-cuối cho chuẩn bị dữ liệu, huấn luyện, kiểm định, triển khai và giám sát, kèm các mẫu điều phối giúp tự động hóa quy trình lặp lại một cách ổn định.

Workflow Automation

Yêu thích 0GitHub 0

frontend-design

bởi anthropics

frontend-design giúp biến ý tưởng UI mơ hồ thành giao diện khác biệt, sẵn sàng production, với frontend code thực tế, định hướng thẩm mỹ rõ ràng và ít kiểu AI chung chung.

UI Design

Yêu thích 1GitHub 105.2k