ai-prompt-engineering-safety-review

von github

ai-prompt-engineering-safety-review ist eine Skill zur Prompt-Prüfung, mit der LLM-Prompts vor dem Produktiveinsatz, vor Evaluationen oder vor kundennahen Anwendungen auf Sicherheit, Bias, Sicherheitslücken und Ausgabequalität überprüft werden.

Stars27.8k

Favoriten0

Kommentare0

Hinzugefügt31. März 2026

KategorieModel Evaluation

Installationsbefehl

npx skills add github/awesome-copilot --skill ai-prompt-engineering-safety-review

Kurationswert

Diese Skill erreicht 68/100. Damit ist sie für Verzeichnisnutzer als echte, wiederverwendbare Review-Vorlage aufführbar, eignet sich aber eher als ausführliches Analyse-Template als als eng gefasste operative Skill. Das Repository bietet umfangreiche schriftliche Workflow-Inhalte und einen klaren Fokus auf Prompt-Sicherheit, Bias, Security und Wirksamkeit, liefert jedoch abseits des textlichen Rahmens nur begrenzte praktische Ausführungshilfen.

68/100

Stärken

Klarer Anwendungsfall: Beschreibung und Zielsetzung positionieren die Skill eindeutig als Werkzeug zur Prüfung und Verbesserung von Prompt-Sicherheit.
Umfangreiche Workflow-Inhalte: SKILL.md ist lang, klar strukturiert und deckt in mehreren Abschnitten Sicherheit, Bias, Security und Evaluations-Frameworks ab.
Gut auslösbar für allgemeine Review-Aufgaben: Ein Agent kann sie plausibel einsetzen, wenn Prompts im Hinblick auf Responsible-AI-Risiken geprüft oder verbessert werden sollen.

Hinweise

Die Ausführung bleibt stark textlastig: Es gibt keine Skripte, Beispiele, Code-Blöcke oder unterstützende Dateien, die Unklarheiten bei Format und Struktur der Ausgaben reduzieren würden.
Die Installationsentscheidung wird durch fehlende Quick-Start-Details erschwert, etwa Eingabe-/Ausgabebeispiele, Hinweise zur Invocation oder konkrete Prompt-Reviews mit Vorher-/Nachher-Vergleich.

Copilot Ai Llm Security Audit

Überblick

Überblick über den Skill ai-prompt-engineering-safety-review

Der Skill ai-prompt-engineering-safety-review ist ein Workflow zur Prüfung und Verbesserung von Prompts für Teams, die einen LLM-Prompt vor dem Einsatz in Produktion, Evaluation, internen Tools oder kundenorientierten Assistenten überprüfen müssen. Er ist nicht dafür gedacht, eine neue App oder Richtlinie von Grund auf zu erstellen. Seine Aufgabe ist es, einen bestehenden Prompt auf Sicherheits-, Bias-, Security- und Output-Qualitätsrisiken zu prüfen und anschließend einen sichereren und klareren Überarbeitungspfad vorzuschlagen.

Für wen dieser Skill am besten geeignet ist

Dieser Skill passt besonders gut für:

Prompt Engineers, die System Prompts oder wirkungsstarke User Flows prüfen
Model-Evaluation-Teams, die testbare Prompt-Baselines aufbauen
AI Product Owner, die vor dem Rollout ein strukturiertes Safety-Review brauchen
Entwickler, die mehr wollen als eine generische Antwort vom Typ „improve this prompt“

Wenn Sie Optionen vergleichen, ist ai-prompt-engineering-safety-review for Model Evaluation vor allem dann sinnvoll, wenn bereits ein Prompt-Entwurf vorliegt und Sie ihn mit einer disziplinierten Review-Perspektive bewerten möchten.

Welche Aufgabe der Skill für Sie erledigt

Die meisten nutzen ai-prompt-engineering-safety-review, weil sie schnell praktische Fragen beantworten müssen:

Führt dieser Prompt wahrscheinlich zu schädlichen oder nicht konformen Ausgaben?
Führt er Bias, unfaire Annahmen oder ausschließendes Verhalten ein?
Können Nutzer ihn über Prompt Injection oder mehrdeutige Anweisungen ausnutzen?
Wie sollte der Prompt umgeschrieben werden, ohne die Aufgabenleistung zu verschlechtern?

Damit ist dieser Skill als Review-Checkpoint wertvoller als als Brainstorming-Werkzeug.

Was ihn von einem normalen Prompt-Rewrite unterscheidet

Ein normales Rewrite optimiert meist nur auf Klarheit oder Tonalität. Der ai-prompt-engineering-safety-review skill erweitert das um einen umfassenderen Bewertungsrahmen:

Sicherheitsbewertung
Erkennung und Minderung von Bias
Analyse von Security- und Misuse-Risiken
Review der Wirksamkeit zusammen mit Responsible-AI-Aspekten
nachvollziehbare Begründung statt nur eines umgeschriebenen Prompts

Dieser breitere Rahmen ist besonders wichtig, wenn Ihr Prompt regulierte Bereiche, öffentlich zugängliche Assistenten, sensible Nutzereingaben oder adversariale Nutzung betrifft.

Was tatsächlich im Repository enthalten ist

Strukturell ist dieser Skill schlank: Laut Repository gibt es nur eine einzelne Datei SKILL.md und keine Helper-Skripte, Regeln oder Referenzdokumente. Das macht die Einführung einfach, Sie sollten den Skill aber eher als gut strukturierten Review-Prompt verstehen und nicht als fertiges Evaluations-Framework mit Artefakten, Tests oder Automatisierung.

Zentrale Trade-offs bei der Einführung

Bevor Sie ai-prompt-engineering-safety-review installieren, ist der wichtigste Trade-off klar:

gut geeignet für strukturiertes Human-in-the-Loop Prompt Review
weniger geeignet, wenn Sie reproduzierbare Policy-Enforcement-Mechanismen, Scoring-Code oder Benchmark-Harnesses brauchen

Anders gesagt: Der Skill reduziert Unsicherheit im Review-Prozess, ersetzt aber keine formale Red-Teaming-Infrastruktur.

So verwenden Sie den Skill ai-prompt-engineering-safety-review

Installationskontext für ai-prompt-engineering-safety-review

Installieren Sie den Skill aus dem Repository mit:

npx skills add github/awesome-copilot --skill ai-prompt-engineering-safety-review

Da der Skill offenbar vollständig in skills/ai-prompt-engineering-safety-review/SKILL.md liegt, geht es bei der Installation vor allem darum, diesen Review-Workflow für Ihren Agent verfügbar zu machen, nicht darum, lokale Abhängigkeiten einzuziehen.

Diese Datei sollten Sie zuerst lesen

Starten Sie mit:

skills/ai-prompt-engineering-safety-review/SKILL.md

In diesem Skill-Ordner sind keine zusätzlichen Support-Dateien sichtbar. Deshalb reicht es, zuerst SKILL.md zu lesen, um den vorgesehenen Workflow und die Review-Dimensionen zu verstehen.

Welche Eingaben der Skill braucht, um gut zu funktionieren

Die Qualität bei der ai-prompt-engineering-safety-review usage hängt stark vom Prompt ab, den Sie übergeben. Geben Sie dem Skill:

den exakten Prompt-Text, der geprüft werden soll
die Rolle des Prompts, etwa System Prompt oder wiederverwendbarer Task Prompt
die beabsichtigten Nutzer und den Use Case
Modell- oder Plattformgrenzen, falls relevant
das Risikoniveau, etwa internes Sandbox-Setup oder öffentlich zugänglicher Workflow
alle nicht verhandelbaren Anforderungen, die im Prompt erhalten bleiben müssen

Ohne diesen Kontext wird das Review schnell zu allgemein.

So formulieren Sie Ihre Anfrage am besten

Sagen Sie nicht nur:

„Review this prompt.“

Geben Sie stattdessen Ziel und Einsatzkontext an, zum Beispiel:

„Review this system prompt for a customer-support assistant used by the public. Focus on harmful advice risk, bias, prompt injection exposure, and places where refusal behavior is underspecified. Preserve the helpful troubleshooting behavior.”

So entsteht nutzbarerer Output, weil der Skill Safety und Aufgabenwirksamkeit gegeneinander abwägen kann.

Aus einem groben Ziel eine vollständige Review-Anfrage machen

Eine grobe Anfrage sieht oft so aus:

„Make this prompt safer.”

Eine stärkere Anfrage für den ai-prompt-engineering-safety-review guide sollte so aufgebaut sein:

aktuellen Prompt einfügen
die Aufgabe nennen, die das Modell erfüllen muss
die kritischsten Failure Modes benennen
festlegen, was nicht abgeschwächt werden darf
sowohl Kritik als auch überarbeiteten Prompt-Text anfordern

Ein praktisches Template:

Current prompt
Intended use
Audience
Top safety concerns
Known abuse cases
Required capabilities to preserve
Desired output format for recommendations

Empfohlener Workflow in der Praxis

Ein praktikabler Workflow für ai-prompt-engineering-safety-review install und die tägliche Nutzung:

Fügen Sie den aktuell eingesetzten Prompt exakt ein.
Beschreiben Sie den Einsatzkontext und die erwarteten Modelleigenschaften.
Bitten Sie um eine Analyse entlang von Sicherheit, Bias, Security und Wirksamkeit.
Fordern Sie einen überarbeiteten Prompt mit expliziten Änderungen an.
Lassen Sie den überarbeiteten Prompt mit demselben Skill ein zweites Mal prüfen.
Testen Sie den überarbeiteten Prompt gegen Edge Cases und Misuse-Fälle.

Der zweite Durchlauf ist wichtig, weil Prompt-Änderungen neue Mehrdeutigkeiten oder übermäßige Einschränkungen einführen können.

Was der Skill besonders gut prüft

Auf Basis der Quelle ist dieser Skill besonders stark, wenn Sie ein strukturiertes Review brauchen für:

Exposition gegenüber schädlichen Inhalten
Risiken in Bezug auf Gewalt, Hass und Diskriminierung
Misinformation-Risiken
Ermöglichung illegaler Aktivitäten
Bias- und Fairness-Probleme
Security-Schwachstellen im Prompt-Design
Prompt-Wirksamkeit nach Safety-Anpassungen

Dadurch eignet er sich gut für System Prompts, Agent-Anweisungen, Task-Templates und Evaluationskandidaten.

Wo gewöhnliche Prompts weiterhin zu kurz greifen

Wenn Sie ein Allzweckmodell nur mit „improve this prompt“ anweisen, optimiert es oft Stil und Formulierung, übersieht aber leicht:

implizite riskante Annahmen
unklare oder unbeschränkte Anweisungen
vage formulierte Ablehnungsbedingungen
sozial verzerrtes Framing
Angriffsflächen durch zu permissive Formulierungen

Der ai-prompt-engineering-safety-review skill lohnt sich besonders dann, wenn solche Auslassungen teuer werden können.

Starkes Input-Beispiel

Verwenden Sie Eingaben wie diese:

“Review the following system prompt for an educational health chatbot. It should provide general wellness information, avoid diagnosis, avoid emergency triage mistakes, and respond safely to self-harm, medication, or illegal drug questions. Identify safety, bias, misinformation, and prompt-injection weaknesses. Then rewrite the prompt while keeping the educational tone.”

Warum das gut funktioniert:

die Domäne ist klar
die Grenzen sind klar
risikoreiche Themen sind benannt
zu erhaltendes Verhalten ist spezifiziert
der gewünschte Output ist umsetzbar

Schwaches Input-Beispiel

Schwacher Input sieht so aus:

“Can you optimize this prompt?”

Warum das unterdurchschnittlich funktioniert:

kein Risikomodell
kein Einsatzkontext
keine geschützten Anforderungen
keine Review-Dimensionen
keine Erwartung an überarbeiteten Prompt plus Begründung

Praktische Tipps für bessere Output-Qualität

Für bessere ai-prompt-engineering-safety-review usage bitten Sie den Skill darum, Folgendes auszugeben:

zuerst eine Risiko-Zusammenfassung
Problemkategorien mit Schweregrad
exakt problematische Zeilen oder Formulierungen
konkrete Umformulierungen statt nur abstrakter Ratschläge
einen final verbesserten Prompt
Testfälle zur Validierung der Überarbeitung

So wird aus einem reinen Kritik-Tool ein tatsächlich nutzbarer Editing-Workflow.

FAQ zum Skill ai-prompt-engineering-safety-review

Ist ai-prompt-engineering-safety-review gut für Einsteiger

Ja, sofern bereits ein Prompt zur Prüfung vorliegt. Der Skill gibt eine Struktur vor, die Einsteigern oft fehlt. Weniger hilfreich ist er, wenn Sie noch entscheiden, was Ihre Anwendung überhaupt tun soll, denn er ist auf Review statt auf Ideation ausgerichtet.

Wann sollte ich diesen Skill statt eines generischen Prompt-Helfers verwenden

Verwenden Sie ai-prompt-engineering-safety-review, wenn Prompt-Fehler Risiken für Vertrauen, Compliance, Marke oder Nutzersicherheit erzeugen könnten. Wenn Sie nur eine sauberere Formulierung für eine risikoarme interne Aufgabe brauchen, reicht ein generischer Rewrite-Prompt oft aus.

Ersetzt dieser Skill die Modellevaluation

Nein. ai-prompt-engineering-safety-review for Model Evaluation sollte am besten als Schritt zur Prüfung von Input-Qualität und Prompt-Risiken verstanden werden. Er verbessert den Prompt vor oder während der Evaluation, ersetzt aber weder Benchmark-Design noch Scoring oder adversariale Testausführung.

Gibt es neben der Installation noch ein spezielles Setup

Nicht viel. Die Repository-Signale zeigen keine Skripte oder Support-Assets, daher ist das Setup einfach. Der schwierigere Teil besteht darin, genügend Kontext für ein hochwertiges Review mitzuliefern.

Wo liegen die Grenzen dieses Skills

Er kann wahrscheinliche Schwächen in Bezug auf Sicherheit, Bias und Security in der Prompt-Formulierung identifizieren. Er kann jedoch weder Policy-Compliance garantieren noch rechtliche Belastbarkeit oder robustes Verhalten über jedes Modell und jede Deployment-Umgebung hinweg zusichern.

Wann ist dieser Skill ungeeignet

Überspringen Sie ihn oder ergänzen Sie ihn, wenn Sie Folgendes brauchen:

automatisiertes Policy-Linting
programmatische Red-Team-Suites
versionierte Scoring-Rubriken
domänenspezifische juristische oder klinische Prüfung
reproduzierbare Eval-Pipelines mit Metriken

Kann ich ihn für System Prompts und User Prompts verwenden

Ja. Besonders nützlich ist er für System Prompts, wiederverwendbare Task-Templates und andere Anweisungen, die das Modellverhalten breit steuern. Bei einmaligen User Prompts lohnt sich der Aufwand meist nur dann, wenn die Aufgabe sensibel ist oder in großem Maßstab wiederholt auftritt.

So verbessern Sie den Skill ai-prompt-engineering-safety-review

Geben Sie reichhaltigeren Einsatzkontext

Der schnellste Weg, die Ergebnisse von ai-prompt-engineering-safety-review zu verbessern, ist zusätzlicher Kontext, den der rohe Prompt allein nicht ausdrücken kann:

wer die Nutzer sind
welche Fehler am schwersten wiegen
was das Modell ablehnen muss
was das Modell weiterhin gut leisten soll
ob der Prompt öffentlich sichtbar oder intern verwendet wird

So kann der Skill bessere Trade-offs treffen, statt standardmäßig auf allgemeine Vorsicht auszuweichen.

Bitten Sie um eine Diagnose Zeile für Zeile

Viele Nutzer fordern nur einen umgeschriebenen Prompt an. Bessere Ergebnisse erhalten Sie, wenn Sie auch Folgendes anfordern:

die riskante Formulierung
warum sie riskant ist
die sicherere Alternative
die erwartete Auswirkung auf die Aufgabenqualität

Dadurch wird das Review nachvollziehbar und leichter umsetzbar.

Trennen Sie Sicherheitsprobleme von Wirksamkeitsproblemen

Ein häufiger Fehler ist, sämtliches Feedback in einer einzigen Liste zu mischen. Bitten Sie den Skill, die Ergebnisse aufzuteilen in:

Safety- und Misuse-Risiken
Bias- und Fairness-Risiken
Security- oder Injection-Risiken
Klarheits- und Wirksamkeitsprobleme

So fallen Änderungen nicht unbemerkt durch, die „sicherer, aber schlechter“ sind.

Geben Sie bekannte Missbrauchsfälle mit

Wenn Sie wahrscheinliche Angriffe oder schlechte Ergebnisse bereits kennen, nehmen Sie sie mit auf. Beispiele:

Nutzer, die Ablehnungen umgehen wollen
Anfragen nach schädlichen Anleitungen
Versuche, diskriminierende Ausgaben zu provozieren
Prompts, die das Modell zu falscher Sicherheit verleiten

Der Skill wird deutlich spezifischer, wenn er gegen konkrete Missbrauchsmuster prüfen kann.

Fordern Sie nach dem Rewrite Test-Prompts an

Ein verbesserter Prompt ist deutlich nützlicher, wenn der Skill zusätzlich Validierungsfälle liefert, etwa:

normale Nutzeranfragen
mehrdeutige Anfragen
adversariale Jailbreak-Versuche
fairness-sensitive Formulierungsvarianten
grenzwertige Policy-Fälle

Das ist eine der besten Möglichkeiten, den Output des ai-prompt-engineering-safety-review guide in einen echten Review-Loop zu überführen.

Achten Sie auf Überkorrektur

Ein häufiges Problem nach Safety-Edits ist, dass der Prompt:

im Ablehnungsverhalten zu breit wird
bei erlaubter Unterstützung zu vage bleibt
zu vorsichtig wird, um die ursprüngliche Aufgabe noch gut zu erfüllen

Wenn das passiert, fordern Sie eine enger gefasste Überarbeitung an, die sicheres erlaubtes Verhalten beibehält und nur die riskanten Teile verschärft.

Iterieren Sie auf dem überarbeiteten Prompt, nicht nur auf dem Original

Nach dem ersten Review sollten Sie den überarbeiteten Prompt erneut einreichen und fragen:

welche neuen Mehrdeutigkeiten eingeführt wurden
ob nützliche Fähigkeiten verloren gegangen sind
welche Risiken weiterhin ungelöst bleiben
welche Edge Cases noch getestet werden müssen

Dieser zweite Review-Durchlauf führt meist zu besseren finalen Prompts als ein einzelnes großes Rewrite.

Nutzen Sie bei Bedarf domänenspezifische Einschränkungen

Wenn Ihr Prompt für Healthcare-, Finance-, Education-, Legal-, HR- oder Trust-and-Safety-Anwendungsfälle gedacht ist, sagen Sie das direkt. ai-prompt-engineering-safety-review arbeitet deutlich wirksamer, wenn die Domäne verändert, was in der Praxis als „sicher“ und „akzeptabel“ gilt.

Schärfen Sie die Erwartungen an die Einführung

Setzen Sie diesen Skill als strukturierten Reviewer ein, nicht als letzte Instanz. Seine größte Stärke entfaltet er in Kombination mit:

Ihren Produktanforderungen
Ihren Policy-Vorgaben
Ihren Evaluationsfällen
menschlichem Review bei High-Risk-Deployments

Mit diesem Verständnis treffen Sie bessere Entscheidungen, als wenn Sie erwarten, dass ein einziger Durchlauf einen Prompt als produktionssicher zertifiziert.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

evaluation-methodology

von wshobson

Die evaluation-methodology Skill erklärt das PluginEval-Scoring für Model Evaluation, einschließlich Ebenen, Rubriken, zusammengesetzter Bewertung, Badge-Schwellen und praxisnaher Hinweise zur Interpretation von Ergebnissen und zur Verbesserung schwacher Dimensionen.

Model Evaluation

Favoriten 0GitHub 32.6k

healthcare-eval-harness

von affaan-m

healthcare-eval-harness ist ein Evaluierungs-Harness für Patientensicherheit bei Healthcare-App-Deployments. Er hilft Teams dabei, vor der Freigabe die Genauigkeit von CDSS, PHI-Offenlegung, Datenintegrität, das Verhalten klinischer Workflows und die Einhaltung von Integrationsvorgaben zu überprüfen. Kritische Fehler blockieren das Deployment, wodurch sich healthcare-eval-harness gut als Sicherheitsschranke für Model Evaluation und CI eignet.

Model Evaluation

Favoriten 0GitHub 156.2k

eval-harness

von affaan-m

Das eval-harness Skill ist ein formaler Evaluierungsrahmen für Claude Code-Sitzungen und eval-getriebene Entwicklung. Es hilft dir dabei, Pass/Fail-Kriterien zu definieren, Capability- und Regression-Evals aufzubauen und die Zuverlässigkeit von Agents vor dem Ausrollen von Prompt- oder Workflow-Änderungen zu messen.

Model Evaluation

Favoriten 0GitHub 156.1k

agent-eval

von affaan-m

agent-eval ist eine Skill zur direkten Bewertung von Coding-Agents anhand reproduzierbarer Aufgaben. Verglichen werden Erfolgsquote, Kosten, Zeit und Konsistenz. Mit der agent-eval Skill können Sie Claude Code, Aider, Codex oder einen anderen Agent in Ihrem eigenen Repo mit deutlich belastbareren Ergebnissen als bei ad hoc Prompts evaluieren.

Model Evaluation

Favoriten 0GitHub 156k

huggingface-community-evals

von huggingface

huggingface-community-evals hilft dir, Modelle aus dem Hugging Face Hub lokal mit inspect-ai oder lighteval zu evaluieren. Nutze es für die Auswahl des Backends, Smoke Tests und einen praxisnahen Einstieg in vLLM, Transformers oder accelerate. Nicht gedacht für HF Jobs-Orchestrierung, model-card-PRs, das Veröffentlichen von .eval_results oder community-evals-Automatisierung.

Model Evaluation

Favoriten 0GitHub 10.4k

huggingface-best

von huggingface

Die huggingface-best Skill hilft dir, das beste Modell für eine Aufgabe zu finden, indem sie Hugging Face-Benchmark-Leaderboards prüft und nach Gerätegrenzen sowie Modellgröße filtert. Nutze sie für Modell-Empfehlungen in Coding, Reasoning, Chat, OCR, RAG, Speech, Vision oder multimodalen Workflows, wenn du eine praktische Shortlist statt einer allgemeinen Modellliste brauchst.

Model Evaluation

Favoriten 0GitHub 10.4k

libafl

von trailofbits

Die libafl-Skill hilft Ihnen dabei, modulare Fuzzer mit LibAFL für eigene Targets, Mutationsstrategien und Security-Audit-Workflows zu planen und aufzubauen. Nutzen Sie diesen libafl-Leitfaden, um von den Target-Details zu einem praktikablen Harness, Feedback-Modell und Run-Plan zu kommen – mit weniger Annahmen.

Security Audit

Favoriten 0GitHub 5k

evaluation

von muratcankoylan

Die Evaluation-Skill hilft dir, Agent-Evaluierungen für nicht-deterministische Systeme zu entwerfen und auszuführen. Verwende sie für die Planung der Evaluation-Installation, Rubriken, Regressionstests, Quality Gates und Evaluationen für Skill Testing. Sie eignet sich für LLM-as-judge-Workflows, mehrdimensionale Bewertungen und den praktischen Einsatz von Evaluationen, wenn reproduzierbare Ergebnisse gefragt sind.

Skill Testing

Favoriten 0GitHub 0

judge-with-debate

von NeoLabHQ

judge-with-debate bewertet Lösungen durch strukturiertes Multi-Agenten-Debattieren – mit gemeinsamer Spezifikation, evidenzbasierten Gegenargumenten und bis zu 3 Runden, um zu einem Konsens zu gelangen. Das eignet sich besonders für Code-Reviews, rubrikbasierte Bewertungen und judge-with-debate in Workflows für Multi-Agent Systems.

Multi-Agent Systems

Favoriten 0GitHub 982

gws-modelarmor

von googleworkspace

gws-modelarmor hilft dir, mit Google Model Armor im googleworkspace/cli-Ökosystem zu arbeiten. Damit kannst du Prompts bereinigen, Modellantworten bereinigen und Templates mit weniger Rätselraten als bei einem generischen Prompt erstellen. Die Skill ist auf wiederholbare, richtlinienbewusste Nutzung und Security-Audit-Workflows ausgelegt.

Security Audit

Favoriten 0GitHub 25.5k

analyzing-campaign-attribution-evidence

von mukul975

analyzing-campaign-attribution-evidence hilft Analysten dabei, Infrastruktur-Überschneidungen, ATT&CK-Konsistenz, Malware-Ähnlichkeiten, Zeitbezug und sprachliche Artefakte abzuwägen, um belastbare Kampagnenzuschreibungen vorzunehmen. Nutzen Sie diesen analyzing-campaign-attribution-evidence-Leitfaden für CTI, Incident-Analysen und Security-Audit-Reviews.

Security Audit

Favoriten 0GitHub 6.1k

detecting-ai-model-prompt-injection-attacks

von mukul975

detecting-ai-model-prompt-injection-attacks ist eine Cybersecurity-Skill zum Prüfen untrusted Texts, bevor er ein LLM erreicht. Sie nutzt gestaffelte Regex-Prüfungen, heuristische Bewertung und DeBERTa-basierte Klassifikation, um direkte und indirekte Prompt-Injection-Angriffe zu erkennen. Nützlich für die Eingabevalidierung von Chatbots, die Dokumentenaufnahme und Threat Modeling.

Threat Modeling

Favoriten 0GitHub 0

llm-evaluation

von wshobson

Mit dem Skill llm-evaluation erstellen Sie wiederholbare Evaluationspläne für LLM-Apps, Prompts, RAG-Systeme und Modelländerungen – mit Metriken, menschlicher Bewertung, Benchmarking und Regressionsprüfungen.

Model Evaluation

Favoriten 0GitHub 32.6k

agentic-eval

von github

agentic-eval ist eine GitHub Copilot Skill, die zeigt, wie sich Evaluierungsschleifen für KI-Ausgaben mit Reflection, rubric-basierter Bewertung und Evaluator-Optimizer-Mustern aufbauen lassen.

Model Evaluation

Favoriten 0GitHub 27.8k

ml-pipeline-workflow

von wshobson

ml-pipeline-workflow ist ein praxisnaher Leitfaden für die Konzeption durchgängiger MLOps-Pipelines für Datenaufbereitung, Training, Validierung, Deployment und Monitoring – inklusive Orchestrierungsmustern für wiederholbare Workflow-Automatisierung.

Workflow Automation

Favoriten 0GitHub 0

frontend-design

von anthropics

frontend-design verwandelt vage UI-Ideen in markante, produktionsreife Interfaces mit echtem Frontend-Code, klarer Designrichtung und weniger generischem AI-Look.

UI Design

Favoriten 1GitHub 105.2k