Analyse des Prompts

prompt-guard-go

AGENT ACTIF LLM01 LLM02 LLM07 LLM09

Détection des attaques sophistiquées — jailbreaks, injections indirectes, obfuscation HTML

Moteur de classification sémantique spécialisé dans la détection des injections de prompts et manipulations complexes. Détecte les injections indirectes via documents RAG, les jailbreaks multi-tour, l'obfuscation HTML (balises intercalées dans les mots-clés), et les attaques Crossword Game multi-phases. Intègre un SSE parser pour l'analyse des flux LLM en streaming.

Capacités de protection

Injection Directe

Roleplay adversarial, DAN patterns, instructions cachées

Injection Indirecte

Via PDF, RAG, outils, plugins MCP — vecteur souvent ignoré

HTML Obfuscation

Obfuscation HTML détectée et bloquée

Crossword Game Attack

Injection multi-phase via jeu de mots — 3 phases détectées

System Prompt Leakage

Requêtes reverse engineering du prompt système

SSE Streaming

Analyse flux LLM token par token en temps réel

Couverture OWASP LLM Top 10 2025

LLM01 Prompt Injection

LLM02 Sensitive Info Disclosure

LLM03 Supply Chain Vulnerabilities

LLM04 Data & Model Poisoning

LLM05 Improper Output Handling

LLM06 Excessive Agency

LLM07 System Prompt Leakage

LLM08 Vector & Embedding Weaknesses

LLM09 Misinformation

LLM10 Unbounded Consumption