Analyse des Prompts

prompt-guard-go

AGENT ACTIF LLM01 LLM02 LLM07 LLM09

Détection des attaques sophistiquées — jailbreaks, injections indirectes, obfuscation HTML

Moteur de classification sémantique spécialisé dans la détection des injections de prompts et manipulations complexes. Détecte les injections indirectes via documents RAG, les jailbreaks multi-tour, l'obfuscation HTML (balises intercalées dans les mots-clés), et les attaques Crossword Game multi-phases. Intègre un SSE parser pour l'analyse des flux LLM en streaming.

Capacités de protection

Injection Directe

Roleplay adversarial, DAN patterns, instructions cachées

Injection Indirecte

Via PDF, RAG, outils, plugins MCP — vecteur souvent ignoré

HTML Obfuscation

Obfuscation HTML détectée et bloquée

Crossword Game Attack

Injection multi-phase via jeu de mots — 3 phases détectées

System Prompt Leakage

Requêtes reverse engineering du prompt système

SSE Streaming

Analyse flux LLM token par token en temps réel

Couverture OWASP LLM Top 10 2025

LLM01 Prompt Injection
LLM02 Sensitive Info Disclosure
LLM03 Supply Chain Vulnerabilities
LLM04 Data & Model Poisoning
LLM05 Improper Output Handling
LLM06 Excessive Agency
LLM07 System Prompt Leakage
LLM08 Vector & Embedding Weaknesses
LLM09 Misinformation
LLM10 Unbounded Consumption