Première ligne de défense — inspection profonde par intelligence artificielle
Agent de filtrage applicatif basé Python offrant une flexibilité maximale d'analyse ML. Inspecte les requêtes et réponses LLM en profondeur via regex et modèles embarqués. Détecte les jailbreaks multi-tour, masque les données personnelles automatiquement et journalise chaque événement de sécurité en JSON structuré.
Jailbreaks, roleplay adversarial, injection indirecte via RAG
IBAN, CB, SSN, email — remplacés par [REDACTED] avant LLM
Requêtes visant à révéler le prompt système bloquées
Nettoyage HTML/SQL/shell dans les réponses LLM
Capping token/minute · circuit breaker configurable
Logs structurés JSON de chaque requête bloquée