Protection Modèles

model-drift

AGENT ACTIF LLM04 LLM08

Détection précoce — empoisonnement des données et dérive comportementale modèle

Monitoring statistique continu des distributions de sortie des modèles. Détecte la dérive comportementale (PSI, KL divergence), les anomalies dans les embeddings des bases vectorielles RAG, et les backdoors comportementaux via golden dataset. Surveille Chroma, Qdrant et Weaviate.

Capacités de protection

Model Drift

PSI / KL divergence sur outputs en production · alertes seuil configurable

Data Poisoning

Détection anomalies distributions · déviation vs baseline établie

Embedding Integrity

Clustering analysis vecteurs RAG — injections embeddings détectées

Backdoor Detection

Test patterns déclencheurs suspects sur golden dataset de référence

Benchmark Continu

Évaluation permanente qualité modèle · régression automatique

Cohérence RAG

Surveillance intégrité bases Chroma / Qdrant / Weaviate

Couverture OWASP LLM Top 10 2025

LLM01 Prompt Injection
LLM02 Sensitive Info Disclosure
LLM03 Supply Chain Vulnerabilities
LLM04 Data & Model Poisoning
LLM05 Improper Output Handling
LLM06 Excessive Agency
LLM07 System Prompt Leakage
LLM08 Vector & Embedding Weaknesses
LLM09 Misinformation
LLM10 Unbounded Consumption