Couche 1
Règles déterministes belges
Seize classes d'entités belges détectées et masquées : Numéro National avec vérification modulo 97, BCE, IBAN belge, parcelle cadastrale CADNET, code postal, numéro de plaque, dénomination sociale, adresse, RPM, etc. Onze règles déterministes calibrées sur corpus annoté.
Couche 2
Reconnaissance d'entités nommées fr+nl
Modèles spaCy bilingues français et néerlandais entraînés sur corpus notarial belge. Détection des entités contextuelles que les règles n'attrapent pas : noms, fonctions, dates, lieux, qualifications juridiques. Tout est consigné, tout est traçable.
Couche 3
Critic LLM local
Un modèle linguistique exécuté localement sur le serveur d'inférence relit la sortie des deux premières couches et signale les fuites résiduelles. En cas de doute, le pipeline bascule en sortie locale uniquement — le mode raw_local_only empêche toute communication avec un modèle distant.
Réversion contrôlée
Table de réversion en mémoire avec zéroïsation
Quand une sortie est jugée sûre, elle est dé-masquée avant retour au notaire. La correspondance pseudonyme → identité réelle vit en mémoire vive, protégée par zéroïsation, jamais persistée sur disque.