Résultats mesurés
99,7% des données traitées
Sur 30 documents juridiques et 1 620 entités annotées manuellement, Lexanon identifie et masque la quasi-totalité. Une relecture de contrôle suffit pour valider.
Ce que Lexanon détecte
Résultats obtenus sur le corpus de test Structured Plausible v2 — 30 documents juridiques, 1 620 entités annotées manuellement.
| Type de donnée | Volume testé | Pris en charge par Lexanon |
|---|---|---|
| Noms de personnes | 210 | 100% |
| Adresses postales | 120 | 100% |
| Dates | 180 | 100% |
| Lieux institutionnels | 240 | 100% |
| Emails et téléphones | — | 100% |
| Organisations | 870 | 96% |
Les noms d'organisations représentent le cas le plus complexe à traiter (raisons sociales, sigles, noms commerciaux). Les 4% restants sont précisément le type d'éléments qu'une relecture de principe permet d'identifier.
Protocole de test
Les résultats ci-dessus sont issus du corpus Structured Plausible v2, composé de documents juridiques réalistes : conclusions, contrats, courriers. Chaque donnée à caractère personnel est annotée manuellement en amont, puis comparée au résultat produit par Lexanon. Les rapports complets sont téléchargeables ci-dessous.