Contexte
Dans le cadre du projet VERGA — mené conjointement par Thales et Beslogic, et financé par Confiance IA — nous avons contribué au développement d’un outil interne intelligent destiné aux professionnels qui consultent régulièrement la documentation navale pour s'assurer de la conformité réglementaire. Ces utilisateurs doivent passer au crible de vastes ensembles de normes techniques pour valider les conditions d'applicabilité et les exigences de sécurité sur les plateformes navales.
Cependant, la navigation dans ces longs documents PDF était lente, manuelle et sujette à des oublis. Avec une complexité croissante et des délais de projets de plus en plus serrés, le besoin d’un moyen plus rapide et plus intelligent pour identifier et consulter les exigences pertinentes était devenu crucial.
Défi
Comment aider les utilisateurs de documentation technique navale à retrouver rapidement les exigences réglementaires pertinentes dans des centaines de pages de normes ?
L’outil devait permettre de :
- Filtrer précisément (ex. : par domaine d’applicabilité)
- Poser des requêtes en langage naturel
- Afficher des résultats contextualisés tout en conservant un lien vers le PDF d’origine
- Être rapide, facile à mettre à jour et évolutif pour d'autres jeux de documents
Notre approche
Extraction intelligente des données
À l’aide de pipelines sur mesure, construits avec des outils comme Docling et Unstructured, les documents PDF sont transformés en données structurées et interrogeables. Chaque exigence est enrichie de métadonnées (domaine d’applicabilité, chapitre, coordonnées dans le PDF) puis indexée dans une base vectorielle.
Interface de recherche hybride
Nous avons développé une application web monopage (SPA) moderne à l’aide d’Angular et d’AG-Grid pour faciliter l’exploration des exigences. L’interface propose deux modes de recherche complémentaires :
- Filtres structurés par mot-clé, étiquette ou domaine d’applicabilité
- Recherche propulsée par l’IA, capable de comprendre les requêtes en langage naturel et d’identifier les exigences les plus pertinentes sur le plan sémantique
L’IA assiste également dans la classification des exigences et la suggestion de domaines d’applicabilité pertinents en fonction des requêtes des utilisateurs.
Technologies
- Frontend : Angular, AG-Grid
- Backend : Python
- Traitement : Docling, Unstructured
- IA : LLMs, Elasticsearch, Embeddings vectoriels
Résultats
La plateforme VERGA permet aux utilisateurs de :
- Retrouver instantanément les exigences réglementaires pertinentes via des filtres ou une recherche sémantique assistée par IA
- Explorer et comparer les exigences extraites, enrichies de métadonnées et regroupées par domaine ou pertinence
- Conserver une traçabilité complète vers les documents PDF originaux, incluant le numéro de page et le contexte
- Réduire le temps passé à consulter manuellement les documents et renforcer la fiabilité des validations réglementaires
En combinant traitement du langage naturel, extraction de métadonnées et filtres contextuels, VERGA transforme la consultation de documentation navale complexe en une expérience intelligente et réactive.
