← Tous les projets
CGR

CGR International

mission menée chez IOD Solutions

IA

Extraction LLM de données techniques pour la cotation industrielle

LLM VisionFull-stackÉvaluationProduction

85–96 %

précision mesurée

UE

données résidentes

288

nuances matériaux

Problème

Automatiser la cotation industrielle en extrayant les données techniques (dimensions, charges, tolérances, matériaux) depuis des documents très hétérogènes, pour alimenter le calculateur métier « E8 » sans ressaisie manuelle.

Contrainte

Documents de formats variés, données devant rester en Union Européenne, matériaux exprimés en texte libre à normaliser, et exigence d’une précision mesurable champ par champ.

Approche

  • Pipeline d’extraction en production avec un LLM de vision (Gemini, choisi pour la résidence des données en UE et sa lecture de plans).
  • Sorties structurées et typées (Pydantic), schéma de données versionné, ingénierie de prompt itérative.
  • Fiabilisé l’extraction par un matching flou (rapidfuzz) d’un matériau texte-libre contre un catalogue de 288 nuances client, et une conversion d’unités physiques (métrique ↔ impérial).
  • Système d’évaluation mesurant objectivement la précision champ par champ (moteur de comparaison maison puis Langfuse).

Résultat

  • Précision d’extraction mesurée de 85 à 96 % selon les documents.
  • Application full-stack livrée : FastAPI / SQLAlchemy async / PostgreSQL, React 19 / TanStack / Tailwind, conteneurisée (Docker, Dokploy), auth Clerk, stockage S3 (déduplication SHA-256), observabilité Logfire.

Stack

GeminiPostgreSQLFastAPIReact 19LangfuseLogfireDocker

Projet suivant

ODERIS · Classification IA de slides à l’échelle pour la due diligence