Je fais du RAG sur 100k documents, des agents LLM,
et du Deep Learning entraîné sur supercalculateur.
4 ans au CNRS à entraîner des modèles pour des chercheurs en météo, astrophysique, écologie et nanomatériaux. Multi-GPU sur Jean Zay, des librairies toujours en prod chez Météo France, 2 publications peer-reviewed.
Aujourd'hui chez Berger-Levrault, je construis Athena : des utilisateurs métier posent des questions sur ~100k documents techniques, des agents RAG et MCP trouvent la réponse et citent leurs sources.
Basé à Toulouse, mobile Paris / Montréal.
Berger-Levrault
Équipe R&D IA · 12 personnes
Athena est la plateforme agentique de Berger-Levrault : multi-agents, routage, connexion aux documents et APIs métier pour tous les clients (collectivités, industrie, maintenance).
Déploiement en cours, ~30 utilisateurs pilotes. Observabilité Langfuse, ateliers clients, itérations sur retours terrain.
4 réalisations :
Athena · architecture multi-agents
Contexte: construire le socle agentique pour tous les clients BL (collectivités, industrie, maintenance).
Rôle: conception de l'architecture multi-agents (LangGraph), routage par type de question, orchestration agents RAG + agents MCP, intégration du sourcing des réponses.
Résultat: plateforme en production, réponses sourcées et actionnables sur plusieurs domaines métier.
Content-extractor · OCR/PDF/DOCX
Contexte: service initial simple (image-extractor), peu modulable.
Rôle: refonte complète OCR/images/PDF/DOCX, batch async (Celery + API batch Mistral), architecture factory/registry pour ajouter facilement de nouveaux extracteurs/chunkers.
Résultat: -50% sur les coûts d'extraction.
Pipelines Airflow
Contexte: ingestion documentaire par client.
Rôle: reprise de l'existant et évolution en équipe sur les pipelines d'ingestion (PDF, notices, work orders, docs machine).
Résultat: 5 DAGs opérationnels (1 par client).
MCP Builder
Contexte: connecter rapidement les APIs internes de BL aux agents.
Rôle: un LLM analyse les specs OpenAPI pour pré-traiter les endpoints (regroupement, masquage, génération de descriptions), puis revue human-in-the-loop pour valider routes et connaissance métier.
Résultat: 120+ APIs internes cartographiées, intégration progressive au runtime.
CNRS · Programme National de Recherche en IA (PNRIA)
Au sein du réseau PNRIA, j'ai accompagné des équipes de recherche partout en France sur leurs problématiques IA.
Toujours 2 projets en parallèle (6-12 mois chacun), livrés à Météo France, le CNES, le CEA, l'INEE.
Entraînement et fine-tuning sur Jean Zay (multi-GPU DDP, jusqu'à 8 GPUs, Slurm). Profilage PyTorch.
Sélection de preuves :
GENS / MetScore · Météo France
Contexte: évaluer des modèles météo en production, optimisation multi-GPU et fine-tuning d'un modèle de diffusion.
Rôle: conception de MetScore (configuration YAML, librairie Python), et entraînement d'un modèle de diffusion (DDPM) en PyTorch pour la génération d'images météorologiques sur Jean Zay.
Résultat: librairie toujours en prod + POC diffusion à -20% de calcul à qualité équivalente.
Co-auteur du papier AMS 2025
DeepFaune · CNRS/INEE
Contexte: reconnaissance d'animaux sur pièges photos (1,5M images).
Rôle: fine-tuning YOLOv5 sur dataset custom (1,5M images, 24 classes), entraînement multi-GPU, gestion du déséquilibre de classes, optimisation précision/vitesse CPU.
Résultat: 93% sur 24 espèces, 3× plus rapide.
Publication peer-reviewed
Autres contributions: AUTOFILL (CEA, PairVAE, MAE 0,98), BIGSF (CNES, tech lead et refacto d'architecture), formation Introduction aux LLMs (3h, ~25 doctorants/chercheurs CNRS).
Agileo Automation (alternance)
Framework de supervision et contrôle de machines robotisées pour la cuisson et fabrication de semi-conducteurs. Architecture orientée objets, C#, IHM. Équipe de 5 ingénieurs, Agile/Scrum.
Master · Intelligence Artificielle et Reconnaissance des Formes (IARF)
Université Paul Sabatier Toulouse III · IRIT
Spécialisation Deep Learning, Vision par ordinateur, NLP. Laboratoire IRIT (Institut de Recherche en Informatique de Toulouse).
Licence Informatique
Université Paul Sabatier Toulouse III
Langues
Mock server LLM pour tester retries, fallbacks et rate limiting sans tokens
Modèle de diffusion probabiliste pour le débruitage d'images météo · −20% de ressources
Utilitaire Python pour générer des chemins de fichiers uniques : suffixes incrémentaux, UUID, timestamps
Pipeline ML end-to-end déployé sur AWS · Computer Vision + API REST
"Enriching Operational High-Resolution Ensemble Forecasts with StyleGAN-2"
C. Brochet, G. Moldovan, J. Rabault, C. Regan, L. Raynaud
Artificial Intelligence for the Earth Systems (AIES), vol. 4, no. 1 · DOI: 10.1175/AIES-D-24-0058.1
"The DeepFaune initiative: a collaborative effort towards the automatic identification of European fauna in camera trap images"
Julien Rabault et al.
Google Scholar
Agentique & RAG
Deep Learning & Vision
MLOps & Infrastructure
Développement & Frameworks
Contact
Disponible pour de nouvelles opportunités. Toulouse, Paris ou Montréal. Remote OK.
Domaines : GenAI · RAG · Systèmes multi-agents · MLOps · Computer Vision
Télécharger mon CVJulien Rabault · Toulouse, France ·