Applied AI / ML Engineer · Toulouse

Julien Rabault

Je fais du RAG sur 100k documents, des agents LLM, et du Deep Learning entraîné sur supercalculateur.

CV PDF Me contacter →
À propos

4 ans au CNRS à entraîner des modèles pour des chercheurs en météo, astrophysique, écologie et nanomatériaux. Multi-GPU sur Jean Zay, des librairies toujours en prod chez Météo France, 2 publications peer-reviewed.

Aujourd'hui chez Berger-Levrault, je construis Athena : des utilisateurs métier posent des questions sur ~100k documents techniques, des agents RAG et MCP trouvent la réponse et citent leurs sources.

Basé à Toulouse, mobile Paris / Montréal.

Expérience

AI Engineer

Berger-Levrault

Janv. 2026 – présent · Toulouse

Équipe R&D IA · 12 personnes

Athena est la plateforme agentique de Berger-Levrault : multi-agents, routage, connexion aux documents et APIs métier pour tous les clients (collectivités, industrie, maintenance).
Déploiement en cours, ~30 utilisateurs pilotes. Observabilité Langfuse, ateliers clients, itérations sur retours terrain.

4 réalisations :

Athena · architecture multi-agents

Contexte: construire le socle agentique pour tous les clients BL (collectivités, industrie, maintenance).
Rôle: conception de l'architecture multi-agents (LangGraph), routage par type de question, orchestration agents RAG + agents MCP, intégration du sourcing des réponses.
Résultat: plateforme en production, réponses sourcées et actionnables sur plusieurs domaines métier.

RAGMCPLangGraphAgent Routing

Content-extractor · OCR/PDF/DOCX

Contexte: service initial simple (image-extractor), peu modulable.
Rôle: refonte complète OCR/images/PDF/DOCX, batch async (Celery + API batch Mistral), architecture factory/registry pour ajouter facilement de nouveaux extracteurs/chunkers.
Résultat: -50% sur les coûts d'extraction.

OCRCeleryMistral BatchFactory/RegistryPython

Pipelines Airflow

Contexte: ingestion documentaire par client.
Rôle: reprise de l'existant et évolution en équipe sur les pipelines d'ingestion (PDF, notices, work orders, docs machine).
Résultat: 5 DAGs opérationnels (1 par client).

AirflowDAGPDF/DOCXIngestionChunking

MCP Builder

Contexte: connecter rapidement les APIs internes de BL aux agents.
Rôle: un LLM analyse les specs OpenAPI pour pré-traiter les endpoints (regroupement, masquage, génération de descriptions), puis revue human-in-the-loop pour valider routes et connaissance métier.
Résultat: 120+ APIs internes cartographiées, intégration progressive au runtime.

OpenAPIMCPHuman-in-the-loopAPI Integration

Machine Learning Engineer

CNRS · Programme National de Recherche en IA (PNRIA)

Déc. 2021 – Janv. 2026 · Toulouse

Au sein du réseau PNRIA, j'ai accompagné des équipes de recherche partout en France sur leurs problématiques IA.
Toujours 2 projets en parallèle (6-12 mois chacun), livrés à Météo France, le CNES, le CEA, l'INEE.
Entraînement et fine-tuning sur Jean Zay (multi-GPU DDP, jusqu'à 8 GPUs, Slurm). Profilage PyTorch.

Sélection de preuves :

GENS / MetScore · Météo France

Contexte: évaluer des modèles météo en production, optimisation multi-GPU et fine-tuning d'un modèle de diffusion.
Rôle: conception de MetScore (configuration YAML, librairie Python), et entraînement d'un modèle de diffusion (DDPM) en PyTorch pour la génération d'images météorologiques sur Jean Zay.
Résultat: librairie toujours en prod + POC diffusion à -20% de calcul à qualité équivalente.
Co-auteur du papier AMS 2025

PyTorchDDPMHPCPython

DeepFaune · CNRS/INEE

Contexte: reconnaissance d'animaux sur pièges photos (1,5M images).
Rôle: fine-tuning YOLOv5 sur dataset custom (1,5M images, 24 classes), entraînement multi-GPU, gestion du déséquilibre de classes, optimisation précision/vitesse CPU.
Résultat: 93% sur 24 espèces, 3× plus rapide.
Publication peer-reviewed

Fine-tuningYOLOv5PyTorchMulti-GPUComputer Vision

Autres contributions: AUTOFILL (CEA, PairVAE, MAE 0,98), BIGSF (CNES, tech lead et refacto d'architecture), formation Introduction aux LLMs (3h, ~25 doctorants/chercheurs CNRS).

Ingénieur Logiciel

Agileo Automation (alternance)

Août 2020 – Sept. 2021 · Montauban

Framework de supervision et contrôle de machines robotisées pour la cuisson et fabrication de semi-conducteurs. Architecture orientée objets, C#, IHM. Équipe de 5 ingénieurs, Agile/Scrum.

Formation

Master · Intelligence Artificielle et Reconnaissance des Formes (IARF)

Université Paul Sabatier Toulouse III · IRIT

Spécialisation Deep Learning, Vision par ordinateur, NLP. Laboratoire IRIT (Institut de Recherche en Informatique de Toulouse).

2019 – 2021

Licence Informatique

Université Paul Sabatier Toulouse III

2016 – 2019

Langues

Français · natif Anglais · courant (B2)
Projets open source 04 projets · 3 sur PyPI ·
LLMock PyPI

Mock server LLM pour tester retries, fallbacks et rate limiting sans tokens

DDPM-weather Open Source

Modèle de diffusion probabiliste pour le débruitage d'images météo · −20% de ressources

uniqpath PyPI

Utilitaire Python pour générer des chemins de fichiers uniques : suffixes incrémentaux, UUID, timestamps

BananaML Production

Pipeline ML end-to-end déployé sur AWS · Computer Vision + API REST

Publication
Compétences

Agentique & RAG

RAG / GraphRAG Multi-agents MCP Protocol Prompt Engineering Structured Outputs Embeddings LLM Routing Fine-tuning

Deep Learning & Vision

PyTorch Transformers Computer Vision Diffusion Models NLP CNNs / U-Net / YOLO

MLOps & Infrastructure

Docker AWS CI/CD MLFlow Airflow Kubernetes Celery Langfuse HPC / Slurm

Développement & Frameworks

Python FastAPI LangChain / LangGraph HuggingFace Qdrant / pgvector Mistral / OpenAI API Git SOLID / Architecture

Contact

Travaillons ensemble

Disponible pour de nouvelles opportunités. Toulouse, Paris ou Montréal. Remote OK.

Domaines : GenAI · RAG · Systèmes multi-agents · MLOps · Computer Vision

Télécharger mon CV

Julien Rabault · Toulouse, France ·