Ingénieur IA — Agents, systèmes LLM & ML

Alan
Blanchet

Je construis de l'IA pour la production — agents, LLM, voix et vision — et je reconstruis les modèles de zéro quand je veux vraiment les comprendre.

5+ ans en IA / ML
~900 k€+ de projets livrés
Construit & opère la stack d'agents IA de l'équipe

Me contacter Télécharger le CV GitHub

Grenoble, France

Ingénieur R&D · Neovision

Grenoble · 25 ans

Défiler

La stack

PyTorch Hugging Face TensorFlow Keras scikit-learn OpenAI Anthropic Ollama LangChain ONNX OpenCV Gradio Jupyter CUDA NumPy pandas Plotly Python Rust TypeScript C++ React Next.js FastAPI Docker Linux PostgreSQL Redis Git GitHub

01 / À propos

À propos

J’apprends en reconstruisant depuis les premiers principes.

Ingénieur IA/ML surtout autodidacte, 5+ ans en systèmes de vision, de parole et de LLM en production, désormais centré sur les agents IA et les applis LLM. J'aime comprendre les couches sous les outils que j'utilise, alors j'en ai construit quelques-unes moi-même — mon propre framework de deep learning avec moteur d'autograd à la main, un pipeline vocal temps réel, un ordonnanceur de cluster GPU multi-utilisateurs, une extension d'agent « computer-use » publiée, un compilateur de prompt-engineering — parce que j'apprends en reconstruisant depuis les premiers principes. Je tiens à un code propre, bien généralisé et typé — construit avec des agents, mais pas « vibe-codé » — gardé honnête par une habitude de tests et de cas limites d'abord.

Surtout autodidacte · 5+ ans

Grenoble, France

Français (natif) · Anglais (bilingue — 3 ans scolarisé au Royaume-Uni)

Co-auteur article SPIE (2025)

Au cœur du travail

Agents IA
Applis LLM
Voix
Vision
Inférence

02 / Compétences

Compétences

La stack, par domaine — ce avec quoi je construis vraiment. · 163 technos

Agents & LLMOps

LiveKit Agents
LangChain / LangGraph
OpenAI Agents SDK
MCP (builds servers)
tool-calling
LLM-as-judge
Langfuse
LiteLLM
Ollama
LM Studio
OpenTelemetry
sentence-transformers
FAISS / usearch
RAG
AGENTS.md / CLAUDE.md

LLMs

Claude / GPT / Gemini (API)
Qwen
Llama
DeepSeek
GPT-OSS
Mistral
RAG
fine-tuning / LoRA
MoE
KV-cache
quantification
vLLM
prompt caching
Batch API cost optimization

Voix — STT

Whisper / faster-whisper
NVIDIA Parakeet
Kyutai
Silero
AssemblyAI
Deepgram

Voix — TTS

ElevenLabs
Cartesia
Deepgram Aura
Kokoro
Piper
Voxtral
Kyutai / Moshi

Voix — rehaussement audio & VAD

Silero VAD
EBEN
HiFi-GAN / HiFi++
MP-SENet
xLSTM-SENet
VoiceFilter
DTLN
RNNoise
SpeechBrain
PESQ / STOI / SI-SDR
SIP telephony (Twilio / Telnyx)

Vision

RT-DETR / RT-DETRv2
D-FINE
YOLO (v8 / NAS)
DETR
Faster R-CNN
SSD
SAM
SegFormer
U-Net
DINOv2 / v3
iBOT
SwAV
Barlow Twins
BYOL
SimCLR
EquiMod
ViT / Swin
MLP-Mixer
CLIP / OpenCLIP / SigLIP
Mask R-CNN
NMS · Hungarian matching · GIoU · TIDE

Appariement d'images

GIM
RoMa
DKM
LoFTR
LightGlue
SuperPoint
OmniGlue
RANSAC / MAGSAC
homographie / TPS

Inférence

TensorRT
ONNX / onnxruntime / graph surgeon
INT8 / FP16 / FP8 quantification
CUDA / Triton
CuPy
batching
einops

RL

REINFORCE / VPG
DQN family (Double, Dueling, Recurrent)
PPO
R2D2 / NGU-style
RND
PER (SumTree)
Gymnasium
Ray RLlib

HPC / distribué

SLURM
submitit
Lightning DDP
Accelerate
DeepSpeed
Ray
Jean Zay (IDRIS)

Systèmes & cloud

Linux (deep) / systemd
Docker / Compose
Kubernetes / Helm
Nginx / Caddy / Traefik + Let's Encrypt
AWS (S3/SQS/Cognito/CloudWatch/EC2)
Scaleway (GPU, dedicated endpoints)
GCP
Terraform
Tailscale
PostgreSQL / Prisma / SQLAlchemy / SQLite
MariaDB/MySQL
Redis
CI/CD
CVAT
Roboflow
FiftyOne
DVC
MLflow
W&B

Langages & outils

Python (expert)
Rust (production)
TypeScript / JS
C / C++
CUDA
Dart
SQL
PHP
Shell
PyTorch
Lightning
timm
transformers / datasets
einops
torchmetrics
Albumentations
sklearn / XGBoost
polars / pandas
NumPy
React
Next.js
Svelte
Vue
Tailwind
Flutter (+ flutter_rust_bridge FFI)
FastAPI
Express
Gradio
Streamlit
uv / Poetry / conda
cargo / clippy / miri / bindgen
just

Transverse

Bilingual FR/EN
scientific writing & client reporting
mentoring
cross-team enablement (R&D News)
GDPR / sovereignty-aware architecture
reads & reproduces papers
code-as-craft convictions

03 / Expérience

Expérience

Ingénieur R&D

Neovision · Grenoble · 2022–présent

IA / ML au cœur du poste, avec un appui transverse régulier — infra & réseau, full-stack, administration des comptes.

~900 k€+ livrés parc ~30 hôtes

Enablement IA — construit l'outillage d'agents interne (serveurs MCP, routage multi-fournisseurs, serving LLM on-prem) ; anime la veille « R&D News » bimensuelle pour l'équipe.
Gère la stack IA — détient les accès API de l'entreprise aux fournisseurs d'IA, opère les comptes d'agents IA et leur budget, ainsi que les comptes Copilot + Claude de l'équipe.
Projets livrés — lead ou ingénieur principal sur ~900 k€+ ; automatisation partielle de la génération du rapport Crédit Impôt Recherche (CIR) (2025, réutilisée en 2026).
Infra & réseau — conçu et opère une plateforme de calcul GPU multi-utilisateurs de zéro ; je gère un parc de ~30 hôtes sur Scaleway, AWS et on-prem — instance GPU L40S dédiée, poste 2× RTX 3090 que j'administre, CVAT, NAS et devices edge — avec reverse proxies, TLS et orchestration de conteneurs.
Livraison full-stack — front-ends React / Next.js / Svelte jusqu'aux back-ends FastAPI / Django.

Combien d’IA ?

Filtrez par part construite avec mes agents IA — du fait-main jusqu’à l’orchestration totale.

fait main

agent-orchestré

● construit avec mes agents IA orchestrés ○ écrit à la main

Agent vocal conversationnel — téléphonie temps réel

2025–présent Lead tech €300k+
- Agent téléphonique temps réel, prise de rendez-vous médicaux
- pipeline construit de zéro → migré sur LiveKit (avec l'équipe)
- LLM/STT/TTS par appel avec repli
5 détails
- tool-calling
- vérification de sûreté LLM
- observabilité complète
- en production
- démo interne de toute la gamme, dont le clonage vocal en direct pendant un appel.
- LiveKit
- LangGraph
- multi-provider STT/TTS
- SIP telephony
- Langfuse
- OpenTelemetry
- eval harness
Appui IA interne & outillage d'agents

2024–présent
- J'épaule les collègues dès qu'ils veulent tester ou expérimenter une IA via API
- outillage construit en interne — serveurs MCP
- routage multi-fournisseurs
3 détails
- serveur LM Studio auto-hébergé (2× RTX 3090, on-prem/confidentiel)
- un système de prompts/standards qui régit la façon dont les agents écrivent le code
- automatisation partielle de la génération du Crédit Impôt Recherche (CIR) (2025, réutilisée en 2026).
- MCP servers
- local LLM server (on-prem)
- Ollama / LM Studio
- AI enablement
- coding standards as prompts
Système de classification d'images multi-têtes

2026 Lead tech €65k
- Classification d'images multi-têtes (DINOv2 + VLM), livrée pour un client
- le plus important : le système agentique maison qui a permis de la construire.
- DINOv2
- multi-head classification
- agent-built
- FastAPI / Gradio
Framework de rehaussement & reconstruction de la parole

2025 Lead tech €85k
- Reconstruit une parole propre à partir de micros intra-auriculaires
- plusieurs modèles de rehaussement (EBEN · HiFi-GAN/++ · MP-SENet · xLSTM-SENet · VoiceFilter) derrière un pipeline
- simulateur de transfert acoustique bouche-oreille
2 détails
- PESQ/STOI/SI-SDR
- mis en production (FastAPI · Gradio · Docker).
- PyTorch Lightning
- torchaudio
- GANs
- audio denoising
- FastAPI / Gradio
Appariement & recalage d'images

2025 Lead tech ~€80k
- Recalage d'images / template matching pour l'authentification de produits
- matching de points-clés (GIM-DKM · RoMa · LoFTR · LightGlue · SuperPoint · OmniGlue) → RANSAC/MAGSAC → homographie/TPS
- robuste aux captures smartphone
2 détails
- plugin d'annotation CVAT de keypoint-matching sur mesure
- métriques GTE/CTE.
- keypoint matching
- RANSAC / homography
- CVAT plugin
- GTE / CTE
- PyTorch
Plateforme de démonstrateurs ML interne

2024–26 Lead tech
- Héberge les démonstrateurs clients + solutions internes
- 25+ applis
- chacune déployée/gérée à partir d'images Docker, liens partageables
3 détails
- orchestration par démo
- reverse proxy
- accès par rôle.
- Next.js
- PostgreSQL / Prisma
- Docker orchestration
- Scaleway
Détection d'objets temps réel

2024
- Étude approfondie + ablation des détecteurs SOTA (RT-DETR · YOLO-NAS · YOLOv8) → sélection de RT-DETR (alors SOTA)
- déploiement edge (ONNX · TensorRT · quant. INT8/FP8).
- RT-DETR
- TensorRT / ONNX
- quantization
- MLflow / DVC
DATAWISE — benchmark d'apprentissage auto-supervisé

2024–25 Lead tech ~€400k
- DATAWISE — benchmark de modèles de vision auto-supervisés modernes (DINOv2 · iBOT · SwAV · Barlow Twins)
- architecture modulaire backbone/neck/head propre
- entraîné sur le supercalculateur national Jean Zay. Programme de ~400 k€ financé par la Région Auvergne-Rhône-Alpes — actuellement inachevé et en pause.
- SSL
- PyTorch Lightning (DDP)
- SLURM
- Jean Zay
Plateforme de recherche image + texte

2022–24 €500k
- Lead front-end, plateforme de production 500 k€
- extraction de motifs visuels (Mask R-CNN)
- recherche par similarité d'image + texte libre (CLIP/OpenCLIP)
1 détails
- a aussi construit des parties du backend de recherche par embeddings.
- React / TypeScript
- Mask R-CNN
- CLIP / OpenCLIP
- AWS
- semantic search
R&D classification bactérienne clinique

2023–24
- Co-pilotage ML
- segmentation + classification de colonies bactériennes vs références classiques (SVM · K-fold)
- rapport scientifique
1 détails
- co-auteur de l'article SPIE évalué par les pairs.
- segmentation
- SVM baselines
- cross-validation
- scientific writing

~200

« R&D News » veille modèles, à toute l'équipe — une synthèse toutes les 2 semaines sur les nouveaux modèles, architectures & techniques notables. Suivi rapproché des SOTA (LMArena · ARC-AGI · SWE-bench…).

04 / Projets

Projets

Voir tous les projets

Actuel — IA / ML & systèmes

interact — computer-use d'agents, ancré vision (MCP)

En vedette

Serveur MCP qui permet à n'importe quel agent d'agir sur ce qu'il voit — navigateur et bureau réel (naviguer/cliquer/taper/scroller/glisser) ; renvoie des diffs textuels de ce qui a changé plutôt que des captures brutes. L'ancrage GUI fusionne la détection VLM et l'arbre d'accessibilité AT-SPI ; routeur multi-fournisseurs LiteLLM avec sélection de modèle automatique et économe, classée d'après des benchmarks publics (MMMU, ScreenSpot-Pro, Video-MME) ; sandbox software-GL isolée pour que les apps GPU/Flutter/Electron s'affichent. S'installe dans les principaux clients d'agents ; ouvre des issues GitHub automatiquement. MIT.

MCP
computer-use
VLM
LiteLLM
Rust
MIT

dépôt Voir le projet

Framework DL de zéro (AI-4-Alan)

Mon framework de deep learning fait maison — là où je reconstruis les choses depuis zéro pour vraiment les comprendre. Sa colonne vertébrale : une interface de données unique et générique — classification, détection et apprentissage par renforcement passent tous par une même abstraction Dataset, poussée si loin qu'un environnement Gym de RL est lui-même enveloppé comme un Dataset : le même dataloader et la même boucle d'entraînement pilotent alors le supervisé comme le RL. Bâti sur myconf, un système de config typé écrit à la main (coercition par métaclasses, champs calculés paresseux, sans Pydantic), avec des modalités sous-classes de tenseurs (image/texte/bbox) et ResNet · VGG · ViT · DETR (matching hongrois) plus la famille DQN réimplémentés à la main. Embarque un petit autograd scalaire avec visualisation du graphe, pour réapprendre la backprop. ~11k LOC — assumé comme projet d'apprentissage. Ci-dessous : un rollout d'Atari Breakout — l'environnement RL Gym enveloppé comme Dataset — et l'observation 84×84 fournie à l'agent par le pipeline.

PyTorch
myconf
autograd
RL
from-scratch

dépôt Voir le projet

Système de prompts & standards multi-agents

Le projet auquel je tiens le plus : il compile mes standards d'ingénierie (code générique, flexible, soigné) en skills, sous-agents et prompts réutilisables sur Claude Code / Codex / Cursor.

prompt-engineering
compiler
multi-agent
Claude Code

privé Voir le projet

any-compute — moteur de calcul & viz Rust

Un moteur agnostique du framework avec noyaux GPU/SIMD et bindings Python / JS / WASM — construit presque entièrement avec mes agents IA.

Rust
CUDA / ROCm / Metal
SIMD
WASM
FFI

dépôt Voir le projet

App d'apprentissage multiplateforme (aino)

App Flutter + Rust avec un pipeline de contenu LLM — déduplication par embeddings locaux, inférence par lots et en cache.

Flutter
Rust
flutter_rust_bridge
embeddings

privé Voir le projet

Agent de tri de candidatures

Analyse CV & lettres, classe les candidats avec un LLM, les range et notifie l'équipe — le genre d'agent qui lit peut-être ce CV.

LLM
docling
scheduled agent
Slack

interne Voir le projet

torch-module-observer

Un petit utilitaire PyTorch open-source qui instrumente n'importe quel nn.Module avec des forward hooks pour extraire les activations et cartes de features intermédiaires — on cible une couche, on passe une entrée, on récupère sa réponse pour l'inspecter ou la visualiser. Ci-dessous : les cartes de features d'une couche superficielle d'un ResNet (le chien encore lisible par filtre) à côté des activations abstraites d'une couche profonde.

PyTorch
hooks
feature-maps
open-source

dépôt Voir le projet

desktop-mcp

Un serveur MCP qui capture les fenêtres X11 et y applique une analyse visuelle, exposant l'ancrage écran du bureau à n'importe quel agent — un complément ciblé d'interact pour voir ce qui est à l'écran.

MCP
X11
VLM
computer-use

dépôt Voir le projet

linux-commands

Mon outillage Linux publié — raccourcis auto-documentés, dont un rebase multi-branches interactif.

Shell
open-source
DX
keyring

dépôt Voir le projet

Premiers travaux — les débuts

Jeux, projets étudiants et premiers travaux — 13 de plus, gardés en archive plutôt qu'affichés ici.

Ouvrir l'archive

Juste pour le fun

Mon avatar Slack suit mon usage de Claude

Pour le fun, j'ai relié mon usage de Claude à ma photo de profil Slack — l'équipe voit d'un coup d'œil quand je suis sur le point d'être à court (et quand ça va me rendre triste). Un modèle d'image GPT peint la mascotte selon dix humeurs, Pillow y appose la barre d'usage exacte (qu'un modèle d'image ne sait pas dessiner au pixel près), et un timer systemd lit mon usage depuis ~/.claude puis pousse la bonne image sur Slack via users.setPhoto.

Encore plein de Claude À court d'usage

Un token utilisateur personnel, dont le scope ne permet de changer que mon propre avatar.

05 / Recherche & enseignement

Recherche & enseignement

Publication

Co-auteur (2ᵉ sur 6) d'un article SPIE évalué par les pairs — classification CNN / SVM en imagerie multispectrale biomédicale.

Leroux, D., Blanchet, A., Davenas, C., Lac, L., Le Bihan, Y., & Fulchiron, C. (2025). A frugal multispectral imaging solution to identify uropathogens via SVM and ANN classification. Translational Biophotonics: Diagnostics and Therapeutics IV, Proc. SPIE Vol. 13934, 1393430.

DOI 2nd author of 6 · ECBO 2025, Munich · published 18 Dec 2025

Encadrement & enseignement

Encadrement d'un stage de recherche de Master sur les agents à base de LLM (soutenu, Grenoble INP/UGA) — agent d'extraction & validation de données d'entreprises B2B ; benchmark LLMs × outils de recherche MCP. Coaching de 5 équipes d'étudiants ingénieurs à l'ESISAR (Grenoble INP) sur des projets industriels d'IA — dont un outil de transcription vocale temps réel exigeant des performances sur du vocabulaire métier.

internship supervision
student coaching
LLM agents
MCP search
ASR / domain vocabulary

06 / Formation

Formation & certifications

Ingénieur ML (alternance)

OpenClassrooms · Neovision

2022–24
Robotique orientée IA (alternance)

IMERIR

2021–22
DUT Informatique (3e/19 · Code Game Jam 2020)

IUT Montpellier-Sète

2019–21
Baccalauréat S, mention Bien

2019
3 ans scolarisé au Royaume-Uni — bilingue FR/EN

2010–13

Le diplôme ML en ligne était un choix assumé — les écoles locales n'étaient pas assez centrées IA ; le format en ligne a libéré du temps pour expérimenter largement et progresser plus vite.

Certificats (autodidacte)

Archives vidéo

t-SNE en entraînement — classification de threads (OpenClassrooms)

07 / Ce qui compte pour moi

Ce qui compte pour moi

Je veux que l'Europe garde ses propres options d'IA crédibles — alors je construis sur de l'infrastructure souveraine européenne là où elle tient, en restant pragmatique : valider d'abord avec les meilleurs modèles, puis basculer vers le souverain une fois que ça tient.

En pratique

Auto-héberge des modèles ouverts (Qwen, Gemma) on-prem pour les données confidentielles

Stack souveraine de prédilection — auto-hébergé, Mistral, Scaleway, Kyutai

08 / Contact

Discutons

Toujours partant pour échanger — sur l'IA, un projet, ou ce que vous avez vu ici. Pour me joindre :

contact@alan-blanchet.fr +33 7 81 86 62 87

CV — Anglais (PDF) CV — Français (PDF)

GitHub

github.com/AlanBlanchet

Hugging Face

huggingface.co/Alanox

in/alanblanchet

AlanBlanchet

Agents & LLMOps

LLMs

Voix — STT

Voix — TTS

Voix — rehaussement audio & VAD

Vision

Appariement d'images

Inférence

RL

HPC / distribué

Systèmes & cloud

Langages & outils

Transverse

Ingénieur R&D

Agent vocal conversationnel — téléphonie temps réel

Appui IA interne & outillage d'agents

Système de classification d'images multi-têtes

Framework de rehaussement & reconstruction de la parole

Appariement & recalage d'images

Plateforme de démonstrateurs ML interne

Détection d'objets temps réel

DATAWISE — benchmark d'apprentissage auto-supervisé

Plateforme de recherche image + texte

R&D classification bactérienne clinique

Actuel — IA / ML & systèmes

interact — computer-use d'agents, ancré vision (MCP)

Framework DL de zéro (AI-4-Alan)

Système de prompts & standards multi-agents

any-compute — moteur de calcul & viz Rust

App d'apprentissage multiplateforme (aino)

Agent de tri de candidatures

torch-module-observer

desktop-mcp

linux-commands

Alan
Blanchet