Alan Blanchet

Ingénieur IA — Agents, systèmes LLM & ML

Alan
Blanchet

Je construis de l'IA pour la production — agents, LLM, voix et vision — et je reconstruis les modèles de zéro quand je veux vraiment les comprendre.

  • 5+ ans en IA / ML
  • ~900 k€+ de projets livrés
  • Construit & opère la stack d'agents IA de l'équipe

Grenoble, France

Alan Blanchet

Ingénieur R&D · Neovision

Grenoble · 25 ans

Défiler

La stack

PyTorch Hugging Face TensorFlow Keras scikit-learn OpenAI Anthropic Ollama LangChain ONNX OpenCV Gradio Jupyter CUDA NumPy pandas Plotly Python Rust TypeScript C++ React Next.js FastAPI Docker Linux PostgreSQL Redis Git GitHub

01 / À propos

À propos

J’apprends en reconstruisant depuis les premiers principes.

Ingénieur IA/ML surtout autodidacte, 5+ ans en systèmes de vision, de parole et de LLM en production, désormais centré sur les agents IA et les applis LLM. J'aime comprendre les couches sous les outils que j'utilise, alors j'en ai construit quelques-unes moi-même — mon propre framework de deep learning avec moteur d'autograd à la main, un pipeline vocal temps réel, un ordonnanceur de cluster GPU multi-utilisateurs, une extension d'agent « computer-use » publiée, un compilateur de prompt-engineering — parce que j'apprends en reconstruisant depuis les premiers principes. Je tiens à un code propre, bien généralisé et typé — construit avec des agents, mais pas « vibe-codé » — gardé honnête par une habitude de tests et de cas limites d'abord.

Surtout autodidacte · 5+ ans

Grenoble, France

Français (natif) · Anglais (bilingue — 3 ans scolarisé au Royaume-Uni)

Co-auteur article SPIE (2025)

Au cœur du travail

  • Agents IA
  • Applis LLM
  • Voix
  • Vision
  • Inférence

02 / Compétences

Compétences

La stack, par domaine — ce avec quoi je construis vraiment. · 163 technos

Agents & LLMOps

  • LiveKit Agents
  • LangChain / LangGraph
  • OpenAI Agents SDK
  • MCP (builds servers)
  • tool-calling
  • LLM-as-judge
  • Langfuse
  • LiteLLM
  • Ollama
  • LM Studio
  • OpenTelemetry
  • sentence-transformers
  • FAISS / usearch
  • RAG
  • AGENTS.md / CLAUDE.md

LLMs

  • Claude / GPT / Gemini (API)
  • Qwen
  • Llama
  • DeepSeek
  • GPT-OSS
  • Mistral
  • RAG
  • fine-tuning / LoRA
  • MoE
  • KV-cache
  • quantification
  • vLLM
  • prompt caching
  • Batch API cost optimization

Voix — STT

  • Whisper / faster-whisper
  • NVIDIA Parakeet
  • Kyutai
  • Silero
  • AssemblyAI
  • Deepgram

Voix — TTS

  • ElevenLabs
  • Cartesia
  • Deepgram Aura
  • Kokoro
  • Piper
  • Voxtral
  • Kyutai / Moshi

Voix — rehaussement audio & VAD

  • Silero VAD
  • EBEN
  • HiFi-GAN / HiFi++
  • MP-SENet
  • xLSTM-SENet
  • VoiceFilter
  • DTLN
  • RNNoise
  • SpeechBrain
  • PESQ / STOI / SI-SDR
  • SIP telephony (Twilio / Telnyx)

Vision

  • RT-DETR / RT-DETRv2
  • D-FINE
  • YOLO (v8 / NAS)
  • DETR
  • Faster R-CNN
  • SSD
  • SAM
  • SegFormer
  • U-Net
  • DINOv2 / v3
  • iBOT
  • SwAV
  • Barlow Twins
  • BYOL
  • SimCLR
  • EquiMod
  • ViT / Swin
  • MLP-Mixer
  • CLIP / OpenCLIP / SigLIP
  • Mask R-CNN
  • NMS · Hungarian matching · GIoU · TIDE

Appariement d'images

  • GIM
  • RoMa
  • DKM
  • LoFTR
  • LightGlue
  • SuperPoint
  • OmniGlue
  • RANSAC / MAGSAC
  • homographie / TPS

Inférence

  • TensorRT
  • ONNX / onnxruntime / graph surgeon
  • INT8 / FP16 / FP8 quantification
  • CUDA / Triton
  • CuPy
  • batching
  • einops

RL

  • REINFORCE / VPG
  • DQN family (Double, Dueling, Recurrent)
  • PPO
  • R2D2 / NGU-style
  • RND
  • PER (SumTree)
  • Gymnasium
  • Ray RLlib

HPC / distribué

  • SLURM
  • submitit
  • Lightning DDP
  • Accelerate
  • DeepSpeed
  • Ray
  • Jean Zay (IDRIS)

Systèmes & cloud

  • Linux (deep) / systemd
  • Docker / Compose
  • Kubernetes / Helm
  • Nginx / Caddy / Traefik + Let's Encrypt
  • AWS (S3/SQS/Cognito/CloudWatch/EC2)
  • Scaleway (GPU, dedicated endpoints)
  • GCP
  • Terraform
  • Tailscale
  • PostgreSQL / Prisma / SQLAlchemy / SQLite
  • MariaDB/MySQL
  • Redis
  • CI/CD
  • CVAT
  • Roboflow
  • FiftyOne
  • DVC
  • MLflow
  • W&B

Langages & outils

  • Python (expert)
  • Rust (production)
  • TypeScript / JS
  • C / C++
  • CUDA
  • Dart
  • SQL
  • PHP
  • Shell
  • PyTorch
  • Lightning
  • timm
  • transformers / datasets
  • einops
  • torchmetrics
  • Albumentations
  • sklearn / XGBoost
  • polars / pandas
  • NumPy
  • React
  • Next.js
  • Svelte
  • Vue
  • Tailwind
  • Flutter (+ flutter_rust_bridge FFI)
  • FastAPI
  • Express
  • Gradio
  • Streamlit
  • uv / Poetry / conda
  • cargo / clippy / miri / bindgen
  • just

Transverse

  • Bilingual FR/EN
  • scientific writing & client reporting
  • mentoring
  • cross-team enablement (R&D News)
  • GDPR / sovereignty-aware architecture
  • reads & reproduces papers
  • code-as-craft convictions

03 / Expérience

Expérience

Ingénieur R&D

Neovision · Grenoble · 2022–présent

IA / ML au cœur du poste, avec un appui transverse régulier — infra & réseau, full-stack, administration des comptes.

~900 k€+ livrés parc ~30 hôtes
  • Enablement IA — construit l'outillage d'agents interne (serveurs MCP, routage multi-fournisseurs, serving LLM on-prem) ; anime la veille « R&D News » bimensuelle pour l'équipe.
  • Gère la stack IA — détient les accès API de l'entreprise aux fournisseurs d'IA, opère les comptes d'agents IA et leur budget, ainsi que les comptes Copilot + Claude de l'équipe.
  • Projets livrés — lead ou ingénieur principal sur ~900 k€+ ; automatisation partielle de la génération du rapport Crédit Impôt Recherche (CIR) (2025, réutilisée en 2026).
  • Infra & réseau — conçu et opère une plateforme de calcul GPU multi-utilisateurs de zéro ; je gère un parc de ~30 hôtes sur Scaleway, AWS et on-prem — instance GPU L40S dédiée, poste 2× RTX 3090 que j'administre, CVAT, NAS et devices edge — avec reverse proxies, TLS et orchestration de conteneurs.
  • Livraison full-stack — front-ends React / Next.js / Svelte jusqu'aux back-ends FastAPI / Django.

Combien d’IA ?

Filtrez par part construite avec mes agents IA — du fait-main jusqu’à l’orchestration totale.

● construit avec mes agents IA orchestrés ○ écrit à la main

  1. Agent vocal conversationnel — téléphonie temps réel

    2025–présent Lead tech €300k+
    • Agent téléphonique temps réel, prise de rendez-vous médicaux
    • pipeline construit de zéro → migré sur LiveKit (avec l'équipe)
    • LLM/STT/TTS par appel avec repli
    5 détails
    • tool-calling
    • vérification de sûreté LLM
    • observabilité complète
    • en production
    • démo interne de toute la gamme, dont le clonage vocal en direct pendant un appel.
    • LiveKit
    • LangGraph
    • multi-provider STT/TTS
    • SIP telephony
    • Langfuse
    • OpenTelemetry
    • eval harness
  2. Appui IA interne & outillage d'agents

    2024–présent
    • J'épaule les collègues dès qu'ils veulent tester ou expérimenter une IA via API
    • outillage construit en interne — serveurs MCP
    • routage multi-fournisseurs
    3 détails
    • serveur LM Studio auto-hébergé (2× RTX 3090, on-prem/confidentiel)
    • un système de prompts/standards qui régit la façon dont les agents écrivent le code
    • automatisation partielle de la génération du Crédit Impôt Recherche (CIR) (2025, réutilisée en 2026).
    • MCP servers
    • local LLM server (on-prem)
    • Ollama / LM Studio
    • AI enablement
    • coding standards as prompts
  3. Système de classification d'images multi-têtes

    2026 Lead tech €65k
    • Classification d'images multi-têtes (DINOv2 + VLM), livrée pour un client
    • le plus important : le système agentique maison qui a permis de la construire.
    • DINOv2
    • multi-head classification
    • agent-built
    • FastAPI / Gradio
  4. Framework de rehaussement & reconstruction de la parole

    2025 Lead tech €85k
    • Reconstruit une parole propre à partir de micros intra-auriculaires
    • plusieurs modèles de rehaussement (EBEN · HiFi-GAN/++ · MP-SENet · xLSTM-SENet · VoiceFilter) derrière un pipeline
    • simulateur de transfert acoustique bouche-oreille
    2 détails
    • PESQ/STOI/SI-SDR
    • mis en production (FastAPI · Gradio · Docker).
    • PyTorch Lightning
    • torchaudio
    • GANs
    • audio denoising
    • FastAPI / Gradio
  5. Appariement & recalage d'images

    2025 Lead tech ~€80k
    • Recalage d'images / template matching pour l'authentification de produits
    • matching de points-clés (GIM-DKM · RoMa · LoFTR · LightGlue · SuperPoint · OmniGlue) → RANSAC/MAGSAC → homographie/TPS
    • robuste aux captures smartphone
    2 détails
    • plugin d'annotation CVAT de keypoint-matching sur mesure
    • métriques GTE/CTE.
    • keypoint matching
    • RANSAC / homography
    • CVAT plugin
    • GTE / CTE
    • PyTorch
  6. Plateforme de démonstrateurs ML interne

    2024–26 Lead tech
    • Héberge les démonstrateurs clients + solutions internes
    • 25+ applis
    • chacune déployée/gérée à partir d'images Docker, liens partageables
    3 détails
    • orchestration par démo
    • reverse proxy
    • accès par rôle.
    • Next.js
    • PostgreSQL / Prisma
    • Docker orchestration
    • Scaleway
  7. Détection d'objets temps réel

    2024
    • Étude approfondie + ablation des détecteurs SOTA (RT-DETR · YOLO-NAS · YOLOv8) → sélection de RT-DETR (alors SOTA)
    • déploiement edge (ONNX · TensorRT · quant. INT8/FP8).
    • RT-DETR
    • TensorRT / ONNX
    • quantization
    • MLflow / DVC
  8. DATAWISE — benchmark d'apprentissage auto-supervisé

    2024–25 Lead tech ~€400k
    • DATAWISE — benchmark de modèles de vision auto-supervisés modernes (DINOv2 · iBOT · SwAV · Barlow Twins)
    • architecture modulaire backbone/neck/head propre
    • entraîné sur le supercalculateur national Jean Zay. Programme de ~400 k€ financé par la Région Auvergne-Rhône-Alpes — actuellement inachevé et en pause.
    • SSL
    • PyTorch Lightning (DDP)
    • SLURM
    • Jean Zay
  9. Plateforme de recherche image + texte

    2022–24 €500k
    • Lead front-end, plateforme de production 500 k€
    • extraction de motifs visuels (Mask R-CNN)
    • recherche par similarité d'image + texte libre (CLIP/OpenCLIP)
    1 détails
    • a aussi construit des parties du backend de recherche par embeddings.
    • React / TypeScript
    • Mask R-CNN
    • CLIP / OpenCLIP
    • AWS
    • semantic search
  10. R&D classification bactérienne clinique

    2023–24
    • Co-pilotage ML
    • segmentation + classification de colonies bactériennes vs références classiques (SVM · K-fold)
    • rapport scientifique
    1 détails
    • co-auteur de l'article SPIE évalué par les pairs.
    • segmentation
    • SVM baselines
    • cross-validation
    • scientific writing
~200

« R&D News » veille modèles, à toute l'équipe — une synthèse toutes les 2 semaines sur les nouveaux modèles, architectures & techniques notables. Suivi rapproché des SOTA (LMArena · ARC-AGI · SWE-bench…).

04 / Projets

Projets

Voir tous les projets

Actuel — IA / ML & systèmes

interact — computer-use d'agents, ancré vision (MCP)

En vedette

Serveur MCP qui permet à n'importe quel agent d'agir sur ce qu'il voit — navigateur et bureau réel (naviguer/cliquer/taper/scroller/glisser) ; renvoie des diffs textuels de ce qui a changé plutôt que des captures brutes. L'ancrage GUI fusionne la détection VLM et l'arbre d'accessibilité AT-SPI ; routeur multi-fournisseurs LiteLLM avec sélection de modèle automatique et économe, classée d'après des benchmarks publics (MMMU, ScreenSpot-Pro, Video-MME) ; sandbox software-GL isolée pour que les apps GPU/Flutter/Electron s'affichent. S'installe dans les principaux clients d'agents ; ouvre des issues GitHub automatiquement. MIT.

  • MCP
  • computer-use
  • VLM
  • LiteLLM
  • Rust
  • MIT
dépôt Voir le projet

Framework DL de zéro (AI-4-Alan)

Mon framework de deep learning fait maison — là où je reconstruis les choses depuis zéro pour vraiment les comprendre. Sa colonne vertébrale : une interface de données unique et générique — classification, détection et apprentissage par renforcement passent tous par une même abstraction Dataset, poussée si loin qu'un environnement Gym de RL est lui-même enveloppé comme un Dataset : le même dataloader et la même boucle d'entraînement pilotent alors le supervisé comme le RL. Bâti sur myconf, un système de config typé écrit à la main (coercition par métaclasses, champs calculés paresseux, sans Pydantic), avec des modalités sous-classes de tenseurs (image/texte/bbox) et ResNet · VGG · ViT · DETR (matching hongrois) plus la famille DQN réimplémentés à la main. Embarque un petit autograd scalaire avec visualisation du graphe, pour réapprendre la backprop. ~11k LOC — assumé comme projet d'apprentissage. Ci-dessous : un rollout d'Atari Breakout — l'environnement RL Gym enveloppé comme Dataset — et l'observation 84×84 fournie à l'agent par le pipeline.

  • PyTorch
  • myconf
  • autograd
  • RL
  • from-scratch
dépôt Voir le projet

Système de prompts & standards multi-agents

Le projet auquel je tiens le plus : il compile mes standards d'ingénierie (code générique, flexible, soigné) en skills, sous-agents et prompts réutilisables sur Claude Code / Codex / Cursor.

  • prompt-engineering
  • compiler
  • multi-agent
  • Claude Code
privé Voir le projet

any-compute — moteur de calcul & viz Rust

Un moteur agnostique du framework avec noyaux GPU/SIMD et bindings Python / JS / WASM — construit presque entièrement avec mes agents IA.

  • Rust
  • CUDA / ROCm / Metal
  • SIMD
  • WASM
  • FFI
dépôt Voir le projet

App d'apprentissage multiplateforme (aino)

App Flutter + Rust avec un pipeline de contenu LLM — déduplication par embeddings locaux, inférence par lots et en cache.

  • Flutter
  • Rust
  • flutter_rust_bridge
  • embeddings
privé Voir le projet

Agent de tri de candidatures

Analyse CV & lettres, classe les candidats avec un LLM, les range et notifie l'équipe — le genre d'agent qui lit peut-être ce CV.

  • LLM
  • docling
  • scheduled agent
  • Slack
interne Voir le projet

torch-module-observer

Un petit utilitaire PyTorch open-source qui instrumente n'importe quel nn.Module avec des forward hooks pour extraire les activations et cartes de features intermédiaires — on cible une couche, on passe une entrée, on récupère sa réponse pour l'inspecter ou la visualiser. Ci-dessous : les cartes de features d'une couche superficielle d'un ResNet (le chien encore lisible par filtre) à côté des activations abstraites d'une couche profonde.

  • PyTorch
  • hooks
  • feature-maps
  • open-source
dépôt Voir le projet

desktop-mcp

Un serveur MCP qui capture les fenêtres X11 et y applique une analyse visuelle, exposant l'ancrage écran du bureau à n'importe quel agent — un complément ciblé d'interact pour voir ce qui est à l'écran.

  • MCP
  • X11
  • VLM
  • computer-use
dépôt Voir le projet

linux-commands

Mon outillage Linux publié — raccourcis auto-documentés, dont un rebase multi-branches interactif.

  • Shell
  • open-source
  • DX
  • keyring
dépôt Voir le projet
Premiers travaux — les débuts

Jeux, projets étudiants et premiers travaux — 13 de plus, gardés en archive plutôt qu'affichés ici.

Ouvrir l'archive

Juste pour le fun

Mon avatar Slack suit mon usage de Claude

Pour le fun, j'ai relié mon usage de Claude à ma photo de profil Slack — l'équipe voit d'un coup d'œil quand je suis sur le point d'être à court (et quand ça va me rendre triste). Un modèle d'image GPT peint la mascotte selon dix humeurs, Pillow y appose la barre d'usage exacte (qu'un modèle d'image ne sait pas dessiner au pixel près), et un timer systemd lit mon usage depuis ~/.claude puis pousse la bonne image sur Slack via users.setPhoto.

Encore plein de Claude À court d'usage
  1. Avatar Slack à 10% d'usage Claude
  2. Avatar Slack à 20% d'usage Claude
  3. Avatar Slack à 30% d'usage Claude
  4. Avatar Slack à 40% d'usage Claude
  5. Avatar Slack à 50% d'usage Claude
  6. Avatar Slack à 60% d'usage Claude
  7. Avatar Slack à 70% d'usage Claude
  8. Avatar Slack à 80% d'usage Claude
  9. Avatar Slack à 90% d'usage Claude
  10. Avatar Slack à 100% d'usage Claude

Un token utilisateur personnel, dont le scope ne permet de changer que mon propre avatar.

05 / Recherche & enseignement

Recherche & enseignement

Publication

Co-auteur (2ᵉ sur 6) d'un article SPIE évalué par les pairs — classification CNN / SVM en imagerie multispectrale biomédicale.

Leroux, D., Blanchet, A., Davenas, C., Lac, L., Le Bihan, Y., & Fulchiron, C. (2025). A frugal multispectral imaging solution to identify uropathogens via SVM and ANN classification. Translational Biophotonics: Diagnostics and Therapeutics IV, Proc. SPIE Vol. 13934, 1393430.
DOI 2nd author of 6 · ECBO 2025, Munich · published 18 Dec 2025

Encadrement & enseignement

Encadrement d'un stage de recherche de Master sur les agents à base de LLM (soutenu, Grenoble INP/UGA) — agent d'extraction & validation de données d'entreprises B2B ; benchmark LLMs × outils de recherche MCP. Coaching de 5 équipes d'étudiants ingénieurs à l'ESISAR (Grenoble INP) sur des projets industriels d'IA — dont un outil de transcription vocale temps réel exigeant des performances sur du vocabulaire métier.

  • internship supervision
  • student coaching
  • LLM agents
  • MCP search
  • ASR / domain vocabulary

06 / Formation

Formation & certifications

  1. Ingénieur ML (alternance)

    OpenClassrooms · Neovision

    2022–24

  2. Robotique orientée IA (alternance)

    IMERIR

    2021–22

  3. DUT Informatique (3e/19 · Code Game Jam 2020)

    IUT Montpellier-Sète

    2019–21

  4. Baccalauréat S, mention Bien

    2019

  5. 3 ans scolarisé au Royaume-Uni — bilingue FR/EN

    2010–13

Le diplôme ML en ligne était un choix assumé — les écoles locales n'étaient pas assez centrées IA ; le format en ligne a libéré du temps pour expérimenter largement et progresser plus vite.

Certificats (autodidacte)

Archives vidéo

Présentation · ≈ 2021 (époque DUT)
Présentation · ≈ 2021 (époque DUT)
t-SNE en entraînement — classification de threads (OpenClassrooms)
t-SNE en entraînement — classification de threads (OpenClassrooms)

07 / Ce qui compte pour moi

Ce qui compte pour moi

Je veux que l'Europe garde ses propres options d'IA crédibles — alors je construis sur de l'infrastructure souveraine européenne là où elle tient, en restant pragmatique : valider d'abord avec les meilleurs modèles, puis basculer vers le souverain une fois que ça tient.

En pratique

Auto-héberge des modèles ouverts (Qwen, Gemma) on-prem pour les données confidentielles

Stack souveraine de prédilection — auto-hébergé, Mistral, Scaleway, Kyutai

08 / Contact

Discutons

Toujours partant pour échanger — sur l'IA, un projet, ou ce que vous avez vu ici. Pour me joindre :