L4 / IC3 · 3 à 5 ans

Préparation entretien ML Engineer, ce qui vous attend

5 rounds4 à 6 semaines9 questions types155–185 base

Si vous préparez un entretien ML Engineer, attendez-vous à un process qui se situe entre Data Scientist et Software Engineer. La barre coding est plus proche du SWE que du DS, des questions d'algorithmes par-dessus de la manipulation de données en pandas / numpy, et le round de system design teste comment vous construiriez l'infrastructure autour d'un modèle, pas seulement le modèle lui-même. C'est la distinction qui surprend le plus les candidats qui viennent du Data Science : on ne vous demande pas surtout de modéliser, on vous demande de mettre en production.

Dans la plupart des boîtes tech, le process est : pré-screen recruteur, un round de coding (souvent un LeetCode-medium plus une petite implémentation ML), un round de ML system design à échelle modérée, un round de fondamentaux ML sur le classique ou le deep learning, et un round comportemental. Les AI labs (Mistral, Hugging Face, Photoroom, Owkin) penchent davantage vers le Python et les implémentations from scratch ; les boîtes produit orientées reco / ranking (Criteo, Doctolib, Dataiku) creusent le system design ; les filiales FAANG restent calées sur la barre coding du SWE. La calibration L4 / IC3, c'est porter un projet de modèle de bout en bout : cadrage, training, déploiement, monitoring.

Version personnalisée

Ce guide couvre la barre générale pour MLE. Collez votre offre et Calibrd la rend personnelle : ce que cette entreprise précise demande, où votre CV est léger, et une simulation complète que vous répétez à voix haute jusqu'à être prêt(e). Tout se passe dans votre navigateur, rien à installer. Calibrd repère votre niveau à partir de votre CV, du stage au poste de direction. Gratuit pour commencer.

Démarrer gratuitement →Ajouter à Chrome, il lit l'offre pour vous →Ou analyser une offre d'abord →

Mise à jour 2026

Ce guide couvre la barre générale pour MLE. Quelques choses ont changé en France en 2026, l'AI Act encadre le recrutement IA à partir du 2 août, 31 % des candidats utilisent déjà l'IA pour préparer (APEC), les mises en situation remplacent les tests classiques, et le cycle de recrutement reste à 12 semaines. Lire ce qui a changé en 2026 →

Ce qui sera attendu de vous

Entraîner et déployer des modèles ML sur un problème produit ou métier défini
Construire les pipelines de training et d'évaluation, généralement en Python avec un framework comme PyTorch / TensorFlow / JAX
Porter les données, les features et les labels de votre modèle, en partenariat avec les DE ou DS en amont
Mettre en place le monitoring, la cadence de ré-entraînement et les déploiements shadow / canary
Écrire du Python de qualité production : tests, code review, CI/CD
Collaborer avec les DS, DE et l'engineering produit sur toute la surface cross-fonctionnelle autour de votre modèle

Process d'entretien typique

La plupart des entreprises suivent une trame similaire pour les entretiens MLE. Délai calendaire total : 4 à 6 semaines du pré-screen recruteur jusqu'à l'offre.

Pré-screen recruteur

Appel de 30 min

Parcours, calibration du poste, motivation, attentes de rémunération

Coding

60 min

Algorithme LeetCode-medium + manipulation de données en pandas / numpy. Certaines boîtes ajoutent une petite implémentation ML, par ex. écrire un k-means, une descente de gradient ou de l'attention from scratch

ML system design

60 min

Designer un système ML de bout en bout : données → training → serving → monitoring. Prompts courants : système de recommandation, détection de fraude, ranking. La barre vise une échelle modérée au L4

Fondamentaux ML appliqués

45 à 60 min

Concepts ML classiques (biais-variance, régularisation, sélection de modèle) ou fondamentaux deep learning si le poste est orienté DL. Parfois un round de discussion de papier dans les AI labs

Comportemental / hiring manager

45 min

Projets passés, collaboration cross-fonctionnelle avec DS / DE, gestion d'incidents en production, retours d'expérience de déploiement

Questions types à anticiper

Représentatives de ce que les entreprises demandent à ce niveau, pas une liste exhaustive. Lancez le scan gratuit ci-dessus pour des questions prédites liées à une offre d'emploi précise. L'extension Chrome ajoute l'entraînement vocal avec coaching IA sur chaque réponse (technique, design système, comportemental, motivation).

Technique / coding

“Implémentez un k-means from scratch en Python, sans sklearn. Détaillez comment vous géreriez les clusters vides et l'initialisation.”
“On vous donne un CSV de training de 10 Go qui ne tient pas en mémoire. Implémentez un DataLoader PyTorch qui streame depuis le disque efficacement. Détaillez comment vous géreriez le déséquilibre de classes au sampling.”
“Détaillez comment vous débuggeriez un modèle dont l'AUC offline est de 0.85 mais dont la performance online est proche du hasard.”

Design système

“Designez le système de recommandation de notre home feed. Couvrez les données de training, les features, la latence de serving et ce que vous monitoreriez en production.”
“Designez un système de détection de fraude qui score les transactions en moins de 50 ms. Détaillez le choix de modèle, le pipeline de features et la cadence de ré-entraînement.”
“Designez un feature store pour une équipe ML de 50 ingénieurs. Quel est le partage lecture / écriture, et comment gérez-vous la parité online / offline ?”

Comportemental (méthode STAR)

“Parlez-moi d'un projet ML que vous avez mis en production. Qu'est-ce qui a cassé en premier ?”
“Décrivez une fois où votre modèle marchait bien offline mais moins bien online. Comment avez-vous diagnostiqué et corrigé ?”
“Déroulez un désaccord avec un data scientist ou un partenaire produit sur un choix de modèle ou de feature.”

Benchmark de salaire

Salaire médian pour MLE dans les grandes boîtes tech US, chiffres principaux en USD. Paris / Berlin / Singapour paient typiquement 30 à 50 % de moins en base ; les ratios d'equity varient selon le stade de l'entreprise.

Salaire de base155–185 k$ (SF/NYC)

Equity (vest annuel)80–150 k$/an

Bonus10–15 %

Le total comp FAANG L4 ML Engineer au 50e percentile est de 260–340 k$. À Paris, la base d'un MLE mid tourne autour de 55–80 k€ selon l'employeur (scale-ups vs grands comptes vs filiales FAANG). Mistral et Hugging Face paient nettement au-dessus du marché, avec un poids equity bien plus lourd que les boîtes produit classiques. Le fixe colle de près à celui d'un SWE L4, avec une prime equity occasionnelle dans les boîtes AI-first.

Comment se préparer, cinq conseils tactiques

Ouvrez vos réponses comportementales avec la méthode STAR, Situation, Tâche, Action, Résultat. Les conseils tactiques ci-dessous s'appuient sur cette structure pour ce rôle précis.

Drillez 60+ LeetCode mediums plus 20+ exercices pandas / numpy. La barre coding du MLE est plus proche du SWE que du DS, c'est l'écart numéro un
Travaillez 3 ou 4 problèmes canoniques de ML system design à froid : recommandation, détection de fraude, ranking, search. Pattern-matchez le reste depuis là
Soyez prêt à implémenter au moins un algorithme ML from scratch : k-means, descente de gradient, une passe forward+backward de réseau simple. Les AI labs (Mistral, Hugging Face, Photoroom) le demandent presque toujours
Lisez « Designing Machine Learning Systems » de Chip Huyen, la référence canonique pour le round de ML system design
Préparez 5 à 6 STAR stories avec des détails de déploiement en production : AUC du modèle, budget de latence, cadence de ré-entraînement, problèmes débuggés après le lancement
Si vous venez d'un bootcamp data (DataScientest, Jedha), prévoyez du temps en plus sur le code de production hors notebook : classes, type hints, pytest, une petite API FastAPI

Les pièges fréquents au niveau MLE

Quelques erreurs fréquentes qui font recaler les candidats MLE même quand ils sont par ailleurs solides. Mieux vaut les repérer en mock interview avant qu'elles n'apparaissent en vrai.

Designer un système ML autour du modèle sans jamais mentionner le pipeline de données de training ni les labels.

Pourquoi ça rate

Les rounds de ML system design notent si vous comprenez que le modèle représente peut-être 10 % du système. Le reste, c'est l'ingestion de données, le labelling, les pipelines de training, l'infra de serving, le monitoring. Un candidat qui part direct sur « je prendrais un gradient boosted tree avec ces features » sans dire d'où viennent les données ni comment les labels sont générés donne l'image d'un chercheur qui n'a jamais shipé en prod.

Comment rattraper

Ouvrez chaque réponse de ML system design par les données : la source, la fréquence de rafraîchissement, comment les labels sont générés (feedback explicite, implicite, labellisation humaine), la cadence du pipeline de training. Passez ensuite au choix de modèle. Consacrez au moins les 10 premières minutes aux données et au pipeline.

Résoudre correctement la question de coding sans narrer le raisonnement ML autour.

Pourquoi ça rate

Les rounds de coding du MLE notent à la fois la justesse algorithmique et le jugement ML. Implémenter un k-means correct sans mentionner la gestion des clusters vides, la sensibilité à l'initialisation ou comment choisir k indique à l'intervieweur que vous avez mémorisé l'algorithme mais que vous ne l'avez jamais fait tourner sur de vraies données. Le signal, c'est la conversation autour du code, pas seulement le code.

Comment rattraper

Quand vous implémentez un algorithme ML, narrez les pièges au fur et à mesure : l'initialisation compte à cause des minima locaux, voici comment je gère les clusters vides, voici comment je choisirais k en pratique. Traitez l'algorithme comme un truc que vous déploieriez vraiment, pas comme une recette de manuel.

Parler de projets passés sans nommer ce qui a été déployé, quelle était la métrique du modèle en prod, ni ce qui a cassé après le lancement.

Pourquoi ça rate

Les intervieweurs MLE calibrent contre une expérience de production IC3. Les histoires qui s'arrêtent à « le modèle a fait 0.85 d'AUC » ratent la réalité de la production, où les modèles dérivent, les features se périment et les pipelines de training cassent. Le commentaire qui revient après le loop, c'est généralement « solide sur le modèle, aucune idée s'il en a vraiment fait tourner un en prod ».

Comment rattraper

Pour chaque story de projet ML, poussez-la au-delà des métriques offline : ce qui a shipé, quelle était la métrique online, ce qui a foiré après le lancement (drift, qualité des données, pics de latence), ce que vous avez changé en conséquence. Un seul échec post-lancement précis vous crédibilise plus que trois belles stories d'AUC offline.

Ressources recommandées

Livres, cours et outils qui reviennent le plus dans la préparation MLE. Sans lien d'affiliation.

01
Designing Machine Learning Systems (Chip Huyen) →Référence canonique pour le ML system design. À lire de bout en bout avant le round de system design.
02
Made With ML →Cours pratique gratuit sur le MLOps et le ML en production. Utile pour les parties déploiement / monitoring du system design.
03
Machine Learning Interviews Book (Chip Huyen) →Banque de questions et frameworks pour la prep d'entretien ML. Gratuit en ligne.
04
Hugging Face, le cours →Pour les fondamentaux Transformers / NLP et le travail de fine-tuning. Précieux quand le poste est orienté LLM ou deep learning.
05
Designing Data-Intensive Applications (Kleppmann) →Pour les volets data-pipeline et stockage du ML system design. Les chapitres 1 à 3 couvrent les fondations utilisées à chaque niveau.

Scénarios courants

Je suis Data Scientist avec 3 ans d'expérience et je veux passer MLE. Comment je comble l'écart de coding quand l'essentiel de mon travail était des notebooks et du SQL ?

La barre coding est le vrai écart. Les entretiens DS restent surtout en territoire pandas / SQL ; le MLE demande du LeetCode-medium en 40 minutes par-dessus le travail pandas / numpy. Si votre dernier coding algo-style remonte à la fac, prévoyez 8 à 12 semaines de LeetCode, 60+ mediums minimum, avec la liste Top 150 comme premier filtre. En parallèle, drillez le Python hors notebook : classes, type hints, pytest, un petit service FastAPI. Les intervieweurs notent « est-ce que cette personne pourrait commit du code de prod sans supervision », et les profils notebook-only échouent souvent là-dessus même quand la modélisation est solide. Si vous sortez d'un bootcamp (DataScientest, Jedha), c'est le même piège en plus marqué. Sautez le grind d'implémentation ML from scratch sauf si vous visez les AI labs (Mistral, Hugging Face) ; pour un poste MLE produit, savoir quand prendre sklearn plutôt que PyTorch compte plus qu'écrire une descente de gradient de mémoire. En behavioral, menez avec ce que vous avez mis en production, pas ce que vous avez entraîné. « J'ai construit un modèle à 0.85 d'AUC » est une réponse DS ; « j'ai déployé un modèle et vu sa précision chuter de 8 % la première semaine à cause d'un skew training-serving » est une réponse MLE.

Je veux entrer chez Mistral ou Hugging Face comme MLE. Le process est-il différent d'une scale-up produit, et comment je m'y prépare ?

Oui, les AI labs creusent un signal différent des boîtes produit reco / ranking. Attendez-vous à plus de Python pur et à au moins une implémentation from scratch : une passe forward+backward d'un réseau, un mécanisme d'attention, un sampler. Maîtrisez les internals des Transformers, pas seulement l'API ; le cours Hugging Face est le bon point de départ, et savoir fine-tuner concrètement (LoRA, quantization, gestion de la mémoire GPU) fait la différence. Le round de profondeur peut devenir une discussion de papier, donc soyez prêt à raisonner sur une archi récente plutôt qu'à la réciter. Là où ces boîtes restent strictes, c'est le code : la barre est proche du SWE, ne la sous-estimez pas sous prétexte que le poste est « recherche appliquée ». Sur le system design, le serving de gros modèles est le sujet (batching, latence, coût GPU, distillation), pas juste un pipeline de reco classique. Côté rémunération, ces deux-là paient au-dessus du marché parisien avec un poids equity lourd, ne vous calez pas sur la grille d'une scale-up produit pour négocier.

Je suis diplômé d'un bootcamp data (DataScientest, Jedha) sans expérience de ML en production. MLE est-il un objectif réaliste à la sortie ?

Réaliste, mais c'est un projet de 6 à 12 mois, pas un sprint de 2 mois. Les bootcamps poussent la modélisation et les notebooks ; le MLE filtre sur la mise en production et le code, exactement la zone qu'ils couvrent le moins. L'écart n'est pas la théorie ML, c'est l'absence de ML en prod à montrer et la barre coding. Chemin honnête : construisez un vrai projet ML de bout en bout sur le côté, pas un Kaggle (les intervieweurs voient clair), un truc avec de vrais utilisateurs, de vraies données, un vrai déploiement, et un monitoring que vous pouvez expliquer. En parallèle, 8 à 12 semaines de LeetCode et de Python de production (classes, tests, une API que vous déployez). Tant que vous n'avez pas ce projet, les postes ML platform / MLOps-adjacents (fiabilité des pipelines de training, infra de serving) sont plus accessibles sans expérience de modélisation, et l'équipe vous formera côté ML. En behavioral, ne vous excusez jamais du bootcamp en défensif ; présentez votre projet comme du vrai code en prod et entrez dans le détail technique.

Je finis une thèse / un PhD en ML et je veux passer MLE en boîte produit (Doctolib, Criteo, Dataiku) sans donner l'image d'un chercheur. Comment je m'y prends ?

Le décalage tient surtout au scope, pas aux connaissances techniques. Les intervieweurs MLE produit ne sont pas impressionnés par le nombre de papiers ; ils filtrent sur votre capacité à shipper quelque chose qui survit au contact des vrais utilisateurs. Trois ajustements concrets. Retirez le cadrage « papiers » de votre CV et menez avec ce qui a été déployé ou s'en est approché, même un petit outil interne ou un modèle servi derrière une démo de labo. En behavioral, les mots « déployé », « utilisateurs », « production » doivent apparaître dans vos histoires, les intervieweurs les guettent physiquement. Pour le ML system design, apprenez ce que la recherche enseigne rarement : budgets de latence de serving, cadence de ré-entraînement, parité online / offline, méthodologie d'A/B test. Lisez Designing Machine Learning Systems de Chip Huyen avant le round. Là où un profil recherche gagne vraiment, c'est le round de profondeur : si on déroule un papier que vous avez écrit, vous avez un avantage qu'aucun MLE industriel n'a. Servez-vous-en, mais n'en parlez pas avant qu'on vous le demande et ne dépassez pas 10 minutes de théorie avant de revenir à ce que vous changeriez sur le modèle en production.

Questions fréquentes

Ce guide est-il utile si je suis Data Scientist en transition vers MLE, ou SWE qui passe au ML ?

Oui, la barre L4 / IC3 décrite ici s'applique que vous veniez du DS, du SWE ou de la recherche. Le plus gros écart pour la transition DS → MLE, c'est la barre coding (plus proche du LeetCode SWE que du SQL DS). Pour la transition SWE → MLE, l'écart est généralement le round de ML system design, construire l'intuition des pipelines de training, des feature stores et de la parité online / offline. Préparez l'écart qui est vraiment votre côté faible ; ne sur-investissez pas dans ce qui est déjà solide.

Combien de temps prévoir avant un onsite MLE ?

Le process prend 4 à 6 semaines. Ajoutez 6 à 8 semaines de prep : LeetCode + 3 ou 4 problèmes canoniques de ML system design, c'est l'ordre de priorité le plus rentable. Ne sautez pas l'entraînement à l'implémentation ML from scratch, les AI labs le demandent presque toujours.

Quelle est l'erreur la plus fréquente des candidats au niveau MLE ?

Le traiter comme un entretien DS. La barre coding du MLE est plus proche du SWE que du DS, et le round de system design attend une vraie réflexion production (latence, monitoring, ré-entraînement), pas seulement de la modélisation. Les réponses style DS centrées sur les métriques offline font baisser le niveau ici.

Et si mon process d'entretien diffère de celui décrit ici ?

L'essentiel de la variation est marginal. Les grandes boîtes tech (FAANG, scale-ups, SaaS mid-size) suivent un process à 1–2 rounds près de ce qui est décrit. Les petites startups tournent souvent sur moins de rounds (3 à 4) mais la barre par round reste similaire ; les boîtes moins matures tech sautent parfois system design ou comportemental. Lisez l'offre et demandez au recruteur lors du pré-screen, il vous dira ce qui vient.

Comment ce guide se compare-t-il au scan gratuit ?

Ce guide couvre la barre générale au niveau L4 / IC3. Le scan gratuit lit votre offre d'emploi spécifique et renvoie les questions prédites pour ce poste + cette entreprise, un benchmark de salaire calibré et (avec votre CV) une analyse des écarts d'expérience et un passage ATS de CV. PDF par e-mail.

Prêt à préparer un vrai poste ?

Collez n'importe quelle offre MLE, découvrez votre coach en moins de 30 secondes.

Déposez une URL LinkedIn, Greenhouse, Lever ou Levels.fyi, ou collez le texte de l'offre. Votre coach prédit les questions pour cette entreprise, fait ressortir vos écarts d'expérience, et calibre un benchmark de salaire pour le poste et la localisation. PDF par e-mail. L'entraînement vocal avec retour IA sur chaque réponse vit dans l'extension Chrome.

Démarrer gratuitement →Ajouter à Chrome, il lit l’offre pour vous →Ou analyser une offre d’abord →

Gratuit, 8 crédits de coaching offerts · Sans carte bancaire · Votre CV reste sur votre appareil