L4 / IC3 · 3 à 5 ans

Préparation entretien Data Scientist, ce qui vous attend

5 rounds4 à 6 semaines9 questions types150–180 base

Si vous préparez un entretien Data Scientist, la trame est assez prévisible dans la plupart des boîtes tech : un pré-screen recruteur, un ou deux rounds de coding technique, un cas A/B test ou sens produit, un round stats / modélisation, et un comportemental avec le hiring manager.

Ce qui change le plus d'une boîte à l'autre, ce sont les screens techniques. Les loops orientés DS produit (Doctolib, BlaBlaCar, Contentsquare) s'appuient sur du SQL plus un peu de Python. Les loops modélisation ou les boîtes AI (Mistral, Hugging Face, Criteo sur la partie reco) penchent vers Python et pandas, souvent avec une question d'implémentation ML. Certaines équipes ajoutent un round algo au niveau SWE. Confirmez le découpage des rounds avec votre recruteur avant de supposer que tout sera du SQL.

La barre, c'est l'aisance technique plus le jugement produit : savez-vous transformer une question business floue en quelque chose de mesurable, et savez-vous raconter un résultat à quelqu'un de non technique. Au L4 / IC3, on vous évalue sur votre capacité à porter une analyse de bout en bout avec un ou deux interlocuteurs.

Version personnalisée

Ce guide couvre la barre générale pour Data Scientist. Collez votre offre et Calibrd la rend personnelle : ce que cette entreprise précise demande, où votre CV est léger, et une simulation complète que vous répétez à voix haute jusqu'à être prêt(e). Tout se passe dans votre navigateur, rien à installer. Calibrd repère votre niveau à partir de votre CV, du stage au poste de direction. Gratuit pour commencer.

Démarrer gratuitement →Ajouter à Chrome, il lit l'offre pour vous →Ou analyser une offre d'abord →

Mise à jour 2026

Ce guide couvre la barre générale pour Data Scientist. Quelques choses ont changé en France en 2026, l'AI Act encadre le recrutement IA à partir du 2 août, 31 % des candidats utilisent déjà l'IA pour préparer (APEC), les mises en situation remplacent les tests classiques, et le cycle de recrutement reste à 12 semaines. Lire ce qui a changé en 2026 →

Ce qui sera attendu de vous

Porter une analyse de bout en bout : cadrer la question, sortir la donnée, la modéliser, communiquer le résultat
Concevoir et lancer des A/B tests pour les équipes produit ou growth ; les dimensionner, les suivre, rédiger la restitution
Construire des dashboards et des métriques récurrentes en SQL et dans l'outil BI de l'équipe
Travailler avec le PM et l'ingénierie sur les définitions de métriques et l'instrumentation
Appliquer de la modélisation de base (régression, classification, clustering) pour de la prédiction ou de la segmentation
Traduire les analyses en recommandations actionnables pour les stakeholders produit ou business

Process d'entretien typique

La plupart des entreprises suivent une trame similaire pour les entretiens Data Scientist. Délai calendaire total : 4 à 6 semaines du pré-screen recruteur jusqu'à l'offre.

Pré-screen recruteur

Appel de 30 min

Parcours, calibration de niveau, motivation, attentes de rémunération

Screen coding technique

60 à 90 min

Combine en général du SQL (jointures, window functions, CTE) avec du Python (manipulation de données pandas / numpy). Certaines boîtes le coupent en deux rounds (Criteo, Dataiku) ; les labos AI sautent parfois le SQL et ajoutent de l'implémentation ML. Confirmez le découpage avec votre recruteur

Cas A/B test / sens produit

60 min

Concevoir une expérience pour un changement produit donné, ou diagnostiquer une chute de métrique. Creusage sur le choix des métriques, le dimensionnement, les guardrails et la façon de communiquer le résultat

Cas stats / modélisation

45 à 60 min

Tests d'hypothèse, raisonnement sur le choix de modèle, concepts ML de base (biais-variance, overfitting), comment vous modéliseriez un problème business précis de bout en bout

Comportemental / hiring manager

45 min

Projets passés, collaboration cross-fonctionnelle, gestion de l'ambiguïté, communication vers des stakeholders non techniques

Questions types à anticiper

Représentatives de ce que les entreprises demandent à ce niveau, pas une liste exhaustive. Lancez le scan gratuit ci-dessus pour des questions prédites liées à une offre d'emploi précise. L'extension Chrome ajoute l'entraînement vocal avec coaching IA sur chaque réponse (technique, design système, comportemental, motivation).

Technique / coding

“Avec une table `sessions` contenant user_id et event_timestamp, écrivez une requête qui renvoie la courbe de rétention à 7 jours depuis l'inscription.”
“Vous avez une table `commandes` et une table `clients`. Écrivez une requête qui sort, par mois, le chiffre d'affaires et le nombre de nouveaux clients. Expliquez vos jointures.”
“Vous avez lancé un t-test et obtenu p = 0,04. Qu'est-ce que ça veut dire concrètement, et que vérifieriez-vous avant de déclarer le test gagnant ?”

Sens produit

“Nos DAU ont chuté de 8 % d'une semaine sur l'autre. Déroulez comment vous diagnostiqueriez ça.”
“Concevez un A/B test pour évaluer un nouveau parcours d'onboarding. Choisissez la métrique, nommez l'unité de randomisation et dites combien de temps vous le feriez tourner.”
“On envisage de lancer un programme de parrainage. Quelles métriques instrumenteriez-vous avant le lancement, et comment sauriez-vous dès la première semaine si ça marche ?”

Comportemental (méthode STAR)

“Parlez-moi d'une analyse dont le résultat vous a surpris. Qu'en avez-vous fait ?”
“Décrivez une fois où un stakeholder n'était pas d'accord avec votre conclusion. Comment avez-vous géré ?”
“Déroulez un projet où la donnée était sale ou incomplète. Comment avez-vous décidé à quoi vous fier ?”

Benchmark de salaire

Salaire médian pour Data Scientist dans les grandes boîtes tech US, chiffres principaux en USD. Paris / Berlin / Singapour paient typiquement 30 à 50 % de moins en base ; les ratios d'equity varient selon le stade de l'entreprise.

Salaire de base150–180 k$ (SF/NYC)

Equity (vest annuel)60–120 k$/an

Bonus10–15 %

Le total comp FAANG L4 Data Scientist au 50e percentile est de 240–310 k$. À Paris, la base d'un DS mid tourne autour de 45–60 k€ selon l'employeur (scale-ups comme Doctolib ou BlaBlaCar, grands comptes, ou missions data en ESN, souvent en bas de fourchette). Londres autour de 80–105 k£. Les boîtes AI-first (Mistral, Hugging Face) paient souvent au-dessus, avec un poids equity plus lourd. Gardez le chiffre US comme repère, pas comme attente sur le marché français.

Comment se préparer, cinq conseils tactiques

Ouvrez vos réponses comportementales avec la méthode STAR, Situation, Tâche, Action, Résultat. Les conseils tactiques ci-dessous s'appuient sur cette structure pour ce rôle précis.

Drillez le SQL à froid : jointures, window functions, CTE, arithmétique de dates. 30 à 50 problèmes suffisent si vous en faites régulièrement ; plus sinon. Le screen SQL est le point de rejet le plus fréquent à ce niveau
Remettez-vous à niveau sur la manipulation de données pandas / numpy en Python. Beaucoup de loops ont un round Python ou SQL+Python combiné, et les candidats qui ne préparent que le SQL se font attraper. Entraînez-vous au group-by, merge, pivot et au plotting de base
Travaillez le framework A/B test à froid : métrique → unité de randomisation → taille d'échantillon → durée → guardrails → restitution. Ayez un canevas applicable à n'importe quel énoncé
Préparez 5 à 6 STAR stories, chacune avec un impact chiffré : hausse de conversion, AUC du modèle, valeur en euros de la décision permise
Lisez 'Trustworthy Online Controlled Experiments' (Kohavi), la référence canonique du round A/B test
Soyez prêt pour une question produit ouverte par loop ("les DAU baissent, diagnostiquez"), entraînez-vous à la structure segmenter d'abord, formuler des hypothèses ensuite

Les pièges fréquents au niveau Data Scientist

Quelques erreurs fréquentes qui font recaler les candidats Data Scientist même quand ils sont par ailleurs solides. Mieux vaut les repérer en mock interview avant qu'elles n'apparaissent en vrai.

Entendre une question et attraper direct un modèle ("j'entraînerais une random forest") sans regarder d'abord à quoi ressemble vraiment la donnée.

Pourquoi ça rate

Au L4 les intervieweurs veulent voir que vous inspectez la donnée avant de choisir une méthode : distributions, valeurs manquantes, clés de jointure, plages de dates. Sauter vers un modèle donne l'image de quelqu'un qui connaît les outils mais pas la pratique. Les candidats qui passent consacrent les premières minutes à des questions de qualité de donnée, pas au choix d'algo.

Comment rattraper

Ouvrez chaque réponse de modélisation en nommant 3 choses que vous vérifieriez d'abord dans la donnée. Du type "je commencerais par vérifier la logique de jointure entre la table users et la table sessions, regarder la distribution de la variable cible, et confirmer qu'il n'y a pas de biais de période". Ensuite seulement, choisissez une méthode.

Concevoir un A/B test sans nommer la métrique, la taille d'échantillon, ni la gestion des guardrails.

Pourquoi ça rate

Les rounds A/B test au L4 évaluent si vous avez réellement lancé des expériences à l'échelle. Les réponses vagues ("on lancerait un A/B test et on regarderait les résultats") ratent la rigueur qui distingue un vrai DS d'un data analyst. L'intervieweur attend une métrique primaire + 1 ou 2 guardrails + une estimation de taille d'échantillon + une durée.

Comment rattraper

Structurez les réponses A/B test comme une checklist : métrique primaire et pourquoi, unité de randomisation (utilisateur vs session vs requête), 1 ou 2 guardrails pour éviter le gaming, estimation approximative de la taille d'échantillon pour le MDE qui vous importe, et combien de temps vous le laisseriez tourner. Même des chiffres approximatifs ("~50k utilisateurs par bras, deux semaines") passent bien mieux que pas de chiffres.

Décrire ses projets passés en termes d'effort et d'ambition, sans aucun impact chiffré.

Pourquoi ça rate

Les entretiens DS calibrent contre le scope IC3, et ils ont besoin de chiffres pour le faire. "J'ai construit un modèle de churn qui a aidé l'équipe rétention" ne dit rien à l'intervieweur. "J'ai construit un modèle de churn à 0,78 d'AUC que l'équipe growth a utilisé pour re-segmenter une cohorte à 20M$ d'ARR et gagner 2,3 points de rétention" lui permet de vous situer tout de suite.

Comment rattraper

Pour vos 4 ou 5 meilleures stories, attachez trois chiffres chacune : échelle (lignes / utilisateurs / segments), qualité du modèle (AUC, précision, MAE, selon le cas), et impact business (revenu, rétention, delta de conversion). Des chiffres approximatifs valent mieux que pas de chiffres. Demandez à votre interlocuteur ingénierie ou PM avant le loop si vous ne vous souvenez plus des valeurs exactes.

Ressources recommandées

Livres, cours et outils qui reviennent le plus dans la préparation Data Scientist. Sans lien d'affiliation.

01
Ace the Data Science Interview (Huang & Singh) →Couvre SQL, stats, ML et cas produit avec des questions tirées de vrais loops. Le manuel le plus complet pour la barre DS mid.
02
Trustworthy Online Controlled Experiments (Kohavi) →Référence canonique du design d'A/B test. Lisez les chapitres 1 à 7 avant le round A/B test.
03
StrataScratch →Practice SQL et Python avec de vraies questions d'entretien, classées par entreprise. Idéal pour driller le screen technique.
04
StatQuest (Josh Starmer) →Chaîne YouTube qui explique les stats et le ML de base clairement. Parfaite pour réviser biais-variance, régression et tests d'hypothèse avant le round stats.
05
An Introduction to Statistical Learning →Manuel Stanford gratuit. Les chapitres 3, 4 et 6 couvrent le round stats / modélisation à la profondeur attendue au L4.

Scénarios courants

Je suis Data Analyst depuis 3 ans (Power BI, SQL, un peu de Python) et je veux passer Data Scientist. Comment je prépare un loop chez Doctolib, BlaBlaCar ou ManoMano sans avoir jamais shippé de modèle en prod ?

La confusion Data Analyst / Data Scientist est le piège classique sur le marché français, et la barre DS attend deux choses que le poste d'analyste ne couvre pas toujours : la rigueur A/B test et une vraie aisance Python au-delà du notebook exploratoire. Votre SQL est probablement déjà au niveau, c'est votre atout, ne le sous-vendez pas. L'écart, c'est : (1) le framework d'expérimentation, drillez métrique → randomisation → taille d'échantillon → guardrails → restitution jusqu'à ce que ça devienne un réflexe ; (2) la modélisation, vous n'avez pas besoin de deep learning au L4, mais vous devez savoir raisonner sur régression vs classification, overfitting, et choix de métrique d'évaluation ; (3) Python au-delà du dashboard, entraînez-vous au pandas (group-by, merge, pivot) et à un modèle sklearn de bout en bout. En behavioral, ne vous excusez pas d'être analyste, reformulez vos analyses passées en "question business → analyse → recommandation → impact mesuré". C'est exactement le récit qu'un DS doit savoir tenir. Comptez 8 à 12 semaines si vous partez d'un Python léger.

Je sors d'un bootcamp data (DataScientest, Jedha, Le Wagon data) et j'ai un portfolio de projets, mais zéro expérience de modèle en production. Comment je passe la barre d'un loop DS chez Contentsquare ou Believe ?

L'écart le plus visible des profils bootcamp, c'est le passage du notebook propre au raisonnement de production. Les projets de bootcamp optimisent l'accuracy sur un dataset Kaggle figé ; le loop DS teste si vous savez cadrer une question floue, choisir une métrique qui compte pour le business, et expliquer ce que vous vérifieriez dans une donnée réelle (sale, biaisée, incomplète). Avant les entretiens, reprenez 2 ou 3 projets de votre portfolio et ré-écrivez-les côté décision : pas "j'ai atteint 0,91 d'AUC", mais "voici la question, voici pourquoi j'ai choisi cette métrique, voici ce que j'en aurais fait en prod". Sur le SQL, c'est souvent le maillon faible des grads bootcamp parce que les cours poussent surtout le Python ML, drillez StrataScratch 4 à 6 semaines, les window functions et les CTE en particulier. Sur l'A/B test, ayez un canevas par cœur, peu de bootcamps le couvrent sérieusement et c'est un round à part entière. En behavioral, ne présentez pas le bootcamp en défensif ; présentez vos projets comme du vrai travail et entrez dans les détails techniques que vous maîtrisez.

Je fais des missions data en ESN (Capgemini, Sopra, Devoteam) depuis 4 ans, mais sur du reporting et un peu de ML client. Comment je rejoins une scale-up produit comme Qonto, Alan ou Aircall en tant que DS ?

Le piège du parcours ESN, c'est que vos missions sont décrites côté client, pas côté impact, et que personne ne sait ce que vous avez vraiment construit. Avant les entretiens, ressortez 2 ou 3 missions et ré-écrivez-les comme un DS produit : pas "intervention chez un client retail sur de la prévision", mais "j'ai construit un modèle de prévision de demande, voici la métrique business visée, voici l'impact estimé". Si vos missions étaient surtout du reporting, lancez un projet personnel sérieux ces 8 prochaines semaines, avec une question business claire et un A/B test simulé, pour avoir une story crédible. La différence majeure entre ESN et scale-up produit, c'est le sens produit : en scale-up vous ne recevez pas une spec, vous transformez "l'activation stagne" en agenda d'analyse. Drillez les questions produit ouvertes ("les DAU baissent, diagnostiquez") avec la structure segmenter d'abord, hypothèses ensuite. Côté technique, vérifiez votre niveau réel : si vos missions sont 60 % PowerPoint, comptez 10 à 12 semaines pour remettre SQL et Python à niveau. Reformulez l'expérience client (multiples parties prenantes, deadlines serrées) comme un atout de communication, pas comme du conseil.

Je termine une thèse (stats, éco, physique) et je vise un premier poste de Data Scientist en France, pas senior, juste DS mid. Comment je me positionne sans paraître trop académique ?

Bonne nouvelle : votre profondeur statistique est un vrai avantage au round stats / modélisation, là où beaucoup de DS venus de l'analytique sont plus faibles. Le risque, c'est de donner l'impression d'un chercheur qui n'a jamais shippé. Avant les entretiens, refaites votre CV pour mettre en avant tout ce qui s'est rapproché de la production : un outil utilisé par d'autres, une contribution open-source, un POC qui a tourné au-delà du papier. En behavioral, les mots "déployé", "utilisateurs", "métrique business" doivent apparaître, sinon l'intervieweur entend "académique déguisé". Sur le coding, c'est votre plus gros écart : la barre DS est plus opérationnelle que la thèse. Drillez SQL (jointures, window functions, CTE) et pandas pendant 6 à 8 semaines, c'est souvent le point de rejet pour les profils PhD. Sur l'A/B test, ne supposez pas que votre formation stats suffit : le round teste le cadrage produit (choix de métrique, guardrails, restitution), pas seulement la théorie du test d'hypothèse. Sur le level : en France, thèse + 0 à 1 an d'industrie calibre en général au DS mid (L4), c'est la cible réaliste pour un premier poste.

Questions fréquentes

Ce guide est-il utile si je viens d'un autre domaine (analyste, ingénieur, thèse) ?

Oui, la barre L4 / IC3 décrite ici s'applique que vous veniez de l'analytique, de l'ingénierie logicielle ou de la recherche académique. L'entretien teste l'aisance SQL, la rigueur A/B test et le jugement produit, et aucun diplôme ne remplace l'un des trois. Le plus gros écart pour les profils en reconversion, c'est d'avoir 5 STAR stories qui relient votre travail passé à des résultats au format DS (analyse → recommandation → impact mesuré). Une thèse sans story d'impact industriel calibre souvent plus bas qu'un bon analyste qui a shippé des expériences.

Combien de temps prévoir avant un onsite Data Scientist ?

Le process prend 4 à 6 semaines. Comptez 4 à 6 semaines de prep si vous êtes rouillé sur le SQL ou le Python ; 2 à 3 si vous pratiquez les deux au quotidien. Le framework A/B test, les drills SQL et la remise à niveau pandas sont la prep la plus rentable. Ne sur-investissez pas la théorie ML profonde au L4, les concepts de base suffisent.

Quelle est l'erreur la plus fréquente des candidats au niveau Data Scientist ?

Ne préparer que le SQL alors que le loop a un round Python ou combiné. Beaucoup de candidats forts en analyse se font surprendre quand le screen technique demande de la manipulation pandas ou un petit algo en Python. Confirmez le découpage des rounds avec votre recruteur et préparez les deux.

Et si mon process d'entretien diffère de celui décrit ici ?

L'essentiel de la variation est marginal. Les grandes boîtes tech (FAANG, scale-ups, SaaS mid-size) suivent un process à 1–2 rounds près de ce qui est décrit. Les petites startups tournent souvent sur moins de rounds (3 à 4) mais la barre par round reste similaire ; les boîtes moins matures tech sautent parfois system design ou comportemental. Lisez l'offre et demandez au recruteur lors du pré-screen, il vous dira ce qui vient.

Comment ce guide se compare-t-il au scan gratuit ?

Ce guide couvre la barre générale au niveau L4 / IC3. Le scan gratuit lit votre offre d'emploi spécifique et renvoie les questions prédites pour ce poste + cette entreprise, un benchmark de salaire calibré et (avec votre CV) une analyse des écarts d'expérience et un passage ATS de CV. PDF par e-mail.

Prêt à préparer un vrai poste ?

Collez n'importe quelle offre Data Scientist, découvrez votre coach en moins de 30 secondes.

Déposez une URL LinkedIn, Greenhouse, Lever ou Levels.fyi, ou collez le texte de l'offre. Votre coach prédit les questions pour cette entreprise, fait ressortir vos écarts d'expérience, et calibre un benchmark de salaire pour le poste et la localisation. PDF par e-mail. L'entraînement vocal avec retour IA sur chaque réponse vit dans l'extension Chrome.

Démarrer gratuitement →Ajouter à Chrome, il lit l’offre pour vous →Ou analyser une offre d’abord →

Gratuit, 8 crédits de coaching offerts · Sans carte bancaire · Votre CV reste sur votre appareil