L5 / IC4 · 5 à 8 ans
Préparation entretien Senior Data Engineer, ce qui vous attend
Si vous visez Senior Data Engineer, l'entretien cherche un signal différent du mid-level : pas de savoir si vous avez construit un pipeline, mais de savoir si vous avez possédé un composant de plateforme data utilisé par plusieurs équipes. Les rounds de system design grandissent, infra de streaming, warehouses multi-région, data contracts transverses, et le deep-dive devient une heure de revue à froid d'une brique de plateforme que vous portez depuis 6 mois ou plus.
Attendez-vous à un deep-dive de projet qui remplace l'un des rounds de coding, un system design plus dur sur le streaming, le temps réel ou le multi-région, et au moins un round avec un staff engineer qui va creuser les trade-offs de vos designs passés. Le piège central à ce niveau : une bonne histoire "j'ai construit ce pipeline" est une histoire L4. Si vous ne la cadrez pas autour des décisions de plateforme, elle vous fait descendre d'un niveau.
Version personnalisée
Ce guide couvre la barre générale pour Senior DE. L'extension Chrome applique la même préparation à chaque offre que vous ouvrez, questions prédites pour cette entreprise précise, entraînement vocal avec votre coach IA sur chaque réponse, benchmark de salaire, analyse des écarts, plus brouillons de lettre de motivation et d'auto-présentation. Premier rapport gratuit ; plans payants à partir de 3,99 $. Ou lancez un scan unique sur une offre, sans installer.
Mise à jour 2026
Ce guide couvre la barre générale pour Senior DE. Quelques choses ont changé en France en 2026, l'AI Act encadre le recrutement IA à partir du 2 août, 31 % des candidats utilisent déjà l'IA pour préparer (APEC), les mises en situation remplacent les tests classiques, et le cycle de recrutement reste à 12 semaines. Lire ce qui a changé en 2026 →
Ce qui sera attendu de vous
- Posséder un composant de plateforme data de bout en bout : infra de streaming, architecture warehouse, framework de qualité des données
- Mener techniquement 2 à 4 DE : relire les designs, écrire les documents sur lesquels les autres s'alignent
- Piloter les décisions transverses sur les data contracts, l'évolution de schéma et la rotation d'astreinte data
- Mentorer les DE mid-level et les analytics engineers ; participer régulièrement aux loops d'entretien DE comme intervieweur
- Fixer la barre de la qualité et de l'observabilité des données de production à l'échelle de l'organisation
- Travailler d'égal à égal avec les leads ingénierie / ML / DS senior sur la stratégie de plateforme
Process d'entretien typique
La plupart des entreprises suivent une trame similaire pour les entretiens Senior DE. Délai calendaire total : 5 à 7 semaines du pré-screen recruteur jusqu'à l'offre.
Questions types à anticiper
Représentatives de ce que les entreprises demandent à ce niveau, pas une liste exhaustive. Lancez le scan gratuit ci-dessus pour des questions prédites liées à une offre d'emploi précise. L'extension Chrome ajoute l'entraînement vocal avec coaching IA sur chaque réponse (technique, design système, comportemental, motivation).
- “À partir d'une table `events` partitionnée par jour (user_id, event_type, payload, event_timestamp), écrivez une requête qui calcule la rétention J+7 par cohorte hebdomadaire. Puis expliquez ce qui change quand la table fait 50 milliards de lignes et comment vous éviteriez un full scan.”
- “Vous devez faire évoluer le schéma d'une table consommée par trois équipes aval, en ajoutant une colonne et en renommant une autre, sans rien casser. Détaillez le plan : versioning, période de double écriture, dépréciation, communication.”
- “Implémentez en Python une déduplication idempotente d'un flux d'événements pouvant contenir des doublons et des arrivées tardives. Puis expliquez comment vous la feriez tenir à 1 million d'événements par seconde et de façon distribuée.”
- “Designez la plateforme data d'un produit analytics à 100M d'utilisateurs. Couvrez l'ingestion, l'architecture streaming et batch, le warehouse, et la façon dont les équipes ML et analytics aval la consomment. Nommez explicitement les data contracts entre producteurs et consommateurs.”
- “Designez une infra de tracking d'événements temps réel qui ingère 1M d'événements par seconde, déduplique à la source, et atterrit dans le warehouse en moins de 5 minutes. Déroulez chaque couche, du SDK au registre de schéma.”
- “Une table centrale consommée par plusieurs équipes doit changer de schéma tous les trimestres sans casser l'aval. Designez la stratégie d'évolution de schéma : registre, compatibilité ascendante / descendante, contrats de fraîcheur et d'ownership, processus de breaking change.”
- “Parlez-moi d'une initiative de plateforme data sur plusieurs trimestres que vous avez menée. Qu'est-ce que l'organisation a fait différemment ensuite ?”
- “Décrivez un incident data majeur dont vous avez piloté la réponse : corruption silencieuse, dépassement de SLA, dérive d'une métrique aval. Qu'avez-vous changé dans les pratiques de votre équipe ?”
- “Déroulez une décision d'évolution de schéma ou de data contract que vous avez prise et qui touchait 3 équipes aval ou plus. Comment avez-vous construit l'alignement ?”
- “Parlez-moi d'une fois où vous avez fait machine arrière sur une décision d'architecture majeure de votre plateforme. Quel signal vous a dit de la revisiter ?”
Benchmark de salaire
Salaire médian pour Senior DE dans les grandes boîtes tech US, chiffres principaux en USD. Paris / Berlin / Singapour paient typiquement 30 à 50 % de moins en base ; les ratios d'equity varient selon le stade de l'entreprise.
Le total comp FAANG L5 Senior DE au 50e percentile est de 370–500 k$. La grille suit celle du Senior SWE avec une légère décote dans la plupart des boîtes, et équivalente ou supérieure chez les boîtes data-infra (Snowflake, Databricks, Confluent). À Paris, la base d'un Senior DE tourne autour de 65–90 k€ selon l'employeur : scale-ups comme BlaBlaCar, Back Market, Contentsquare ou Dataiku, grands comptes data comme Criteo et Datadog, ou filiales FAANG. Berlin / Stockholm autour de 70–95 k€. Gardez le chiffre US comme benchmark, pas comme attente locale.
Comment se préparer, cinq conseils tactiques
Ouvrez vos réponses comportementales avec la méthode STAR, Situation, Tâche, Action, Résultat. Les conseils tactiques ci-dessous s'appuient sur cette structure pour ce rôle précis.
- Choisissez 1 ou 2 projets de plateforme que vous avez portés et répétez le deep-dive à froid : chaque choix de design, chaque incident de production, chaque contre-factuel
- Maîtrisez 4 ou 5 problèmes canoniques de system design plateforme à l'échelle : pipeline de streaming, architecture warehouse, tracking d'événements temps réel, réplication multi-région, feature pipeline ML
- Lisez les posts data récents du blog ingénierie de la boîte que vous visez, et faites du pattern-matching sur leurs choix d'architecture
- Préparez 8 à 10 récits STAR étiquetés sur les signaux senior : incidents de production, investissements plateforme sur plusieurs trimestres, influence cross-fonctionnelle, décisions d'évolution de schéma
- Sachez nommer les data contracts dans chaque design transverse : version de schéma et processus de breaking change, SLA de fraîcheur et chemin d'escalade, frontière d'ownership producteur / consommateur, politique de dépréciation
- Préparez une réponse plan 30 / 60 / 90 : ce que vous posséderiez et livreriez sur vos 90 premiers jours sur la plateforme data de cette boîte précise
Les pièges fréquents au niveau Senior DE
Quelques erreurs fréquentes qui font recaler les candidats Senior DE même quand ils sont par ailleurs solides. Mieux vaut les repérer en mock interview avant qu'elles n'apparaissent en vrai.
Designer une plateforme data sans jamais nommer les data contracts entre les équipes.
Pourquoi ça rate
Les entretiens Senior DE notent si vous comprenez qu'une plateforme data est un système organisationnel, pas seulement technique. Schéma, SLA de fraîcheur, ownership, escalade d'astreinte : ce sont des contrats entre équipes, et la fiabilité de la plateforme dépend de leur explicitation. Un candidat qui design le stack technique sans mentionner les contrats donne l'impression d'être "solide sur les outils, faible sur l'exploitation d'une plateforme".
Comment rattraper
Dans tout design de système data transverse, nommez les contrats explicitement : version de schéma et processus de breaking change, SLA de fraîcheur et chemin d'escalade, frontière d'ownership entre producteur et consommateur, politique de dépréciation. Même 60 secondes sur les contrats dans un system design de 60 minutes font monter la réponse au niveau senior.
Faire le system design sans chiffrer le volume, le budget de latence ou le coût.
Pourquoi ça rate
Le system design L5 note si vous raisonnez l'échelle avec des chiffres. Un design de plateforme qui ne mentionne ni événements par seconde, ni Go par jour, ni latence de requête, ni coût de compute pourrait aussi bien servir 1 000 utilisateurs qu'un milliard. La note qui suit, c'est souvent "bien designé dans l'abstrait, aucune idée si ça tiendrait à notre échelle".
Comment rattraper
Dans les 5 premières minutes, faites le calcul de coin de table : événements par seconde, Go par jour, patterns de requêtes, budget de latence, coût de compute mensuel. "200M d'événements par jour à 500 octets l'événement, ça fait 100 Go par jour ; on stockerait 5 ans à X $/To-mois." Des chiffres approximatifs donnent le signal senior.
Traiter les rounds cross-fonctionnels avec les consommateurs aval (DS, ML, ingénierie produit) comme de simples discussions de collaboration.
Pourquoi ça rate
Les rounds cross-fonctionnels Senior DE cherchent précisément les points de friction : un DS qui a besoin d'une feature que le schéma ne supporte pas, une équipe ML dont la cadence de ré-entraînement casse votre pipeline, une équipe produit dont le format d'événement change sans prévenir. Une réponse générique du type "on collabore bien" donne l'impression que vous n'avez pas opéré au niveau senior où ces conflits sont réels.
Comment rattraper
Préparez 2 ou 3 histoires où vous avez tenu une position face à un partenaire cross-fonctionnel senior : un data contract que vous avez refusé de changer, une équipe aval avec qui vous avez négocié un calendrier de dépréciation, une évolution de schéma où vous avez forcé un changement en amont. La précision ici sépare les histoires Senior DE des cadrages mid-level "esprit d'équipe".
Ressources recommandées
Livres, cours et outils qui reviennent le plus dans la préparation Senior DE. Sans lien d'affiliation.
- 01Designing Data-Intensive Applications (Kleppmann) →À relire pour le round de system design senior. Les chapitres 5 (réplication), 6 (partitionnement) et 11 (stream processing) sont les plus rentables.
- 02Fundamentals of Data Engineering (Reis & Housley) →Le meilleur panorama du data lifecycle. Idéal pour cadrer le vocabulaire plateforme avant les rounds de design.
- 03Documentation dbt →Lisez 'sources', 'models', 'tests', 'snapshots' et 'materializations' : la lingua franca du DE moderne, attendue dans les questions de modélisation et de qualité.
- 04Documentation Apache Kafka →La référence pour le round de streaming : partitions, consumer groups, exactly-once, registre de schéma. Indispensable avant un design temps réel.
- 05Documentation Apache Flink →Pour le stream processing stateful : event time, watermarks, fenêtrage, exactly-once. À lire si la boîte fait du vrai temps réel.
- 06Documentation Apache Spark →La référence pour le compute distribué à l'échelle : partitionnement, shuffle, broadcast joins, tuning. Toujours utile au deep-dive de plateforme batch.
Scénarios courants
Je suis Data Engineer mid-level depuis 4 ans, je porte un pipeline en propre, et je vise un poste Senior DE chez Criteo, Datadog ou Contentsquare. Comment je montre que je suis prêt pour le L5 et pas un bon L4 ?
Le découpage est net : un L4 construit des pipelines, un L5 possède une brique de plateforme dont d'autres équipes dépendent. Votre risque, c'est de raconter votre meilleur pipeline en mode L4 et de descendre d'un niveau. Avant le loop, reprenez vos 1 ou 2 projets les plus forts et recadrez-les autour des décisions de plateforme : pas "j'ai construit le pipeline de clickstream" mais "j'ai défini le data contract entre l'ingestion et les 3 équipes analytics aval, voici la stratégie d'évolution de schéma, voici comment l'astreinte et le SLA de fraîcheur étaient partagés". Sur le system design, attendez-vous à plus dur que le pipeline de bout en bout du L4 : streaming et batch qui coexistent, multi-région, évolution de schéma, coût à l'échelle du pétaoctet. Répétez le deep-dive à froid, parce que c'est là que des staff engineers vont creuser chaque trade-off. Et ne sautez pas le SQL : beaucoup de candidats senior supposent que la barre monte uniquement vers l'architecture et se font attraper au technical screen.
Tous mes projets sont des pipelines que j'ai construits seul, pas des plateformes possédées par plusieurs équipes. Comment je cadre ça pour un entretien Senior DE sans mentir sur mon scope ?
Vous n'avez pas besoin d'avoir possédé une plateforme à 50 équipes ; vous avez besoin de montrer le raisonnement de plateforme sur ce que vous avez réellement fait. Prenez votre pipeline le plus important et regardez-le par l'angle des consommateurs : qui lit vos tables, quel contrat implicite existe déjà sur le schéma et la fraîcheur, ce qui casse en aval quand vous changez quelque chose. Même un seul consommateur aval suffit à raconter une histoire de data contract honnête : "l'équipe analytics dépendait de ma table de faits, donc avant de renommer une colonne j'ai mis en place une période de double écriture et un calendrier de dépréciation". C'est exactement le signal L5, à plus petite échelle. Évitez l'erreur inverse, gonfler le scope : un intervieweur senior repère une fausse plateforme en deux questions. Présentez le vrai périmètre, mais raisonné au niveau plateforme. Côté system design, comblez l'écart d'échelle en travaillant les problèmes canoniques (streaming, multi-région, registre de schéma) pour avoir le vocabulaire même si vous ne l'avez pas vécu à cette taille.
J'ai 6 ans en ESN (Capgemini, Sopra Steria) sur des missions data, jamais une vraie plateforme en propre, et je vise un poste Senior DE dans une scale-up produit comme Back Market, BlaBlaCar ou Believe. C'est jouable au niveau senior ?
C'est jouable, mais le double piège du parcours ESN se paie plus cher au niveau senior. Premier piège : vos missions sont décrites côté client et côté outil ("Spark, Talend, mission BNP"), jamais côté décision de plateforme, alors que c'est exactement le signal L5. Deuxième piège : le scope. Un Senior DE en scale-up doit posséder une brique transverse, mentorer, et arbitrer des data contracts ; si vos missions étaient bornées et pilotées par le client, l'intervieweur va le sentir. Avant le loop, ressortez 2 ou 3 projets et réécrivez-les en langage plateforme : quelle décision d'architecture vous avez prise, quel contrat entre équipes vous avez défini, ce qui a tenu 6 mois après. Si vos missions étaient surtout du build figé sans ownership transverse, soyez lucide sur le niveau : vous visez peut-être un Senior DE en scale-up à scope plus modeste plutôt qu'un L5 en filiale FAANG. Ne sous-vendez pas l'expérience clients (contraintes réglementaires, jonglage parties prenantes) ; reformatez-la en "livré et négocié sous contrainte", ce qui est un vrai signal senior.
J'ai 7 ans sur Apache Spark / Hadoop dans un grand groupe français et la scale-up que je vise est full Snowflake + dbt. À mon niveau, on attend des décisions de plateforme : comment je passe l'entretien Senior DE sans expérience warehouse-native ?
Même métier, dialecte différent, et au niveau senior votre background distribué est un atout plus qu'un handicap, à condition de le recadrer. Si vous venez de Hive / Spark, vous avez sans doute une compréhension plus profonde du compute distribué et du coût à l'échelle que beaucoup de candidats Snowflake-natifs. La friction se voit au system design, où la boîte attend un raisonnement dans leur idiome : transformations warehouse-first (dbt), micro-partitions et clustering keys, streams and tasks, et le COÛT plutôt que le CPU. Deux semaines de doc Snowflake plus un petit projet hands-on couvrent le gap de vocabulaire. Mais à votre niveau, le test réel n'est pas l'outil, c'est la décision de plateforme : sachez raisonner évolution de schéma, data contracts transverses et stratégie multi-équipes indépendamment du warehouse. Présentez votre passé Spark comme "du compute distribué de production à l'échelle" et reconnaissez une fois que les idiomes warehouse-natifs sont plus récents pour vous. Ne sur-vendez pas une aisance Snowflake que vous n'avez pas : un intervieweur senior le sent, et une montée en compétence rapide démontrée vaut mieux qu'une fausse familiarité.
Questions fréquentes
Je suis actuellement Data Engineer (L4 / IC3). Dois-je lire ce guide ou celui de Data Engineer en premier ?
Lisez d'abord le guide Data Engineer. Les entreprises calibrent les candidats L5 / IC4 contre la barre L4 / IC3, en ciblant clairement l'écart de scope, elles veulent voir où vous êtes aujourd'hui, puis creuser le gap jusqu'au L5 / IC4. Lisez ce guide APRÈS avoir compris la baseline L4 / IC3, comme ça vous saurez exactement quels signaux démontrer pour le step-up.
Combien de temps prévoir avant un onsite Senior DE ?
Le process prend 5 à 7 semaines. Ajoutez 8 à 12 semaines de prep : le system design plateforme et le deep-dive projet sont les leviers les plus rentables. Choisissez 1 ou 2 briques de plateforme que vous avez portées et répétez-les à froid : chaque choix de design, chaque incident de production, chaque contre-factuel.
Quelle est l'erreur la plus fréquente des candidats au niveau Senior DE ?
Décrire du travail au niveau pipeline sans cadrage au niveau plateforme. Les entretiens Senior DE calibrent contre des plateformes multi-équipes, des décisions d'évolution de schéma et des data contracts transverses. De bonnes histoires L4 "j'ai construit ce pipeline" vous font descendre d'un niveau si vous ne les cadrez pas autour des décisions de plateforme qui comptaient.
Et si mon process d'entretien diffère de celui décrit ici ?
L'essentiel de la variation est marginal. Les grandes boîtes tech (FAANG, scale-ups, SaaS mid-size) suivent un process à 1–2 rounds près de ce qui est décrit. Les petites startups tournent souvent sur moins de rounds (3 à 4) mais la barre par round reste similaire ; les boîtes moins matures tech sautent parfois system design ou comportemental. Lisez l'offre et demandez au recruteur lors du pré-screen, il vous dira ce qui vient.
Comment ce guide se compare-t-il au scan gratuit ?
Ce guide couvre la barre générale au niveau L5 / IC4. Le scan gratuit lit votre offre d'emploi spécifique et renvoie les questions prédites pour ce poste + cette entreprise, un benchmark de salaire calibré et (avec votre CV) une analyse des écarts d'expérience et un passage ATS de CV. PDF par e-mail.
Prêt à préparer un vrai poste ?
Collez n'importe quelle offre Senior DE, découvrez votre coach en moins de 30 secondes.
Déposez une URL LinkedIn, Greenhouse, Lever ou Levels.fyi, ou collez le texte de l'offre. Votre coach prédit les questions pour cette entreprise, fait ressortir vos écarts d'expérience, et calibre un benchmark de salaire pour le poste et la localisation. PDF par e-mail. L'entraînement vocal avec retour IA sur chaque réponse vit dans l'extension Chrome.
Installation libre · Aperçu sur chaque offre · Plans payants à partir de 3,99 $