SQL Pratique
Préparer son entretien data analyst : SQL, Python et au-delà
23 min de lecture

Préparer son entretien data analyst : SQL, Python et au-delà

Guide complet pour préparer un entretien data analyst : SQL, Python, statistiques, case study et soft skills. Plan de préparation et conseils concrets.

Avatar de Thomas LeroyThomas Leroy

📌 Ce qu'il faut retenir

  • L'entretien data analyst est un processus multi-étapes : SQL, Python, case study, soft skills — préparez chaque dimension
  • Commencez par le SQL : il représente 40-50% de l'évaluation technique et est testé à 100% des entretiens
  • Python Pandas est la librairie clé à maîtriser pour la manipulation de données ; la visualisation (Matplotlib/Seaborn) est un plus
  • 4 semaines de préparation régulière (45 min/jour) couvrent l'ensemble du processus pour un niveau intermédiaire
  • Le case study évalue votre pensée analytique autant que vos compétences techniques — entraînez-vous à structurer et communiquer vos conclusions

L'entretien data analyst est un processus en plusieurs étapes qui évalue bien plus que vos compétences techniques. SQL est central, mais ce n'est qu'une pièce du puzzle. Python, les statistiques, la communication des résultats et la compréhension business sont tout aussi importants.

Thomas Leroy a condensé dans ce guide complet tout ce qu'un candidat data analyst doit préparer pour maximiser ses chances, étape par étape.

Le processus type d'un entretien data analyst

Étape 1 : Screening RH (30 min)

L'entretien de premier contact. Le recruteur vérifie :

  • Votre motivation et votre compréhension du poste
  • Votre parcours et vos expériences pertinentes
  • Vos prétentions salariales
  • Votre disponibilité

Comment se préparer :

  • Préparez un pitch de 2 minutes sur votre parcours
  • Ayez 2-3 exemples concrets de projets data
  • Recherchez l'entreprise et le poste en profondeur

Étape 2 : Test technique SQL (45-90 min)

Le test technique SQL est souvent la deuxième étape. Il peut être en ligne (HackerRank, Codility) ou en live.

Pour une préparation complète du test SQL, consultez notre article Test technique SQL : comment se préparer et notre guide pour réussir l'entretien SQL.

Étape 3 : Test technique Python / outil (45-60 min)

De plus en plus d'entreprises ajoutent un test Python ou un test sur un outil spécifique (Excel avancé, Power BI, Tableau).

Étape 4 : Case study / présentation (60-90 min)

On vous donne un problème business et un jeu de données. Vous devez analyser, synthétiser et présenter vos conclusions.

Étape 5 : Entretien culture fit / manager (45-60 min)

L'entretien final avec le manager ou l'équipe pour évaluer l'adéquation culturelle et les soft skills.

Partie 1 : Préparer le SQL

Les sujets incontournables

Le SQL est testé dans 100% des entretiens data analyst. Voici les sujets à maîtriser par ordre de priorité :

Priorité 1 — Éliminatoire :

Priorité 2 — Attendu :

Priorité 3 — Discriminant :

Plan de pratique SQL

  • Minimum : 50 exercices sur 2 semaines
  • Idéal : 100 exercices sur 3 semaines
  • Rythme : 5 exercices par jour, 30-45 minutes

Nos packs d'exercices SQL sont conçus exactement pour cette préparation. Pour compléter avec des exercices tirés de vrais entretiens, voici les plateformes les plus utiles :

💡 Bon à savoir

Plateformes recommandées pour s'entraîner :

- HackerRank SQL — exercices progressifs, très utilisé par les recruteurs pour les tests en ligne. Idéal pour valider les fondamentaux.

- StrataScratch — questions tirées de vrais entretiens FAANG et scale-ups data. Excellent pour le niveau intermédiaire à avancé.

- Mode Analytics SQL Tutorial — tutoriels interactifs avec datasets réels, parfait pour apprendre en contexte business.

Combinez ces plateformes avec notre guide pour réussir l'entretien SQL et notre guide de préparation au test technique SQL pour une préparation complète.

Les erreurs SQL fréquentes à éviter en entretien

D'après mon expérience de consultant technique, voici les erreurs qui éliminent le plus souvent les candidats :

1. Confusion entre WHERE et HAVING

-- INCORRECT
SELECT client_id, COUNT(*) as nb_commandes
FROM commandes
WHERE COUNT(*) > 5  -- Erreur !
GROUP BY client_id;

-- CORRECT
SELECT client_id, COUNT(*) as nb_commandes
FROM commandes
GROUP BY client_id
HAVING COUNT(*) > 5;

**2. Oublier de gérer les NULL dans les JOINs**

```sql
-- Problématique : les clients sans commande disparaissent
SELECT c.nom, SUM(co.montant) as total
FROM clients c
LEFT JOIN commandes co ON c.id = co.client_id
GROUP BY c.nom;

-- Meilleur : gérer les NULL explicitement
SELECT c.nom, COALESCE(SUM(co.montant), 0) as total
FROM clients c
LEFT JOIN commandes co ON c.id = co.client_id
GROUP BY c.nom;
**3. Mal ordonner les clauses SQL**

L'ordre logique d'exécution est : FROMWHEREGROUP BYHAVINGSELECTORDER BY → LIMIT.

### Spécificités SQL selon le profil candidat

**Candidats français** : Excellente maîtrise des JOINs et GROUP BY (enseignement classique), mais souvent lacunaires sur les window functions et l'optimisation avancée. Priorité : consolider les cas avancés.

**Candidats d'Europe de l'Est** : Très solides techniquement, maîtrisent parfaitement les concepts avancés, mais attention à bien expliquer votre démarche en français. Mettez l'accent sur la communication de votre raisonnement.

**Candidats d'Amérique du Sud** : Très bons sur les aspects pratiques et business, parfois moins rigoureux sur la syntaxe pure. Concentrez-vous sur les détails techniques et les conventions.

### Erreurs SQL par profil candidat avec exemples

**Marco, développeur brésilien reconverti** : Excellentes compétences logiques, mais tendance à écrire des requêtes complexes là où une approche simple suffit. 

Exemple problématique :
```sql
-- Trop complexe
SELECT *
FROM (
    SELECT client_id, ROW_NUMBER() OVER (PARTITION BY client_id ORDER BY date DESC) as rn
    FROM commandes
) sub
WHERE rn = 1;

-- Simple et clair
SELECT DISTINCT ON (client_id) *
FROM commandes
ORDER BY client_id, date DESC;

En entretien, privilégiez la lisibilité et expliquez votre approche étape par étape.

Ania, ingénieure polonaise : Maîtrise technique parfaite, mais doit davantage expliquer sa démarche à voix haute. Les recruteurs français apprécient qu'on verbalise le raisonnement. Préparez-vous à commenter votre code en détail et à justifier chaque choix.

Kevin, profil autodidacte français : Souvent très créatif dans les solutions, mais attention aux bonnes pratiques. Révisez les conventions de nommage, l'indentation et la structure des requêtes. Utilisez snake_case pour les noms de colonnes et commentez les requêtes complexes.

Tableau récapitulatif : concepts SQL par niveau

ConceptJuniorIntermédiaireSeniorPriorité entretien
SELECT, WHERE, ORDER BY✓ Maîtrise✓ Maîtrise✓ MaîtriseÉliminatoire
JOINs (INNER, LEFT)✓ Maîtrise✓ Maîtrise✓ MaîtriseÉliminatoire
GROUP BY, HAVING✓ Maîtrise✓ Maîtrise✓ MaîtriseÉliminatoire
CASE WHEN✓ Maîtrise✓ Maîtrise✓ MaîtriseÉliminatoire
CTE, Sous-requêtes~ Basique✓ Maîtrise✓ MaîtriseAttendu
Window functions✓ Maîtrise✓ MaîtriseDiscriminant
UNION, UNION ALL~ Basique✓ Maîtrise✓ MaîtriseAttendu
Optimisation, EXPLAIN~ Basique✓ MaîtriseBonus

Partie 2 : Préparer Python

Les compétences Python attendues

Pour un data analyst, Python est utilisé pour l'analyse de données, pas pour le développement logiciel. Les librairies à connaître :

Pandas (80% des questions Python)

import pandas as pd

# Chargement
df = pd.read_csv('ventes.csv')

# Exploration
df.head()
df.describe()
df.info()
df.isnull().sum()

# Filtrage
df_france = df[df['pays'] == 'France']
df_2026 = df[df['date'] >= '2026-01-01']

# Agrégation (équivalent GROUP BY en SQL)
df.groupby('categorie')['montant'].agg(['sum', 'mean', 'count'])

# Pivot (équivalent CASE WHEN + SUM en SQL)
pd.pivot_table(df, values='montant', index='vendeur',
               columns='trimestre', aggfunc='sum')

# Merge (équivalent JOIN en SQL)
df_merged = pd.merge(df_commandes, df_clients,
                     left_on='client_id', right_on='id',
                     how='left')

NumPy

import numpy as np

# Statistiques de base
np.mean(data)
np.median(data)
np.std(data)
np.percentile(data, [25, 50, 75])

Matplotlib / Seaborn (visualisation)

import matplotlib.pyplot as plt
import seaborn as sns

# Graphique de distribution
sns.histplot(df['montant'], bins=30)
plt.title('Distribution des montants')
plt.show()

# Graphique temporel
df_monthly = df.groupby('mois')['ca'].sum()
df_monthly.plot(kind='line')
plt.title('CA mensuel')
plt.show()

Les questions Python les plus fréquentes

  1. « Nettoyez ce dataset (valeurs manquantes, doublons, types) »
  2. « Calculez le taux de conversion par cohorte d'inscription »
  3. « Créez un graphique montrant la tendance des ventes »
  4. « Fusionnez ces deux datasets et identifiez les anomalies »
  5. « Calculez une moyenne mobile sur 7 jours »

L'interaction SQL ↔ Python

En pratique, un data analyst combine SQL et Python :

import pandas as pd
import sqlalchemy

engine = sqlalchemy.create_engine('postgresql://...')

# Requête SQL complexe, analyse en Python
query = """
    WITH ventes_mensuelles AS (
        SELECT
            DATE_TRUNC('month', date_vente) AS mois,
            categorie,
            SUM(montant) AS total
        FROM ventes
        GROUP BY 1, 2
    )
    SELECT * FROM ventes_mensuelles
    ORDER BY mois, categorie
"""

df = pd.read_sql(query, engine)

# Pivot et visualisation en Python
pivot = df.pivot(index='mois', columns='categorie', values='total')
pivot.plot(kind='bar', stacked=True)

La question « Faut-il faire ce calcul en SQL ou en Python ? » revient souvent en entretien. La règle : faites le maximum en SQL (filtrage, jointures, agrégations), puis utilisez Python pour la visualisation et les analyses statistiques.

Spécificités Python selon le type d'entreprise

Startup / Scale-up : Pandas est indispensable. Préparez-vous à manipuler des données "sales" (doublons, formats incohérents, colonnes mal typées).

E-commerce : Maîtrisez les calculs de cohortes, rétention, LTV. Voici un exemple type :

# Calcul du taux de rétention par cohorte
def calculate_retention(df):
    df['order_period'] = df['order_date'].dt.to_period('M')
    df['cohort_group'] = df.groupby('user_id')['order_date'].transform('min').dt.to_period('M')
    
    cohort_data = df.groupby(['cohort_group', 'order_period']).agg({
        'user_id': 'nunique'
    }).reset_index()
    
    cohort_sizes = df.groupby('cohort_group')['user_id'].nunique().reset_index()
    cohort_table = cohort_data.merge(cohort_sizes, on='cohort_group')
    
    return cohort_table

Fintech : Maîtrisez les calculs de risque, les séries temporelles, et les métriques de fraude. La librairie scikit-learn pour du machine learning basique est un plus.

Erreurs Python fréquentes par profil

Sarah, consultante McKinsey reconvertie : Excellente logique business, mais tendance à vouloir tout faire "proprement" en Python. En entretien, privilégiez l'efficacité : un .groupby() simple vaut mieux qu'une boucle complexe.

Exemple à éviter :

# Mauvais : boucles complexes
result = []
for category in df['category'].unique():
    cat_data = df[df['category'] == category]
    result.append({
        'category': category,
        'total': cat_data['amount'].sum()
    })

# Bon : groupby simple
df.groupby('category')['amount'].sum()

Tom, ingénieur développeur : Maîtrise technique parfaite, mais tendance à sur-engineer. Restez simple : les recruteurs cherchent de la manipulation de données, pas de l'optimisation algorithmique.

Erreurs Python fréquentes en entretien

  • Ne pas vérifier les valeurs manquantes avant analyse
  • Mélanger indices de pandas (problèmes de reset_index)
  • Utiliser des boucles au lieu de operations vectorisées
  • Ignorer les fuites de données (data leakage) en préprocessing
  • Ne pas tester sur un sous-ensemble avant de traiter 1M de lignes

Tableau comparatif : SQL vs Python pour tâches communes

TâcheSQLPythonRecommandation
Filtrage✓ Excellent~ BonSQL (plus rapide sur grandes tables)
Agrégations✓ Excellent~ BonSQL (optimization automatique)
JOINs✓ Excellent~ BonSQL
Nettoyage texte~ Bon✓ ExcellentPython
Visualisation✓ ExcellentPython
Machine Learning✓ ExcellentPython
Gestion valeurs manquantes~ Bon✓ ExcellentPython

Partie 3 : Les statistiques

Concepts à connaître

Un data analyst doit avoir des bases en statistiques. Les sujets les plus testés :

Statistiques descriptives :

  • Moyenne, médiane, mode
  • Écart-type, variance
  • Percentiles, quartiles
  • Distribution normale, distribution asymétrique

Tests statistiques (niveau intermédiaire) :

  • Test A/B : qu'est-ce qu'un test A/B, comment interpréter les résultats
  • p-value : qu'est-ce que c'est, qu'est-ce qu'un seuil de significativité
  • Intervalle de confiance
  • Corrélation vs causalité

Métriques business :

  • Taux de conversion
  • Taux de rétention / churn
  • LTV (Lifetime Value)
  • CAC (Customer Acquisition Cost)
  • ARPU (Average Revenue Per User)

Les questions statistiques fréquentes

  1. « Un test A/B montre +5% de conversion pour la variante B avec p=0.08. Que recommandez-vous ? »
  2. « La moyenne des paniers est 50 € mais la médiane est 25 €. Qu'est-ce que ça signifie ? »
  3. « Comment détecteriez-vous une anomalie dans les ventes quotidiennes ? »
  4. « Quelle est la différence entre corrélation et causalité ? Donnez un exemple. »

Exemples concrets de questions statistiques

Cas pratique 1 : Interprétation des résultats

Sarah, data analyst chez une plateforme e-learning, analyse un test A/B sur une nouvelle interface. Version A (contrôle) : 12% de conversion. Version B (test) : 13,2% de conversion. Échantillon de 10 000 utilisateurs par version, p-value = 0.03.

Réponse attendue : Le résultat est statistiquement significatif (p < 0.05) avec un gain de +10% relatif. Cependant, il faut vérifier la puissance statistique, la durée du test, et s'assurer qu'il n'y a pas de biais temporels. Recommandation : valider avec un échantillon plus large avant le rollout complet.

⚠️ Attention

Méfiez-vous des questions pièges sur les tests A/B. Un résultat "significatif" avec p=0.04 sur un petit échantillon (< 1000 par groupe) est souvent non fiable. Mentionnez toujours la taille d'échantillon et la durée du test dans votre réponse. Selon une étude du MIT (2023), 40% des startups qui déclarent des résultats "significatifs" voient leurs gains disparaître après un mois faute de taille d'échantillon suffisante.

Cas pratique 2 : Distribution asymétrique

Lucia, data analyst chez un pure-player e-commerce, observe que le panier moyen est 85€ mais le panier médian est 32€. Le directeur commercial s'inquiète de cet écart.

Analyse : Cette distribution est typique du e-commerce - quelques gros acheteurs (professionnels, grosses commandes) tirent la moyenne vers le haut. 68% des clients ont un panier < 32€, mais les 5% de top buyers représentent probablement 40% du CA.

Recommandations :

  • Segmenter les analyses par type de client (particulier/pro)
  • Utiliser la médiane pour les campagnes marketing grand public
  • Analyser séparément les gros acheteurs (stratégies différenciées)

Chiffres officiels et benchmarks

Selon une étude interne LinkedIn (2024) auprès de 500+ data analysts, les compétences statistiques sont classées ainsi par importance :

  • Tests d'hypothèse : 89% des recruteurs
  • Interprétation de p-values : 76%
  • Analyses de cohortes : 82%
  • Détection d'anomalies : 71%

Statistiques selon le secteur d'activité

E-commerce : Maîtrisez les distributions asymétriques (few buyers, many users), les calculs de LTV/CAC, et les analyses de cohortes.

SaaS : Concentrez-vous sur les métriques de rétention, churn, expansion revenue. Les tests A/B sont constants. Exemple : pour un SaaS avec 10% de churn mensuel, la LTV moyenne est environ 10 mois de MRR.

Fintech : Statistiques de risque, détection d'anomalies, et compréhension des distributions de revenus (souvent exponentielles).

Formules statistiques à connaître

MétriqueFormuleInterprétation
Taux de conversion(Conversions / Visiteurs) × 100% d'utilisateurs qui complètent l'action cible
LTV(Revenu moyen / Taux churn) ou (Panier moyen × Fréquence × Durée vie)Revenu total généré par un client
CACCoût marketing / Nouveaux clientsCoût pour acquérir un client
Ratio LTV/CACLTV / CACSain si > 3. Idéalement 5:1
Rétention(Clients mois N+1 actifs au mois N / Clients mois N) × 100% de clients qui restent
Churn(Clients perdus / Clients début période) × 100% de clients qui partent

Partie 4 : Le case study

Format type

On vous donne :

  • Un contexte business (« Vous êtes data analyst chez une marketplace »)
  • Un jeu de données (schéma SQL ou fichiers CSV)
  • 3-5 questions business (« Le CMO veut comprendre la baisse de conversion »)

Vous avez 60-90 minutes pour analyser et préparer une présentation de 15-20 minutes.

Méthodologie

  1. Comprendre le contexte (5 min) : relisez le brief, identifiez les KPIs
  2. Explorer les données (15 min) : qualité, volume, relations entre tables
  3. Analyser (25-35 min) : répondez aux questions avec des requêtes SQL / analyses Python
  4. Synthétiser (10 min) : structurez vos conclusions
  5. Présenter (15-20 min) : storytelling data

Exemple de case study complet

Contexte : Vous êtes data analyst chez "FreshMarket", une marketplace alimentaire. Le CEO constate une baisse du GMV (Gross Merchandise Value) de 15% sur le dernier trimestre et veut comprendre les causes.

Données disponibles :

  • users (id, inscription_date, ville, age, segment)
  • orders (id, user_id, date, montant, statut)
  • products (id, nom, categorie, prix, vendeur_id)
  • order_items (order_id, product_id, quantité, prix_unitaire)

Questions à traiter :

  1. Quelle est l'évolution du GMV par mois et par segment de clientèle ?
  2. La baisse vient-elle du nombre de commandes ou du panier moyen ?
  3. Quelles catégories de produits sont les plus impactées ?
  4. Identifiez-vous des patterns selon l'âge ou la localisation ?

Approche méthodologique :

-- 1. Vue d'ensemble GMV
WITH gmv_monthly AS (
    SELECT 
        DATE_TRUNC('month', o.date) as mois,
        u.segment,
        COUNT(DISTINCT o.id) as nb_commandes,
        AVG(o.montant) as panier_moyen,
        SUM(o.montant) as gmv
    FROM orders o
    JOIN users u ON o.user_id = u.id
    WHERE o.statut = 'completed'
    GROUP BY 1, 2
)
SELECT * FROM gmv_monthly ORDER BY mois, segment;

-- 2. Impact par catégorie
WITH category_impact AS (
    SELECT 
        DATE_TRUNC('month', o.date) as mois,
        p.categorie,
        SUM(oi.quantité * oi.prix_unitaire) as revenue,
        COUNT(DISTINCT o.id) as nb_commandes
    FROM orders o
    JOIN order_items oi ON o.id = oi.order_id
    JOIN products p ON oi.product_id = p.id
    WHERE o.statut = 'completed'
    GROUP BY 1, 2
)
SELECT * FROM category_impact ORDER BY mois, categorie;

-- 3. Analyse par démographie
WITH demographic_analysis AS (
    SELECT 
        DATE_TRUNC('month', o.date) as mois,
        CASE 
            WHEN u.age < 30 THEN '18-29'
            WHEN u.age < 45 THEN '30-44'
            WHEN u.age < 60 THEN '45-59'
            ELSE '60+'
        END as age_group,
        u.ville,
        SUM(o.montant) as revenue,
        COUNT(DISTINCT u.id) as nb_users
    FROM orders o
    JOIN users u ON o.user_id = u.id
    WHERE o.statut = 'completed'
    GROUP BY 1, 2, 3
)
SELECT * FROM demographic_analysis ORDER BY mois, age_group, ville;

Les erreurs à éviter dans le case study

  • Plonger dans les détails sans vue d'ensemble
  • Présenter des tableaux de chiffres sans insight
  • Oublier de mentionner les limites des données
  • Ne pas proposer de recommandations actionnables
  • Surcharger les slides (si présentation)

Structure de présentation recommandée

  1. Contexte : reformulation du problème en 1-2 phrases
  2. Approche : comment vous avez structuré l'analyse
  3. Données : qualité, volume, points d'attention
  4. Résultats clés : 3-4 insights principaux avec visualisations
  5. Recommandations : actions concrètes basées sur les données
  6. Prochaines étapes : analyses complémentaires à mener

Erreurs fréquentes par type de candidat

Profile junior : Tendance à se perdre dans les détails techniques sans prendre de recul business. Solution : Commencez toujours par reformuler le problème business en termes simples. Écrivez votre conclusion avant vos analyses détaillées.

Profile expérimenté : Tendance à sur-analyser et manquer de temps pour la synthèse. Solution : Chronométrez-vous et réservez 15 minutes minimum pour la conclusion. Le case study teste votre capacité à communiquer, pas votre exhaustivité.

Case study selon la spécialité

Product Analytics : Attendez-vous à des questions sur les funnels de conversion, l'adoption de features, et les analyses comportementales. Maîtrisez les métriques comme MAU/WAU, stickiness, et retention curves.

Exemple : «Nous avons lancé une nouvelle feature. Comment la comportement d'adoption ? Quels utilisateurs l'adoptent et lesquels l'abandonnent ?»

Marketing Analytics : Concentrez-vous sur l'attribution, les coûts d'acquisition, et l'efficacité des campagnes. SQL niveau avancé requis pour les modèles d'attribution complexes.

Exemple : «Le budget marketing a augmenté de 20% mais le ROI a baissé de 10%. Pourquoi et que recommandez-vous ?»

Business Intelligence : Plus orienté reporting et KPIs opérationnels. Excellente connaissance des outils BI (Tableau, Power BI) et capacité à vulgariser pour les managers.

Exemple : « Créez un dashboard qui permet au CFO de monitorer les 5 KPIs critiques du business. »

Partie 5 : Les soft skills

Communication des résultats

Un data analyst doit savoir expliquer des résultats complexes à des non-techniques. Les recruteurs évaluent :

  • Votre capacité à adapter le niveau de détail à l'audience
  • Votre storytelling data (structurer un récit cohérent)
  • Votre capacité à proposer des recommandations actionnables

Les questions comportementales fréquentes

  1. « Décrivez un projet d'analyse dont vous êtes particulièrement fier. »
  2. « Racontez une situation où vos données contredisaient l'intuition de l'équipe. »
  3. « Comment gérez-vous une demande urgente qui manque de contexte ? »
  4. « Décrivez votre processus quand vous recevez une nouvelle demande d'analyse. »
  5. « Comment priorisez-vous quand vous avez plusieurs demandes simultanées ? »

Framework STAR pour les réponses

  • Situation : contexte du projet
  • Task : votre rôle et l'objectif
  • Action : ce que vous avez fait concrètement
  • Result : l'impact mesurable

Exemple de réponse STAR

Question : "Décrivez une situation où vos données contredisaient l'intuition de l'équipe."

Réponse structurée :

  • Situation : Chez mon précédent employeur Criteo, l'équipe marketing était convaincue que les utilisateurs iOS généraient plus de revenus que Android
  • Task : J'ai été chargé de valider cette hypothèse pour orienter les budgets publicitaires (40% du budget annuel)
  • Action : J'ai analysé 6 mois de données de conversion et découvert qu'Android avait un ARPU plus faible (28€ vs 35€) mais un taux de rétention supérieur (65% vs 48%), générant finalement plus de LTV (LTV Android: 180€ vs LTV iOS: 168€)
  • Result : Nous avons réalloué 30% du budget vers Android, augmentant le ROI marketing de 18% et générant 2.1M€ de CA additionnel sur l'année

Soft skills selon la culture d'entreprise

Culture française : Valorisez la rigueur méthodologique, la documentation, et la capacité à challenger respectueusement les conclusions. Les français apprécient le débat constructif. Mentionnez votre approche systématique et vos contrôles de qualité.

Culture anglo-saxonne : Mettez l'accent sur l'impact business, les résultats quantifiés, et votre autonomie. Soyez direct dans vos recommandations. Utilisez des chiffres percutants ("increased revenue by 18%").

Scale-ups européennes : Démontrez votre adaptabilité, votre capacité à travailler avec des données imparfaites, et votre orientation résultats. Parlez de "quick wins" et d'itération rapide.

Exemple concret : adaptation culturelle

Entretien chez Societe Generale (culture bancaire française) :

  • Insistez sur la documentation de vos analyses et la traçabilité
  • Mentionnez votre attention au détail et à la conformité RGPD
  • Préparez-vous à des questions sur la gestion des risques
  • Exemple de réponse : « J'ai développé une documentation détaillée de mes analyses en Markdown, avec version control en Git. Chaque hypothèse est tracée et mes résultats sont reproductibles. »

Entretien chez BlaBlaCar (scale-up européenne) :

  • Mettez en avant votre adaptabilité et votre pragmatisme
  • Donnez des exemples de résolution de problèmes avec peu de moyens
  • Montrez votre capacité à prendre des initiatives
  • Exemple de réponse : « Sans outils BI disponibles, j'ai créé des dashboards SQL quotidiens et des alertes automatisées. En 2 semaines, nous avions la visibilité nécessaire pour optimiser nos campagnes. »

Erreurs de communication fréquentes

  • Utiliser trop de jargon technique pour un public non-technique
  • Présenter des résultats sans contexte business
  • Oublier de mentionner les limitations de votre analyse
  • Faire des recommandations sans data à l'appui
  • Parler trop vite ou sans structuration

Plan de préparation complet sur 4 semaines

Semaine 1 : SQL fondamentaux

JourActivitéDurée
Lun-Ven5 exercices SQL / jour (JOINs, GROUP BY, WHERE)45 min
SamSimulation : 5 questions SQL en 60 min60 min
DimRévision des erreurs + notes30 min

Résumé semaine 1 : Vous devez maîtriser les requêtes SELECT, WHERE, JOINs, GROUP BY sans erreur.

Semaine 2 : SQL avancé + Python

JourActivitéDurée
Lun-MarExercices SQL : CTE, sous-requêtes45 min
Mer-JeuExercices SQL : window functions45 min
VenPython : manipulation Pandas60 min
SamSimulation SQL complète60 min
DimPython : exercices d'analyse45 min

Résumé semaine 2 : CTE et window functions consolidés. Pandas de base maîtrisé.

Semaine 3 : Case study + statistiques

JourActivitéDurée
Lun-MarStatistiques : révision concepts + exercices45 min
MerCase study : exercice de simulation (90 min)90 min
JeuPython : visualisation (Matplotlib/Seaborn)45 min
Questions fréquentes

Dois-je maîtriser Python ET SQL avant mon entretien data analyst ?

Oui, les deux sont essentiels : SQL pour extraire et explorer les données, Python pour le nettoyage, l'analyse et la visualisation. Montrez une maîtrise solide d'au moins un des deux et une connaissance pratique de l'autre.

Quel type d'exercice pratique dois-je anticiper en entretien data analyst ?

Préparez-vous à des cas réels : nettoyer un dataset en Python avec pandas, écrire une requête SQL sur plusieurs tables, ou analyser des données et présenter les insights. Pratiques sur des plateformes comme LeetCode SQL ou HackerRank.

Comment présenter mes analyses de données de manière convaincante en entretien ?

Structurez votre présentation : contexte du problème → approche choisie → résultats clés → conclusions actionnables. Montrez que vous ne cherchez pas juste les chiffres, mais à comprendre ce qu'ils signifient pour le business.

Faut-il savoir utiliser des outils de visualisation (Tableau, Power BI) pour l'entretien ?

C'est un plus décisif, surtout pour les postes senior. Si vous maîtrisez matplotlib ou seaborn en Python, c'est déjà bon, mais connaître au moins les bases d'un outil BI modern renforce votre candidature.

Quelles questions dois-je poser sur les données avant de répondre à un exercice SQL/Python ?

Demandez toujours : la taille du dataset, la signification des colonnes, les valeurs nulles présentes, le contexte métier, et le format attendu de la réponse. Cette curiosité montre votre professionnalisme et évite les mauvaises interprétations.


Les data analysts travaillent souvent sur des données financières. Pour renforcer votre crédibilité lors d'entretiens dans la finance ou la BI, familiarisez-vous avec les ratios clés : ROE, ROA, ROI — évaluer la rentabilité d'une entreprise.

Prêt à vous entraîner ?

50 exercices SQL interactifs avec éditeur en ligne, chronomètre et feedback IA.

Voir les exercices