Data Analyst, Data Engineer, Data Scientist : missions, compétences, différences et synergies

Depuis une bonne dizaine d’années, la démocratisation accélérée de la data dans les entreprises a entraîné l’émergence de nouveaux métiers opérant dans la chaîne de traitement des données. Parmi les plus familiers d’entre eux, citons notamment le Data Analyst, le Data Engineer et le Data Scientist… Mais, galvaudées, ces terminologies apparaissent souvent interchangeables aux yeux du grand public. À tort. Ces profils, qui sont parmi les plus recherchés aujourd’hui par les services RH, sont à la fois spécialisés et parfaitement complémentaires les uns des autres. Dans cet article, Empirik vous expose en détails les particularités et les cas d’usages des trois métiers pour vous aider à mieux les appréhender au quotidien.

 

Data Analyst : l’interprète, créateur de valeur pour l’entreprise par la donnée

Généralement moins qualifié techniquement que le Data Scientist, le Data Analyst est, comme son nom l’indique, responsable de l’analyse des données existantes issues de l’activité de l’entreprise. Plus proche du cœur de métier de l’entreprise, il collecte, traite et transforme la donnée pour établir des recommandations d’actions à destination des teams Produit, Marketing, Finance, Commerciale ou encore de l’équipe dirigeante. Ainsi, il facilite le pilotage de l’entreprise via l’analyse des principaux KPIs et participe en définitive à la prise de décisions éclairées.

Bon à savoir : l’objectif principal du Data Analyst est de recueillir et interpréter les données de l’entreprise, souvent depuis une seule source (ex : CRM, Analytics, etc), mais n’a pas vocation comme le Data Scientist à effectuer des analyses complexes de données brutes multi-plateformes ou encore développer des modèles mathématiques prédictifs.

Quelles sont les principales missions d’un Data Analyst ?

  • Analyser la donnée structurée fournie par le Data Engineer ou le Data Scientist.
  • Requêter, manipuler, filtrer, préparer la donnée pour établir des rapports d’analyses.
  • Appliquer des méthodes statistiques basiques et avancées sur les données.
  • Définir les KPIs, les métriques, les dimensions, les angles d’analyses en coordination avec les équipes métiers.
  • Représenter visuellement les données pour faciliter leur accessibilité.
  • Déduire et présenter des actions concrètes à mettre en œuvre pour tirer parti des enseignements de la donnée au niveau de l’entreprise.
  • Communiquer et présenter les résultats à l’équipe dirigeante. 

Quelles compétences doit avoir un Data Analyst ?

Polyvalent et flexible, le Data Analyst peut s’exprimer dans divers domaines :

  • Disposer de compétences avancées en statistiques et en mathématiques.
  • Être capable de travailler avec des bases de données relationnelles et structurées et d’effectuer divers types de requêtes, avec le langage SQL, par exemple.
  • Savoir exploiter avec aisance les tableurs comme Excel ou Google Sheets.
  • Maîtriser parfaitement les outils de Data Visualisation et de Business Intelligence.
  • Avoir une capacité d’analyse et un esprit critique pour interroger en profondeur les données.
  • Optionnellement, avoir des connaissances basiques en programmation.
  • Savoir faire parler la donnée de manière intelligible et contextualisée en inspirant les différentes équipes métiers par un talent narratif et par des visualisations de données (Data Storytelling).

Dans quels cas d’usages digitaux intervient un Data Analyst ?

Un Data Analyst peut exprimer tout son savoir-faire dans différentes circonstances :
  • Analyser les tendances de marché pour adapter une stratégie commerciale.
  • Analyser l’impact des investissements digitaux (SEO, SEA, réseaux sociaux, display, email, etc) afin de préconiser le meilleur mix e-marketing.
  • Analyser le funnel de vente pour évaluer les taux de déperdition à chaque étape du processus et optimiser le parcours d’achat.
  • Analyser les données d’acquisition et de prospection pour conseiller les commerciaux sur de nouvelles opportunités business et les orienter sur de meilleures pratiques relationnelles.

Data Engineer : le bâtisseur, garant de la chaîne de production des données

Un Data Engineer a pour rôle de concevoir, tester et maintenir une architecture technique fiable permettant de collecter, de stocker et de convertir à grande échelle des données brutes en informations prêtes à l’emploi pour des Data Scientists, des Data Analysts ou encore des Business Analysts.

Bon à savoir : un Data Engineer n’est pas un administrateur système. Il n’est pas voué à configurer des machines, à gérer la sécurité du réseau ou autres.
Il est vraiment focalisé sur l’administration et le développement de l’architecture logicielle du traitement de la donnée et se rapproche plus en cela du concept de DevOps, réunissant des connaissances systèmes et logicielles pour optimiser les cycles de développement.

Quelles sont les principales missions d’un Data Engineer ?

  • Concevoir, développer et assurer la maintenance technique de l’architecture logicielle qui permet de traiter et stocker la donnée.
  • Créer des pipelines de données pour automatiser les étapes d’acquisition des données brutes, de l’extraction jusqu’au stockage, tout en veillant à la fiabilité des flux de données.
  • Réaliser des processus d’ETL (Extract, Transform, Load) pour identifier et connecter différentes sources de données, les nettoyer, les transformer puis les centraliser dans un Data Lake.
  • Organiser et maintenir des entrepôts de données (Data Warehouses).
  • Superviser la mise en production des modèles et algorithmes fournis par les Data Scientists.

Quelles compétences doit avoir un Data Engineer ?

Un Data Engineer est un profil ultra-technique qui doit avoir plusieurs cordes à son arc :

  • Être un développeur de haut niveau doté d’une parfaite maîtrise du code et des différents langages de programmation : Python, Java, Scala, etc.
  • Savoir gérer des bases de données SQL, MongoDB ou encore Cassandra.
  • Créer des systèmes distribués grâce à des solutions d’analyse basées sur des logiciels comme Hadoop ou Spark.
  • Maîtriser les environnements Cloud pour les Data Warehouses type Amazon RedShift, Google BigQuery, Snowflake.
  • Savoir manipuler les outils d’ETL pour agréger et transformer les données (ex : Fivetran).
  • Comprendre les technologies de Machine Learning, Deep Learning et Intelligence Artificielle utilisées par les Data Scientists.

Dans quels cas d’usages digitaux intervient un Data Engineer ?

Un Data Engineer peut intervenir dans différentes circonstances :
  • Se connecter simultanément aux principales sources de données (APIs Facebook Ads ; CRM – Salesforce, Hubspot ; Google Analytics ou Piano Analytics, etc) dans le but de construire un set de données agrégées vous permettant d’appliquer des ciblages prédéfinis ou calculés par la machine.
  • Croiser et unifier de façon massive des données disparates et hétérogènes comme on peut en avoir besoin en SEO (Google Analytics, Search Console, PageSpeed, OnCrawl, Majestic, etc).
  • Pérenniser et entretenir un actif de données actionnables par l’entreprise.

Comparatif des compétences par métier

Data Scientist : le statisticien, programmeur de modèles algorithmiques

Avec les progrès des technologies informatiques, le volume des données produites dans le monde ne cesse de croître de manière exponentielle, offrant ainsi l’opportunité aux entreprises d’identifier de nouvelles tendances ou pratiques de consommation et d’améliorer leurs performances commerciales.

Pour traiter et analyser ces mégadonnées, elles font généralement appel à un Data Scientist. Cet expert, en étroite collaboration avec le Data Engineer, a pour rôle de développer des modèles mathématiques ou des algorithmes d’apprentissage automatique afin d’explorer des grandes masses de données et de les faire parler.

Bon à savoir : un Data Scientist est doté de savoir-faire dans le maniement des outils statistiques, dans la programmation et dans la création d’algorithmes de machine learning qui permettent notamment de prédire des événements futurs (taux de churn, évolution des ventes, baisse ou croissance des revenus).

Quelles sont les principales missions d’un Data Scientist ?

  • Trier, classer, transformer et explorer en profondeur les données pertinentes pour les traduire en problématiques spécifiques à la Data Science et, grâce à l’expérimentation et à la construction de pipelines de “pré-production”, identifier des insights.
  • Découvrir des tendances et des patterns dans les données, puis en tirer des modélisations statistiques, des classifications, des moteurs de recommandations, des prédictions…
  • Utiliser des algorithmes et des méthodes statistiques avancées pour procéder à l’exploration des données. Par ailleurs, savoir choisir le bon outil, la bonne méthode et/ou le bon « algo » pour résoudre un problème donné.
  • Comprendre les exigences de l’entreprise et traduire une problématique métier ou business en des méthodes d’analyse de données : déterminer les données nécessaires, les traitements et analyses avancées. Ainsi, faciliter les échanges avec le Data Engineer pour la mise en place des pipelines et Data Warehouses.
  • Faire preuve de créativité et de vulgarisation pour restituer de manière convaincante les résultats d’analyses aux autres corps de métiers (Data Storytelling, Data Visualisation) afin d’amorcer une réflexion stratégique commune au sein de l’organisation.

Quelles compétences doit avoir un Data Scientist ?

Un Data Scientist doit avoir des compétences variées et pluridisciplinaires, comme :

  • Bénéficier d’une solide formation en mathématiques, en statistiques et/ou en programmation informatique.
  • Savoir réaliser des analyses avancées de données structurées et non structurées.
  • Posséder de solides connaissances dans les langages de programmation : Python, R, SAS.
  • Maîtriser les algorithmes et les méthodes statistiques avancées (Machine Learning, AI…).
  • Pouvoir formuler et exécuter des requêtes SQL dans les bases de données.
  • Être familiarisé avec les outils utilisés par les Data Engineers.
  • Avoir une bonne compréhension du monde de l’entreprise pour communiquer de manière compréhensible les conclusions d’analyses de données complexes via des outils de Data Visualisation ou par des développements ad hoc.

Dans quels cas d’usages digitaux intervient un Data Scientist ?

Un Data Scientist exprime tout son savoir-faire dans plusieurs cas de figure :

  • Classer des prospects chauds et froids à partir de l’analyse de milliers de signaux et critères.
  • Prédire l’évolution du trafic sur un site ou du CA sur les ventes, l’évolution d’une tendance de marché, la valeur vie d’un client, etc.
  • Rechercher des corrélations et causalité entre les données observées, par exemple analyser l’impact de la météo sur les ventes d’un site ou la taille du contenu sur les performances SEO…
  • Modéliser des phénomènes mathématiques : processus de décision d‘achat, comportement et expérience client sur un site, analyse des liens entre contenus et ranking. La liste des applications est infinie.

Vous souhaitez en savoir plus sur la Data Science ?

Consultez notre série d’articles « la Data Science expliquée à ma grand-mère »

En résumé : des experts data spécialisés au service de problématiques d’entreprise communes

Il ne fait aucun doute que les métiers de Data Analyst, Data Engineer et Data Scientist ne requièrent pas les mêmes aptitudes, même s’ils peuvent avoir des compétences communes dans les domaines de la programmation, de l’analyse ou de la visualisation.

Dans tous les cas, il est certain que les trois experts travaillent en étroite collaboration pour coordonner leurs interventions dans la chaîne de production et d’analyse de la donnée :

  • En première ligne, le Data Scientist et le Data Analyst ont pour rôle principal de traduire des enjeux business en données et en analyses, 
  • Puis réclamer au Data Engineer des pipelines de données et des Data Warehouses qui répondent vraiment aux intérêts de développement de l’entreprise. 

Rôle des différents métiers sur la chaine de valeur de la donnée

Et attention, il ne s’agit surtout pas d’amasser de la data à l’infini – depuis toutes les sources disponibles – mais plutôt de collecter, stocker et exploiter le Juste Nécessaire dans une logique de Data Minimisation.

En revanche, plus concrètement, si dans les grandes organisations on tend à privilégier la spécialisation des experts data, la réalité est tout autre dans des petites ou moyennes structures où l’on recherche davantage des généralistes touche-à-tout qui peuvent endosser les trois casquettes.

Par ailleurs, les évolutions des salaires et des besoins des employeurs tendent à redéfinir les compétences nécessaires

Ainsi, aujourd’hui, un Data Analyst qui a des connaissances fragiles en SQL devient moins attractif sur le marché ; un Data Scientist doit dorénavant s’intéresser aux pipelines de données et à la mise en production et non plus se concentrer uniquement sur les algorithmes et l’expérimentation. 

Enfin, de plus en plus de Data Engineers se spécialisent dans l’application de leur métier au Machine Learning et maîtrisent donc le domaine aussi bien qu’un Data Scientist. 

Alors, quel profil devez-vous recruter en premier ?

Plusieurs cas de figure peuvent se présenter :

  • Si vos besoins en analyses sont simples et que vos données sont déjà structurées et organisées, orientez vos recherches vers un Data Analyst.
  • Au contraire, si vous avez des données très éparpillées, que vous croulez sous les APIs et faites des copier-coller dans Excel 8h par jour, alors cherchez immédiatement un Data Engineer.
  • Si vous n’avez aucune idée de ce que vous pouvez tirer de vos données, privilégiez le recrutement d’un Data Scientist.

Et enfin, si vous continuez à vous poser des questions, vous pouvez aussi contacter Empirik !
Nous disposons en interne des 3 compétences : Data Analyst, Data Engineer et Data Scientist.

Besoin d’aide en matière de Data ?

Ces articles peuvent vous intéresser

  • Data

Les principales alternatives à Google Analytics conformes au RGPD et validées par la CNIL

  • Data

Expressions régulières (ou RegEx) : définition, cas d'usages et exemples