Par Thierry Vallaud, Responsable Data mining et Décisionnel, SOCIO Logiciels (groupe NP6)
Le métier de Data Miner serait la dénomination ancienne du métier en vogue de Data Scientist. Les termes de statisticien, chargé d’études statistiques ou d’analyste statisticien apparaissent également dans l’étude. Le profil diffère en fonction des pays. Aux Etats Unis, ce sont des informaticiens intelligents disposant d’un solide bagage scientifique alors qu’en France les profils sont plus des statisticiens issus de formations scientifiques de type Grandes Ecoles.
Des compétences multiples aux socles de connaissance déjà existants
Le socle de base du Data Scientist, c’est la statistique. La notion de compétences multiples est très présente. Le Data Scientist dispose d’une triple compétence opérationnelle :
- maitriser les techniques du data mining et des statistiques
- disposer d’une appétence pour les technologies et les bases de données
- savoir-faire dans le domaine d’application des données étudiées.
Pour l’entreprise, la clé du succès réside certainement davantage dans le fait de faire collaborer managers, statisticiens et informaticiens.
Des missions précédemment dévolues aux data miners
Au quotidien, la répartition des tâches incombant au Data Scientist est très variable :
- Comprendre la problématique métier, les enjeux et les objectifs de l’analyse. Il s’agit de traduire un enjeu « business » en problèmes mathématiques et statistiques.
- Obtenir des données adéquates : trouver les sources de données pertinentes, faire des recommandations sur les bases de données à consolider, modifier, rapatrier, externaliser, internaliser, concevoir des datamarts, voire des entrepôts de données (data warehouses).
- Evaluer la qualité et la richesse des données, les analyser et en restituer les résultats. Les intégrer dans le système d’information cible.
Pas encore de formations dédiées
Les formations préconisées par les répondants sont principalement les écoles d’ingénieurs spécialisées en statistique ENSAI, ENSAE, Télécom, etc) ou encore des grandes écoles généralistes, comme Centrale ou Polytechnique. Dans tous les cas, le cursus doit associer les statistiques à l’informatique. Le monde universitaire semble pour l’instant peu adapté (les outils récents n’y sont pas enseignés) et le déconseillent.
Un avenir prometteur, à condition de miser sur la complémentarité des métiers
C’est un métier qui dispose d’une visibilité dans le futur. Pour Google c’est LE métier n°1 d’avenir. La fonction sera de plus en plus reconnue et demandée. Les vrais Data Scientists vont exercer des fonctions stratégiques au sein des entreprises. La demande étant croissante, l’écart entre demande et offre va continuer de se creuser. En pratique, les Data Scientists vont devoir être plus polyvalents dans les technologies et les outils maitrisés. Ils vont également devoir faire preuve de plus de pédagogie et accroitre encore leur maîtrise du Data Mining. Les fonctions de Data Management, aujourd’hui assumées par le Data Scientist, devraient pouvoir être confiées à des Data Managers encadrés par un Data Scientist afin que ce dernier consacre moins de temps à la préparation des données et davantage à l’analyse et l’interprétation des résultats.
En réalité, il n’y aurait pas finalement « un Data Scientist » mais des Data scientists avec des compétences différentes qui devraient s’associer.