Entretien avec Florent Thomann et Hugo Maillot
Pourriez-vous décrire un aspect concret de la mise en place d’une stratégie « Big Data » ?
L’apport du Big Data est très verticalisé et dépend du secteur d’activité. De nombreux secteurs utilisent désormais des modèles statistiques à des fins prédictives pour améliorer leurs processus opérationnels, mieux cibler leurs clients potentiels ou encore modifier leurs offres. Certains secteurs ont la data ancrée dans leurs gènes. C’est le cas du secteur bancaire qui utilise depuis toujours les données pour proposer des crédits et assurances adaptés à ses clients.
L’une des nouvelles applications les plus impressionnantes et « visibles » des stratégies « Big Data » concerne les changements opérés dans les techniques publicitaires ou « AdTechs », qui permettent aujourd’hui d’utiliser en temps réel les données consommateurs (et notamment les parcours de navigation en ligne) pour toucher les internautes avec de la publicité ciblée qui correspond à leurs centres d’intérêts. Ces nouvelles technologies attirent les investisseurs car elles bousculent (sans les rendre non plus obsolètes) les pratiques traditionnelles du marketing. Chez Creadev, nous regardons ces évolutions avec beaucoup d’intérêt et sommes à l’écoute des nouvelles entreprises et entrepreneurs sur ces nouveaux modèles passionnants.
Comment fonctionnent les Adtechs et que permettent-elles ?
Les nouvelles technologies publicitaires agrègent les informations liées aux parcours de navigation des internautes, tracés à l’aide de cookies déposés sur les navigateurs, mais également toutes les sources de données permettant de mieux connaître le profil des internautes : fiches clients au sein d’une base de données CRM (Customer Relationship Management) ou encore cartes de fidélité, permettant de repérer les habitudes de consommation offline. Ces données, parfois associées à un certain nombre de données exogènes (météo, cours de bourse, analyse du « bruit » des réseaux sociaux…), réunies au sein de la Data Management Platform (DMP), sont « activées » de façon à opérer une segmentation très fine des internautes, à repérer des schémas de consommation et à cibler de potentiels « intentionnistes » (personnes ayant plus de chance d’être intéressées par une offre commerciale donnée) à l’aide d’algorithmes prédictifs (issus de la théorie mathématique).
Cela est réalisé à l’aide d’un protocole d’enchères, le « Real-Time Bidding » (RTB), reposant sur un écosystème de technologies complexes : technologies d’achat ciblé et d’enchères côté annonceur (Demand-Slide Platform ou DSP) et technologies de commercialisation d’inventaire côté vendeurs (Supply-Side Platform ou SSP). Le RTB, apparu il y a tout au plus 5 ans mais concernant déjà une grande partie de l’inventaire publicitaire d’affichage commercialisé, fonctionne, schématiquement, de la façon suivante :
Un internaute clique sur une nouvelle page d’un media en ligne (ex. : Lemonde.fr). Lemonde.fr commercialise immédiatement (au moment où la page se charge) l’inventaire publicitaire de la page en question. Pour cela, le site fournit à son SSP l’identifiant, crypté, du cookie lié au navigateur de l’internaute. Le SSP « appelle » un tour d’enchères auprès des DSP des annonceurs auxquels il est connecté. Ceux-ci (par exemple les DSP de Renault ou Peugeot) consultent alors les Data Management Platforms auxquelles ils ont accès (DMP « first party » – les données de l’annonceur lui-même – ou DMP « third party » appartenant à des agrégateurs de données) pour voir si l’internaute en question présente une affinité avec l’offre qu’ils proposent (en l’occurrence si c’est un « intentionniste » auto qui passe depuis quelques semaines tout son temps sur des sites de comparateurs de voitures). Si c’est le cas, elles émettent une enchère. La meilleure enchère emporte l’inventaire. Le tout en moins de 140 millisecondes.
Ce qu’on appelle « retargeting », c’est le fait pour un annonceur, de publier, via l’écosystème que nous venons de décrire, une publicité sur un site média tiers afin de toucher un internaute qu’il avait déjà identifié dans sa DMP « first party » (et donc étant déjà passé par l’un de ses sites).
Ce processus est rendu possible par les nouvelles architectures Big Data (souvent open source) qui permettent de stocker, nettoyer, indexer, mobiliser en des temps infiniment courts et avec des puissances de calculs limitées de très larges volumes de données, issus de sources très diverses.
Quels sont les impacts attendus de cette stratégie de ciblage ?
Le principal impact attendu est tout simplement l’amélioration du ROI (Retour sur Investissement) des dépenses publicitaires et achat média en ligne. En proposant une publicité plus pertinente avec un ciblage affiné, on améliore le taux de clic.
Une telle stratégie d’achat média est-elle coûteuse à mettre en place ?
Oui et non (cf. la description de la chaîne de valeur – estimations Creadev – ci-dessous). Aujourd’hui, la plupart des régies des médias en ligne ont recours au RTB pour écouler une partie de leur inventaire. Côté annonceur, il faut avoir un minimum mensuel de volume d’achat média en ligne pour pouvoir accéder à un DSP (on parle de 100 k€) ce qui peut poser problème aux petits annonceurs qui sont obligés de passer par des intermédiaires.
La plupart des annonceurs (petits ou gros) ne travaillent d’ailleurs pas en direct avec des DSP, ils confient leurs budgets d’achat média à des agences ou « trading desks », parfois indépendants mais plus fréquemment liées à de grandes agences de publicité. Ces trading desks se chargent souvent de gérer les pools de cookies sur les portails web de leurs clients, pour activer pour leur compte les données qu’elles récoltent (mise en place d’une DMP first party).
Leurs prestations sont plus ou moins coûteuses et leurs politiques de reporting (quels achats, sur quels médias, à quels prix, avec quelles marges reversées aux technologies utilisées, à quelle heure, avec quel taux de clic.. ?) sont plus ou moins opaques : attention néanmoins à ne pas laisser les agences profiter de la dissymétrie d’informations en leur faveur et du fait que ces sujets soient nouveaux pour leurs clients pour gonfler leurs marges.
Qu’est-ce que le data leaking et comment le prévenir ?
On pourrait définir le « Data Leaking » comme le fait pour une entreprise, un annonceur, de laisser un tiers accumuler des données sur sa propre organisation, ses propres clients, sans en tirer un bénéfice direct. Par exemple, comme nous l’avons mentionné, un certain nombre de prestataires, comme les trading desks, doivent pouvoir disposer leurs cookies pour tracer les parcours clients afin de « retargeter » ceux-ci sur d’autres medias. Pour éviter qu’un trop grand nombre d’acteurs n’aient accès aux données de navigation de ses clients, une grande multinationale américaine des produits de grande consommation (PGC), bien connue, et qui dépense jusqu’à 300 MUSD annuels en publicité en ligne, a choisi un prestataire de confiance unique sur chacun des maillons de la chaîne de valeur. Elle a imposé une grande transparence et une certaine exclusivité à chacun des prestataires en question, pour éviter toute fuite de données.
Pierre Berendes