Utiliser les données pour se démarquer
Par Mike Luke, responsable national des pratiques de gestion de données, SAS Canada
MAP, PIG, HIVE, alouette!
L’ère des mégadonnées a permis la création de l’écosystème Hadoop, qui, à son tour, a submergé les professionnels du marketing dans un océan d’acronymes et de mots à la mode. Laissez-moi vous expliquer : Hadoop est simplement un environnement qui permet le stockage et le traitement de données… d’immenses quantités de données, évidemment. Cependant, Hadoop reste un outil qu’il faut maîtriser et non un outil auquel il faut se soumettre.
Les principales composantes d’Hadoop incluent un système de fichiers (HDFS), qui répartit des pétaoctets de données (un pétaoctet contient un quadrillion d’octets) en de grands ensembles sur plusieurs ordinateurs dans un centre de données ou dans un environnement infonuagique, et des modèles de programmation (comme MapReduce et Spark), qui appliquent un code de traitement aux machines qui stockent les données pertinentes. On peut ainsi analyser d’immenses ensembles de données en parallèle sur plusieurs machines.
Le bon côté est que l’on peut traiter des grandes quantités de données, et ce, rapidement. L’inconvénient, c’est la naïveté relative qui caractérise la nature des données. Dans une base de données traditionnelle, les dossiers et les champs précisent la fonction des données. Dans un environnement Hadoop, il faut préparer, épurer et mettre en forme les données pour qu’elles soient utiles. Les scientifiques des données consacrent de 70 à 80 % de leur temps à rendre les données utilisables, ce qui ne constitue pas l’utilisation la plus efficace de leur grand talent.
Des outils commencent à voir le jour, comme notre propre chargeur de données SAS pour Hadoop, qui permet de transférer ces capacités en matière d’intégration des données et d’assurance de la qualité directement dans Hadoop tout en fournissant une interface qui permet à l’analyste d’affaires, et pas seulement aux professionnels des technologies, de s’acquitter facilement des tâches de traitement de base liées aux données. Une fois que l’analyste d’affaires maîtrise ce pouvoir, il a accès à une toute nouvelle compréhension des comportements des clients et de la façon de les influencer.
PLUS DE DONNÉES QUE JAMAIS
Les données sont essentielles à la survie du marketing, et on en crée des quantités presque inimaginables chaque jour. Selon les estimations, nous créons 2,5 quintillions d’octets de données chaque jour. Quatre-vingt-dix pour cent des données créées dans l’histoire de l’humanité l’ont été au cours des deux dernières années.
La quantité de données ne fera qu’augmenter à mesure que de nouvelles sources d’information commenceront à en générer. Nous sommes en bonne voie d’atteindre l’« Internet des objets », un monde où des capteurs connectés à Internet et apposés sur tout – des tablettes des magasins aux espaces de stationnement – généreront des données, qui pourront être disséquées, examinées et analysées. Les téléphones mobiles créent des données GPS. Les caméras de surveillance peuvent aider à déterminer les temps d’arrêt devant les tablettes en magasin ainsi que les tendances en matière d’affluence dans les commerces. La maîtrise de ces données peut servir à assurer la conversion des consommateurs. L’objectif n’est pas simplement de recueillir des données au hasard. Toutes les données ne sont pas pertinentes, et le contexte est essentiel si l’on veut proposer la bonne offre au bon consommateur.
Prenons par exemple le fameux panier d’achats virtuel. Grâce à une base de données de transactions, aux données de parcours et à votre historique de recherches, Amazon peut vous recommander d’autres titres susceptibles de vous intéresser lorsque vous avez commandé furtivement Cinquante nuances de Grey. Les renseignements contextuels – les autres articles achetés par les personnes qui se sont procurées le même item que vous, les recherches que vous avez faites ultérieurement, les autres articles que vous avez consultés – influence l’offre. C’est un exemple simple, mais projeté dans un monde de mégadonnées plus complexe, la mise en contexte de ces données crée une approche itérative qui permet d’améliorer les modèles de données et de proposer des offres plus pertinentes au consommateur grâce à chaque parcelle d’information. Les données des capteurs peuvent faciliter la création de modèles du trafic dans le stationnement d’un point de vente afin d’aider à prendre des décisions au sujet de la gestion de la circulation. Les flux de clients dans un centre commercial peuvent orienter le placement de produits secondaires.
PROPOSER L’OFFRE Les nouvelles technologies changent la façon dont on peut proposer les offres aux consommateurs. L’omniprésence des téléphones intelligents et la prolifération des applications mobiles jouent un rôle central dans ce nouveau modèle. Les téléphones fournissent des renseignements de géolocalisation, et les applications qui appartiennent à des marques peuvent fournir des historiques de recherches et de transactions. Les technologies de balisage peuvent transmettre des offres hyperlocales aux téléphones intelligents qui passent tout près. Imaginez un environnement dans lequel un consommateur peut entrer dans un commerce, chercher une rangée ou un article grâce à son téléphone intelligent ou à partir d’un kiosque, recevoir des directions précises en temps réel (qui sont optimisées afin qu’il évite la congestion ou des obstacles à la mobilité) et se voir proposer une offre personnalisée en cours de route, directement sur l’application de son téléphone intelligent. C’est exactement la définition de la bonne offre au bon moment. Et ce n’est pas qu’un vœu pieux : des centres commerciaux, des centres hospitaliers et des palais de congrès du monde entier mettent en place de plateformes d’orientation pour mettre au point ces applications. Cependant, le modèle s’effondre sans les mégadonnées.
DES ÊTRES SOCIAUX Les données ne se limitent pas à des réponses fermées (oui/non), des coordonnées GPS, des transactions, etc. Nous créons aussi davantage de données non structurées – des données qu’on ne peut manipuler à l’aide de formules. Les sources les plus importantes de données non structurées pour les responsables du marketing sont les médias sociaux.
Les messages Facebook et les gazouillis sur Twitter ont un impact important – qu’il soit positif ou négatif – sur votre marque. Dans le passé, un consommateur pouvait envoyer des plaintes ou des félicitations par la poste ou téléphoner directement pour porter plainte. Quelqu’un devait examiner ces interactions et produire des rapports connexes à des fins d’assurance de la qualité.
Grâce au caractère immédiat des médias sociaux, la quantité de messages à l’intention des marques et sur les marques a explosé. Il devient possible de surveiller ces messages manuellement (et on ne parle pas de l’histoire bien connue du technicien du transporteur aérien Porter qui a immédiatement réagi à des rapports sur le bris d’une machine à cappuccino).
Heureusement, il y a des outils qui permettent de structurer ce qui ne l’est pas et d’intégrer ces données dans le modèle des mégadonnées de façon à faciliter les processus décisionnels dans le domaine du marketing. MapReduce, le modèle de traitement réparti intégré d’Hadoop, fournit la puissance nécessaire pour prétraiter le texte, attribuer des valeurs numériques au ton du contenu (analyse des sentiments), extraire des mots clés (région, emplacement) et transformer un gazouillis ou un commentaire sur Facebook en données qu’une application peut traiter.
L’extension logique de cette tendance consiste à saisir d’autres données non structurées comme vos appels téléphoniques sortants et entrants. Si l’appel est enregistré à des fins de formation et d’assurance de la qualité (comme on l’entend si souvent!), ces données peuvent être analysées. On pourrait utiliser le pouvoir de traitement de MapReduce pour améliorer l’exactitude de la conversion voix-texte. Combiné avec les outils qui existent déjà et qui permettent d’analyser le ton de la voix pour déceler les niveaux d’agitation en temps réel et le registre de l’agent du centre d’appels, cela pourrait créer un fichier de données très complet qui pourrait ensuite être analysé.
POURQUOI C’EST IMPORTANT
En résumé, il y a de nombreuses raisons pour lesquelles les responsables du marketing doivent s’intéresser à Hadoop et en comprendre le potentiel.
*C’est économique. Ou plutôt, l’infrastructure de soutien nécessaire est moins coûteuse que les anciennes bases de données et anciens solutions propriétaires. Par exemple, HDFS et MapReduce fonctionnent sur du matériel x86. De plus, il s’agit d’une plateforme de source ouverte. Elle peut être téléchargée et exécutée grâce à une licence publique générale (LPG), ce qui signifie que la seule obligation des utilisateurs, c’est de communiquer à la communauté toutes les améliorations qu’ils ont apportées (c’est ce qu’on appelait auparavant du « copyleft » ou libre-droit, par opposition à « copyright », qui lui désigne le droit d’auteur). Bien sûr, il y a des versions commerciales du logiciel et des possibilités de soutien connexes, qui permettent d’avoir accès à plus de caractéristiques liées à la plateforme pour un certain montant, ce qui rend, par conséquent, cette plateforme accessible à un plus large auditoire.
*Elle permet de traiter des ensembles de données beaucoup plus vastes que le modèle de base de données traditionnel. Cela signifie que vous pouvez obtenir et utiliser plus de données au sujet de vos clients, ce qui vous permet de détecter des tendances ou des liens inattendus.
*C’est une technologie perturbatrice qui remet en question l’approche traditionnelle en informatique. La combinaison de la dernière crise financière et de la croissance générale des données ont poussé les organisations à tirer parti de nouvelles approches pour obtenir des renseignements au sujet de leurs clients de façon à accroître la rentabilité et à réduire les coûts. L’écosystème continuera à se perfectionner tandis que des technologies comme Hadoop deviendront plus populaires. Soyez assurés que la « mer » de mots à la mode et d’acronymes continuera à croître au même rythme que les quantités de données accessibles.
Pour de plus amples renseignements au sujet des solutions de SAS pour Hadoop, veuillez consulter le http://www.sas.com/en_us/software/sas-hadoop.html.
En tant que responsable national des pratiques de gestion de données de SAS Canada, Mike aide les clients de partout au pays à tirer profit de leur actif le plus important, leurs données. Mike a acquis une vaste expérience en technologie de l’information en travaillant auprès d’institutions financières, de détaillants et de fournisseurs de services de télécommunication partout au Canada.