Big data
Présentation et atouts
Les big data désignent les gros volumes de données (structurées ou non) qui alimentent l'activité quotidienne d'une entreprise. Mais ce n’est pas la quantité des données qui compte, c'est ce que les entreprises en font. Il est possible d'analyser les big data pour en tirer des enseignements permettant de prendre de meilleures décisions et de lancer des initiatives stratégiques.
Histoire des big data
Le terme "big data" désigne les données qui sont si volumineuses, rapides ou complexes qu'il est difficile voire impossible de les traiter à l'aide des méthodes traditionnelles. L'accès et le stockage de grandes quantités d'informations à des fins d'analyse existent depuis longtemps. Mais le concept de big data a pris de l'ampleur au début des années 2000, lorsque l'analyste industriel Doug Laney a défini les grandes données selon les trois "V" :
Volume: Les organisations collectent des données à partir de diverses sources, notamment les transactions commerciales, les appareils intelligents (IoT), les équipements industriels, les vidéos, les médias sociaux et bien d'autres encore. Dans le passé, le stockage aurait posé problème - mais la possibilité d'un stockage moins coûteux sur des plateformes comme les Data Lakes (ou Lacs de données) et Hadoop a levé ce frein.
Vitesse: Avec la croissance de l'internet des objets, les données arrivent dans les entreprises à une vitesse sans précédent et doivent être traitées au bon moment. Les étiquettes RFID, les capteurs et les compteurs intelligents imposent le traitement de ces torrents de données en temps quasi réel.
Variété : Les données revêtent tous types de formats : des données numériques structurées dans des bases de données traditionnelles aux documents texte non structurés, en passant par les e-mails, les vidéos, les fichiers audio, les données boursières et les transactions financières.
Chez SAS, nous y associons deux dimensions supplémentaires :
Variabilité :
En plus de l'augmentation de la vitesse et de la variété des données, les flux de données sont imprévisibles - ils changent fréquemment et sont extrêmement variables. C'est un défi, mais les entreprises doivent savoir reconnaître une tendance imminente sur les médias sociaux, et être capable de gérer les pics de charge quotidiens, saisonniers, et ponctuels déclenchés par des événements.
Véracité :
La véracité fait référence à la qualité des données. Les données provenant de multiples sources différentes, il est difficile de les relier, de les faire correspondre, de les nettoyer et de les transformer d'un système à l'autre. Les entreprises doivent connecter et corréler les relations, les hiérarchies et les multiples liaisons de données, qui risquent sinon d’échapper à tout contrôle.
Une production optimisée grâce à l'analyse des big data
Chez USG Corporation, le traitement des big data avec l'analyse prédictive est essentielle pour comprendre pleinement la fabrication des produits et leur fonctionnement. Et dans un marché où la concurrence mondiale est féroce, les fabricants comme USG savent combien il est important de fabriquer des produits de haute qualité à un prix abordable. Grâce à la plateforme SAS, USG a éliminé les approximations et optimisé ses investissements de production. Résultat : une amélioration de la qualité des produits et des délais de mise sur le marché.
Quel est l'intérêt des big data ?
Ce n’est pas la quantité des big data qui compte, mais l'usage qui en est fait. Il est possible d'analyser les données issues de n'importe quelle source pour y trouver des réponses permettant de 1) réduire les coûts, 2) gagner du temps, 3) développer de nouveaux produits et optimiser les offres et 4) prendre des décisions avisées. En associant les big data à de puissants outils analytiques, vous pouvez accomplir des tâches essentielles pour l'entreprise :
- Déterminer en temps quasi réel les causes premières des défaillances, problèmes et défauts.
- Générer des bons de réduction sur le point de vente en fonction des habitudes d'achat du client.
- Recalculer le risque sur des portefeuilles complets en quelques minutes.
- Détecter un comportement frauduleux avant qu'il n’ait une incidence sur votre entreprise.
Les big data dans le monde d'aujourd'hui
Les big data (ainsi que leur gestion et leur exploitation par les entreprises) transforment les modes d'utilisation de l'information dans le monde entier. Découvrez quel est l'impact des big data.
Le renouveau de l'intégration des données, grâce aux big data
Pour rester pertinente, l'intégration des données doit porter sur de nombreux types et sources de données, tout en observant des temps de latence différents, du temps réel au flux continu. Découvrez comment l'intégration des données a évolué pour satisfaire aux nouvelles exigences.
Données et analytique : construire votre stratégie
Vous vous demandez comment mettre en place une organisation analytique de pointe ? Assurez-vous de la fiabilité des informations. Renforcez les décisions fondées sur les données dans toutes les lignes métier. Pilotez la stratégie. Et sachez comment exploiter toute la valeur des big data.
Faire la différence entre data lake et entrepôt de données
L'expression « data lake » (lac de données) relève-t-elle du jargon marketing à la mode ? Ou s'agit-il simplement d'une nouvelle appellation désignant un entrepôt de données ? Phil Simon fait le point sur la définition d'un data lake, son fonctionnement et son utilité.
Nouvel écosystème analytique
Cloud, conteneurs et puissance de calcul à la demande - une enquête de SAS auprès de plus de 1 000 organisations explore l'adoption des technologies et illustre comment l'adoption d'approches spécifiques vous permet de faire évoluer avec succès vos écosystèmes analytiques.
Qui se concentre sur les big data ?
Les big data sont clés pour les industries. L'assaut de l'IoT et d'autres dispositifs connectés a créé une augmentation massive de la quantité d'informations que les organisations collectent, gèrent et analysent. Les big data apportent un potentiel de découverte d'informations majeures, pour tous les secteurs de toute envergure.
- Sélectionnez un secteur d'activité
- Grande distribution
- Industrie
- Banque
- Santé
- Enseignement
- Petites et moyennes entreprises
- Administration
- Assurance
Grande distribution
Bâtir des relations avec la clientèle est un enjeu capital de la grande distribution, et la meilleure façon d'y parvenir est de s'appuyer sur les big data. Les retailers doivent trouver la meilleure façon d'attirer la clientèle, de gérer les transactions et de regagner du terrain. Les big data sont encore et toujours au cœur de ces processus.
Industrie
Forts des enseignements tirés des big data, les industriels peuvent améliorer la qualité et la productivité, tout en réduisant le gaspillage — des processus essentiels sur un marché très concurrentiel. De plus en plus d'industriels ont développé une culture de l'analytique, qui leur permet de résoudre les problèmes plus rapidement et de prendre des décisions plus avisées.
Banque
Alimentées en continu par de grandes quantités d'informations issues d'innombrables sources, les banques doivent innover dans la gestion des big data. S'il est essentiel de bien comprendre les clients et d'améliorer leur satisfaction, il est aussi important de limiter les risques et la fraude, tout en se conformant à la réglementation en vigueur. Les big data fournissent de précieux enseignements, mais nécessitent que les institutions financières conservent leur avance en s'équipant d'analytique avancée.
Santé
Dossiers médicaux. Protocoles de soins. Médicaments prescrits. Dans le domaine de la santé, il faut toujours agir rapidement, avec précision et, dans certains cas, avec la transparence requise pour respecter la réglementation stricte du secteur. En gérant efficacement les big data, les professionnels de santé peuvent mettre en lumière des données jusqu'alors inconnues qui permettent d'améliorer la prise en charge des patients.
Enseignement
Avec les informations tirées des données, les enseignants peuvent exercer une influence considérable sur les systèmes scolaires, les étudiants et les programmes. L'analyse des big data permet en effet d'identifier les étudiants à risque, de s'assurer que les élèves progressent de façon satisfaisante et de mettre en œuvre un meilleur système d'évaluation et de soutien des enseignants et directeurs d'établissement.
Petites et moyennes entreprises
Entre la facilité de collecte des big data et les possibilités simplifiées de gestion, de stockage et d'analyse des données, les PME sont mieux équipées que jamais pour dominer leurs concurrents les plus menaçants. Les PME peuvent utiliser les big data avec l'analyrique pour réduire leurs coûts, augmenter leur productivité, renforcer les relations avec leurs clients, réduire les risques et les fraudes.
Administration
Lorsque les administrations parviennent à tirer parti de l'analytique appliquée à leurs big data, elles font d'énormes progrès en matière de gestion des services et organismes publics, de réduction des embouteillages ou de lutte contre la criminalité. Mais, si les big data présentent de nombreux avantages, les administrations doivent également résoudre les problèmes de transparence et de confidentialité.
Assurance
Télématique, données de capteurs, données météorologiques, données de drones et d'images aériennes - les assureurs sont submergés par un afflux de big data. La combinaison de ces données à l'analytique fournit de nouvelles informations qui peuvent appuyer la transformation numérique. Par exemple, les big data permettent aux assureurs de mieux évaluer les risques, créer de nouvelles politiques de tarification, faire des offres hautement personnalisées et être plus proactifs en matière de prévention des pertes.
Le deep learning a besoin de big data, car celles-ci sont nécessaires pour isoler les modèles cachés et trouver des réponses sans devoir ajuster les données excessivement. Avec le deep learning, plus vous disposez de données de bonne qualité, meilleurs sont les résultats. Wayne Thompson SAS Product Manager
L'innovation fondée sur les données
Les exabytes de big data d'aujourd'hui ouvrent d'innombrables possibilités pour saisir les informations qui stimulent l'innovation. Des prévisions plus précises à une efficacité opérationnelle accrue et à une meilleure expérience client, les utilisations sophistiquées des big data et de l'analytique propulsent des avancées qui peuvent changer notre monde - en améliorant le quotidien, en soignant les maladies, en protégeant les personnes vulnérables et les ressources.
Comment fonctionnent les big data
Avant de pouvoir mettre les big data à profit, les entreprises doivent réfléchir à la manière dont ces données circulent entre une multitude de lieux, de sources, de systèmes, de propriétaires et d'utilisateurs. Il y a cinq étapes clés pour prendre en charge ce grand "tissu de données" qui comprend des données traditionnelles et structurées ainsi que des données non structurées et semi-structurées :
- Définir une stratégie big data.
- Identifier les sources de big data.
- Accéder, gérer et stocker les données.
- Analyser les données.
- Prendre des décisions fondées sur des données.
1) Définir une stratégie big data.
Une stratégie big data est un plan conçu pour superviser et améliorer la manière dont vous acquérez, stockez, gérez, partagez et utilisez les données au sein et à l'extérieur de votre organisation. Une stratégie big data prépare le terrain pour la réussite de l'entreprise dans un contexte d'abondance de données. Lors de l'élaboration d'une stratégie, il est important de tenir compte des objectifs et initiatives métier et technologiques existants et futurs. Il faut donc considérer les big data comme tout autre asset de valeur et non comme un simple sous-produit des applications.
2) Connaître les sources de big data
- Les données en continu proviennent de l'internet des objets (IoT) et d'autres appareils connectés qui transmettent leurs flux aux systèmes informatiques depuis des vêtements, voitures intelligentes, appareils médicaux, équipements industriels et autres. Vous pouvez traiter ces big data dès leur arrivée, en décidant quelles données conserver, et lesquelles analyser de façon plus approfondie.
- Les données desmédias sociaux proviennent des interactions sur Facebook, YouTube, Instagram, etc. Il s'agit de vastes quantités de big data sous forme d'images, de vidéos, de voix, de texte et de son - utiles pour le marketing, la vente et le support client. Elles se présentent souvent sous des formes non structurées ou semi-structurées, ce qui les rend particulièrement difficiles à utiliser et analyser.
- Lesdonnées accessibles au public proviennent d'un grand nombre de sources de données ouvertes comme le portail data.gov du gouvernement américain, le World Factbook de la CIA ou le portail des données ouvertes de l'Union européenne.
- D'autres big data peuvent provenir de Data Lakes (ou Lacs de données), de sources de données cloud, de fournisseurs et de clients.
3) Accès, gestion et stockage de big data
Les systèmes informatiques modernes offrent la vitesse, la puissance et la flexibilité nécessaires pour accéder rapidement à des quantités de big data de différents types. Outre un accès fiable, les entreprises ont également besoin de méthodes pour intégrer les données, garantir leur qualité, assurer la gouvernance et le stockage des données et préparer les données pour l'analyse. Certaines données peuvent être stockées sur place dans un entrepôt de données traditionnel, mais il existe également des options flexibles et peu coûteuses pour le stockage et la manipulation de données volumineuses via des solutions de cloud computing, des Data Lakes (ou Lacs de données) et Hadoop.
4) Analyser les big data
Grâce aux technologies de haute performance comme le grid computing ou l'analyse en mémoire, les organisations peuvent choisir d'utiliser l'intégralité de leurs big data pour l'analyse. Une autre approche consiste à déterminer en amont quelles données sont pertinentes avant de les analyser. Dans tous les cas, l'analytique pour les big data est clé pour matérialiser les informations et la valeur de leurs données. Les big data contribuent de plus en plus aux initiatives d'analytique avancée telles que l'intelligence artificielle.
5) Prendre des décisions avisées, fondées sur des données
Des données de qualité et bien gérées produisent des analyses et des décisions fiables. Pour rester compétitives, les entreprises doivent saisir toute la valeur des big data et les intégrer à leur fonctionnenent, en basant leurs décisions sur les preuves apportées par les big data plutôt que sur leur instinct. Les avantages d'une telle approche sont évidents. Les entreprises qui s'appuient sur les données sont plus performantes, plus prévisibles et plus rentables.
Étapes suivantes
Les big data exigent une gestion sophistiquée des données et des techniques analytiques avancées. SAS vous les fournit.
Préparation des données SAS
Pour préparer des big data qui changent constamment, à des fins d'analyse, vous devez d'abord y accéder, les profiler, les nettoyer et les transformer. La préparation des données peut être consommatrice de temps en raison de la diversité des sources, des tailles et de vitesse des données. SAS Data Preparation vous simplifie la tâche : vous pouvez préparer les données sans codage, sans compétences spécialisées et sans solliciter les équipes informatiques.
Lecture recommandée
- Interview How do you know if you’re ready for Hadoop?Ask an early adopter. Epsilon VP of Products answers our Hadoop questions about implementation, preparation and scalability.
- ARTICLE How do recommendation systems know what you might like?How do recommendation systems know what you’re likely to want and offer it up while you’re shopping? That’s a computationally intensive question that used to take hours or days to answer. With distributed computing and in-memory analytics, it’s done in minutes.
- ARTICLE Using Hadoop as an Analytics CatalystLearn how to get the most out of Hadoop by developing a sound strategy for analyzing data in this new storage environment.