This page exists on your local site.

Go there now
Stay here
X
Teal abstract honeycomb background with white line art overlay

Machine Learning ou Apprentissage Automatique

Présentation et atouts

Le Machine Learning est une méthode d'analyse des données qui automatise la construction de modèles analytiques. Il s'agit d'une branche de l'intelligence artificielle basée sur l'idée que les systèmes peuvent apprendre à partir de données, identifier des modèles et prendre des décisions avec une intervention humaine minimale.

Évolution du machine learning

Grâce aux nouvelles technologies informatiques, le machine learning a énormément progressé. Il est issu de la reconnaissance de tendances et de la théorie selon laquelle les ordinateurs peuvent apprendre sans être programmés à effectuer des tâches spécifiques. Les chercheurs s'intéressant à l'intelligence artificielle voulaient en effet savoir si les ordinateurs étaient capables d’apprendre des données. La dimension itérative du machine learning est importante car les modèles s'adaptent d’eux-mêmes lorsqu'ils sont exposés à de nouvelles données. Ils apprennent de calculs précédents afin de produire des décisions et résultats fiables et reproductibles. La science n'est donc pas nouvelle, mais elle connaît un nouvel élan.

Si de nombreux algorithmes de machine learning existent depuis longtemps, la capacité d'appliquer automatiquement des calculs mathématiques complexes à des données volumineuses - encore et encore, de plus en plus vite - est un développement récent. Voici quelques exemples largement médiatisés d'applications de machine learning que vous connaissez peut-être :

  • La voiture autonome surmédiatisée de Google ? L'essence du machine learning.
  • Les recommandations en ligne comme celles d'Amazon et de Netflix ? Des applications de machine learning pour la vie quotidienne.
  • Savoir ce que les clients disent de vous sur Twitter ? Du machine learning associé à la création de règles linguistiques.
  • Prévention et détection de la fraude? L'une des utilisations les plus évidentes et les plus importantes dans notre monde actuel.

 

Lecteur vidéo en cours de chargement.
Temps actuel 0:00
Durée 0:00
Chargé: 0%
Type de flux EN DIRECT
Temps restant 0:00
 
1x
  • Chapitres
  • descriptions désactivées, sélectionné

    Machine learning et intelligence artificielle

    Si l'intelligence artificielle (IA) désigne au sens large une science visant à imiter les capacités humaines, le machine learning en est un sous-ensemble qui consiste à former une machine à apprendre par elle-même. Regardez cette vidéo pour comprendre la relation entre l'IA et le machine learning. Elle explique le fonctionnement de ces deux technologies, exemples et anecdotes à l’appui.

    Quel est l'intérêt du machine learning ?

    Le regain d'intérêt pour le machine learning est dû aux mêmes facteurs qui ont rendu l'exploration de données et l'analyse bayésienne plus populaires que jamais. Des éléments tels que les volumes et variétés croissants de données disponibles, un traitement informatique moins cher et plus puissant, un stockage de données abordable.

    Autant de facteurs qui permettent désormais de créer automatiquement des modèles capables d’analyser des données complexes et volumineuses, et d’obtenir rapidement des résultats précis, y compris à très grande échelle. Et en élaborant des modèles précis, une entreprise multiplie ses chances d'identifier des opportunités rentables, ou de se prémunir des risques inconnus.

     

    Quelles sont les composantes essentielles d’un système de machine learning performant ?

    • Fonctions de préparation des données.
    • Algorithmes (de base et avancés).
    • Processus d'automatisation et itératifs.
    • Évolutivité
    • Modélisation d’ensembles.
    Infographie sur le machine learning

    Le saviez-vous ?

    • En machine learning, la cible est une « étiquette ».
    • En statistique, la cible est une « variable dépendante ».
    • Une variable en statistique est une « caractéristique » en machine learning.
    • Une transformation en statistique est une « création de caractéristique » en machine learning.

    Le machine learning de nos jours

    En utilisant des algorithmes pour créer des modèles qui révèlent des connexions, les entreprises peuvent prendre de meilleures décisions sans intervention humaine. Découvrez les technologies qui façonnent le monde dans lequel nous vivons.

    Blogs

    Tout sur les algorithmes de machine learning

    Il existe quatre types d'algorithmes de machine learning : supervisé, semi-supervisé, non supervisé et de renforcement. Découvrez comment ils fonctionnent et lequel est le mieux adapté aux besoins de votre entreprise.

    Lire l'article

    Améliorez vos compétences SAS

    Bénéficiez d'une formation approfondie et d'un accès gratuit aux logiciels SAS pour développer vos compétences en machine learning. Les cours comprennent : 14 heures de cours, 90 jours d'accès gratuit au logiciel dans le cloud et un format d'apprentissage en ligne flexible, sans aucune compétence en programmation. 

    Cours sur le Machine Learning

    Adopter une IA digne de confiance

    Les consommateurs font davantage confiance aux organisations qui font preuve d'une utilisation responsable et éthique de l'IA, comme l'apprentissage automatique et l'IA générative. Découvrez pourquoi il est essentiel d'adopter des systèmes d'IA conçus pour être centrés sur l'humain, inclusifs et responsables.

    Découvrez comment SAS s'y prend

    6 pièges du machine learning

    Des hypothèses sous-jacentes erronées peuvent conduire à de mauvais choix et à des erreurs, en particulier avec des méthodes sophistiquées telles que le machine learning. Passez outre les erreurs des autres grâce aux conseils d'un expert en machine learning.

    Lire l'article de blogue

    Utilisation

    La plupart des entreprises qui manipulent de gros volumes de données reconnaissent l'intérêt du machine learning. En extrayant des informations de ces données (souvent en temps réel), elles peuvent travailler plus efficacement ou devancer leurs concurrents.

    Services financiers

    Les banques et autres entreprises du secteur financier utilisent la technologie de machine learning à deux fins principales : pour identifier des informations importantes dans les données et pour la prévention et la détection des fraudes. Ces informations peuvent permettre d'identifier des opportunités d'investissement ou d'aider les investisseurs à savoir quand négocier. Le Data Mining peut également permettre d'identifier les clients présentant des profils à risque, ou d'utiliser la cybersurveillance pour repérer les signes avant-coureurs de la fraude.

    Administration

    Les administrations en charge de la sécurité et des services publics ont particulièrement besoin du machine learning car elles ont accès à de nombreuses sources de données pouvant receler de précieuses informations. Ainsi, l'analyse des données des capteurs fait apparaître des pistes pour améliorer l'efficacité et réaliser des économies. Le machine learning permet également de détecter la fraude et d'éviter l'usurpation d'identité.

    Santé

    Le machine learning a le vent en poupe dans le secteur de la santé, grâce à l'avènement d'accessoires connectés et de capteurs qui évaluent en temps réel l'état de santé d'un patient. La technologie sert également à analyser les données pour dégager des tendances ou des indicateurs d'alerte permettant d’améliorer les diagnostics et les traitements. 

    Vente au détail

    Les sites web qui vous recommandent des articles susceptibles de vous plaire en fonction de vos achats antérieurs utilisent le machine learning pour analyser votre historique d'achat.  Les détaillants s'appuient sur le machine learning pour capturer des données, les analyser et les utiliser pour personnaliser l'expérience d'achat, mettre en œuvre une campagne de marketing, optimiser les prix, planifier les marchandises et obtenir des informations sur les clients.   

    Energies

    Trouver de nouvelles sources d'énergie. Analyser les minerais présents dans le sol. Prévoir les pannes des capteurs d'une raffinerie. Simplifier l'approvisionnement en pétrole pour optimiser l’efficacité et la rentabilité. Les cas d'usage dans ce secteur sont nombreux et ne cessent de se multiplier.

    Transports

    L'analyse des données pour identifier des schémas et tendances joue un rôle clé dans le secteur des transports, dont la rentabilité est tributaire de la capacité à optimiser les itinéraires et à anticiper les problèmes. L'analyse des données et la modélisation sont des outils importants pour les sociétés de livraison, les transports publics et autres entreprises du secteur.

    Comment ça marche

    Pour tirer le meilleur parti du machine learning, vous devez savoir comment associer les meilleurs algorithmes aux bons outils et processus. SAS combine un héritage riche et sophistiqué en matière de statistiques et d'exploration de données avec de nouvelles avancées architecturales pour garantir que vos modèles s'exécutent aussi rapidement que possible - dans des environnements d'entreprise gigantesques ou dans un environnement de cloud computing.

    Algorithmes: Les interfaces graphiques SAS vous aident à construire des modèles de machine learning et à mettre en œuvre un processus itératif d'apprentissage automatique. Il n'est pas nécessaire d'être un statisticien chevronné. Notre sélection complète d'algorithmes de machine learning est incluse dans de nombreux produits SAS et peut vous aider à obtenir rapidement de la valeur à partir de vos big data - y compris les données de l'internet des objets. Les algorithmes de machine learning SAS comprennent

    Réseaux neuronaux
     
    Arbres décisionnels
     
    Forêts aléatoires
     
    Etude d’associations et recherche de séquences
     
    Gradient boosting et bagging
     
    Machines à vecteurs de support
     
    Mappage du voisin le plus proche
     
    Clusterisation par la méthode des nuées dynamiques
     
    Cartes auto-organisatrices
     
    Techniques d'optimisation de la recherche locale (par exemple, algorithmes génétiques)
     
    Espérance-maximisation
     
    Splines de régression adaptatifs multivariés
     
    Réseaux bayésiens
     
    Estimation de la densité du noyau
     
    Analyse en composantes principales
     
    Décomposition en valeurs singulières
     
    Modèles de mélange gaussien
     
    Création de règles d’exécution séquentielle
     

     

    Outils et processus : Comme nous le savons maintenant, les algorithmes ne font pas tout. En définitive, le secret de l'exploitation des big data réside dans l’association des meilleurs algorithmes selon la tâche à accomplir, intégrant les fonctionnalités suivantes :

    Qualité et gestion des données
     
    Interfaces utilisateur pour la création de modèles et de flux de processus
     
    Exploration interactive des données et visualisation des résultats de modèles
     
    Comparaisons de différents modèles de machine learning pour identifier rapidement le plus performant    
     
    Évaluation automatisée de modèles d'ensembles pour identifier les plus performants
     
    Déploiement aisé de modèles pour obtenir rapidement des résultats reproductibles et fiables
     
    Plate-forme intégrée complète pour l'automatisation du processus décisionnel fondé sur les données
     

    Méthodes courantes de machine learning

    Les deux méthodes de machine learning les plus utilisées sont l'apprentissage supervisé et l'apprentissage non supervisé, mais il en existe d'autres. Voici les principales.

    Les algorithmes d'apprentissage supervisé sont entraînés sur des exemples étiquetés, par exemple une entrée dont le résultat attendu est connu. Ainsi, un équipement pourrait comporter des points de données étiquetés « E » (échecs) ou « R » (réussites). L'algorithme d'apprentissage reçoit une série de données en entrée avec les sorties correctes correspondantes, et apprend en comparant la sortie réelle avec les sorties correctes. Il modifie alors le modèle en conséquence. A l'aide de méthodes comme la classification, la régression, la prédiction et le "gradient boosting", l'apprentissage supervisé utilise des schémas pour prédire les valeurs de l'étiquette sur d'autres données non étiquetées. Cette méthode d'apprentissage est couramment utilisée dans les applications où les données historiques servent à prévoir des événements futurs probables. Par exemple, elle permet de savoir dans quels cas des transactions de carte de crédit risquent d'être frauduleuses ou quel assuré est susceptible de soumettre une demande d'indemnisation.

    L'apprentissage non supervisé s’applique aux données sans étiquettes historiques. Dans ce cas, le système ne connaît pas la « bonne réponse ». C'est à l'algorithme de déterminer le modèle présenté. Le but est d'explorer les données et d'en découvrir la structure. L'apprentissage non supervisé fonctionne bien avec les données transactionnelles. Il permet par exemple d'identifier des segments de clients qui possèdent des attributs similaires et peuvent donc être traités de la même façon dans les campagnes marketing. Il peut aussi détecter les attributs principaux qui servent à segmenter la clientèle. Parmi les techniques les plus courantes figurent les cartes auto-organisatrices, le mappage du voisin le plus proche, la clusterisation par la méthode des nuées dynamiques et la décomposition en valeurs singulières. Ces algorithmes servent aussi à segmenter des thématiques de texte, à recommander des articles et à identifier des données hors normes.

    L'apprentissage semi-supervisé a les mêmes applications que l'apprentissage supervisé. Cependant, son entraînement repose à la fois sur des données étiquetées et non étiquetées, généralement une petite quantité de la première catégorie et une grande quantité de la seconde catégorie (car l'acquisition de données non étiquetées coûte moins cher et nécessite moins d'efforts). Ce type d'apprentissage peut être utilisé avec des méthodes comme la classification, la régression et la prédiction. L'apprentissage semi-supervisé est utile lorsque le coût de l'étiquetage est trop élevé pour justifier un processus d'apprentissage entièrement étiqueté. La reconnaissance du visage d'une personne sur une webcam fait partie des premières applications de cette méthode.

    L'apprentissage par renforcement est souvent utilisé pour la robotique, les jeux et la navigation. Elle est également utilisée en conjonction avec des techniques d'IA générative, comme les grands modèles de langage. Avec l'apprentissage par renforcement, l'algorithme découvre, par essais et erreurs, quelles sont les actions qui rapportent le plus. Ce type d'apprentissage comporte trois composantes principales : l'agent (l'apprenant ou le décideur), l'environnement (tout ce avec quoi l'agent interagit) et les actions (ce que l'agent peut faire). L'objectif est que l'agent choisisse des actions qui maximisent la récompense attendue dans un laps de temps donné. L'agent atteindra son objectif beaucoup plus rapidement en suivant une bonne politique. L'objectif de l'apprentissage par renforcement est donc d'apprendre la meilleure politique.

    Les humains peuvent généralement créer un ou deux modèles satisfaisants par semaine ; le machine learning est capable d'en générer des milliers.

    Thomas H. Davenport, expert reconnu de l'analytique
    extrait du Wall Street Journal

    Différences entre le data mining, le machine learning et le deep learning

    Bien que toutes ces méthodes aient un objectif commun (extraire des informations, des tendances et des relations permettant de prendre des décisions), les approches et les capacités diffèrent.

    Exploration de données

    L'exploration de données peut être considérée comme un ensemble de méthodes différentes permettant d'extraire des informations des données. Il peut s'agir de méthodes statistiques traditionnelles et de Machine Learning. L'exploration de données applique des méthodes issues de nombreux domaines différents afin d'identifier des modèles précédemment inconnus à partir de données. Il peut s'agir d'algorithmes statistiques, de Machine Learning, d'analyse de texte, d'analyse de séries chronologiques et d'autres domaines de l'analytique. Le data mining comprend également l'étude et la pratique du stockage et de la manipulation des données.

     

    Infographie sur le machine learning

    Machine learning

    Avec le machine learning, la grande différence est que, comme pour les modèles statistiques, il s'agit de comprendre la structure des données — d'ajuster des distributions théoriques aux données qui sont bien comprises. Par conséquent, il y a derrière les modèles statistiques une théorie mathématiquement prouvée, à condition que les données répondent également à des hypothèses fortes. Le machine learning repose sur le fait de pouvoir utiliser des ordinateurs pour rechercher une structure dans les données, même si aucune théorie existante ne permet de se faire une idée de cette structure. Le test d'un modèle de machine learning est une erreur de validation de nouvelles données, et non un test théorique vérifiant une hypothèse nulle. Comme le machine learning utilise souvent une approche itérative pour apprendre des données, il est facile d'automatiser cet apprentissage. Les données sont soumises à des passages successifs jusqu'à ce qu'un schéma cohérent soit établi.

    Infographie sur le deep learning

    Deep learning

    Le deep learning combine les progrès de la puissance de calcul et des types particuliers de réseaux neuronaux pour apprendre des schémas complexes dans de grandes quantités de données. Les techniques de deep learning sont actuellement à la pointe de la technologie pour l'identification d'objets dans les images et de mots dans les sons. Les chercheurs cherchent maintenant à appliquer ces succès en matière de reconnaissance des formes à des tâches plus complexes telles que la traduction automatique des langues, les diagnostics médicaux et de nombreux autres problèmes sociaux et commerciaux importants.