Personne codant sur un ordinateur portable

Machine Learning

Machine Learning ou Apprentissage Automatique

Présentation et atouts

Le machine learning est une méthode d'analyse des données qui automatise la construction de modèles analytiques. Il s'agit d'une branche de l'intelligence artificielle (IA) & basée sur l'idée que les systèmes peuvent apprendre à partir de données, identifier des modèles et prendre des décisions avec une intervention humaine minimale.

Évolution du machine learning

Grâce aux nouvelles technologies informatiques, le machine learning d'aujourd'hui n'a plus rien à voir avec l'apprentissage automatique du passé. Elle est née de la reconnaissance des formes et de la théorie selon laquelle les ordinateurs peuvent apprendre sans être programmés pour effectuer des tâches spécifiques ; les chercheurs intéressés par l'intelligence artificielle voulaient voir si les ordinateurs pouvaient apprendre à partir de données. L'aspect itératif du machine learning est important, car lorsque les modèles sont exposés à de nouvelles données, ils peuvent s'adapter de manière indépendante. Ils tirent des enseignements des calculs précédents pour produire des décisions et des résultats fiables et reproductibles. Cette science n'est pas nouvelle, mais elle a pris un nouvel essor.

De nombreux algorithmes de machine learning existent depuis longtemps, et la capacité d'appliquer automatiquement des calculs mathématiques complexes à des Big Data - encore et encore, de plus en plus rapidement - est en cours. Voici quelques exemples largement médiatisés de machine learning que vous connaissez peut-être :

Les voitures autonomes comme Waymo et Tesla, qui ont fait l'objet d'un battage médiatique important ? L'essence du machine learning.
Les offres de recommandation en ligne telles que celles d'Amazon ? Applications du machine learning pour la vie quotidienne.
Savoir ce que les clients disent de vous sur les plateformes de médias sociaux ? Le machine learning combiné à la création de règles linguistiques.
Prévention et détection de la fraude ? L'une des utilisations les plus évidentes et les plus importantes dans notre monde actuel.
Le GPT d'Open AI et d'autres grands modèles de langage (LLMs) populaires aujourd'hui ? Ces formes d'IA générative (GenAI) sont construites avec des modèles de machine learning.

Machine learning et intelligence artificielle

Si l'intelligence artificielle (IA) est la science générale qui consiste à imiter les capacités humaines, le machine learning est un sous-ensemble spécifique de l'IA qui consiste à apprendre à une machine à apprendre. Regardez cette vidéo pour mieux comprendre la relation entre l'IA et le machine learning. Vous verrez comment ces deux technologies fonctionnent, avec des exemples utiles et quelques apartés amusants.

Le machine learning de nos jours

En utilisant des algorithmes pour construire des modèles qui révèlent les connexions, les organisations peuvent prendre de meilleures décisions sans intervention humaine. Découvrez les technologies qui façonnent le monde dans lequel nous vivons.

Tout sur les algorithmes de machine learning

Il existe quatre types d'algorithmes de machine learning : supervisé, semi-supervisé, non supervisé et de renforcement. Découvrez chaque type d'algorithme et son fonctionnement. Vous serez alors en mesure de choisir celui qui répond le mieux aux besoins de votre entreprise.

Lire l'article Read about the 4 main types of machine learning algorithms

Construire des modèles avec un atelier de développement

Un environnement informatique en libre-service et à la demande pour l'analyse des données et les modèles ML permet d'augmenter la productivité et les performances tout en minimisant le support informatique et les coûts. Dans cette Q&A, un expert explique pourquoi un atelier de développement est un environnement idéal pour les développeurs et les modélisateurs.

Lire l'article de blogue See why a developer workbench is so good for developers and modelers

Reconnaissance d'une technologie de pointe

Fast Company, les American Business Awards, PRNews et d'autres ont récompensé SAS pour ses projets innovants en matière de technologie et d'innovation sociale. Découvrez pourquoi SAS est un leader dans le Magic Quadrant 2024 de Gartner®™ pour la science des données et le machine learning.

Découvrir Learn more about why SAS is a recognized leader in machine learning and more

Adopter une IA digne de confiance

Les consommateurs font davantage confiance aux organisations qui font preuve d'une utilisation responsable et éthique de l'IA, comme le machine learning et l'IA générative. Découvrez pourquoi il est essentiel d'adopter des systèmes d'IA conçus pour être centrés sur l'humain, inclusifs et responsables.

Découvrez comment le SAS procède Discover why it's so important to adopt trustworthy AI

Applications de machine learning dans le monde réel

CNG Holdings utilise le machine learning pour améliorer la détection et la prévention des fraudes tout en garantissant une expérience client fluide. En se concentrant dès le départ sur la vérification de l'identité, ils sont passés d'une prévention réactive à une prévention proactive de la fraude. Les modèles de machine learning permettent de valider rapidement les identités, ce qui réduit considérablement les cas de fraude et les faux positifs. L'accès aux données en temps réel permet à CNG d'adapter rapidement ses stratégies lors des tentatives de fraude, ce qui permet de réduire les coûts et d'améliorer l'efficacité des enquêtes.

En savoir plus Read a story about CNG Holdings and how they used machine learning for fraud detection

Lecteur vidéo en cours de chargement.

Temps actuel 0:00

Durée 0:00

Chargé: 0%

Type de flux EN DIRECT

Temps restant 0:00

Quel est l'intérêt du machine learning ?

Le regain d'intérêt pour le machine learning est dû aux mêmes facteurs qui ont rendu l'exploration de données et l'analyse bayésienne plus populaires que jamais. Des éléments tels que les volumes et variétés croissants de données disponibles, un traitement informatique moins cher et plus puissant, un stockage de données abordable.

Tous ces éléments signifient qu'il est possible de produire rapidement et automatiquement des modèles capables d'analyser des données plus importantes et plus complexes et de fournir des résultats plus rapides et plus précis, même à très grande échelle. En construisant des modèles précis, une organisation a plus de chances d'identifier des opportunités rentables ou d'éviter des risques inconnus.

Quelles sont les composantes essentielles d’un système de machine learning performant ?

Fonctions de préparation des données.
Algorithmes (de base et avancés).
Processus d'automatisation et itératifs.
Évolutivité
Modélisation d’ensembles.

Le saviez-vous ?

En machine learning, la cible est une « étiquette ».
En statistique, la cible est une « variable dépendante ».
Une variable en statistique est une « caractéristique » en machine learning.
Une transformation en statistique est une « création de caractéristique » en machine learning.

Utilisation

La plupart des entreprises qui manipulent de gros volumes de données reconnaissent l'intérêt du machine learning. En extrayant des informations de ces données (souvent en temps réel), elles peuvent travailler plus efficacement ou devancer leurs concurrents.

Services financiers

Les banques et autres acteurs du secteur financier peuvent utiliser le machine learning pour améliorer la précision et l'efficacité, identifier des informations importantes dans les données, détecter et prévenir la fraude et contribuer à la lutte contre le blanchiment d'argent. L'exploration de données, un sous-ensemble du machine learning, permet d'identifier les clients présentant des profils à haut risque et d'intégrer la cybersurveillance pour repérer les signes avant-coureurs de la fraude.

Santé

Le machine learning est une tendance en plein essor dans le secteur des soins de santé, grâce à l'avènement des dispositifs portables et des capteurs qui peuvent utiliser des données pour évaluer la santé d'un patient en temps réel. La technologie peut également aider les experts médicaux à analyser les données afin d'identifier les tendances ou les signaux d'alerte susceptibles d'améliorer les diagnostics et les traitements.

Assurance

Le machine learning révolutionne le secteur de l'assurance en améliorant l'évaluation des risques, les décisions de souscription et la détection des fraudes. Il contribue également à améliorer l'expérience des clients et à stimuler la rentabilité. En analysant de grandes quantités de données, les algorithmes de machine learning peuvent évaluer les risques avec plus de précision, ce qui permet aux assureurs d'adapter les polices et les tarifs aux clients.

Sciences de la vie

Le machine learning et d'autres techniques d'IA et d'analyse permettent d'accélérer la recherche, d'améliorer les diagnostics et de personnaliser les traitements pour l'industrie des sciences de la vie. Par exemple, les chercheurs peuvent analyser des données biologiques complexes, identifier des modèles et prédire des résultats afin d'accélérer la découverte et le développement de médicaments. Pour les traitements, l'analyse des données des patients permet d'adapter les thérapies aux profils génétiques et aux antécédents médicaux de chacun (pour une médecine personnalisée).

Secteur public

Les agences gouvernementales responsables de la sécurité publique et des services sociaux ont un besoin particulier en machine learning car elles disposent de multiples sources de données qui peuvent être exploitées pour obtenir des informations. L'analyse des données des capteurs, par exemple, permet d'identifier les moyens d'accroître l'efficacité et d'économiser de l'argent. Le machine learning peut également aider à détecter les fraudes et à minimiser l'usurpation d'identité.

Commerce de détail et biens de consommation

Les sites web qui recommandent des articles susceptibles de vous plaire en fonction de vos achats précédents utilisent le machine learning pour analyser votre historique d'achat. Les détaillants s'appuient sur le machine learning pour capturer des données, les analyser et les utiliser pour personnaliser l'expérience d'achat, mettre en œuvre une campagne de marketing, optimiser les prix, planifier les marchandises et obtenir des informations sur les clients.

En savoir plus sur les secteurs qui utilisent cette technologie

Comment ça marche

Pour tirer le meilleur parti du machine learning, vous devez savoir comment associer les meilleurs algorithmes aux bons outils et processus. SAS combine un héritage riche et sophistiqué en matière de statistiques et d'exploration de données avec de nouvelles avancées architecturales pour garantir que vos modèles s'exécutent aussi rapidement que possible - dans des environnements d'entreprise gigantesques ou dans un environnement de cloud computing.

Algorithmes: Les interfaces graphiques de SAS® vous aident à construire des modèles de machine learning et à mettre en œuvre un processus itératif d'apprentissage automatique. Il n'est pas nécessaire d'être un statisticien chevronné. Notre sélection complète d'algorithmes de machine learning est incluse dans de nombreux produits SAS et peut vous aider à obtenir rapidement de la valeur à partir de vos big data - y compris les données de l'Internet des objets.

Les algorithmes de machine learning de SAS comprennent

Réseaux de neurones
Arbres de décision
Forêts aléatoires.
Associations et découverte de séquences.

Développer la liste

Renforcement du gradient et mise en sac.
Machines à vecteurs de support.
Cartographie des plus proches voisins.
Clusterisation par la méthode des nuées dynamiques (k-moyennes).
Cartes auto-organisatrices.
Techniques d'optimisation par recherche locale (par exemple, algorithmes génétiques).
Maximisation des attentes.
Splines de régression adaptatives multivariées.
les réseaux bayésiens.
Estimation de la densité du noyau.
Analyse des composantes principales.
Décomposition en valeur singulière.
Modèles de mélange gaussien.
Construction de règles de couverture séquentielle.

Outils et processus : Comme nous le savons maintenant, il n'y a pas que les algorithmes. En fin de compte, le secret pour tirer le meilleur parti de vos big data réside dans l'association des meilleurs algorithmes pour la tâche à accomplir :

Data Management et qualité des données.
Des interfaces graphiques pour la construction de modèles et de flux de processus.
Exploration interactive des données et visualisation des résultats du modèle.
Comparaisons de différents modèles de machine learning pour identifier rapidement le meilleur.
Évaluation automatisée des modèles d'ensemble pour identifier les plus performants.
Déploiement facile du modèle pour obtenir rapidement des résultats fiables et reproductibles.
Une plateforme intégrée de bout en bout pour l'automatisation du processus "données-décision".

Renforcez vos compétences SAS®

Bénéficiez d'une formation approfondie et d'un accès gratuit aux logiciels SAS pour développer vos compétences en machine learning. Les cours comprennent : 14 heures de cours, 90 jours d'accès gratuit au logiciel dans le cloud et un format d'apprentissage en ligne flexible, sans aucune compétence en programmation.

En savoir plus et tester gratuitement Sign up for machine learning courses, free access to software, and more

Deux femmes pointant un code sur un écran d'ordinateur

Méthodes courantes de machine learning

Deux des méthodes de machine learning les plus largement adoptées sont l'apprentissage supervisé et l'apprentissage non supervisé, mais il existe également d'autres méthodes d'apprentissage automatique. Voici un aperçu des types les plus populaires.

Apprentissage supervisé

Les algorithmes d'apprentissage supervisé sont entraînés sur des exemples étiquetés, par exemple une entrée dont le résultat attendu est connu. Ainsi, un équipement pourrait comporter des points de données étiquetés « E » (échecs) ou « R » (réussites). L'algorithme d'apprentissage reçoit une série de données en entrée avec les sorties correctes correspondantes, et apprend en comparant la sortie réelle avec les sorties correctes. Il modifie alors le modèle en conséquence. A l'aide de méthodes comme la classification, la régression, la prédiction et le "gradient boosting", l'apprentissage supervisé utilise des schémas pour prédire les valeurs de l'étiquette sur d'autres données non étiquetées. Cette méthode d'apprentissage est couramment utilisée dans les applications où les données historiques servent à prévoir des événements futurs probables. Par exemple, elle permet de savoir dans quels cas des transactions de carte de crédit risquent d'être frauduleuses ou quel assuré est susceptible de soumettre une demande d'indemnisation.

Apprentissage non supervisé

L'apprentissage non supervisé s’applique aux données sans étiquettes historiques. Dans ce cas, le système ne connaît pas la « bonne réponse ». C'est à l'algorithme de déterminer le modèle présenté. Le but est d'explorer les données et d'en découvrir la structure. L'apprentissage non supervisé fonctionne bien avec les données transactionnelles. Il permet par exemple d'identifier des segments de clients qui possèdent des attributs similaires et peuvent donc être traités de la même façon dans les campagnes marketing. Il peut aussi détecter les attributs principaux qui servent à segmenter la clientèle. Parmi les techniques les plus courantes figurent les cartes auto-organisatrices, le mappage du voisin le plus proche, la clusterisation par la méthode des nuées dynamiques et la décomposition en valeurs singulières. Ces algorithmes servent aussi à segmenter des thématiques de texte, à recommander des articles et à identifier des données hors normes.

Apprentissage semi-supervisé

L'apprentissage semi-supervisé est utilisé pour les mêmes applications que l'apprentissage supervisé. Mais il utilise à la fois des données étiquetées et non étiquetées pour la formation - généralement une petite quantité de données étiquetées avec une grande quantité de données non étiquetées (parce que les données non étiquetées sont moins coûteuses et nécessitent moins d'efforts pour les acquérir). Ce type d'apprentissage peut être utilisé avec des méthodes telles que la classification, la régression et la prédiction. L'apprentissage semi-supervisé est utile lorsque le coût associé à l'étiquetage est trop élevé pour permettre un processus de formation entièrement étiqueté. Parmi les premiers exemples, citons l'identification du visage d'une personne sur une webcam.

Apprentissage par renforcement

L'apprentissage par renforcement est souvent utilisé pour la robotique, les jeux et la navigation. Elle est également utilisée en conjonction avec des techniques d'IA générative, comme les grands modèles de langage. Avec l'apprentissage par renforcement, l'algorithme découvre par essais et erreurs les actions qui rapportent le plus. Ce type d'apprentissage comporte trois composantes principales : l'agent (l'apprenant ou le décideur), l'environnement (tout ce avec quoi l'agent interagit) et les actions (ce que l'agent peut faire). L'objectif est que l'agent choisisse des actions qui maximisent la récompense attendue dans un laps de temps donné. L'agent atteindra son objectif beaucoup plus rapidement en suivant une bonne politique. L'objectif de l'apprentissage par renforcement est donc d'apprendre la meilleure politique.

La gestion des données a besoin de l'IA et de machine learning et, ce qui est tout aussi important, l'IA/machine learning a besoin de la gestion des données. Dès à présent, les deux sont liés, la voie vers une IA réussie étant intrinsèquement liée à des pratiques modernes de gestion des données. Dan Soceanu Senior Product Manager for AI and Data Management, SAS

Différences entre le data mining, le machine learning et le deep learning

Bien que toutes ces méthodes aient un objectif commun (extraire des informations, des tendances et des relations permettant de prendre des décisions), les approches et les capacités diffèrent.

Le data mining peut être considérée comme un ensemble de méthodes différentes permettant d'extraire des informations des données. Il peut s'agir de méthodes statistiques traditionnelles et de machine learning. L'exploration de données applique des méthodes issues de nombreux domaines différents afin d'identifier des modèles précédemment inconnus à partir de données. Il peut s'agir d'algorithmes statistiques, de machine learning, d'analyse de texte, d'analyse de séries chronologiques et d'autres domaines de l'analytique. Le data mining comprend également l'étude et la pratique du stockage et de la manipulation des données.

Comme pour les modèles statistiques, l'objectif du machine learning est de comprendre la structure des données, c'est-à-dire d'adapter aux données des distributions théoriques bien comprises. Les modèles statistiques reposent sur une théorie mathématiquement prouvée, mais ils exigent que les données répondent à certaines hypothèses fortes. Le machine learning s'est développé sur la base de la capacité à utiliser des ordinateurs pour rechercher une structure dans les données, même si nous n'avons pas de théorie sur la nature de cette structure. Le test d'un modèle de machine learning est une erreur de validation sur de nouvelles données, et non un test théorique qui prouve une hypothèse nulle. Comme le machine learning utilise souvent une approche itérative pour apprendre à partir des données, l'apprentissage peut être facilement automatisé. Les données sont passées au crible jusqu'à ce qu'un modèle robuste soit trouvé.

Le deep learning combine les progrès de la puissance de calcul et des types particuliers de réseaux neuronaux pour apprendre des schémas complexes dans de grandes quantités de données. Les techniques de Deep Learning sont actuellement à la pointe de la technologie pour l'identification d'objets dans les images et de mots dans les sons. Les chercheurs cherchent maintenant à appliquer ces succès en matière de reconnaissance des formes à des tâches plus complexes telles que la traduction automatique des langues, les diagnostics médicaux et de nombreux autres problèmes sociaux et commerciaux importants.

Étapes suivantes

Donnez à chacun la possibilité de travailler dans le même environnement intégré - de la gestion des données au développement et au déploiement des modèles.

Solutions de machine learning SAS Learn more about SAS machine learning solutions

Choisir l'environnement idéal

Conçu pour les développeurs et les modélisateurs, SAS® Viya® Workbench est un environnement de calcul à la demande en libre-service pour le développement analytique, y compris la construction de modèles d'IA et de machine learning pour une meilleure analyse des données.

En savoir plus Try SAS Developer Workbench for developers and modelers

SAS Viya Workbench - Run Multiple Workbenches

Lecture recommandée