Machine Learning

Che cos'è e perché è importante

Il machine learning è un metodo di analisi dati che automatizza la costruzione di modelli analitici. È una branca dell'Intelligenza Artificiale e si basa sull'idea che i sistemi possono imparare dai dati, identificare modelli autonomamente e prendere decisioni con un intervento umano ridotto al minimo.

L'evoluzione del machine learning

I primi ricercatori interessati all'intelligenza artificiale volevano scoprire se i computer potessero apprendere dai dati. Il machine learning, l'apprendimento automatico, nasce dalla teoria che i computer possono imparare ad eseguire compiti specifici senza essere programmati per farlo, grazie al riconoscimento di schemi tra i dati. Il machine learning utilizza algoritmi che imparano dai dati in modo iterativo. Permette, ad esempio, ai computer di individuare informazioni anche sconosciute senza che venga loro segnalato esplicitamente dove cercarle.

L'aspetto più importante del machine learning è la ripetitività, perchè più i modelli sono esposti ai dati, più sono in grado di adattarsi in modo autonomo. I computer imparano da elaborazioni precedenti per produrre risultati e prendere decisioni che siano affidabili e replicabili.

Grazie alle nuove tecnologie di elaborazione, il machine learning di oggi non è il machine learning del passato. Questa scienza non è nuova ma sta acquisendo un nuovo slancio. E sebbene molti algoritmi di machine learning siano in circolazione da molto tempo, la capacità di applicare calcoli matematici complessi ai big data è uno sviluppo più recente. Qui troverai alcuni esempi ampiamente conosciuti di utilizzo del machine learning che potrebbero suonarti familiari:

  • La guida autonoma? L'essenza del machine learning.
  • I suggerimenti di offerte online come quelli di Amazon o Netflix? L'applicazione del machine learning alla vita quotidiana.
  • Sapere cosa dicono della tua azienda i clienti che postano su X? Machine learning abbinato alla creazione di regole linguistiche.
  • Intercettazione di una frode? Uno dei suoi utilizzi meno ovvi ma sempre più frequenti.

 

Le basi del machine learning

Che cos'è il machine learning e perchè sta diventando così popolare? Questo breve video spiega tutto ciò che devi sapere sulla tecnologia SAS - cosa fa, come funziona, e come sta influenzando il modo di fare business.

Perchè il machine learning è importante?

Il rinnovato interesse nel machine learning è dovuto agli stessi fattori che hanno reso data mining e analisi Bayesiane più popolari che mai; ad esempio la crescita del volume e della varietà dei dati, i processi di elaborazione più economici e potenti oltre agli spazi per l'archiviazione dei dati sempre più a buon mercato.

Tutto ciò significa che ora è possibile realizzare, automaticamente, modelli per l'analisi di dati più grandi e complessi, e di elaborare velocemente risultati più accurati anche su larga scala. La costruzione di modelli precisi permette alle aziende di identificare nuove opportunità di profitto o di evitare rischi non preventivati.

 

Cosa serve per creare dei buoni sistemi di machine learning?

  • Capacità di preparazione dei dati.
  • Algoritmi - base e avanzati.
  • Processi di automazione iterativi.
  • Scalabilità.
  • Ensemble modeling.
Machine learning infographic

Sapevi che...

  • Nel machine learning, un target è chiamato label.
  • In statistica, un target è chiamato variabile dipendente.
  • Una variabile in statistica è chiamata feature nel machine learning.
  • Una trasformazione in statistica è chiamata feature creation nel machine learning.

Machine learning nel mondo di oggi

Usando gli algoritmi per la costruzione di modelli che svelano connessioni, le organizzazioni possono prendere decisioni migliori senza bisogno dell'intervento umano. Scopri di più su questa soluzione che sta trasformando il mondo in cui viviamo.

White Paper

Opportunità e sfide per il machine learning in azienda

Questo white paper O'Reilly ti offre una guida pratica all'implementazione di applicazioni machine-learning nella tua azienda.

Leggi il white paper

Amplia le tue conoscenze

Ottieni istruzioni approfondite e accesso gratuito al software SAS per sviluppare le tue capacità di machine learning. I corsi includono: 14 ore di corso, 90 giorni di accesso gratuito al software nel cloud, un formato di e-learning flessibile, senza competenze di programmazione richieste.

Corsi sul machine learning

Il machine learning cambierà anche la tua azienda?

Questo report di Harvard Business Review Insight Center esamina come il machine learning cambierà le aziende e la loro organizzazione.  

Scarica il report

Applicare il machine learning all'IoT

Il machine learning può essere utilizzato per raggiungere livelli ancora più alti di efficienza, in particolare se applicato all'Internet of Things.

Leggi l'articolo su IoT

SAS advanced analytics


Il machine learning non è una tecnologia specifica in senso stretto poiché coinvolge software come data mining e forecasting, strumenti indispensabili per analizzare grandi volumi di dati e scoprire le informazioni di business veramente utili per la tua azienda.
Il segreto? Algoritmi innovativi, da sempre al cuore delle soluzioni SAS®.

Scopri di più sugli advanced analytics di SAS

Chi lo usa?

Molti settori che lavorano con grandi volumi di dati hanno riconosciuto il valore della tecnologia machine learning. Raccogliendo informazioni dai dati, anche in tempo reale, le organizzazioni sono i grado di lavorare con più efficienza e acquisire un vantaggio competitivo.

Servizi finanziari

Banche e altre aziende nell'industria finanziaria utilizzano le tecnologie di machine learning con due principali scopi: identificare le informazioni importanti nei dati e prevenire le frodi. Le informazioni possono identificare opportunità d'investimento e aiutare gli investitori a sapere quando agire. Il data mining, invece può identificare clienti con profili altamente a rischio o utilizzare la sorveglianza informatica per segnalare allarmi di possibile frode.

Pubblica amministrazione

Gli enti pubblici che si occupano ad esempio di pubblica sicurezza o dei servizi hanno particolare bisogno del machine learning, avendo a disposizione molteplici sorgenti di dati che possono essere setacciate alla ricerca di informazioni. L'analisi dei dati provenienti dai sensori, ad esempio, può svelare le modalità per aumentare l'efficienza e risparmiare denaro. Inoltre, il machine learning può aiutare a individuare le frodi e a ridurre il fenomeno dei furti d'identità.

Assistenza sanitaria

Il machine learning sta crescendo velocemente nell'industria dell'assistenza sanitaria, grazie all'avvento dei dispositivi indossabili e ai sensori che utilizzano i dati per verificare in tempo reale lo stato di salute di un paziente. Inoltre, questa tecnologia aiuta i consulenti medici nell'analisi, identificando tendenze o i segnali d'allarme che potrebbero condurre a diagnosi e a migliori trattamenti farmacologici.

Marketing e vendite

I siti web che consigliano gli articoli che potrebbero interessarti basandosi su acquisti fatti in precedenza utilizzano il machine learning per analizzare la cronologia dei tuoi acquisti. Il futuro del commercio al dettaglio risiede nella capacità di memorizzare, analizzare e usare i dati per personalizzare l'esperienza d'acquisto o le campagne di marketing.

Oil & Gas

Trovare nuove risorse energetiche. Analizzare i minerali nel suolo. Prevedere un guasto dei sensori in raffineria. Snellire la distribuzione di petrolio per renderla più efficiente e redditizia. In questo settore il machine learning viene usato in un numero molto vasto di casi, un dato in costante aumento.

Trasporti

L'analisi dei dati al fine di identificare schemi e tendenze è fondamentale nell'industria dei trasporti che, per incrementare il profitto, fa affidamento sulla creazione di rotte più efficienti e sulla previsione dei potenziali problemi. Gli strumenti presenti nel machine learning per l'analisi dei dati e la creazione di modelli sono utili alle società di consegne, ai trasporti pubblici e alle altre ditte di trasporto.

Quali sono i metodi più utilizzati di machine learning?

Qualli maggiormente adottati sono l'apprendimento supervisionato e l'apprendimento non supervisionato.
Ma esistono anche altri metodi di machine learning. Ecco una panoramica di quelli più noti.

Apprendimento supervisionato
Gli algoritmi vengono addestrati utilizzando esempi già classificati, come gli input di cui già si conoscono gli output. Ad esempio, un'apparecchiatura potrebbe contenere dei dati classificati con "F" (failed) o "R" (runs). L'algoritmo di apprendimento impara abbinando input ad output corrispondenti (F con F, R con R), compara i risultati per trovare gli errori e poi modifica il modello di conseguenza. Attraverso metodologie come classificazione, regressione, previsione e gradient boosting, l'apprendimento supervisionato utilizza i modelli per prevedere il valore da utilizzare ai dati non ancora classificati. L'apprendimento supervisionato è comunemente utilizzato in applicazioni dove i dati storici sono in grado di predire possibili eventi futuri. Ad esempio può prevedere se le operazioni effettuate con alcune carte di credito possono essere fraudolente oppure quali clienti di un'azienda assicurativa potrebbero chiedere un risarcimento.

Apprendimento semi supervisionato

Ha le stesse applicazioni dell'apprendimento supervisionato. Ma per l'addestramento utilizza dati classificati e non: solitamente di un ridotto volume di dati classificati e un più ampio volume di dati non classificati (perchè acquisire questi ultimi è più economico e meno faticoso). Questo tipo di apprendimento può essere utilizzato con metodi di classificazione, regressione e previsione. L'apprendimento semi supervisionato è utile se la classificazione ha un costo troppo alto per permettere un processo di apprendimento completamente supervisionato. Un esempio recente sono le fotocamere capaci di identificare il volto delle persone.

Apprendimento non supervisionato
Viene utilizzato su dati che non hanno una classificazione. Al sistema non viene quindi fornita la "risposta giusta". L'algoritmo deve scoprire cosa gli viene mostrato. L'obiettivo è quello di esplorare i dati e individuarne una qualche struttura interna. L'apprendimento non supervisionato funziona bene con i dati transazionali. Ad esempio, può individuare consumatori con caratteristiche simili a cui rivolgere campagne di marketing specifiche. O può scoprire le caratteristiche principali che differenziano segmenti di consumatori dagli altri. Alcune tecniche del momento includono mappe self-organize, mappature nearest-neighbor, algoritmi k-means clustering e decomposizione ai valori singolari. Questi algoritmi vengono anche usati per segmentare argomenti testuali, consigliare prodotti o identificare valori anomali.

Apprendimento per rinforzo
Spesso viene usato in robotica, videogiochi e navigazione. Con l'apprendimento per rinforzo l'algoritmo scopre da quali azioni vengono generate le ricompense maggiori, passando per esperimenti ed errori. Questo tipo di apprendimento presenta tre componenti principali: l'agente (chi impara o prende decisioni), l'ambiente (tutto ciò con cui l'agente interagisce) e le azioni (cosa può fare l'agente). L'obiettivo dell'agente è scegliere quelle azioni che massimizzano la ricompensa prevista in un determinato lasso temporale. Scegliendo le azioni giuste, l'agente raggiungerà l'obiettivo più velocemente. Quindi l'obiettivo dell'apprendimento per rinforzo è quello di imparare quali sono le azioni migliori da attuare.

Humans can typically create one or two good models a week; machine learning can create thousands of models a week.

Thomas H. Davenport, Analytics thought leader
excerpt from The Wall Street Journal

Quai sono le differenze tra data mining, machine learning e deep learning?

Sebbene tutti questi metodi abbiano un obiettivo comune, estrarre informazioni, schemi e relazioni che possono essere usati per prendere decisioni, hanno approcci e funzionalità differenti.

 


Data Mining

Il data mining può essere considerato come un assortimento di metodi diversi per estrarre informazioni dai dati. Può coinvolgere metodi statistici tradizionali e machine learning. Il data mining applica metodi da molte aree differenti per identificare in anticipo schemi sconosciuti nei dati. Questo può comprendere algoritmi statistici, machine learning, text analytics, analisi delle serie temporali e altre aree ancora. Il data mining comprende anche lo studio e la messa in opera di tecniche per l'archiviazione dei dati e la loro manipolazione.

 


Machine Learning

L'approccio del machine learning, così come i modelli statistici, ha come obiettivo quello di capire la struttura dei dati. Dietro ad ogni modello esiste una teoria matematica comprovata, ma perchè ciò accada i dati devono soddisfare alcuni presupposti specifici. Il machine learning si è sviluppato basandosi sull'utilizzo dei computer per sondare i dati alla ricerca di una struttura, anche se non si ha una teoria su come potrebbe presentarsi quella struttura. Il test di un modello di machine learning si basa sugli errori di validazione di nuovi dati, non è un test teorico che prova un'ipotesi senza valore. L'apprendimento può essere automatizzato, perchè il machine learning utilizza un approccio iterativo. Vengono eseguiti molteplici passaggi con i dati fino a quando si individua un modello funzionante.


Deep Learning

Il deep learning combina computer sempre più potenti a speciali reti neuronali per comprendere gli schemi presenti nei grandi volumi di dati. Le tecniche di deep learning sono attualmente allo stato dell'arte per la capacità di identificare oggetti nelle immagini e le parole nei suoni. I ricercatori stanno ora cercando di applicare questi successi nel riconoscimento dei modelli a compiti più complessi, come la traduzione automatica del linguaggio, le diagnosi mediche e in tanti altri importanti ambiti, sia sociali che di business.

Come funziona

Per ottenere il massimo del valore dal machine learning devi imparare ad abbinare i migliori algoritmi agli strumenti e ai processi corretti. SAS combina le ricche e sofisticate conoscienze di statistica e data mining  ai nuovi sviluppi dell'architettura software per assicurarti che i tuoi modelli funzionino il più velocemente possibile - anche in aziende dagli ambienti molto estesi.

 

Algoritmi: Le interfacce grafiche SAS ti aiutano a costruire modelli di machine learning e applicare processi machine learning iterativi. Non c'è bisogno che tu sia un grande statistico. La nostra selezione esaustiva di algoritmi può aiutarti velocemente ad ottenere valore dai tuoi big data ed è inclusa in molti dei prodotti SAS. Gli algoritmi di machine learning SAS includono:

Neural networks
 
Decision trees
 
Random forests
 
Associations and sequence discovery
 
Gradient boosting and bagging
 
Support vector machines
 
Nearest-neighbor mapping
 
k-means clustering
 
Self-organizing maps
 
Local search optimization techniques (e.g., genetic algorithms)
 
Expectation maximization
 
Multivariate adaptive regression splines
 
Bayesian networks
 
Kernel density estimation
 
Principal component analysis
 
Singular value decomposition
 
Gaussian mixture models
 
Sequential covering rule building
 

 

Strumenti e Processi: Come ben saprai a questo punto, non si tratta solo di algoritmi. In definitiva, il segreto per ottenere il massimo del valore dai tuoi big data sta nell'abbinare i migliori algoritmi disponibili a:

Gestione completa dei dati e della loro qualità
 
Comparazione di diversi modelli di machine learning per identificare velocemente quali sono i migliori
 
Strumenti interattivi di data exploration e data visualization sui risultati dei modelli
 
Applicazione di ensemble model per individuare il più performante
 
 
GUI per costruire modelli e flussi di processo

Distribuzione semplificata dei modelli per ottenere rapidamente risultati affidabili e replicabili

Una piattaforma end-to-end integrata, per rendere automatico il passaggio dal dato alla decisione

Vuoi capire quale algoritmo di machine learning potresti utilizzare per raggiungere i tuoi obiettivi? In questo blog, Hui Li, data scientist in SAS, ti offre una guida pratica per comprenderne meglio l'utilizzo.