Machine Learning
Che cos'è e perché è importante
Il machine learning è un metodo di analisi dati che automatizza la costruzione di modelli analitici. È una branca dell'Intelligenza Artificiale e si basa sull'idea che i sistemi possono imparare dai dati, identificare modelli autonomamente e prendere decisioni con un intervento umano ridotto al minimo.
L'evoluzione del machine learning
I primi ricercatori interessati all'intelligenza artificiale volevano scoprire se i computer potessero apprendere dai dati. Il machine learning, l'apprendimento automatico, nasce dalla teoria che i computer possono imparare ad eseguire compiti specifici senza essere programmati per farlo, grazie al riconoscimento di schemi tra i dati. Il machine learning utilizza algoritmi che imparano dai dati in modo iterativo. Permette, ad esempio, ai computer di individuare informazioni anche sconosciute senza che venga loro segnalato esplicitamente dove cercarle.
L'aspetto più importante del machine learning è la ripetitività, perchè più i modelli sono esposti ai dati, più sono in grado di adattarsi in modo autonomo. I computer imparano da elaborazioni precedenti per produrre risultati e prendere decisioni che siano affidabili e replicabili.
Grazie alle nuove tecnologie di elaborazione, il machine learning di oggi non è il machine learning del passato. Questa scienza non è nuova ma sta acquisendo un nuovo slancio. E sebbene molti algoritmi di machine learning siano in circolazione da molto tempo, la capacità di applicare calcoli matematici complessi ai big data è uno sviluppo più recente. Qui troverai alcuni esempi ampiamente conosciuti di utilizzo del machine learning che potrebbero suonarti familiari:
- La guida autonoma? L'essenza del machine learning.
- I suggerimenti di offerte online come quelli di Amazon o Netflix? L'applicazione del machine learning alla vita quotidiana.
- Sapere cosa dicono della tua azienda i clienti che postano su X? Machine learning abbinato alla creazione di regole linguistiche.
- Intercettazione di una frode? Uno dei suoi utilizzi meno ovvi ma sempre più frequenti.
Le basi del machine learning
Che cos'è il machine learning e perchè sta diventando così popolare? Questo breve video spiega tutto ciò che devi sapere sulla tecnologia SAS - cosa fa, come funziona, e come sta influenzando il modo di fare business.
Perchè il machine learning è importante?
Il rinnovato interesse nel machine learning è dovuto agli stessi fattori che hanno reso data mining e analisi Bayesiane più popolari che mai; ad esempio la crescita del volume e della varietà dei dati, i processi di elaborazione più economici e potenti oltre agli spazi per l'archiviazione dei dati sempre più a buon mercato.
Tutto ciò significa che ora è possibile realizzare, automaticamente, modelli per l'analisi di dati più grandi e complessi, e di elaborare velocemente risultati più accurati anche su larga scala. La costruzione di modelli precisi permette alle aziende di identificare nuove opportunità di profitto o di evitare rischi non preventivati.
Cosa serve per creare dei buoni sistemi di machine learning?
- Capacità di preparazione dei dati.
- Algoritmi - base e avanzati.
- Processi di automazione iterativi.
- Scalabilità.
- Ensemble modeling.
Sapevi che...
- Nel machine learning, un target è chiamato label.
- In statistica, un target è chiamato variabile dipendente.
- Una variabile in statistica è chiamata feature nel machine learning.
- Una trasformazione in statistica è chiamata feature creation nel machine learning.
Machine learning nel mondo di oggi
Usando gli algoritmi per la costruzione di modelli che svelano connessioni, le organizzazioni possono prendere decisioni migliori senza bisogno dell'intervento umano. Scopri di più su questa soluzione che sta trasformando il mondo in cui viviamo.
Opportunità e sfide per il machine learning in azienda
Questo white paper O'Reilly ti offre una guida pratica all'implementazione di applicazioni machine-learning nella tua azienda.
Amplia le tue conoscenze
Ottieni istruzioni approfondite e accesso gratuito al software SAS per sviluppare le tue capacità di machine learning. I corsi includono: 14 ore di corso, 90 giorni di accesso gratuito al software nel cloud, un formato di e-learning flessibile, senza competenze di programmazione richieste.
Il machine learning cambierà anche la tua azienda?
Questo report di Harvard Business Review Insight Center esamina come il machine learning cambierà le aziende e la loro organizzazione.
Scarica il report
Applicare il machine learning all'IoT
Il machine learning può essere utilizzato per raggiungere livelli ancora più alti di efficienza, in particolare se applicato all'Internet of Things.
SAS advanced analytics
Il machine learning non è una tecnologia specifica in senso stretto poiché coinvolge software come data mining e forecasting, strumenti indispensabili per analizzare grandi volumi di dati e scoprire le informazioni di business veramente utili per la tua azienda.
Il segreto? Algoritmi innovativi, da sempre al cuore delle soluzioni SAS®.
Scopri di più sugli advanced analytics di SAS
Chi lo usa?
Molti settori che lavorano con grandi volumi di dati hanno riconosciuto il valore della tecnologia machine learning. Raccogliendo informazioni dai dati, anche in tempo reale, le organizzazioni sono i grado di lavorare con più efficienza e acquisire un vantaggio competitivo.
Servizi finanziari
Banche e altre aziende nell'industria finanziaria utilizzano le tecnologie di machine learning con due principali scopi: identificare le informazioni importanti nei dati e prevenire le frodi. Le informazioni possono identificare opportunità d'investimento e aiutare gli investitori a sapere quando agire. Il data mining, invece può identificare clienti con profili altamente a rischio o utilizzare la sorveglianza informatica per segnalare allarmi di possibile frode.
Pubblica amministrazione
Gli enti pubblici che si occupano ad esempio di pubblica sicurezza o dei servizi hanno particolare bisogno del machine learning, avendo a disposizione molteplici sorgenti di dati che possono essere setacciate alla ricerca di informazioni. L'analisi dei dati provenienti dai sensori, ad esempio, può svelare le modalità per aumentare l'efficienza e risparmiare denaro. Inoltre, il machine learning può aiutare a individuare le frodi e a ridurre il fenomeno dei furti d'identità.
Assistenza sanitaria
Il machine learning sta crescendo velocemente nell'industria dell'assistenza sanitaria, grazie all'avvento dei dispositivi indossabili e ai sensori che utilizzano i dati per verificare in tempo reale lo stato di salute di un paziente. Inoltre, questa tecnologia aiuta i consulenti medici nell'analisi, identificando tendenze o i segnali d'allarme che potrebbero condurre a diagnosi e a migliori trattamenti farmacologici.
Marketing e vendite
I siti web che consigliano gli articoli che potrebbero interessarti basandosi su acquisti fatti in precedenza utilizzano il machine learning per analizzare la cronologia dei tuoi acquisti. Il futuro del commercio al dettaglio risiede nella capacità di memorizzare, analizzare e usare i dati per personalizzare l'esperienza d'acquisto o le campagne di marketing.
Oil & Gas
Trovare nuove risorse energetiche. Analizzare i minerali nel suolo. Prevedere un guasto dei sensori in raffineria. Snellire la distribuzione di petrolio per renderla più efficiente e redditizia. In questo settore il machine learning viene usato in un numero molto vasto di casi, un dato in costante aumento.
Trasporti
L'analisi dei dati al fine di identificare schemi e tendenze è fondamentale nell'industria dei trasporti che, per incrementare il profitto, fa affidamento sulla creazione di rotte più efficienti e sulla previsione dei potenziali problemi. Gli strumenti presenti nel machine learning per l'analisi dei dati e la creazione di modelli sono utili alle società di consegne, ai trasporti pubblici e alle altre ditte di trasporto.
Scopri i settori di mercato che utilizzano questa tecnologia
Quali sono i metodi più utilizzati di machine learning?
Qualli maggiormente adottati sono l'apprendimento supervisionato e l'apprendimento non supervisionato.
Ma esistono anche altri metodi di machine learning. Ecco una panoramica di quelli più noti.
Apprendimento supervisionato
Gli algoritmi vengono addestrati utilizzando esempi già classificati, come gli input di cui già si conoscono gli output. Ad esempio, un'apparecchiatura potrebbe contenere dei dati classificati con "F" (failed) o "R" (runs). L'algoritmo di apprendimento impara abbinando input ad output corrispondenti (F con F, R con R), compara i risultati per trovare gli errori e poi modifica il modello di conseguenza. Attraverso metodologie come classificazione, regressione, previsione e gradient boosting, l'apprendimento supervisionato utilizza i modelli per prevedere il valore da utilizzare ai dati non ancora classificati. L'apprendimento supervisionato è comunemente utilizzato in applicazioni dove i dati storici sono in grado di predire possibili eventi futuri. Ad esempio può prevedere se le operazioni effettuate con alcune carte di credito possono essere fraudolente oppure quali clienti di un'azienda assicurativa potrebbero chiedere un risarcimento.
Apprendimento semi supervisionato
Ha le stesse applicazioni dell'apprendimento supervisionato. Ma per l'addestramento utilizza dati classificati e non: solitamente di un ridotto volume di dati classificati e un più ampio volume di dati non classificati (perchè acquisire questi ultimi è più economico e meno faticoso). Questo tipo di apprendimento può essere utilizzato con metodi di classificazione, regressione e previsione. L'apprendimento semi supervisionato è utile se la classificazione ha un costo troppo alto per permettere un processo di apprendimento completamente supervisionato. Un esempio recente sono le fotocamere capaci di identificare il volto delle persone.
Apprendimento non supervisionato
Viene utilizzato su dati che non hanno una classificazione. Al sistema non viene quindi fornita la "risposta giusta". L'algoritmo deve scoprire cosa gli viene mostrato. L'obiettivo è quello di esplorare i dati e individuarne una qualche struttura interna. L'apprendimento non supervisionato funziona bene con i dati transazionali. Ad esempio, può individuare consumatori con caratteristiche simili a cui rivolgere campagne di marketing specifiche. O può scoprire le caratteristiche principali che differenziano segmenti di consumatori dagli altri. Alcune tecniche del momento includono mappe self-organize, mappature nearest-neighbor, algoritmi k-means clustering e decomposizione ai valori singolari. Questi algoritmi vengono anche usati per segmentare argomenti testuali, consigliare prodotti o identificare valori anomali.
Apprendimento per rinforzo
Spesso viene usato in robotica, videogiochi e navigazione. Con l'apprendimento per rinforzo l'algoritmo scopre da quali azioni vengono generate le ricompense maggiori, passando per esperimenti ed errori. Questo tipo di apprendimento presenta tre componenti principali: l'agente (chi impara o prende decisioni), l'ambiente (tutto ciò con cui l'agente interagisce) e le azioni (cosa può fare l'agente). L'obiettivo dell'agente è scegliere quelle azioni che massimizzano la ricompensa prevista in un determinato lasso temporale. Scegliendo le azioni giuste, l'agente raggiungerà l'obiettivo più velocemente. Quindi l'obiettivo dell'apprendimento per rinforzo è quello di imparare quali sono le azioni migliori da attuare.
Humans can typically create one or two good models a week; machine learning can create thousands of models a week.
Thomas H. Davenport, Analytics thought leader
excerpt from The Wall Street Journal
Quai sono le differenze tra data mining, machine learning e deep learning?
Sebbene tutti questi metodi abbiano un obiettivo comune, estrarre informazioni, schemi e relazioni che possono essere usati per prendere decisioni, hanno approcci e funzionalità differenti.
Data Mining
Il data mining può essere considerato come un assortimento di metodi diversi per estrarre informazioni dai dati. Può coinvolgere metodi statistici tradizionali e machine learning. Il data mining applica metodi da molte aree differenti per identificare in anticipo schemi sconosciuti nei dati. Questo può comprendere algoritmi statistici, machine learning, text analytics, analisi delle serie temporali e altre aree ancora. Il data mining comprende anche lo studio e la messa in opera di tecniche per l'archiviazione dei dati e la loro manipolazione.
Machine Learning
L'approccio del machine learning, così come i modelli statistici, ha come obiettivo quello di capire la struttura dei dati. Dietro ad ogni modello esiste una teoria matematica comprovata, ma perchè ciò accada i dati devono soddisfare alcuni presupposti specifici. Il machine learning si è sviluppato basandosi sull'utilizzo dei computer per sondare i dati alla ricerca di una struttura, anche se non si ha una teoria su come potrebbe presentarsi quella struttura. Il test di un modello di machine learning si basa sugli errori di validazione di nuovi dati, non è un test teorico che prova un'ipotesi senza valore. L'apprendimento può essere automatizzato, perchè il machine learning utilizza un approccio iterativo. Vengono eseguiti molteplici passaggi con i dati fino a quando si individua un modello funzionante.
Deep Learning
Il deep learning combina computer sempre più potenti a speciali reti neuronali per comprendere gli schemi presenti nei grandi volumi di dati. Le tecniche di deep learning sono attualmente allo stato dell'arte per la capacità di identificare oggetti nelle immagini e le parole nei suoni. I ricercatori stanno ora cercando di applicare questi successi nel riconoscimento dei modelli a compiti più complessi, come la traduzione automatica del linguaggio, le diagnosi mediche e in tanti altri importanti ambiti, sia sociali che di business.
Recommended reading
- Sfruttare i dati sintetici per alimentare l'evoluzione dell'AIScopri perché i dati sintetici sono essenziali per le iniziative basate sull'AI che richiedono un elevato consumo di dati, in che modo le aziende li utilizzano per favorire la crescita e come possono contribuire a risolvere i problemi etici associati.
- Cosa sono i chatbot?Il chatbot è una forma di intelligenza artificiale conversazionale progettata per semplificare l'interazione tra uomo e computer. Scopri in che modo i chatbot sono utilizzati nelle aziende e come possono essere incorporati nelle applicazioni di analytics.
- What are AI hallucinations?Separating fact from AI-generated fiction can be hard. Learn how large language models can fail and lead to AI hallucinations – and discover how to use GenAI responsibly.
- Analytics leads to lifesaving cancer therapiesA long-shot treatment offers hope to 10-year-old Harrison after he learns the DNA profile of his cancer is resistant to chemo. Find out how data and analytics play a role in cancer research and cancer treatments that are saving lives.
Come funziona
Per ottenere il massimo del valore dal machine learning devi imparare ad abbinare i migliori algoritmi agli strumenti e ai processi corretti. SAS combina le ricche e sofisticate conoscienze di statistica e data mining ai nuovi sviluppi dell'architettura software per assicurarti che i tuoi modelli funzionino il più velocemente possibile - anche in aziende dagli ambienti molto estesi.
Algoritmi: Le interfacce grafiche SAS ti aiutano a costruire modelli di machine learning e applicare processi machine learning iterativi. Non c'è bisogno che tu sia un grande statistico. La nostra selezione esaustiva di algoritmi può aiutarti velocemente ad ottenere valore dai tuoi big data ed è inclusa in molti dei prodotti SAS. Gli algoritmi di machine learning SAS includono:
Neural networks
| |
Decision trees
| |
Random forests
| |
Associations and sequence discovery
| |
Gradient boosting and bagging
| |
Support vector machines | |
Nearest-neighbor mapping | |
k-means clustering | |
Self-organizing maps |
Local search optimization techniques (e.g., genetic algorithms)
| |
Expectation maximization
| |
Multivariate adaptive regression splines
| |
Bayesian networks
| |
Kernel density estimation
| |
Principal component analysis | |
Singular value decomposition | |
Gaussian mixture models | |
Sequential covering rule building |
Strumenti e Processi: Come ben saprai a questo punto, non si tratta solo di algoritmi. In definitiva, il segreto per ottenere il massimo del valore dai tuoi big data sta nell'abbinare i migliori algoritmi disponibili a:
Gestione completa dei dati e della loro qualità
| |
Comparazione di diversi modelli di machine learning per identificare velocemente quali sono i migliori | |
Strumenti interattivi di data exploration e data visualization sui risultati dei modelli
| |
Applicazione di ensemble model per individuare il più performante |
GUI per costruire modelli e flussi di processo
| |
Distribuzione semplificata dei modelli per ottenere rapidamente risultati affidabili e replicabili
| |
Una piattaforma end-to-end integrata, per rendere automatico il passaggio dal dato alla decisione
|