Data Mining
Vad det är och därför är det viktigt
Data mining är processen för att hitta avvikelser, mönster och korrelationer i stora mängder data för att förutsäga resultat. Med hjälp av ett brett spektrum tekniker kan du använda denna information för att öka intäkter, minska kostnader, förbättra kundrelationer, reducera risker i affärer med mera.
Data Mining historia och senaste utvecklingen
Processen för att leta igenom data för att upptäcka dolda kopplingar och förutsäga framtida trender har en lång historia. Efter att tidigare ha benämnts “skapa kunskap från databaser" myntades termen "datautvinning" på 1990-talet. Dess grund består av tre sammanflätade vetenskapliga discipliner: statistik (numeriska studier av datakopplingar), artificiell intelligens (människoliknande intelligens i programvara och/eller maskiner) och maskininlärning (algoritmer som kan lära av data för att göra förutsägelser). Det som var gammalt blir nytt igen, eftersom tekniker för datautvinning fortsätter att utvecklas för att hålla jämna steg med den närmast obegränsade potentialen hos big data och billig datorkraft.
Under det senaste decenniet har framsteg inom processorkraft och snabbhet gjort det möjligt för oss att lämna manuella, tråkiga och tidskrävande metoder för analys för snabbare, enklare och mer automatiserade. Ju mer komplexa datamängder som samlas in, desto större potential finns det att hitta relevanta insikter. Detaljhandeln, banker, verkstadsföretag, telekomoperatörer och försäkringsbolag använder sig idag av datautvinning. Med tekniken finner de relationer mellan allt från prisoptimering, kampanjer och demografier vilka påverkar deras affärsmodeller, intäkter och kundrelationer.
Varför är data mining viktigt?
Så varför är data mining viktigt? Du har kanske sett de häpnadsväckande siffrorna som visar att mängden data som produceras i världen fördubblas vartannat år. Mängden ostrukturerad data utgör 90 procent av det digitala universumet. Men mer information ger inte nödvändigtvis mer kunskap.
Med data mining kan du:
- Sålla igenom kaotiskt och repetitivt brus som finns i dina data.
- Förstå vad som är relevant och använda den informationen på ett bra sätt för att förutspå sannolika utfall.
- Kunna fatta informerade beslut snabbare
Läs mer om tekniker för datautvinning i rapporten “Datautvinning från A till Ö”, Rapporten beskriver hur organisationer kan använda sig av prediktiv analys och datautvinning för använda data för att hitta nya insikter.
Data Mining in Today's World
Data mining is a cornerstone of analytics, helping you develop the models that can uncover connections within millions or billions of records. Learn how data mining is shaping the world we live in.
Programvara för data mining
Programvara från SAS använder beprövade men banbrytande algoritmer som skapats för att hjälpa dig att lösa de största utmaningarna.
Data Mining idag
Data mining utgör en hörnsten för analys, och hjälper dig att utveckla modeller som kan avslöja kopplingar och mönster i miljontals eller miljarder dataposter. Lär dig hur datautvinning bidrar till att forma världen.
Data mining i olje- och gasindustrin
Läs om hur datautvinning, prediktiv modellering och realtidsanalys används i olje- och gasindustrin. Rapporten beskriver de tillvägagångssätt, arbetsflöden och tekniker som används.
Skärningspunkten mellan big data & data mining
Jared Dean har skrivit en bok om datautvinning. Han förklarar hur du maximerar din analysfunktion med hjälp av högpresterande datorsystem och avancerad analys.
Den magiska kvadranten för datavetenskapliga plattformar
SAS är det företag som under sina åtta år haft platsen längst som ledare i “Gartner Magic Quadrant for Data Science and Machine Learning Platforms”.
Tung läsning: Avancerad prediktiv nätverksanalys
Lär dig mer om hur du kan optimera nätverk genom att använda prediktiv analys för att utvärdera nätverksprestanda – samt finjustera kapacitet och få möjlighet att göra riktad marknadsföring.
Vilka använder det?
Data mining är kärnan i analysarbetet inom en mängd olika branscher och verksamheter.
Telekom, media & teknik
På en överbelastad marknad där konkurrensen är hård går det att dra stor nytta av dina konsumentdata. Telekom-, medie- och teknikföretag kan använda analytiska modeller för att skapa värde från sina berg av kunddata. Det hjälper dem att förutsäga kundbeteenden och att göra riktade och relevanta kampanjer.
Försäkring
Med analytiskt kunnande kan försäkringsbolag lösa komplexa problem som rör bedrägerier, regelefterlevnad, riskhantering och kundlivscyklar. Företag har använt datautvinningsteknik för att prissätta sina produkter mer effektivt och hitta nya sätt att erbjuda konkurrenskraftiga produkter till sin befintliga kundbas.
Utbildning
Med en enhetlig och datastödd vy av elevers framsteg kan lärare förutsäga elevernas prestationer innan de ens har satt sin fot i klassrummet. Det blir möjligt att utveckla interventionsstrategier för att guida dem rätt. Data mining hjälper lärare att komma åt studentdata, förutsäga prestationsnivåer och hitta elever eller grupper av studenter som behöver stöd.
Tillverkning
Det är viktigt att anpassa leveransplaner till prognoser om efterfrågan, likaså att tidigt upptäcka problem, kvalitetssäkra och beräkna nödvändiga investeringar i sitt varumärkeskapital. Tillverkare får verktyg för att förutsäga slitage på produktionstillgångar och förutse underhåll, vilket kan maximera drifttiden och hålla igång produktionen.
Banker
Automatiserade algoritmer hjälper banker att förstå sin kundbas och de miljarder transaktioner som är kärnan i det finansiella systemet. Datautvinning hjälper finansiella tjänsteföretag att få en bättre bild av marknadsrisker, upptäcka bedrägerier snabbare, , hantera regleringskrav och få optimal avkastning på sina investeringar i marknadsföring.
Detaljhandel
I stora kunddatabaser finns dolda kundinsikter som kan hjälpa dig att förbättra kundrelationer, optimera marknadsföringskampanjer och prognostisera försäljning. Genom mer exakta datamodeller kan detaljhandelsföretag erbjuda mer riktade kampanjer – och hitta det erbjudande som fungerar bäst på kunden.
Läs om fler branscher som använder metoden
Så fungerar det
Data mining består av en mängd olika metoder eller tekniker som används för olika analytiska funktioner som tillgodoser en mängd organisatoriska behov, ställer olika typer av frågor till data och använder olika nivåer av mänsklig inmatning eller regler för att komma fram till beslut.
Deskriptiv modellering: Tar fram delade likheter eller grupperingar i historiska data för att fastställa orsaker till framgång eller misslyckanden, till exempel genom att kategorisera kunder efter produktpreferenser eller sentiment. Exempel på tekniker som används:
Klustring | Gruppera liknande poster tillsammans |
Identifiera avvikelser
| Identifiera avvikande värden i flera dimensioner.
|
Inlärning av associationsregel
| Identifiera relationer mellan dataposter.
|
Huvudkomponentanalys
| Identifiera relationer mellan variabler. |
Gruppering av tillhörighet | Gruppering av personer med gemensamma intressen eller liknande mål (t.ex. människor som köper X köper ofta Y och eventuellt Z). |
Prediktiv modellering: Prediktiv modellering: Den här typen av modellering går djupare för att klassificera händelser i framtiden eller bedöma okända resultat – till exempel genom att använda kreditbedömning för att avgöra en individs sannolikhet att återbetala ett lån. Prediktiv modellering hjälper också till att avslöja insikter för saker som kundtapp, kampanjeffekter eller kreditförluster. Bland exempel på metoder finns:
Regression | Ett mått på styrkan i förhållande mellan en beroende variabel och en serie oberoende variabler. |
Neurala nätverk | Datorprogram som identifierar mönster, gör förutsägelser och lär sig. |
Beslutsträd | Trädformade diagram där varje gren representerar en trolig förekomst eller händelse. |
Stödvektormaskin | Övervakade inlärningsmodeller med tillhörande inlärningsalgoritmer. |
Preskriptiv modellering: Med den snabba ökningen av ostrukturerad data från webb, kommentarsfält, böcker, e-post, PDF-filer, ljud och andra textkällor har textutvinning växt fram som en relaterad disciplin till datautvinning. Det behövs förmåga att framgångsrikt tolka, filtrera och omvandla ostrukturerad data för att inkludera den i prediktiva modeller för förbättrade möjligheter att göra förutsägelser.
I slutändan bör du inte titta på data mining som en separat, fristående entitet eftersom förbearbetning (data förberedelse, datautforskning) och efterbearbetning (modellvalidering, poängsättning, bedömning av modellers prestanda) är lika viktiga. Preskriptiv modellering tittar på interna och externa variabler och begränsningar för att rekommendera en eller flera handlingsalternativ – till exempel att bestämma det bästa marknadsföringserbjudandet att skicka till olika kunder. Exempel på tekniker är:
Prediktiv analys med regler | Utveckla “if/then”-regler från mönster och förutsäga utfall. |
Optimering av marknadsföring | Simulera den mest fördelaktiga mediemixen i realtid för högsta möjliga ROI. |
Läs mer om detta ämne
- What is synthetic data? And how can you use it to fuel AI breakthroughs?There's no shortage of data in today's world, but it can be difficult, slow and costly to access sufficient high-quality data that’s suitable for training AI models. Learn why synthetic data is so vital for data-hungry AI initiatives, how businesses can use it to unlock growth, and how it can help address ethical challenges.
- How to drill a better hole with analyticsFrom drilling holes to preventing health care fraud, learn about some of the new technologies SAS has patented with IoT and machine learning technologies.
- 5 machine learning mistakes and how to avoid themMachine learning is not magic. It presents many of the same challenges as other analytics methods. Learn how to overcome those challenges and incorporate new techniques into your analytics strategy.
- Applying machine learning to IoT dataLet’s move beyond theoretical discussions about machine learning and the Internet of Things – and talk about practical business applications instead.