Dataudvinding
Hvad det er, og hvorfor det betyder noget
Dataudvinding er processen med at finde uregelmæssigheder, mønstre og sammenhænge i store datasæt for at forudsige resultater. Ved hjælp af en bred vifte af teknikker kan du bruge disse oplysninger til at øge indtægterne, reducere omkostningerne, forbedre kunderelationerne, reducere risici og meget mere.
Dataudvinding - historie og aktuelle fremskridt
Processen med at grave i data for at opdage skjulte sammenhænge og forudsige fremtidige tendenser har en lang historie. Begrebet "dataudvinding", der også kaldes "knowledge discovery in databases", blev først opfundet i 1990'erne. Men dets fundament består af tre sammenflettede videnskabelige discipliner: statistik (den numeriske undersøgelse af dataforhold), kunstig intelligens (menneskelignende intelligens, der demonstreres af software og/eller maskiner) og machine learning (algoritmer, der kan lære af data for at lave forudsigelser). Hvad der var gammelt, er nyt igen, da dataudvindingsteknologien hele tiden udvikler sig for at holde trit med det ubegrænsede potentiale i big data og tilgængelig computerkraft.
Hvorfor er dataudvinding vigtigt?
Så hvorfor er dataudvinding vigtigt? Du har set de svimlende tal - mængden af data, der produceres, fordobles hvert andet år. Ustrukturerede data alene udgør 90 procent af det digitale univers. Men mere information betyder ikke nødvendigvis mere viden.
Dataudvinding giver dig mulighed for at:
- Sortere i al den kaotiske og repetitive støj i dine data.
- Forstå, hvad der er relevant, og derefter gøre nyttig brug af disse oplysninger til at vurdere sandsynlige resultater.
- Øg tempoet for at træffe informerede beslutninger.
Lær mere om dataudvindingsteknikker i Data Mining From A to Z, en artikel, der viser, hvordan organisationer kan bruge prognostisk analyse og dataudvinding til at afsløre nye indsigter fra data.
Data mining allows you to:
- Sift through all the chaotic and repetitive noise in your data.
- Understand what is relevant and then make good use of that information to assess likely outcomes.
- Accelerate the pace of making informed decisions.
- Uncover new insights from data through the use of predictive analytics.
Data Mining in Today's World
Data mining is a cornerstone of analytics, helping you develop the models that can uncover connections within millions or billions of records. Learn how data mining is shaping the world we live in.
Data mining software
SAS for Machine Learning and Deep Learning helps you solve complex analytical problems and lets everyone work in the same, integrated environment. It even includes an automated modeling API.
Software til dataudvinding
dataudvindingssoftware fra SAS anvender dokumenterede, banebrydende algoritmer, der er designet til at hjælpe dig med at løse de største udfordringer.
Data mining software
SAS for Machine Learning and Deep Learning helps you solve complex analytical problems and lets everyone work in the same, integrated environment. It even includes an automated modeling API.
Software til dataudvinding
dataudvindingssoftware fra SAS anvender dokumenterede, banebrydende algoritmer, der er designet til at hjælpe dig med at løse de største udfordringer.
Hvem bruger det?
dataudvinding er kernen i analyseindsatsen på tværs af en række brancher og discipliner.
In an overloaded market where competition is tight, the answers are often within your consumer data. Telecom, media and technology companies can use analytic models to make sense of mountains of customers data, helping them predict customer behavior and offer highly targeted and relevant campaigns.
Telekommunikation, medier og teknologi
På et overbelastet marked, hvor konkurrencen er hård, findes svarene ofte i dine forbrugerdata. Telecom-, medie- og teknologivirksomheder kan bruge analytiske modeller til at finde mening i bjerge af kundedata, hvilket hjælper dem med at forudsige kundeadfærd og tilbyde meget målrettede og relevante kampagner.
With analytic know-how, insurance companies can solve complex problems concerning fraud, compliance, risk management and customer attrition. Companies have used data mining techniques to price products more effectively across business lines and find new ways to offer competitive products to their existing customer base.
With unified, data-driven views of student progress, educators can predict student performance before they set foot in the classroom – and develop intervention strategies to keep them on course. Data mining helps educators access student data, predict achievement levels and pinpoint students or groups of students in need of extra attention.
Forsikring
Med analytisk knowhow kan forsikringsselskaber løse komplekse problemer med svindel, compliance, risikostyring og kundeafgang. Virksomheder har brugt dataudvindingsteknikker til at prissætte produkter mere effektivt på tværs af forretningsområder og finde nye måder at tilbyde konkurrencedygtige produkter til deres eksisterende kundebase.
Aligning supply plans with demand forecasts is essential, as is early detection of problems, quality assurance and investment in brand equity. Manufacturers can predict wear of production assets and anticipate maintenance, which can maximize uptime and keep the production line on schedule.
Uddannelse
Med et samlet, datadrevet overblik over elevernes fremskridt kan undervisere forudsige elevernes præstationer, før de sætter fod i klasseværelset - og udvikle strategier til at holde dem på rette kurs. Dataudvinding hjælper undervisere med at få adgang til elevdata, forudsige præstationsniveauer og udpege elever eller grupper af elever, der har brug for ekstra opmærksomhed.
Automated algorithms help banks understand their customer base as well as the billions of transactions at the heart of the financial system. Data mining helps financial services companies get a better view of market risks, quickly detect and prevent fraud, manage regulatory compliance obligations and get optimal returns on their marketing investments.
Large customer databases hold hidden customer insight that can help you improve relationships, optimize marketing campaigns and forecast sales. Through more accurate data models and marketing analytics, retail companies can offer more targeted campaigns – and find the offer that makes the biggest impact on the customer.
Produktion
Det er vigtigt at tilpasse forsyningsplaner til efterspørgselsprognoser, ligesom tidlig opdagelse af problemer, kvalitetssikring og investering i varemærkeværdi er afgørende. Producenter kan forudsige slid på produktionsaktiver og forudse vedligeholdelse, hvilket kan maksimere oppetiden og holde produktionslinjen på skemaet.
Banksektoren
Automatiserede algoritmer hjælper bankerne med at forstå deres kundebase samt de milliarder af transaktioner, der er kernen i det finansielle system. Dataudvinding hjælper finansielle virksomheder med at få et bedre overblik over markedsrisici, opdage svindel hurtigere, håndtere lovmæssige forpligtelser og få optimalt afkast af deres marketinginvesteringer.
Detailhandel
Store kundedatabaser indeholder skjult kundeindsigt som kan hjælpe dig med at forbedre relationer, optimere marketingkampagner og forudsige salg. Gennem mere præcise datamodeller kan detailvirksomheder tilbyde mere målrettede kampagner - og vælge det tilbud, der gør størst indtryk på kunden.
Få mere at vide om brancher, der bruger denne teknologi
- Landbrug
- Bankvæsen
- Kapitalmarkeder
- Forbrugsvarer
- Kasinoer
- Sundhedspleje
- Højere uddannelse
- Hoteller
- Forsikring
- Biovidenskab
- Produktion
- Olie og gas
- P-12 Uddannelse
- Offentlig sektor
- Detailhandel
- Små og mellemstore virksomheder
- Sportsanalyse
- Rejser og transport
- Telekommunikation, medier og teknologi
- Forsyningsvirksomheder
Software til dataudvinding
Dataudvindingssoftware fra SAS bruger dokumenterede, banebrydende algoritmer, der er designet til at hjælpe dig med at løse dine største udfordringer.
Sådan fungerer det
Dataudvinding, som en sammensat disciplin, repræsenterer en række metoder eller teknikker, der bruges i forskellige analytiske kapaciteter, der imødekommer en række organisatoriske behov, stiller forskellige typer spørgsmål og bruger forskellige niveauer af menneskeligt input eller regler for at nå frem til en beslutning.
Deskriptiv modellering: Den afdækker fælles ligheder eller grupperinger i historiske data for at bestemme årsagerne til succes eller fiasko, såsom at kategorisere kunder efter produktpræferencer eller følelser. Eksempler på teknikker omfatter:
Klyngedannelse | Gruppering af lignende poster under ét. |
Registrering af afvigelser
| Identifikation af multidimensionelle afvigelser.
|
Indlæring af associationsregler
| Registrering af sammenhænge mellem registreringer.
|
Analyse af hovedkomponenter
| Påvisning af relationer mellem variabler. |
Gruppering af tilhørsforhold | Gruppering af mennesker med fælles interesser eller lignende motiver (f.eks. folk, der køber X, køber ofte Y og muligvis Z). |
Prognostisk modellering: Denne modellering går mere i dybden med at klassificere begivenheder i fremtiden eller estimere ukendte resultater - for eksempel ved at bruge kreditvurdering til at bestemme en persons sandsynlighed for at tilbagebetale et lån. Prognostisk modellering hjælper også med at identificere indsigter i ting som kundeafgang, kampagnerespons eller kreditmisligholdelse. Eksempler på teknikker omfatter:
Regression | En måling af styrken af forholdet mellem en afhængig variabel og en række uafhængige variabler. |
Neurale netværk | Computerprogrammer, der registrerer mønstre, laver forudsigelser og tager ved lære. |
Beslutningstræer | Træformede diagrammer, hvor hver gren repræsenterer en sandsynlig begivenhed. |
Støttevektormaskiner | Superviserede læringsmodeller med tilhørende læringsalgoritmer. |
Præskriptiv modellering: I takt med væksten i ustrukturerede data fra nettet, kommentarfelter, bøger, e-mail, PDF-filer, lyd og andre tekstkilder er anvendelsen af tekstudvinding som en beslægtet disciplin til dataudvinding også vokset markant. Du har brug for evnen til at analysere, filtrere og transformere ustrukturerede data for at kunne inkludere dem i prognostiske modeller for at forbedre forudsigelsesnøjagtigheden.
I sidste ende bør du ikke se på dataudvinding som en separat, selvstændig enhed, fordi præ-processering (dataforberedelse, dataudforskning) og post-processering (modelvalidering, scoring, overvågning af modelperformance) er lige så vigtige. Præskriptiv modellering ser på interne og eksterne variabler og begrænsninger for at anbefale et eller flere handlingsforløb - for eksempel at bestemme det bedste marketingtilbud, der skal sendes til hver kunde. Eksempler på teknikker omfatter:
Prognostisk analyse plus regler | Udvikling af hvis/så-regler ud fra mønstre og forudsigelse af resultater. |
Optimering af markedsføring | Det mest fordelagtige mediemix simuleres i realtid for at opnå den højest mulige ROI. |
Optimering af markedsføring
- 4 strategies that will change your approach to fraud detectionAs fraudulent activity grows and fighting fraud becomes more costly, financial institutions are turning to anti-fraud technology to build better arsenals for fraud detection. Discover four ways to improve your organization's risk posture.
- Analytics: A must-have tool for leading the fight on prescription and illicit drug addictionStates and MFCUs now have the analytics tools they need to change the trajectory of the opioid crisis by analyzing data and predicting trouble spots – whether in patients, prescribers, distributors or manufacturers. The OIG Toolkit with free SAS® programming code makes that possible.
- When it matters: Safeguarding your organization from the insideWith evolving threats, fraud detection technologies have to be flexible and nimble, and automated risk detection is a crucial component of decision advantage.
- Exploring the sun with big dataResearchers working for NASA are using automatic, exploratory and visual analysis of big data to help understand the mysteries of our universe.