Store data
Hvad det er, og hvorfor det betyder noget
Big data er et begreb, der beskriver store, svært håndterbare datamængder - både strukturerede og ustrukturerede - som oversvømmer virksomheder på daglig basis. Men det er ikke kun typen eller mængden af data, der er vigtig, det er også, hvad organisationer gør med dataene. Big data kan analyseres til indsigt, der forbedrer beslutninger og giver tillid til at foretage strategiske forretningsbevægelser.
Historien om Big Data
Big data refererer til data, der er så store, hurtige eller komplekse, at de er vanskelige eller umulige at behandle med traditionelle metoder. Det at få adgang til og lagre store mængder information til analyseformål har eksisteret i lang tid. Men begrebet big data tog fart i begyndelsen af 2000'erne, da brancheanalytikeren Doug Laney formulerede den nu almindelige definition af big data som de tre V'er:
Volumen.Organisationer indsamler data fra en række forskellige kilder, herunder transaktioner, intelligente (IoT) enheder, industrielt udstyr, videoer, billeder, lyd, sociale medier og meget mere. Tidligere ville det have været for dyrt at opbevare alle disse data - men billigere opbevaring ved hjælp af datalagre, Hadoop og skyen har lettet byrden.
Hastighed.I takt med udbredelsen af Internet of Things strømmer data ind i virksomhederne med en hidtil uset hastighed og skal håndteres rettidigt. RFID-tags, sensorer og intelligente målere gør det nødvendigt at håndtere disse strømme af data i nær-realtid.
Mangfoldighed. Data kommer i alle typer formater - fra strukturerede, numeriske data i traditionelle databaser til ustrukturerede tekstdokumenter, e-mails, videoer, lydbånd, aktiedata og finansielle transaktioner.
Hos SAS overvejer vi yderligere to dimensioner, når det gælder big data:
Variation
Ud over de stigende datahastigheder og -varianter er datastrømme uforudsigelige - de ændrer sig ofte og varierer meget. Det er udfordrende, men virksomheder er nødt til at vide, hvornår noget trender på de sociale medier, og hvordan de håndterer daglige, sæsonbestemte og begivenhedsudløste spidsbelastninger af data.
Sandfærdighed
Sandfærdighed refererer til kvaliteten af data. Fordi data kommer fra så mange forskellige kilder, er det svært at linke, matche, rense og omforme data på tværs af systemer. Virksomheder er nødt til at forbinde og sammenholde relationer, hierarkier og flere dataforbindelser. Ellers kan deres data hurtigt komme ud af kontrol.
Big Data og analyse gør det muligt at yde helhedsorienteret pleje for den enkelte person
Riverside County bruger datahåndtering og analyse fra SAS til at integrere sundheds- og ikke-sundhedsdata fra deres offentlige hospital, adfærdsrelaterede sundhedssystem, amtsfængsel, sociale servicesystemer og systemer for hjemløse. Ved at forstå, hvordan enkeltpersoner interagerer med forskellige tjenester, kan plejeveje kortlægges i forhold til sundhedsresultater - hvilket resulterer i koordineret, helhedsorienteret pleje.
Hvorfor er big data vigtigt?
Vigtigheden af big data drejer sig ikke kun om, hvor meget data du har. Værdien ligger i, hvordan du bruger det. Ved at tage data fra enhver kilde og analysere dem, kan du finde svar, der 1) strømliner ressourcestyringen, 2) forbedrer driftseffektiviteten, 3) optimerer produktudviklingen, 4) skaber nye indtægts- og vækstmuligheder og 5) muliggør intelligent beslutningstagning. Når du kombinerer big data med high-performance analyse, kan du udføre erhvervsrelaterede opgaver som f.eks:
- Bestemmelse af de grundlæggende årsager til fejl, problemer og defekter i nær-realtid.
- Spotte uregelmæssigheder hurtigere og mere præcist end det menneskelige øje.
- Forbedring af patientresultater ved hurtigt at konvertere medicinske billeddata til indsigt.
- Genberegning af hele risikoporteføljer på få minutter.
- Skærpe deep learning-modellernes evne til præcist at klassificere og reagere på skiftende variabler.
- Opdagelse af bedragerisk adfærd, før det påvirker din organisation.
Big data i dag
Big data - og den måde, organisationer håndterer og får indsigt fra det på - ændrer den måde, verden bruger virksomhedsinformation på. Få mere at vide om big datas indvirkning.
Hvad skal en datahelt gøre?
Hvem er datahelte? En dataspecialist analyserer og leder efter indsigt i data. Dataingeniører bygger pipelines med fokus på DataOps. Den dataansvarlige sikrer, at data er pålidelige og håndteres ansvarligt. Synergi mellem rollerne skaber analytisk succes.
Datasø vs. datalager
Er udtrykket " datasø" bare marketinghype? Eller et nyt navn for et datalager? Phil Simon sætter tingene på plads omkring datasø versus datalager og forklarer, hvad det er, hvordan det fungerer, og hvornår du kan få brug for det.
Big data og skyen
Big data-projekter kræver intense ressourcer til databehandling og -lagring. Når big data-teknologier og cloud computing arbejder sammen, giver det en omkostningseffektiv måde at håndtere alle typer data på - en vindende kombination af smidighed og elasticitet.
Hvem har fokus på Big Data?
Big data er en big deal for alle brancher. Strømmen af IoT og andre forbundne enheder har skabt en massiv stigning i mængden af information, som organisationer indsamler, administrerer og analyserer. Sammen med big data kommer potentialet til at frigøre store indsigter - for alle brancher, store som små.
- Vælg branche
- Detailhandel
- Produktion
- Bankvæsen
- Sundhedspleje
- Uddannelse
- Små og mellemstore virksomheder
- Det offentlige
- Forsikring
Detailhandel
Det er afgørende for detailbranchen at opbygge gode kunderelationer - og den bedste måde at gøre det på er at have styr på big data. Detailhandlere skal vide, hvordan de bedst markedsfører sig over for kunderne, hvordan de mest effektivt håndterer transaktioner, og hvordan de mest strategisk kan få kunder, der har forladt butikken, tilbage. Big data er kernen i alt dette.
Produktion
Bevæbnet med den indsigt, som big data kan give, kan producenter øge kvalitet og output og samtidig minimere spild - processer, der er afgørende på nutidens stærkt konkurrenceprægede marked. Flere og flere producenter arbejder i en analysebaseret kultur, hvilket betyder, at de kan løse problemer hurtigere og træffe mere fleksible forretningsbeslutninger.
Bankvæsen
Med store mængder information, der strømmer ind fra utallige kilder, står bankerne over for at skulle finde nye og innovative måder at håndtere big data på. Selvom det er vigtigt at kunne forstå kunderne og øge deres tilfredshed, er det lige så vigtigt at minimere risici og svindel og samtidig overholde lovgivningen. Big data giver stor indsigt, men det kræver også, at de finansielle institutioner er et skridt foran med avancerede analyser.
Sundhedspleje
Patientjournaler. Behandlingsplaner. Information om recepter. Når det drejer sig om sundhedspleje, skal alting foregå hurtigt, præcist - og i nogle tilfælde med tilstrækkelig gennemskuelighed for at opfylde strenge brancheregler. Når big data håndteres effektivt, kan udbydere af sundhedsydelser identificere skjulte indsigter, der gør patientplejen bedre.
Uddannelse
Undervisere, der er bevæbnet med datadrevet indsigt, kan have en betydelig indflydelse på skolesystemer, elever og læseplaner. Ved at analysere big data kan de identificere elever i risikogruppen, sikre sig, at eleverne gør tilstrækkelige fremskridt, og implementere et bedre system til evaluering og støtte af lærere og skoleledere.
Små og mellemstore virksomheder
Med den enkle indsamling af big data og de stadig billigere muligheder for at administrere, lagre og analysere data, har små og mellemstore virksomheder en bedre chance end nogensinde for at konkurrere med deres større modparter. De små og mellemstore virksomheder kan bruge big data kombineret med analyser til at sænke omkostningerne, øge produktiviteten, opbygge stærkere kunderelationer og minimere risici og svindel.
Det offentlige
Når offentlige myndigheder er i stand til at håndtere og anvende analyser baseret på deres big data, vinder de betydeligt terræn, når det handler om at varetage forsyningsvirksomheder, drive agenturer, håndtere trafikpropper eller forebygge kriminalitet. Men selvom der er mange fordele ved big data, skal myndighederne også tage stilling til spørgsmål om gennemsigtighed og privatlivets fred.
Forsikring
Telematik, sensordata, vejrdata, drone- og luftbilleddata - forsikringsselskaber oversvømmes af en strøm af big data. Kombinationen af big data og analyse giver helt nye indsigter, som kan drive den digitale transformation. For eksempel hjælper big data forsikringsselskaberne med at vurdere risici bedre, skabe nye prispolitikker, give meget personaliserede tilbud og være mere proaktive med hensyn til forebyggelse af tab.
Deep learning kræver big data, fordi big data er nødvendigt for at isolere skjulte mønstre og for at finde svar uden at overbearbejde dataene. Jo flere data af god kvalitet man har, jo bedre resultater får man med deep learning. Wayne Thompson SAS forskning og udvikling
Datadrevet innovation
Nutidens enorme mængder big data åbner op for utallige muligheder for at få indsigt, der driver innovation. Fra mere præcise prognoser til øget driftseffektivitet og bedre kundeoplevelser - sofistikeret brug af big data og analyse fremmer fremskridt, der kan ændre vores verden - forbedre liv, helbrede sygdomme, beskytte de sårbare og spare på ressourcerne.
Sådan fungerer big data
Før virksomheder kan sætte big data i arbejde for dem, bør de overveje, hvordan de flyder mellem en lang række lokationer, kilder, systemer, ejere og brugere. Der er fem vigtige trin til at få styr på denne "big data-fabrik", der omfatter traditionelle, strukturerede data sammen med ustrukturerede og semistrukturerede data:
- Fastlæg en big data-strategi.
- Identificer big data-kilder.
- Få adgang til, administrer og opbevar data.
- Analyser data.
- Træf intelligente, datadrevne beslutninger.
1) Udarbejd en big data-strategi
På et overordnet niveau er en big data-strategi en plan, der er designet til at hjælpe dig med at overvåge og forbedre den måde, du indsamler, opbevarer, administrerer, deler og bruger data på i og uden for din organisation. En big data-strategi sætter scenen for forretningssucces midt i en overflod af data. Når man udvikler en strategi, er det vigtigt at overveje eksisterende - og fremtidige - forretningsmæssige og teknologiske mål og initiativer. Det kræver, at man behandler big data som ethvert andet værdifuldt forretningsaktiv i stedet for blot et biprodukt af forskellige applikationer.
2) Identificer kilder til big data
- Streaming-data kommer fra Internet of Things (IoT) og andre forbundne enheder, der strømmer ind i IT-systemer fra bærbare enheder, smart cars, medicinsk udstyr, industrielt udstyr og meget mere. Du kan analysere disse big data, når de ankommer, og beslutte, hvilke data du vil beholde eller ikke beholde, og hvilke der skal analyseres yderligere.
- Data fra sociale medier stammer fra interaktioner på Facebook, YouTube, Instagram osv. Det omfatter store mængder big data i form af billeder, videoer, stemme, tekst og lyd - nyttigt for marketing-, salgs- og supportfunktioner. Disse data er ofte i ustruktureret eller semistruktureret form, så de udgør en unik udfordring for forbrug og analyse.
- Offentligt tilgængelige data kommer fra massive mængder af åbne datakilder som den amerikanske regerings data.gov, CIA World Factbook eller EU's Open Data Portal.
- Andre big data kan komme fra datasøer, cloud-datakilder, leverandører og kunder.
3) Adgang til, håndtering og lagring af big data
Moderne computersystemer giver den hastighed, effekt og fleksibilitet, der er nødvendig for hurtigt at få adgang til massive mængder og typer af big data. Ud over driftssikker adgang har virksomhederne også brug for metoder til at integrere data, opbygge datapipelines, sikre datakvalitet, sørge for datastyring og -lagring og forberede data til analyse. Nogle big data kan gemmes på stedet i et traditionelt datalager - men der er også fleksible, billige muligheder for at gemme og håndtere big data via cloud-løsninger, datasøer, datapipelines og Hadoop.
4) Analysér dataene
Med højtydende teknologier som grid computing eller in-memory analytics kan organisationer vælge at bruge alle deres big data til analyser. En anden tilgang er på forhånd at afgøre, hvilke data der er relevante, før de analyseres. Uanset hvad er big data-analyse den måde, hvorpå virksomheder får værdi og indsigt fra data. Big data bliver i stigende grad brugt til avancerede analyser som kunstig intelligens (AI) og maskinlæring.
5) Træf intelligente, datadrevne beslutninger
Veladministrerede, pålidelige data fører til troværdige analyser og sikre beslutninger. For at forblive konkurrencedygtige er virksomheder nødt til at udnytte den fulde værdi af big data og arbejde datadrevet - træffe beslutninger baseret på de beviser, som big data præsenterer, snarere end på mavefornemmelser. Fordelene ved at være datadrevet er klare. Datadrevne organisationer præsterer bedre, er driftsmæssigt mere forudsigelige og er mere rentable.
De næste skridt
Big data kræver avanceret datahåndteringsteknologi for at forvandle dine analyse- og AI-programmer til store muligheder. Og det kan SAS hjælpe dig med.
Informationsstyring fra SAS®
Uanset kilden, hvor dataene er gemt, eller hvor store og komplekse de er, gør brugen af informationsstyring fra SAS det hurtigere og nemmere for databrugerne at finde, katalogisere og beskytte de big data, der er mest værdifulde for analysen. Metadata-orienterede søgeresultater viser detaljerede oplysninger om hvert dataaktiv. Til gengæld kan erhvervsbrugere evaluere dataenes anvendelighed til formålet med mindre afhængighed af IT, mens de undgår omarbejdning og træffer mere informerede valg.
Anbefalet læsning
- Article Exploring the sun with big dataResearchers working for NASA are using automatic, exploratory and visual analysis of big data to help understand the mysteries of our universe.
- Series Tracking down answers to your questions about data scientistsDo you need a data scientist? Want to be a data scientist, or improve the skills you already have? Check out our Insights series.
- Article Big data integration: Go beyond 'just add data'Every business-focused technology requires users to "just add data." This article by Matt Magne explores why that's not as easy as it sounds, especially in a big data age.