Dataforvaltning
Hvad er det og hvorfor er det vigtigt
Dataforvaltning handler om at administrere data på en måde, der gør dem til en værdifuld ressource og udnytter deres potentiale i organisationen. Effektiv dataforvaltning kræver en datastrategi og pålidelige metoder til at få adgang til, integrere, rense, forvalte, lagre og forberede data til AI og analyse.
Dataforvaltning i AI-æraen
I al den tid, virksomheder har indsamlet data, har de været nødt til at forvalte dem for at undgå problemstillingen »skrald ind, skrald ud«. Det er afgørende med god dataforvaltning for at sikre pålidelige, etiske og bias-fri resultater. Det er især vigtigt for kunstig intelligens og maskinlæringsopgaver og store sprogmodeller (LLM'er), der trænes på enorme datasæt og derefter bruges til at forstå og generere menneskeligt sprog.
Hvad er moderne dataforvaltning?
Moderne dataforvaltning er koblet sammen med AI og maskinlæring. I takt med at disse teknologier udvikler sig, øges behovet for dataadgang, datakvalitet og datastyring. I denne forklarende video kan du lære, hvordan moderne datastyring handler om nye teknologier og processer, såsom DataOps og AIOps. Du vil høre, hvorfor AI- og maskinlæringsmodeller kræver pålidelige data, hvis organisationer skal undgå risici, omkostninger og tabt produktivitet - især i stærkt regulerede brancher med strenge compliance-krav.
Dataforvaltningens historie
Nogle siger, at behovet for dataforvaltning begyndte i 1890'erne i forbindelse med de mekaniske hulkort, der registrerede oplysninger (data) på et tykt kort. Men begrebet dataforvaltning blev ikke bredt diskuteret før i 1960'erne, hvor Association of Data Processing Service Organizations (ADPSO) begyndte at give råd om dataforvaltning til fagfolk.
Dataforvaltningssystemer, som vi kender dem i dag, var ikke almindelige før 1970'erne. Disse dataforvaltningssystemer var strengt operationelle. De leverede optegnelser (rapporter) over forretningsaktiviteter på et givet tidspunkt, hentet fra en relationsdatabase, der lagrede oplysninger i rækker og kolonner (typisk et datalager). Nogle af de almindelige processer og teknologier i forbindelse med dataforvaltning omfatter:
- Batch-behandling og ETL (extract, transform, load).
- Struktureret programmeringssprog (SQL) og relationelle databasestyringssystemer (RDBMS'er).
- Ikke kun SQL (NoSQL) og ikke-relationelle databaser.
- Virksomhedsdatalagre, datasøer og datastrukturer.
- Dataføderation og virtualisering.
- Datakataloger, metadatastyring og datalinje.
- Skybaseret databehandling og event stream processing (datastreaming).
I dag kan forretnings- og it-funktioner samarbejde om at optimere den måde, data håndteres på, før de bruges med AI og generativ AI (GenAI). Dataingeniører og analytikere arbejder f.eks. sammen med dataforskere om at administrere og udtrække værdi fra data.
Stærkt fokus på data: Fundamentet for studerendes og universitetets succes
Ligesom mange andre havde University of North Texas (UNT) masser af data og ringe indsigt i dem. Universitetet havde grundlæggende problemer med dataintegritet, datahåndtering og datastyring - og da data var forvist til siloer, var det vanskeligt at foretage virksomhedsanalyser. Læs, hvordan implementeringen af datastyringssoftware fra SAS skabte et seismisk skift i analysekapaciteten på UNT - hvilket resulterede i bedre resultater for de studerende og enorme besparelser.
Hvem anvender dataforvaltning?
Dataforvaltning er drivkraften bag processerne i succesfulde organisationer på tværs af alle brancher. Med flere data og lettere adgang til analyser får man chancen for at gribe flere muligheder, stille flere spørgsmål og løse flere problemer. Se, hvordan globale brancher bruger dataforvaltning til at understøtte deres målsætninger.
Mere end nogensinde kræver spørgsmål om databeskyttelse, compliance og digitalisering, at bankerne har et pålideligt datafundament. Kun med et komplet, integreret overblik over alle deres data - og sunde teknikker til kvalitet, styring og beskyttelse af persondata - kan bankerne vinde kundernes tillid og forfølge en fremadrettet digital transformationsindsats.
Dataforvaltning for virksomheder er et must-have i sundhedssektoren. Branchen er afhængig af at kunne integrere data fra alle formater og kilder - inklusive eksterne data - samtidig med at man spotter duplikerede data, løser problemer med datakvalitet og overholder strenge lovgivningsmæssige krav til beskyttelse af persondata og privatlivets fred.
Forsikringsselskaber jonglerer med enorme mængder data hver dag - herunder data fra forsikringstilbud, policer, skadesanmeldelser, kunder og tilknyttede IoT-enheder. At opbygge gode aktuarmodeller og træffe informerede beslutninger om prissætning, forbehold, betalinger og meget mere afhænger af, at man har pålidelige dataforvaltningsfunktioner til at integrere, rense og administrere forsikringsdata på en hensigtsmæssig måde.
I produktionsbranchen er der intet, der indikerer succes på samme måde som kvalitet. Med solide dataforvaltnings- og datakvalitetsteknologier kan producenter effektivt styre produktbeholdningen og integrere strukturerede og ustrukturerede data fra alle kilder for at få et overblik over ydeevnen, skabe bedre resultater og træffe velinformerede forretningsbeslutninger.
Lokale og nationale myndigheder er ansvarlige for en lang række tjenester og systemer. Pålidelige dataforvaltningsteknologier understøtter alle disse bestræbelser - fra bekæmpelse af svindel og ukorrekte betalinger til sikring af borgernes sikkerhed og overvågning af befolkningens sundhedsresultater, økonomisk udvikling og smart city-initiativer.
At forstå kundeoplevelsen og reagere hensigtsmæssigt på forventningerne kræver et nøjagtigt, opdateret overblik over alle data - uanset om de streames, er cloudbaserede eller lagres i en datasø eller et lager. Lige fra marketing til merchandising og salg er pålidelig dataforvaltning afgørende for at få styr på data i detailhandlen.
Få mere at vide om brancher, der bruger denne teknologi
- Landbrug
- Bankvæsen
- Kapitalmarkeder
- Forbrugsvarer
- Kasinoer
- Sundhedspleje
- Højere uddannelse
- Hoteller
- Forsikring
- Biovidenskab
- Produktion
- Olie og gas
- P-12 Uddannelse
- Offentlig sektor
- Detailhandel
- Små og mellemstore virksomheder
- Sportsanalyse
- Rejser og transport
- Telekommunikation, medier og teknologi
- Forsyningsvirksomheder
Dataforvaltning er en forudsætning for AI og maskinlæring, og lige så vigtigt er det, at AI/ML har behov for dataforvaltning. Fra nu af er de to forbundet, og vejen til vellykket AI er uløseligt forbundet med moderne dataforvaltningspraksis. Dan Soceanu Senior Product Manager for AI og Data Management, SAS
Sådan fungerer datahåndtering
I takt med at datamængder, -typer og -kilder stiger, udvides behovet for at behandle data i realtid - og det haster med at kunne forvalte data ordentligt, hvilket fortsat er en topprioritet for virksomhedens succes. Se nærmere på nogle af de centrale dataforvaltningsteknologier.
Udvidet dataforvaltning
Denne tilgang bruger kunstig intelligens eller maskinlæringsteknikker til at gøre processer som datakvalitet, metadatastyring og dataintegration selvkonfigurerende og selvjusterende.
For eksempel kan udvidet dataforvaltning:
Generere en liste med forslag til, hvordan man kan forbedre data. Handlinger, der foretages over tid, vil fortsætte med at forbedre resultaterne.
Skabe en dataprofil og automatisk finde personlige oplysninger, som kan markeres for at påvirke adfærden - f.eks. ved kun at give bestemte brugere adgang til personlige data i en tabel.
Foreslå datatransformationer, og derefter foreslå forbedringer over tid ved hjælp af maskinlæring - udført via en søgemaskine, der analyserer data og metadata.
Give anbefalinger til brugerne og foreslå de efterfølgende bedste handlinger i forbindelse med dataforberedelsesprocessen:s.
Mere om, hvordan dataforvaltning fungerer
Datahåndtering til AI og maskinlæring (ML)
Mange forretningsprocesser er afhængige af AI, som er læren om at træne systemer til at efterligne menneskelige opgaver gennem læring og automatisering. For eksempel bruges AI- og ML-teknikker ofte til at træffe låne- og kreditbeslutninger, medicinske diagnoser og detailtilbud. Med AI og ML er det vigtigere end nogensinde at have veladministrerede data, som du forstår og stoler på - for hvis dårlige data fodrer algoritmer, der tilpasser sig ud fra, hvad de lærer, kan fejlene hurtigt blive mange.
Forvaltning af data til IoT
De data, der strømmer ud fra sensorer i IoT-enheder (Internet of Things), kaldes ofte streamingdata. Datastreaming, eller event stream processing, indebærer analyse af realtidsdata på farten. Det sker ved at anvende datalogik, genkende mønstre i data og filtrere dem til forskellige formål, efterhånden som de strømmer ind i en organisation. Opdagelse af svindel, netværksovervågning, e-handel og risikostyring er populære anvendelser af disse teknikker.
Tovejs metadataforvaltning
Tovejs metadatastyring deler og forbinder metadata mellem forskellige systemer. SAS er for eksempel forpligtet til at være en del af det åbne metadatasamfund gennem sit engagement i OPDi Egeria-projektet - som understreger behovet for metadatastandarder for at fremme ansvarlig dataudveksling på tværs af forskellige teknologimiljøer.
Datastruktur og semantisk lag
Udtrykket datastruktur beskriver en organisations forskelligartede datalandskab - hvor store mængder og typer af data administreres, behandles, lagres og analyseres ved hjælp af en række forskellige metoder. Det semantiske lag spiller en vigtig rolle i datastrukturen. Ligesom en forretningsordliste er det semantiske lag en måde at forbinde data med almindeligt definerede forretningstermer, der bruges i hele organisationen.
Datahåndtering og open source
Open source henviser til et computerprogram eller en infrastruktur, hvor kildekoden er offentligt tilgængelig til brug og ændring af et fællesskab af brugere. Brug af open source kan gøre udviklingsarbejdet hurtigere og reducere omkostningerne. Og dataprofessionelle kan trives, hvis de kan arbejde i det programmeringssprog og miljø, de ønsker.
Dataføderation/virtualisering
Dataføderation er en særlig form for virtuel dataintegration, der giver dig mulighed for at se på kombinerede data fra flere kilder uden at skulle flytte og gemme den kombinerede visning et nyt sted. Så du kan få adgang til kombinerede data, præcis når du beder om det. I modsætning til ETL- og ELT-værktøjer, der viser et øjebliksbillede på et bestemt tidspunkt, genererer dataføderation resultater baseret på, hvordan datakilderne ser ud på tidspunktet for anmodningen. Det giver en mere aktuel og potentielt mere præcis visning af oplysningerne.
Næste trin
Løsninger til dataforvaltning
Pålidelige data fører til pålidelig AI og analyse - hvilket er vigtigt for enhver virksomheds succes. Vores dataforvaltningsløsninger omfatter alle de funktioner, du har brug for til at få adgang til, integrere, rense, styre og klargøre dine data til analyse - herunder avanceret analyse som kunstig intelligens og maskinlæring.