Hoe gegevensbeheer werkt
Zolang bedrijven gegevens verzamelen, moeten zij die beheren om te voorkomen dat ze verzanden in het dilemma, 'Garbage in, garbage out'. Naarmate de hoeveelheden, soorten en bronnen van gegevens toenemen, groeit ook de behoefte om gegevens in realtime te verwerken. De urgentie om gegevens goed te managen blijft een topprioriteit voor zakelijk succes. We nemen enkele van de belangrijkste technologieën voor gegevensbeheer onder de loep.
Gegevenstoegang
Gegevenstoegang is de mogelijkheid om toegang te krijgen tot informatie (of deze te halen) uit elke bron, waar die ook is opgeslagen. Bepaalde technologieën, zoals database stuurprogramma's en document converters, maken dit gemakkelijker en efficiënter.
Waarom is het belangrijk?
Belangrijke gegevens bevinden zich op veel plaatsen: tekstbestanden, databases, e-mails, data lakes, webpagina's en feeds in de sociale media. Met een goede toegangstechnologie kunt u nuttige gegevens extraheren uit elk type gegevensopslag of -formaat dat beschikbaar is, zodat u meer tijd kunt besteden aan het gebruiken van de gegevens - en niet alleen aan het zoeken ervan.
Gegevensintegratie
Gegevensintegratie (Data integration - DI) is een proces waarbij verschillende soorten gegevens worden gecombineerd om uniforme resultaten te presenteren. Met gegevensintegratietools kunt u stappen automatiseren om dit te doen. ETL (extract, transform and load) en ELT (extract, load and transform) zijn voorbeelden van DI-tools.
Waarom is het belangrijk?
Gegevensintegratie zorgt voor combinaties van gegevens, wat nuttig is bij het nemen van beslissingen. Omdat geïntegreerde gegevens elementen van meerdere, afzonderlijke datasets combineren, kunnen ze nieuwe inzichten aan het licht brengen en u helpen verschillende vragen te beantwoorden.
Gegevenskwaliteit (Data Quality)
Gegevenskwaliteit is de praktijk om ervoor te zorgen dat gegevens accuraat zijn en bruikbaar voor het beoogde doel. Dit begint op het moment dat de gegevens worden opgevraagd en gaat verder via verschillende integratiepunten met andere gegevens, inclusief het punt vlak voordat ze worden gepubliceerd of gerapporteerd.
Waarom is het belangrijk?
Slechte gegevenskwaliteit kan leiden tot kostbare fouten. Gegevens die verouderd, onbetrouwbaar, onvolledig of niet geschikt zijn voor het beoogde doel, worden niet vertrouwd en veroorzaken problemen in de hele organisatie. Een oplossing voor gegevenskwaliteit die data op een geautomatiseerde, consistente manier kan standaardiseren, doorlopen en verifiëren, verkleint die risico's.
Gegevensbeheer
Data Governance is een kader van mensen, beleid, processen en technologieën dat bepaalt hoe u de gegevens van uw organisatie beheert. Met data governance software kunt u de regels definiëren die uw beleid afdwingen en zo uw gegevens- en bedrijfsstrategieën op elkaar afstemmen.
Waarom is het belangrijk?
Governance wordt meestal ingegeven door de noodzaak om te voldoen aan regelgeving, zoals CECL of de AVG. Via beheerbeleid kunt u bepalen tot welke gegevens gebruikers toegang hebben, wie gegevens mag wijzigen (in plaats van bekijken) en hoe moet worden omgegaan met uitzonderingen. Met tools voor gegevensbeheer kunt u regels controleren en beheren, nagaan hoe ze worden afgehandeld en rapporten leveren voor audits.
Bedrijfswoordenlijsten, oorsprong en metadata
Gebruik een bedrijfswoordenlijst om gegevensdefinities en -eigenaars in te stellen, workflows te integreren en problemen te markeren en om oorsprong en relaties te visualiseren. Gegevensoorsprong volgt gegevens vanaf hun oorsprong tot hun huidige locatie door belangrijke details te traceren: technische, zakelijke en metadata (gegevens over de gegevens).
Waarom is het belangrijk?
Door samen te werken, bevorderen deze tools de collaboratie en brengen ze business en IT op één lijn. Wanneer u op de hoogte wordt gebracht van potentiële problemen, kunt u deze in een vroeg stadium aanpakken, voordat ze grotere problemen veroorzaken. U kunt met deze tools ook gegevens relaties onderzoeken en impactanalyses uitvoeren.
Gegevensvoorbereiding
Gegevensvoorbereiding is een taak waarbij gegevens worden klaargemaakt voor analyse. Hierbij worden gegevens uit verschillende bronnen gecombineerd en vervolgens opgeschoond en getransformeerd. Als dit via een selfservice-interface gebeurt, kunnen zakelijke gebruikers met minimale training toegang krijgen tot de gegevens die zij nodig hebben en deze manipuleren, zonder IT om hulp te hoeven vragen.
Waarom is het belangrijk?
Goede modellen zijn afhankelijk van een goede gegevensvoorbereiding, maar dat is een tijdrovende taak. Goede tools voor datavoorbereiding onthullen prachtige, schone gegevens en voegen waarde toe zodat data professionals ze snel kunnen openen, opschonen, transformeren en structureren voor elk analytisch doel. Het resultaat: hogere productiviteit, betere beslissingen en meer flexibiliteit.
Augmented Data Management
Voor deze aanpak worden kunstmatige intelligentie of technieken uit het Machine Learning gebruikt om processen zoals gegevenskwaliteit, metadatabeheer en gegevensintegratie zelf configurerend te maken. Zo kan SAS bijvoorbeeld:
Een lijst genereren van suggesties voor het verbeteren van gegevens. Acties die worden ondernomen, zullen de resultaten blijven verbeteren.
Gegevens profileren en automatisch persoonlijke informatie vinden, die kan worden gemarkeerd om gedrag te beïnvloeden, zoals alleen gespecificeerde gebruikers toegang geven tot persoonlijke gegevens in een tabel.
Datatransformaties voorstellen en vervolgens verbeteringen voorstellen met behulp van machine learning. Dit gebeurt via een discovery engine die data en metadata analyseert.
Aanbevelingen doen aan gebruikers en de volgende beste acties voorstellen tijdens het proces van gegevensvoorbereiding.
Meer over hoe gegevensbeheer vandaag werkt
- Gegevensbeheer voor artificial intelligence (AI) en machine learning (ML). Veel bedrijfsprocessen vertrouwen op AI, de wetenschap die systemen traint om menselijke taken na te bootsen door middel van leren en automatisering. AI- en ML-technieken worden bijvoorbeeld vaak gebruikt bij het nemen van beslissingen over leningen en kredieten, medische diagnoses en aanbiedingen in de detailhandel. Met AI en ML is het belangrijker dan ooit om goed-beheerde gegevens te hebben die u begrijpt en vertrouwt. Want als algoritmen die zich aanpassen op basis van wat ze leren, worden gevoed met slechte gegevens kunnen fouten zich snel vermenigvuldigen.
- Gegevensbeheer voor het Internet of Things (IoT). Gegevens die stromen van sensoren die zijn ingebouwd in IoT-apparaten, wordt vaak 'data streaming' genoemd. Bij data streaming, of event stream processing, worden gegevens in realtime geanalyseerd. Dit wordt bereikt door logica op de gegevens toe te passen, patronen in de gegevens te herkennen en ze te filteren voor meervoudig gebruik terwijl ze een organisatie binnenstromen. Fraudedetectie, netwerkbewaking, e-commerce en risicobeheer zijn populaire toepassingen voor deze technieken.
- Bidirectioneel metadatabeheer. Bidirectioneel metadatabeheer deelt en verbindt metadata tussen verschillende systemen. SAS zet zich bijvoorbeeld in om deel uit te maken van de open metadata community door zijn betrokkenheid bij het OPDi Egeria-project. Dit project onderstreept de behoefte aan metadatastandaarden om een verantwoorde uitwisseling van gegevens in uiteenlopende technologieomgevingen te bevorderen.
- Gegevensinfrastructuur en semantische laag. De term gegevensinfrastructuur beschrijft het diverse gegevenslandschap van een organisatie, waar enorme hoeveelheden en soorten gegevens worden beheerd, verwerkt, opgeslagen en geanalyseerd, met gebruikmaking van een verscheidenheid van methoden. De semantische laag speelt een belangrijke rol in de gegevensinfrastructuur. Net als een bedrijfswoordenlijst is de semantische laag een manier om gegevens te koppelen aan algemeen gedefinieerde bedrijfstermen die in de hele organisatie worden gebruikt.
- Gegevensbeheer en open source. Open source verwijst naar een computerprogramma of -infrastructuur waarvan de broncode publiekelijk beschikbaar is, en gebruikt en gewijzigd kan worden door een community van gebruikers. Het gebruik van open source kan ontwikkeling versnellen en kosten drukken. En data professionals vinden het prettig als ze kunnen werken in de programmeertaal en -omgeving van hun keuze.
- Gegevensfederatie en -visualisatie. Gegevensfederatie is een speciaal soort virtuele gegevensintegratie waarmee u gecombineerde gegevens uit meerdere bronnen kunt bekijken zonder dat u de gecombineerde weergave hoeft te verplaatsen en op een nieuwe locatie hoeft op te slaan. U kunt dus toegang krijgen tot gecombineerde gegevens op het moment dat u erom vraagt. In tegenstelling tot ETL- en ELT-tools die een momentopname tonen, genereert gegevensfederatie resultaten op basis van hoe de gegevensbronnen eruit zien op het moment van het verzoek. Dit geeft een tijdiger en potentieel nauwkeuriger beeld van de informatie.
Oplossingen in gegevensbeheer
Vertrouwde gegevens leiden tot betrouwbare analyses, en dat is belangrijk voor het succes van elke onderneming. En betrouwbare gegevens beginnen met een solide strategie voor gegevensbeheer die wordt ondersteund door beproefde technologie. SAS Data Management omvat alle mogelijkheden die u nodig hebt om uw gegevens te ontsluiten, te integreren, op te schonen, te beheren en voor te bereiden voor analyses - inclusief geavanceerde analyses zoals kunstmatige intelligentie en machine learning. Het is allemaal onderdeel van het SAS-platform. Leer hoe u uw analytische programma's kunt omzetten in grote kansen.
Aanbevolen leesstof
- Artikel 5 data management best practices to help you do data rightFollow these 5 data management best practices to make sure your business data gives you great results from analytics.
- Artikel Data lineage: Making artificial intelligence smarterLear how data lineage plays a vital role in understanding data, making it a foundational principle of AI.
- Artikel Data integration: It ain't what it used to beOnce limited in scope, data integration now supports analytics and data-driven operational processes like real-time insurance claims processing and IoT apps.