Big Data
Wat is het en waarom is het belangrijk
Big data is een ander woord voor een enorm datavolume van zowel gestructureerde als ongestructureerde data waar bedrijven op dagelijkse basis mee overspoeld worden. De hoeveelheid data doet er echter niet toe, want het gaat er vooral om wat organisaties met de data doen. Big data kan geanalyseerd worden om inzicht te krijgen in het nemen van betere beslissingen en het zetten van strategische stappen op zakelijk gebied.
Geschiedenis van big data
De term “big data” refereert naar data met zo’n groot volume of zo’n enorme snelheid of complexiteit dat het lastig of onmogelijk is om de data te verwerken op basis van een traditionele methode. Toegang krijgen en het opslaan van grote hoeveelheden data die geanalyseerd moeten worden is niet nieuw, maar het concept “big data” kwam op rond 2000, toen industrie-analist Doug Laney de huidige definitie van big data bedacht op basis van drie V’s:
Volume. Organisaties verzamelen data vanuit verschillende bronnen, inclusief zakelijke transacties, slimme (IoT-) apparaten, industriële installaties, video’s, social media en nog veel meer. In het verleden zou dataopslag een probleem zijn geweest, maar tegenwoordig kan je makkelijk en goedkoop je data opslaan op platforms als data lakes en Hadoop.
Velocity (snelheid). Nu het Internet of Things aan het groeien is, stroomt data met een enorme snelheid bedrijven binnen, terwijl diezelfde data binnen korte tijd verwerkt moet worden. RFID tags, sensors en slimme meters maken dat er steeds meer behoefte is aan snelle dataverwerking.
Variety (verscheidenheid). Er zijn allerlei verschillende soorten data: gestructureerde data, numerieke data in traditionele databases en ongestructureerde tekstdocumenten, e-mails, video’s, audiobestanden, stock ticker data en financiële transacties.
Bij SAS voegen we hier in het geval van big data nog twee V’s aan toe:
Variability
In addition to the increasing velocities and varieties of data, data flows are unpredictable – changing often and varying greatly. It’s challenging, but businesses need to know when something is trending in social media, and how to manage daily, seasonal and event-triggered peak data loads.
Variability (variaties)
Naast de toenemende snelheden en verschillende soorten data, zijn dataflows ook onvoorspelbaar. Ze veranderen snel en kunnen enorm verschillen. Het is een uitdaging, maar het is belangrijk dat bedrijven weten wat er trending is op social media en hoe er omgegaan moet worden met de dagelijkse datastroom, of met datastromen die gelinkt zijn aan een bepaald seizoen of een bepaalde gebeurtenis.
Veracity (betrouwbaarheid)
Betrouwbaarheid gaat over de kwaliteit van de data. Data zijn afkomstig van heel veel verschillende bronnen en daarom is het lastig om het te linken, te matchen, op te schonen en te transformeren binnen verschillende systemen. Bedrijven moeten zorgen dat relaties, hiërarchieën en verschillende gegevenskoppelingen met elkaar samenwerken, omdat het anders bijna onmogelijk wordt om de data bij te houden.
Big data and IoT analytics foster economic growth, sustainability and well-being
Jakarta had vast amounts of unstructured data scattered across silos and multiple applications. To enhance public service, the city partnered with SAS to develop a one-stop super app for residents, businesses and government departments. Now, everyone can use the app to access public services, get emergency updates, report accidents and crimes, and much more. The city even uses SAS to build models that predict and mitigate flooding – reducing damage to lives, properties and businesses.
Why is big data important?
The importance of big data doesn’t simply revolve around how much data you have. The value lies in how you use it. By taking data from any source and analyzing it, you can find answers that 1) streamline resource management, 2) improve operational efficiencies, 3) optimize product development, 4) drive new revenue and growth opportunities and 5) enable smart decision making. When you combine big data with high-performance analytics, you can accomplish business-related tasks such as:
- Determining root causes of failures, issues and defects in near-real time.
- Spotting anomalies faster and more accurately than the human eye.
- Improving patient outcomes by rapidly converting medical image data into insights.
- Recalculating entire risk portfolios in minutes.
- Sharpening deep learning models' ability to accurately classify and react to changing variables.
- Detecting fraudulent behavior before it affects your organization.
Big data in de wereld van tegenwoordig
Big data, en de manier waarop organisaties big data gebruiken om inzichten op te doen, verandert de manier waarop de wereld omgaat met zakelijke informatie. Ontdek meer over de impact van big data.
What's a data hero to do?
Who are data heroes? A data scientist analyzes and looks for insights in data. Data engineers build pipelines focused on DataOps. Data officers ensure data is reliable and managed responsibly. Synergy among roles drives analytics success.
Data lake en data warehouse – wat is het verschil?
Is de term “data lake” gewoon een marketinghype? Of is het een nieuwe naam voor een data warehouse? Phil Simon legt precies uit wat een data lake is, hoe het werkt en wanneer je er mogelijk één nodig hebt.
Big data and cloud
Big data projects demand intense resources for data processing and storage. Working together, big data technologies and cloud computing provide a cost-effective way to handle all types of data – for a winning combination of agility and elasticity.
Deep learning heeft big data nodig omdat big data de plek is waar je verborgen patronen ontdekt en antwoorden vindt. Dankzij deep learning haal je betere resultaten uit data van een hoge kwaliteit. Wayne Thompson SAS Product Manager
Wie focust er op big data?
Big data is belangrijk voor industrieën. De opmars van IoT en andere aangesloten apparaten heeft gezorgd voor een enorme toename in de hoeveelheid informatie die bedrijven verzamelen, beheren en analyseren. Big data biedt voor elke industrie het potentieel om grote inzichten op te doen, zowel voor grote als kleine industrieën.
- Selecteer een industrie
- Retail
- Productie-industrie
- Banken
- Gezondheidszorg
- Educatie
- Kleine- en middelgrote bedrijven
- Overheid
- Verzekeringsmaatschappijen
Retail
Het opbouwen van goede klantrelaties is essentieel voor de retail. Het is bovendien dé manier om big data te beheren. Het is belangrijk dat retailers weten hoe ze hun klanten kunnen bereiken, hoe ze transacties moeten verwerken en hoe ze op een strategische manier werkzaamheden die zijn blijven liggen kunnen oppakken. En big data speelt in al deze gevallen een heel grote rol.
Productie-industrie
Bedrijven die in de productie-industrie gebruikmaken van big data, kunnen een hogere kwaliteit én meer producten leveren, terwijl ze minder afval produceren. En laat dit nou net heel belangrijk zijn in de competitieve markt van tegenwoordig. Fabrikanten werken steeds meer met analyses, waardoor problemen sneller kunnen worden opgelost en er een meer flexibele besluitvorming is.
Banking
Banken worden constant geconfronteerd met enorme hoeveelheden informatie die vanuit ontelbare bronnen binnenstromen. Dit maakt dat het voor banken heel belangrijk is om nieuwe en innovatieve manieren te vinden waarop je kunt omgaan met big data. Het is belangrijk om klanten te begrijpen en hen tevreden te houden, maar het is net zo belangrijk om risico’s zo laag mogelijk te houden, fraude te voorkomen en aan de regelgeving te blijven voldoen. Big data biedt belangrijke inzichten, maar vereist ook dat financiële instellingen altijd een stap voorlopen op de geavanceerde vormen van analyse.
Gezondheidszorg
Medische dossiers. Behandelplannen. Voorgeschreven recepten. In de gezondheidszorg moet alles snel en nauwkeurig gedaan worden en moet er in sommige gevallen ook nog rekening gehouden worden met zeer strenge regelgeving. Als big data op een efficiënte manier wordt beheerd, kan de gezondheidszorg verborgen inzichten opdoen die de zorg voor patiënten kan verbeteren.
Educatie
Als het onderwijs werkt op basis van een datasysteem, kan dit een enorme impact hebben op schoolsystemen, studenten en curriculums. Door big data te analyseren, kunnen “probleemstudenten” sneller opgespoord worden en kan er bijgehouden worden of studenten bijblijven met hun studie. Bovendien kan er een beter systeem geïmplementeerd worden voor evaluaties en ondersteuning voor docenten en schoolhoofden.
Kleine- en middelgrote bedrijven
Kleine- en middelgrote bedrijven kunnen beter dan ooit concurreren met hun grotere concurrenten nu het zo makkelijk is om aan big data te komen en de manieren om big data te beheren zo betaalbaar zijn. Kleine- en middelgrote bedrijven kunnen big data-analyses inzetten om productiever te worden, betere klantrelaties op te bouwen en de kans op risico’s en fraude te minimaliseren.
Overheid
Voor overheidsinstanties wordt het veel makkelijker om utiliteiten te beheren, bedrijven te runnen, om te gaan met verkeersopstoppingen en criminaliteit te voorkomen wanneer deze instanties weten hoe ze big data kunnen benutten en analyseren. Maar hoewel er veel voordelen zitten aan big data, is het voor overheidsinstanties wel belangrijk dat ze aandacht blijven besteden aan transparantie en privacy.
Verzekeringsmaatschappijen
Telematica, sensorgegevens, weergegevens en luchtfoto’s… verzekeringsmaatschappijen ontvangen enorm veel big data. Door big data te combineren met analyses, kunnen verzekeringsmaatschappijen inzichten opdoen die een digitale transformatie teweeg kunnen brengen. Zo kan big data er bijvoorbeeld voor zorgen dat verzekeraars risico’s beter kunnen inschatten, dat ze nieuwe prijzen kunnen hanteren, dat ze zeer persoonlijke aanbiedingen kunnen doen en dat ze zich proactiever kunnen opstellen als het gaat om schadepreventie.
Data-driven innovation
Today’s exabytes of big data open countless opportunities to capture insights that drive innovation. From more accurate forecasting to increased operational efficiency and better customer experiences, sophisticated uses of big data and analytics, along with AI and GenAI, propel advances that can change our world – improving lives, healing sickness, protecting the vulnerable and conserving resources. But we can't overlook the importance of always starting with good quality data and relying on trustworthy analytics and AI ethics to ensure the best outcomes for all of humanity.
Hoe werkt big data
Voordat bedrijven voordeel kunnen halen uit big data, moeten ze eerst nagaan langs welke locaties, bronnen, systemen, eigenaren en gebruikers de big data komt. Er zijn vijf belangrijke stappen om controle te krijgen over deze “datafabriek” vol traditionele, gestructureerde, ongestructureerde en semi-gestructureerde data:
- Zorg voor een big data strategie.
- Identificeer big data bronnen.
- Regel toegang tot en beheer en opslag van data.
- Analyseer de data.
- Neem beslissingen op basis van data.
1) Zorg voor een big data strategie
Een big data strategie is een plan dat is ontworpen om de manier waarop je data vergaart, opslaat, beheert, deelt en gebruikt, zowel binnen als buiten je organisatie, te structureren en te verbeteren. Een big data strategie is de basis voor zakelijk succes te midden van een enorme hoeveelheden data. Wanneer je een strategie ontwikkelt, is het belangrijk om rekening te houden met bestaande en toekomstige zakelijke doelen op het gebied van techniek en initiatieven. Dit betekent dat je big data moet beschouwen als een waardevol bedrijfsmiddel en niet als een bijproduct of een toepassing.
2) Weet wat de bronnen van big data zijn
- Het streamen van data komt van het Internet of Things (lvd) en andere aangesloten apparaten in IT-systemen, zoals draagbare apparaten, slimme auto’s, medische apparaten, industriële installaties en nog veel meer. Deze big data kan je analyseren zodra het binnenkomt, waarna je besluit welke data je wel en niet wil houden voor een meer uitgebreide analyse.
- Social media data zijn vooral afkomstig van interacties op Facebook, YouTube, Instagram, enz. Dit zijn grote hoeveelheden data in de vorm van afbeeldingen, video’s, spraak, tekst en geluid en dit kan gebruikt worden voor marketing-, verkoop- en ondersteuningsdoeleinden. Deze data zijn vaak ongestructureerd of semi-gestructureerd. Het is dus een grote uitdaging om deze data te gebruiken en te analyseren.
- Publicly available data is afkomstig van enorme hoeveelheden openbare databronnen, zoals data.gov van de Amerikaanse overheid, de CIA World Factbook of het Open Data Portaal van de Europese Unie.
- Overige big data kan afkomstig zijn uit data lakes, uit de cloud, van dataleveranciers en van klanten.
3) Toegang tot, beheer en opslag van big data
Moderne informaticasystemen leveren snelheid, kracht en flexibiliteit om snel toegang te krijgen tot grote hoeveelheden en soorten big data. Maar naast betrouwbare toegang, hebben bedrijven ook methodes nodig om de data te integreren en om de kwaliteit van de data te kunnen garanderen. Er moet ook gezorgd worden voor dataopslag en data moet worden voorbereid voor de analyses. Sommige soorten data kunnen worden opgeslagen in traditionele data warehouse, maar er zijn ook flexibele en goedkope manieren om big data op te slaan in de cloud, in data lakes of in Hadoop.
4) Big data analyseren
Dankzij geavanceerde technologieën, zoals grid computing of in-memory analytics, kunnen organisaties ervoor kiezen om al hun big data te laten analyseren. Een andere aanpak kan zijn dat je van tevoren bepaalt welke data relevant zijn, voor je begint met analyseren. In beide gevallen levert het analyseren van big data waarde en inzichten op. Vandaag de dag is big data zelfs de bron voor geavanceerde analyses, zoals kunstmatige intelligentie.
5) Neem slimme beslissingen op basis van je data
Betrouwbare en goed beheerde data leiden tot een betrouwbare analyse en uiteindelijk tot betrouwbare beslissingen. Om mee te doen met de concurrentie moeten bedrijven alles uit hun big data halen en moeten ze opereren op basis van data. Beslissingen moeten niet worden genomen op basis van een onderbuikgevoel, maar op basis van bewijs dat door big data wordt geleverd. De voordelen van werken op basis van data zijn duidelijk. Organisaties die werken op basis van data presteren beter, zijn voorspelbaarder en maken meer winst.
Next Steps
Big data demands sophisticated data management technology to transform your analytics and AI programs into big opportunities. SAS has you covered.
SAS® Information Governance
Regardless of source, where the data is stored, or how large and complex it is, SAS Information Governance makes it faster and easier for data users to find, catalog and protect the big data that is most valuable for analysis. Metadata-oriented search results show detailed information about each data asset. In turn, business users can evaluate the data’s fitness for purpose with less reliance on IT while avoiding rework and making more informed choices.
Recommended Reading
- Artikel What big data has brought to the privacy discussionHow does big data impact your privacy? There are ways to balance privacy and security in an increasingly transparent and dangerous world.
- Artikel Hadoop survey results reveal use cases, needs and trendsHow are companies using Hadoop? Why are adoption rates still low? And why is it so important? Data professionals’ candid answers may surprise you.
- Real-world techniques for analyzing big dataWhat are the top two analytics techniques you should know for big data? And how are businesses modernizing for big data analytics? Find out in this interview with author and professor Bart Baesens.