dummie_bot

Big Data voor dummies

Alex Mietes: Active Group 

Data betekent niet veel anders dan ‘gegevens’. Zo oud als de wereld zelf dus. Maar we hebben het pas over Big Data sinds de intrede van de ICT in ons leven, omdat toen de hoeveelheden data in enorm tempo toenamen. Zozeer zelfs, dat bijna niemand er meer soep van kon maken. Het werd een vakgebied voor specialisten als data-analisten en data miners. En daarbij hoort, zoals zo vaak, een eigen begrippenlijst. Om de wereld van de Big Data een beetje te kunnen doorgronden: Big Data voor dummies.    
 

Business Intelligence (BI)

Opvragen van informatie uit databases via specifieke applicaties. Doorgaans worden drie vormen van data-analyse onderscheiden.

  1. Descriptive analytics: een analyse van historische gegevens maken
    (wat is er gebeurd?)
  2. Predictive analytics: voorspellingen doen op basis van gegevens uit het verleden
    (wat zou er kunnen gebeuren?)
  3. Prespective analytics: een volgende stap voor de toekomst voorspellen
    (wat moeten we gaan doen?)

 

De data scientist of data miner

Een data scientist of data miner duikt in de grote hoeveelheden ongestructureerde data en probeert hierin -door gericht te zoeken- structuren te ontdekken. Die ongestructureerde data kunnen uit vele bronnen komen zoals e-mails, video’s, foto’s, social media, bestelhistorie en kassabonnen, maar bij-voorbeeld ook uit machines. Voor het structureren worden speciale technologieën en algoritmes gebruikt. De bedoeling is om uiteindelijk modellen te creëren waarmee het gedrag van mensen of systemen kan worden voorspeld.
 

Data mining

Het systematisch doorzoeken van gegevens in een database om patronen te ontdekken die nieuwe inzichten opleveren of kunnen worden gebruikt om prognoses te maken.
 

Process mining

Verwant aan data mining (zie hierboven) maar nu worden complete (bedrijfs-) pro-cessen geanalyseerd door gebruik te maken van opgeslagen data. Hierdoor wordt inzicht gekregen in het werkelijke procesverloop, wat vaak afwijkt van wat mensen zien, denken te zien en of denken te weten.
 

Scraping

Voorheen was het zo dat de meeste data afkomstig was uit operationele bedrijfsdata-bases. Tegenwoordig wordt data gedolven uit allerlei verschillende bronnen, waarbij met name internet een belangrijke bron is. Het proces van het delven van de internetdata heet ook wel scraping. De kunst van het scrapen is het verwijderen van alle overbodige informatie (code, tags) en alleen de belangrijkste data te bewaren.
 

Embedded system

Een elektronisch systeem (hardware én software) dat is geïntegreerd in gebruiksartikelen of apparaten, met de bedoeling deze een vorm van intelligent gedrag te bezorgen. De essentie van een embedded system is dat er software zit ingebed in een hardware-apparaat. Doordat software eenvoudig vervangen of geüpdate kan worden, is het apparaat flexibeler aan te passen aan toekomstige eisen.

Categorie: mediatrends