Gestructureerde gegevens

Waarom het van belang is om een gegevensverzameling te structureren.

Wanneer je gegevens uit externe bronnen importeert heb je geen controle over de indeling en het type gegevens en de manier waarop deze is georganiseerd. Voordat je de gegevens kunt analyseren, moet je vaak veel tijd besteden aan het opschonen en structureren van de gegevens.

Veel gegevensbestanden zijn vervuild, gegevens ontbreken of de gegevens zijn niet goed gestructureerd. Excel heeft enkele functies om je daarbij te helpen. Maar helaas kan Excel jouw handelingen niet vastleggen. Daarom is het belangrijk om te documenteren wat je hebt gedaan met de oorspronkelijke gegevens om deze geschikt te maken voor analyse. Acties die je met de Power Query-Editor uitvoert worden wel in een script vastgelegd. Probeer daarom zoveel mogelijk de Power-Query-Editor te gebruiken.

Wanneer de gegevens goed gestructureerd zijn kun je ze gemakkelijker modelleren, visualiseren en transformeren waardoor de analyse eenvoudiger wordt. Wanneer je met relationele databases gewerkt heb, herken je veel van de concepten die je ook bij het normaliseren tegen komt.