Taak: waarden variabele in kolomkoppen

Een veel voorkomende vorm van een gegevensverzameling is een tabelvorm waarbij de kolomkoppen waarden zijn en geen variabelenamen. De volgende tabel is hier een voorbeeld van. Hierin staat het aantal mannelijke en vrouwelijke studenten dat een bepaalde score (A t/m E) behaald heeft.

Deze gegevensverzameling heeft in feite drie variabelen:

score
Met de waarden A t/m E.
geslacht
Met de waarden man en vrouw
aantal
Met het aantal keren dat de score behaald is, de frequentie

Het probleem is dus dat de waarden van de variabele geslacht in twee kolomkoppen staat.

De eerste variabele score is al een kolom, dat moet dus zo blijven. Voor de variabelen geslacht en aantal moeten nieuwe kolommen gemaakt worden. Voor elke combinatie van score en geslacht moet een rij gemaakt worden.

Bestand: Scores1.xlsx
  1. Open het hulpbestand.
  2. Selecteer een willekeurige cel met gegevens en kies tab Gegevens > Van tabel / bereik (Gegevens ophalen en transformeren.

    Het dialoogvenster Tabel maken verschijnt, waarin de tabelgegevens gespecificeerd kunnen worden. Het gegevensgebied is standaard al goed ingevuld.

  3. Zorg er voor dat de optie voor kopteksten geselecteerd is en klik OK.

    Op het werkblad worden de gegevens allereerst in een Excel tabel omgezet. Daarna wordt in een nieuw venster de Power Query-editor opgestart die de gegevens uit de tabel inleest.

  4. Selecteer in de Power Query editor de eerste kolom score.
  5. Kies tab Transformeren > Draaitabel opheffen voor kolommen (groep Alle kolommen) > Draaitabel voor andere kolommen opheffen.

    Er zijn twee nieuwe kolommen gemaakt. Een kolom Kenmerk (met de waarden voor variabele geslacht) en een kolom Waarde met de aantallen. En voor elke combinatie van score en geslacht is een rij gemaakt.

  6. Selecteer kolom Kenmerk, Rechter muisklik > Naam wijzigen en wijzig de naam in geslacht.
  7. Wijzig op dezelfde manier de naam van kolom Waarde in aantal.
  8. Kies tab Startpagina > Sluiten en laden > Sluiten en laden.

Het resultaat is een tabel met gestructureerde gegevens. Elke kolom is één variabele en elke rij is één waarneming.

Figuur 1. Tabel met gestructureerde gegevens van scores1
Tabel met gestructureerde gegevens van scores1