Datacleaning: wat is het eigenlijk?

HomeDatacleaning: wat is het eigenlijk?
26 juli 2021

Voordat je begint met de analyse van je data is het goed om te controleren of het veldwerk dat je hebt gedaan goed is uitgevoerd en geregistreerd. Zijn er voldoende respondenten, voldoende vragenlijsten, voldoende observaties, voldoende interviews? En het belangrijkste is je data representatief? Is het representatief voor de gehele onderzoekspopulatie? Om hierachter te komen is het goed om aan datacleaning te doen. Maar wat is dat eigenlijk?

Kwalitatieve datacleaning

Bij interviews of groepsgesprekken wil het wel eens dat er bepaalde informatie onderbelicht blijft. Kijk daarom halverwege je veldwerk of je al antwoord kunt geven op je onderzoeksvragen. Je hebt dan namelijk nog tijd om extra gesprekken in te plannen of je protocol aan te passen. Op deze manier krijg je alsnog de informatie boven die je nodig hebt. Wanneer je hier aan het eind van je veldwerk achter komt, moet je extra gesprekken inplannen om alsnog achter de informatie te komen.

Kwantitatieve datacleaning

Bij kwantitatieve data is het belangrijk om te controleren of je voldoende respons hebt ontvangen. Tevens kijk je of de aantallen representatief zijn voor je onderzoekspopulatie. Doe je een onderzoek in de provincie en je hebt alleen respons van één gemeente, dan is dit niet representatief voor de gehele provincie. Naast representativiteit moet je ook controleren op fouten bij invoeren en registreren. Als je fouten ontdekt in de registratie, kijk of je het kunt corrigeren zonder dat de data wordt veranderd. Als je veel fouten ontdekt, kijk waar de fout ligt en pas de vragenlijst aan en controleer intensiever de data.

Controleer of respondenten minimaal 2/3 van de vragen die ze hebben gekregen hebben ingevuld. Let op: soms krijgen ondervraagden slechts een deel van de vragenlijst te zien. Houd daar rekening mee. Als iemand minder dan 2/3 van de vragen heeft ingevuld, moet deze uit het databestand worden verwijderd.

Bekijk tevens de antwoorden van de respondenten, spreken de antwoorden elkaar tegen? Zijn de vragenlijsten ingevuld om ervan af te zijn, als iemand bijvoorbeeld altijd het eerste antwoord heeft aangekruist. Als er te veel interne tegenspraak is, de vragenlijst te onzorgvuldig ingevuld is of veel antwoorden ontbreken, verwijder dan de gehele vragenlijst. Deze antwoorden zijn niet betrouwbaar.

Zorg dat je een databestand hebt waar de goede data in staat, waarmee je de analyse kunt maken. Hierdoor wordt je analyse makkelijker en representatief.

Overzicht in je onderzoek

Wil jij overzicht in je onderzoek? Download mijn cheatsheet en je weet wanneer je wat moet doen in je onderzoek
Vraag hier de cheatsheet aan

Gerelateerde blogs

10 oktober 2023
De cultuurcoach: wat doet die eigenlijk?

In steeds meer gemeentes werkt tegenwoordig een cultuurcoach of combinatiefunctionaris. Er wordt hiervoor gekozen omdat een schakel nodig is culturele […]

Lees meer
11 september 2023
Items samenvoegen tot een schaal

Om diverse redenen kan het in een onderzoek voorkomen dat je meer vragen stelt over hetzelfde begrip. De analyse van […]

Lees meer
15 augustus 2023
Je hebt een bezoekersonderzoek gedaan en dan?

Je hebt een bezoekersonderzoek gedaan en dan? Je hebt een bezoekersonderzoek uitgezet, je hebt voldoende respons en de resultaten van […]

Lees meer
22 juli 2023
8 vormen om je onderzoeksresultaten te verspreiden

Bij een onderzoeksrapportage denken veel mensen, helaas, nog steeds aan een lijvig boekwerk dat leest als een spannend boek (er […]

Lees meer
Ericssonstraat 2
5121 ML  Rijen
Nederland
Claudia’s hart ligt bij onderzoek. Haar werkwijze is heel persoonlijk; ieder onderzoek vraagt tenslotte om maatwerk. Samen met de klant formuleert ze doelen, die ze vervolgens ook realiseert. Daarbij is ze volkomen transparant en deelt ze graag haar kennis en ervaring met anderen via haar laagdrempelige digitale cursussen en e-books.
© 2022 – 2024 Claudia de Graauw. Alle rechten voorbehouden.
homeenvelopesmartphone