Datacleaning: wat is het eigenlijk?

Datacleaning: wat is het eigenlijk?

Heb jij nog overzicht in je onderzoek? Weet je wat de volgende stap is?  Download direct mijn cheatsheet en krijg weer overzicht in je onderzoek!

Voordat je begint met de analyse van je data is het goed om te controleren of het veldwerk dat je hebt gedaan goed is uitgevoerd en geregistreerd. Zijn er voldoende respondenten, voldoende vragenlijsten, voldoende observaties, voldoende interviews? En het belangrijkste is je data representatief? Is het representatief voor de gehele onderzoekspopulatie? Om hierachter te komen is het goed om aan datacleaning te doen. Maar wat is dat eigenlijk?

Kwalitatieve datacleaning

Bij interviews of groepsgesprekken wil het wel eens dat er bepaalde informatie onderbelicht blijft. Kijk daarom halverwege je veldwerk of je al antwoord kunt geven op je onderzoeksvragen. Je hebt dan namelijk nog tijd om extra gesprekken in te plannen of je protocol aan te passen. Op deze manier krijg je alsnog de informatie boven die je nodig hebt. Wanneer je hier aan het eind van je veldwerk achter komt, moet je extra gesprekken inplannen om alsnog achter de informatie te komen.

 

Kwantitatieve datacleaning 

Bij kwantitatieve data is het belangrijk om te controleren of je voldoende respons hebt ontvangen. Tevens kijk je of de aantallen representatief zijn voor je onderzoekspopulatie. Doe je een onderzoek in de provincie en je hebt alleen respons van één gemeente, dan is dit niet representatief voor de gehele provincie. Naast representativiteit moet je ook controleren op fouten bij invoeren en registreren. Als je fouten ontdekt in de registratie, kijk of je het kunt corrigeren zonder dat de data wordt veranderd. Als je veel fouten ontdekt, kijk waar de fout ligt en pas de vragenlijst aan en controleer intensiever de data.  

Controleer of respondenten minimaal 2/3 van de vragen die ze hebben gekregen hebben ingevuld. Let op: soms krijgen ondervraagden slechts een deel van de vragenlijst te zien. Houd daar rekening mee. Als iemand minder dan 2/3 van de vragen heeft ingevuld, moet deze uit het databestand worden verwijderd. 

Bekijk tevens de antwoorden van de respondenten, spreken de antwoorden elkaar tegen? Zijn de vragenlijsten ingevuld om ervan af te zijn, als iemand bijvoorbeeld altijd het eerste antwoord heeft aangekruist. Als er te veel interne tegenspraak is, de vragenlijst te onzorgvuldig ingevuld is of veel antwoorden ontbreken, verwijder dan de gehele vragenlijst. Deze antwoorden zijn niet betrouwbaar. 

Zorg dat je een databestand hebt waar de goede data in staat, waarmee je de analyse kunt maken. Hierdoor wordt je analyse makkelijker en representatief.  

keuze kwantitatief kwalitatief

Keuze: kwalitatief onderzoek of kwantitatief onderzoek?

In mijn vorige blog ‘Kwalitatief en kwantitatief onderzoek: Wat is wat?’ heb ik uitgelegd wat het verschil is tussen kwantitatief en kwalitatief onderzoek. In dit blog ga ik in op wat voor soort onderzoeksonderwerpen vragen om een kwalitatieve aanpak en welke juist een kwantitatieve aanpak vereisen.

Read More »
tips subsidie aanvragen

Tips voor het doen van subsidie aanvragen

Het aanvragen van een subsidie voor je project, programma of activiteit bij een gemeente, provincie of een landelijk fonds kan lastig zijn. Vooral als je een kleine organisatie bent met weinig ervaring in fondsenwerving.

Read More »

Waarom is een dashboard interessant?

Steeds vaker wordt er een dashboard gebouwd om data om te zetten in informatie voor analyse. In het dashboard staan de interessante samengevatte gegevens. Van verzamelde data wordt informatie gemaakt. Het dashboard bestaat uit grafieken en tabellen en rapporteert over de indicatoren die van belang zijn. Met behulp van filters kan desgewenst ingezoomd worden. Het dashboard wordt steeds geüpdate als er nieuwe data wordt toegevoegd.

Read More »