Twaalf miljoen woorden door kinderen geschreven. Drie jaar lang, twee keer per jaar een extra dicteetje, een opstel en een oefening, van leerlingen verdeeld over heel Nederland, met een zo gevarieerd mogelijke achtergrond. Al die woorden gaan - keurig gelabeld - in een grote database, die daarna beschikbaar komt voor onderzoekers. De Nederlandse Organisatie voor Wetenschappelijk Onderwijs (NWO) gaf er deze week subsidie voor.
Het is een investering zoals die niet zo vaak worden gedaan - meestal gaat subsidiegeld naar projecten waar direct nieuwe wetenschap uit komt. Maar dit is echt een basis waarop het veld zit te wachten,' zegt Agnes Tellings. Samen met Nelleke Oostdijk onderzoekt ze aan de Radboud Universiteit van Nijmegen alles wat met het mentale lexicon - de woordenboeken in je hoofd - te maken heeft.

Eerder al begon Tellings aan een corpus van alle teksten die kinderen tussen groep 4 en groep 8 onder ogen krijgen. Van lesmethoden tot strips, boeken, ondertitelingen en internetpagina's. Ook al die woorden krijgen labels over frequentie, lengte, verwantschap met andere woorden, etc. Hieruit zal een lijst komen van 20.000 woorden die alle achtstegroepers zouden moeten kennen. Het ministerie van onderwijs wil deze als norm gaan gebruiken.

Tellings: Nu we ook de geschreven taal kunnen gaan inventariseren kunnen we die lijst gaan vergelijken met de woorden die kinderen gebruiken. Maar je kunt er veel en veel meer mee. Iedereen die onderzoek doet naar taalontwikkeling bij kinderen, heeft baat bij deze verzameling. We kunnen er denk ik vijftien jaar mee vooruit.'

Het project Basiscript kreeg deze week een subsidie van NWO. Over drienhalf jaar is de verzameling klaar voor gebruik. Eerst maar eens voldoende scholen vinden om mee te doen. Een hele klus - er zijn 6300 leerlingen nodig.

Nationale Onderwijsgids