Hoe beantwoord je de vraag “is dit Engelse woord populairder geworden?”

Hoe onderzoek je wanneer "training shoes" veranderde in "trainers"?
Tegenwoordig zeggen we “trainers”
Bron: flickr.com/photos/adifans

Onder mijn artikel over ‘vrijblijvend‘ kreeg ik een uitstekende reactie van Benjamin, met daarbij de opmerking:

Zou het een uitdrukking kunnen zijn die in opkomst is?

Dat is een prima opmerking. Sommige woorden en uitdrukkingen waren vroeger veelgebruikt, maar nu niet meer, terwijl sommige andere woorden juist in opkomst zijn. Denk aan het woord ‘influencer’, tien jaar geleden had nog niemand daarvan gehoord!

Maar hoe zoek je dat uit?

Goudmijn voor de taalkunde: het internet!

Om te kijken naar de populariteit van een woord over tijd heb je teksten nodig, veel teksten, gesorteerd naar publicatiedatum. Dat heet een corpus. En dan ga je tellen. Hoe vaak kwam het woord in 1990 voor? En in 1991? En in 2000? Vroeger deden taalkundigen dit dus echt handmatig (nu ja, hun student-assistenten deden het handmatig), later werden teksten gedigitaliseerd en op grote bakbeestcomputers gezet waar academici voor in de wachtrij moesten. Nu is er het internet, en is dit soort taalkundig onderzoek ineens veel makkelijker geworden. Een heuse revolutie, die nog steeds doordendert, want elk jaar komen er weer tools bij.

Helaas zijn sommige tools en bronnen op het internet niet voor niet-academici bereikbaar. Het Corpus Hedendaags Nederlands is bijvoorbeeld alleen toegankelijk voor mensen die aan een universiteit gelieerd zijn, vanwege copyright.

Maar het Engels, hoera, heeft best een aantal bronnen die voor iedereen toegankelijk zijn. Het is nu eenmaal een grote en belangrijke taal.

De drie makkelijkste manieren om te kijken naar Engelse woorden en uitdrukkingen door de jaren heen

Niet alle bronnen zijn geschikt voor het onderzoek waar we het hier over hebben, naar populariteit over de jaren heen. Een corpus dat slechts voor één jaar aan materiaal heeft is natuurlijk niet geschikt, zoals het populaire iWeb dat heel groot is, maar alleen gaat over het jaar 2017.

Hier zijn de drie belangrijkste hulpmiddelen:

1) Als je ver terug wilt: Google N-gram

In 2004 heeft Google bedacht dat ze gewoon alle papieren boeken in alle bibliotheken gaan scannen en online zetten. Dat is niet helemaal gegaan zoals gehoopt, maar er staan nu toch maar mooi 25 miljoen boeken online.

De boeken waar geen copyright meer op staat kun je zelfs helemaal lezen via Google, andere boeken zijn alleen doorzoekbaar, maar niet leesbaar. Misschien heb je het weleens meegemaakt als je iets aan het Googlen was, dat je een resultaat kreeg in Google Books, maar vervolgens alleen het paragraafje waar jouw zoekterm in stond mocht lezen en de rest van het boek niet.

Google N-gram, of compleet gezegd Google Books N-gram Viewer, kijkt voor al die boeken hoe vaak een bepaald woord voorkomt. Je kunt ook termen vergelijken. Omdat er ook flink oude boeken gescand zijn, kun je terugkijken tot 1500! Maar, let op: er zitten haken en ogen aan de conclusies die je uit deze data kunt trekken.

Ik heb hier gekeken naar de vergelijking tussen “Holland” en “Netherlands”. In de jaren ’90 was het blijkbaar populairder om naar ons land te verwijzen met ’the Netherlands’, maar nu nemen beide termen af. Minder interesse in ons land, misschien?

Een andere interessante manier om te kijken naar de populariteit van bepaalde termen is Google Trends. Dan kijk je niet naar hoe vaak een woord in teksten voorkomt, maar hoe vaak ernaar gegoogled werd. Dat betekent dat als een term bijvoorbeeld in het nieuws is, je een stijging zult zien.

De hoogste frequentie van zoekopdrachten wordt op 100 gezet en de rest wordt dan daarmee vergeleken. Voor ons land was dat in 2014, toen we het erg goed deden met voetbal.

Deze grafiek laat meteen ook een groot manco zien van Google Trends, want die stijging in 2021 heeft weinig met ons land te maken, gok ik, maar alles met de acteur Tom Holland die in de Spiderman films speelt. En ook de algemene trend dat er meer naar ‘Holland’ wordt gezocht heeft, denk ik, te maken met het feit dat ‘Holland’ naar veel meer zaken kan verwijzen dan alleen ons land. Het is een achternaam, voornaam, en er zijn ter wereld best veel steden en dorpen die zo heten. Het komt ook voor in de namen van winkelketens zoals Holland & Barret en Holland Cooper. Genoeg redenen om ‘Holland’ te googlen zonder interesse in Nederland, dus.

Tom Holland. Bron: https://www.flickr.com/photos/gageskidmore/28652888235

3) Als je online nieuwsbronnen vanaf 2010 wilt bekijken

Het News of the World Corpus (NOW corpus) is een heel bijzonderdere database omdat er heel veel in staat, omdat hij elke dag wordt ge-update, en omdat hij voor iedereen gratis te doorzoeken is.

Helaas is de site niet erg intuïtief en ook de handleiding die je kunt downloaden is niet voor leken geschreven. Zo heb ik zelf bijvoorbeeld niet begrepen hoe ik twee termen kan vergelijken zoals ik ook hierboven heb gedaan, terwijl dat volgens mij wel mogelijk zou moeten zijn… Ik doe het voor nu dus even zo.

Op nieuwswebsites is de term (the) ‘Netherlands’ dus weer populairder dan ‘Holland’. Niet verbazingwekkend, aangezien dat de officiële naam is van ons land.

Resultaten NOW corpus frequentie ‘Netherlands’
Resultaten NOW corpus frequentie ‘Holland’

Als je wilt zoeken op Twitter

Als je geïnteresseerd bent in taalkunde dan is het je misschien opgevallen dat veel onderzoekers Twitter gebruiken om te kijken naar bijvoorbeeld modern woordgebruik op social media. Dit is omdat Twitter het redelijk makkelijk maakt om een hele bups aan tweets te downloaden en daar vervolgens met speciale tools in te zoeken naar bepaalde termen.

Helaas is dit soort onderzoek specialistisch en ingewikkeld. Niets voor leken dus…

Is er nog een manier die ik niet ken?

De ontwikkelingen gaan zo snel, misschien is er een manier van online woordpopulariteitsonderzoek die ik nog niet ken. Ik ben ook heel benieuwd of er bronnen zijn voor het Nederlands die voor niet-academici bereikbaar zijn! Een site als Delpher is natuurlijk prachtig, maar lijstjes frequenties over de tijd kun je er (volgens mij) niet uithalen. Maar mischien heb ik het ook mis!

Heddwen Newton is an English teacher and a translator from Dutch into English. She thinks about languages way too much, for example about how strange it is that these little blurb things are written in the third person.

Heddwen has two children, two passports, two smartphones, two arms, two legs, and two email newsletters.

English and the Dutch examines all the ways Dutch speakers interact with the English language. It has more than 800 subscribers and is growing every day. Sign up here.

English in Progress is about how the English language is evolving and how it is spoken around the world. It has more than 1400 subscribers and is growing every day. Sign up here.

Meer lezen? GA NAAR EEN WILLEKEURIG ARTIKEL


Reacties

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *