Taal & Literatuur - Weblog Alex Reuneker

T-toets-calculator

07 March 2025 — Posted in Taal & Literatuur by Alex

Aangezien ik voorzie dat een aantal van mijn studenten verzamelingen van metingen van lexicale diversiteit wil gaan vergelijken, leek het me handig een t-toets-calculator te maken die gemakkelijk te gebruiken is en de juiste rapportage geeft van zowel significantie als effectgrootte (in termen van Cohen's d). Een en ander kan nog wat opgepoetst worden, maar de pagina is wel functioneel.

enter image description here Online t-toets-calculator

Je kunt 'm gebruiken op https://www.reuneker.nl/files/t/ en als je nog geen data hebt om te testen, dan kun je door middel van een druk op de knop een voorbeeldonderzoekje tevoorschijn roepen.

Hapax en dis legomena

05 March 2025 — Posted in Taal & Literatuur by Alex

Hapax legomena, woorden die maar eenmaal voorkomen in een tekst, worden onder andere gebruikt om auteurschap van een tekst te bepalen. Hoewel daar tegenwoordig andere, robuustere manieren voor bestaan, worden hapax legomena nog wel gebruikt in corpusonderzoek en daarbuiten – zo laat onderzoek van Hernández-Domínguez et al. (2018) zien dat de frequentie van hapax en dis legomena (woorden die respectievelijk een- en tweemaal voorkomen) gecorreleerd is aan cognitieve stoornis (zie ook Alegria & Radanovic, 2019).

Voor vertalingen van bijbelteksten en (andere) klassieke teksten vormen hapax legomena een moeilijkheid; de betekenis van de woorden is moeilijk te achterhalen, omdat dat meestal gebeurt door verschillende gebruiken/contexten met elkaar te vergelijken en bij hapaxen kan dat niet.

Hoe dan ook, op https://www.reuneker.nl/ld kun je zelf de hapaxen uit een tekst halen. Wist je bijvoorbeeld dat het woord koffiegod precies een keer voorkomt in de Max Havelaar, namelijk in de onderstaande passage?

Scherp en onverwacht is de wending waar Droogstoppel wordt weggedoemd: verdwijn, stik in koffie, en waar de schrijver zelf optreedt; en wilder en demonischer dan eenige andere bladzij Nederlandsch is de woede kreet, de laatste toon die klinkt van dit veelsnarig instrument. Dat boek tastte Nederland aan in een van zijn idioten, den koffiegod van 't batig slot.

enter image description here

Hapax Legomena in de Max Havelaar

Hapax Legomena added to Lexical Diversity tool

03 March 2025 — Posted in Taal & Literatuur by Alex

In mailing back and forth with one of the researchers over at the Max Planck Institute, there was some confusion over the use of the term unique words in the Lexical Diversity tool. Unique words are not hapax legomena, which is the term in corpus linguistics for words that only occur once. Unique words are simply types and count up to the number of different words in a text. A word might occur once, twice or twenty times, but in all three cases, it would count as one unique word. This measure is also used for calculating the type-token-ratio. As the researcher was interested in how many words occur only once in a text, I've added this count. You can use the new feature here right away!

enter image description here

Hapax legomena in the Lexical Diversity tool

Digital Humanities Small Grant - Results

28 February 2025 — Posted in Taal & Literatuur by Alex

The two projects subsidised through the Leiden University Centre for Digital Humanities Small Grant are nearly finished, and the grant webpage of the overarching project entitled 'D or t? Using Big Data to Explore Linguistic Factors in Dutch Verb Spelling' has been updated accordingly.

Using big data, we were able to enhance the academic knowledge of two specific factors in verb-spelling errors and to offer evidence-based solutions to long-lasting and persistent problem in Dutch language education.

enter image description here

Writing and verb spelling

For more info on the two projects ('Study 1: The spelling of homophonic verbs preceding the reduced possessive and personal pronoun je' and 'The spelling of the imperative mood in secondary education'), visit https://www.universiteitleiden.nl/en/humanities/centre-for-digital-humanities/projects/small-grants-2024-research-projects#alex-reuneker.

There's more to life than books you know, but not much more

11 February 2025 — Posted in Taal & Literatuur by Alex

Gisteren was ik in de UB (Universiteitsbibliotheek) en daar werd ik blij verrast door het volgende citaat van The Smiths. Mooi dat het een prominente plek in dit thuishonk voor boekenliefhebbers heeft gekregen!

enter image description here

There's more to life than books you know, but not much more.

Het citaat komt overigens uit het nummer Handsome Devil en het gaat om een van de laatste zinnen – even doorluisteren dus, maar dat is zeker geen straf.