Random Text Sampler

— Posted in Taal & Literatuur by

Soms is het handig om voor een vergelijkend onderzoek steekproeven (samples) van een bepaald aantal woorden uit een tekst te halen. Omdat dat typisch zo’n terugkerend klusje is waaraan ik elke keer toch weer meer tijd kwijt ben dan gedacht, heb ik er maar een online tooltje voor gemaakt.

enter image description here

Random text sampler

Het lijkt me zonde om dat voor mezelf te houden en daarom kan iedereen die dat wil op https://www.reuneker.nl/randsamples een tekst invoeren, het gewenste aantal steekproeven en de steekproefgrootte (in aantal woorden) selecteren en met een druk op de knop de samples tevoorschijn toveren. Je kunt daarbij ook aangeven dat je, per sample en voor het geheel, de type-token-ratio’s en MTLD-scores wilt zien.

Concreet was de aanleiding overigens een klein onderzoekje naar jeugdliteratuur ter illustratie van de t-toets-calculator voor studenten, dat je hier vindt: https://www.reuneker.nl/files/blog/2025/03/zinslengte-in-de-brief-voor-de-koning-en-kinderen-van-moeder-aarde. Mocht je gewoon eens willen kijken hoe e.e.a. werkt, dan kun je gemakkelijk samples nemen uit Jules Vernes Twenty Thousand Leagues under the Sea of Louis Couperus' Stille Kracht, die je met een klik op de desbetreffende knop op het scherm tovert.

New publication in Argumentation: Assessing Classification Reliability...

— Posted in Taal & Literatuur by

Different types and argumentative uses of conditionals (if-then) have been distinguished in the literature, but their applicability to actual language use is rarely evaluated.

As 'the proof of the pudding is in the eating', my new paper in Argumentation (Springer) entitled 'Assessing Classification Reliability of Conditionals in Discourse' addresses this issue by means of an experiment in which the inter-rater reliability of classifications applied to natural-language corpora was assessed.

enter image description here

New publication in Argumentation: 'Assessing Classification Reliability of Conditionals in Discourse'

You can find the paper (open access) in Argumentation here: https://rdcu.be/c9nO4.

Custom reference corpora in keyword analysis

— Posted in Taal & Literatuur by

Today I added the option to directly compare two texts on the keyword analysis page.

Before today, only one general Dutch and one general English reference corpus could be loaded, but much of the time, a custom corpus is needed to get more informative results. For example, say you'd like to see a list of keywords in a certain novel. It makes sense to compare this novel to another novel, as in the screenshot below, or perhaps to a collection of other novels.

enter image description here

Well, now you can. Simply copy-paste the reference corpus to the webpage, and you're good to go.