Übungsaufgaben zu Korpushäufigkeitsmaßen
Abgabefrist: Mittwoch, 11.11.2020
In den folgenden Übungsaufgaben sollen Sie Häufigkeitsmaße in DWDS mit
R durch Aufruf der entsprechenden
selbst-definierten R-Funktionen
berechnen (die Sie
vorher in R laden müssen).
Geben Sie in Ihren Lösungen jeweils an:
- die von Ihnen verwendeten DWDS-Korpora und Ihre jeweilige Größe in
Tokens (die Sie hier finden) (in
Aufgabe 3 auch die Größe der Teilkorpora, die
Sie hier abfragen
können);
- die von Ihnen formulierte Anfrage;
- die von DWDS angezeigte absolute Häufigkeit (insgesamt, falls nicht
alle Treffer anzeigbar sind und in Aufgabe 3 auch für die
Teilkorpora);
- und alle Ihrer R-Eingaben sowie die R-Ausgaben.
- Berechnen Sie für einen Worttype oder ein Lemma Ihrer Wahl
(d.h. suchen Sie sich einen Worttype oder ein Lemma aus) die relativen
Häufigkeiten sowohl als Dezimalzahl als auch in Prozent und in pMW in
fünf verschiedenen DWDS-Korpora.
- Berechnen Sie für einen Worttype Ihrer Wahl, die mindestens zwei
Varianten hat, die proportionalen Häufigkeiten der Varianten in fünf
verschiedenen DWDS-Korpora. Mögliche Worttypes sind z.B. Verbformen
im Präteritum wie sandte, sendete oder Partizipformen
wie gesandt, gesendet oder Substantive im Plural wie Dinge,
Dinger oder Blöcke, Blocks. Weitere Möglichkeiten können
Sie z.B. in einer Grammatik wie der Duden finden.
- Berechnen Sie für einen Worttype oder ein Lemma Ihrer Wahl im DWDS
Kernkorpus die Differenzenkoeffizienten bezüglich jeder Textklasse
sowie einer Dekade Ihrer Wahl als Teilkorpora (insgesamt also fünf
Differenzenkoeffizienten).
- Berechnen Sie die Häufigkeitsklasse eines Worttypes oder Lemmas
Ihrer Wahl in fünf verschiedenen DWDS-Korpora.
- Erstellen Sie Tabellen der Häufigkeitsklassen für fünf verschiedene
DWDS-Korpora (außer dem Kernkorpus).