Häufigkeitsmaße mit R Sitemap

Übungsaufgaben zu Korpushäufigkeitsmaßen

Abgabefrist: Mittwoch, 11.11.2020

In den folgenden Übungsaufgaben sollen Sie Häufigkeitsmaße in DWDS mit R durch Aufruf der entsprechenden selbst-definierten R-Funktionen berechnen (die Sie vorher in R laden müssen). Geben Sie in Ihren Lösungen jeweils an:

  1. Berechnen Sie für einen Worttype oder ein Lemma Ihrer Wahl (d.h. suchen Sie sich einen Worttype oder ein Lemma aus) die relativen Häufigkeiten sowohl als Dezimalzahl als auch in Prozent und in pMW in fünf verschiedenen DWDS-Korpora.
  2. Berechnen Sie für einen Worttype Ihrer Wahl, die mindestens zwei Varianten hat, die proportionalen Häufigkeiten der Varianten in fünf verschiedenen DWDS-Korpora. Mögliche Worttypes sind z.B. Verbformen im Präteritum wie sandte, sendete oder Partizipformen wie gesandt, gesendet oder Substantive im Plural wie Dinge, Dinger oder Blöcke, Blocks. Weitere Möglichkeiten können Sie z.B. in einer Grammatik wie der Duden finden.
  3. Berechnen Sie für einen Worttype oder ein Lemma Ihrer Wahl im DWDS Kernkorpus die Differenzenkoeffizienten bezüglich jeder Textklasse sowie einer Dekade Ihrer Wahl als Teilkorpora (insgesamt also fünf Differenzenkoeffizienten).
  4. Berechnen Sie die Häufigkeitsklasse eines Worttypes oder Lemmas Ihrer Wahl in fünf verschiedenen DWDS-Korpora.
  5. Erstellen Sie Tabellen der Häufigkeitsklassen für fünf verschiedene DWDS-Korpora (außer dem Kernkorpus).

Häufigkeitsmaße mit R Sitemap