Korpusstichproben Sitemap

Übungsaufgaben zu statistischer Signifikanz

Abgabefrist: Mittwoch, 03.02.2021

(Den 4. Satz der DWDS-Übungsaufgaben bitte auch nicht vergessen!)

  1. Führen Sie unter Verwendung von binom.test() oder prop.test()
    1. einen einseitigen und
    2. einen zweiseitigen
    Ein-Stichproben-Hypothesentest durch, bei dem Sie die relative Häufigkeit eines Worts oder Lemmas Ihrer Wahl im DWDS-Kernkorpus als Nullhypothese und die entsprechende relative Häufigkeit in einem anderen DWDS-Korpus als alternative Hypothese verwenden.
    Geben Sie für beide Tests jeweils den p-Wert an und schließen Sie auf die statistische Signifikanz des Ergebnisses.
    Berechnen Sie für beide Tests unter Verwendung von konfint.fr() zwei- und einseitige Konfidenzintervalle in pMW, Dezimal, Prozent und absoluten Häufigkeiten.
  2. Führen Sie unter Verwendung von chisq.test() oder prop.test() einen Mehrfach-Stichprobentest, um die Differenzen zwischen den relativen Häufigkeiten eines Suchbegriffs Ihrer Wahl
    1. in mindestens drei DWDS-Korpora, oder in den vier Textklassen des DWDS-Kernkorpus oder des Kernkorpus 21, auf statistisch signifikante Unterschiede zu testen.
    2. Vergleichen Sie das Ergebnis mit den Ergebnissen der entsprechenden Zwei-Stichprobentests zwischen Paaren der Korpora (bzw. Textklassen). Berechnen Sie für diese unter Verwendung von konfint.fr.diff() zweiseitige Konfidenzintervalle in pMW, Dezimal und Prozent.
  3. Führen Sie unter Verwendung von chisq.test() einen Chi-Quadrat-Test durch, um die Differenzen zwischen den proportionalen Häufigkeiten zweier verwandten Wortformen Ihrer Wahl
    1. in den vier Textklassen des DWDS-Kernkorpus oder des Kernkorpus 21, auf statistisch signifikante Unterschiede zu testen.
    2. Vergleichen Sie das Ergebnis mit den Ergebnissen der entsprechenden Zwei-Stichprobentests zwischen Paaren der Korpora (bzw. Textklassen). Berechnen Sie für diese unter Verwendung von konfint.fr.diff() zweiseitige Konfidenzintervalle in pMW, Dezimal und Prozent.
  4. Untersuchen Sie anhand von eigenen Stichproben aus dem DWDS-Kernkorpus die Hypothese, dass der Grad der Formalilät des Schreibstils mit dem Anteil an Sätzen im Passiv zusammenhängt. Gehen Sie dabei wie in diesem Beispiel vor:
Korpusstichproben Sitemap