Übungsaufgaben zu statistischer Signifikanz
Abgabefrist: Mittwoch, 03.02.2021
(Den 4. Satz der
DWDS-Übungsaufgaben bitte auch nicht vergessen!)
- Führen Sie unter Verwendung von
binom.test()
oder prop.test()
- einen einseitigen und
- einen zweiseitigen
Ein-Stichproben-Hypothesentest
durch, bei dem Sie die relative Häufigkeit eines Worts oder Lemmas
Ihrer Wahl im DWDS-Kernkorpus als Nullhypothese und die
entsprechende relative Häufigkeit in einem anderen DWDS-Korpus als
alternative Hypothese verwenden.
Geben Sie für beide Tests
jeweils den p-Wert an und schließen Sie auf die statistische
Signifikanz des Ergebnisses.
Berechnen Sie für beide Tests
unter Verwendung
von konfint.fr()
zwei- und einseitige Konfidenzintervalle in pMW, Dezimal, Prozent und
absoluten Häufigkeiten.
- Führen Sie unter Verwendung von
chisq.test()
oder prop.test()
einen Mehrfach-Stichprobentest, um die
Differenzen zwischen
den relativen Häufigkeiten
eines Suchbegriffs Ihrer Wahl
- in mindestens drei DWDS-Korpora, oder in den vier Textklassen
des DWDS-Kernkorpus oder des Kernkorpus 21, auf statistisch
signifikante Unterschiede zu testen.
- Vergleichen Sie das Ergebnis mit den Ergebnissen der
entsprechenden Zwei-Stichprobentests zwischen Paaren der Korpora
(bzw. Textklassen). Berechnen Sie für diese unter Verwendung
von
konfint.fr.diff()
zweiseitige Konfidenzintervalle in pMW, Dezimal und Prozent.
- Führen Sie unter Verwendung von
chisq.test()
einen
Chi-Quadrat-Test durch, um die Differenzen zwischen
den proportionalen
Häufigkeiten zweier verwandten Wortformen Ihrer Wahl
- in den vier Textklassen des DWDS-Kernkorpus oder des Kernkorpus
21, auf statistisch signifikante Unterschiede zu testen.
- Vergleichen Sie das Ergebnis mit den Ergebnissen der
entsprechenden Zwei-Stichprobentests zwischen Paaren der Korpora
(bzw. Textklassen). Berechnen Sie für diese unter Verwendung
von
konfint.fr.diff()
zweiseitige Konfidenzintervalle in pMW, Dezimal und Prozent.
- Untersuchen Sie anhand von eigenen Stichproben aus dem
DWDS-Kernkorpus die Hypothese, dass der Grad der Formalilät des
Schreibstils mit dem Anteil an Sätzen im Passiv zusammenhängt. Gehen
Sie dabei wie in diesem
Beispiel vor:
- Erstellen Sie Vektoren von Sätzen für die vermutlich eher
formalen und nicht-formalen Stile, die eine Form von werden
enthalten, und geben Sie die Belege aus.
- Überprüfen Sie, wieviele der Belege tatsächlich Sätze im Passiv
sind.
- Dann führen Sie einen Zwei-Stichproben-Hypothesentest durch und
berechnen Sie das entsprechende Konfidenzintervall.