Wahrscheinlichkeitsverteilungen mit R Sitemap Hypothesentests

Konfidenzintervalle

Eine Statistik aus einer Zufallsstichprobe stellt eine Schätzung des unbekannten Werts des entsprechenden Parameters der Grundgesamtheit dar. So ist z.B. die relative Häufigkeit der Wortform Hund im DWDS-Kernkorpus ein Schätzwert für die relative Häufigkeit dieser Wortform im geschriebenen Deutsch des 20. Jahrhunderts. Man spricht dabei von einem sogenannten Punktschätzer, weil es sich um einzelnen Wert aus der Stichprobe handelt.

Von einem Punktschätzer weiß man naturgemäß zwar nicht, ob er mit dem Wert des entsprechenden Parameters der Grundgesamtheit übereinstimmt oder wie groß der Unterschied zum Parameterwert ist. Man kann lediglich, wenn man die Stichprobenverteilung der Statistik erstellen kann, die Wahrscheinlichkeit ermitteln, dass der Wert der Statistik mit dem des Parameters übereinstimmt. Mit Hilfe der Stichprobenverteilung kann man aber auch ein Intervall von Werten um die Statistik berechnen, dass mit einer gegebenen Wahrscheinlichkeit den Parameterwert umschließt. Das Intervall heißt (aus Gründen, die auf der nächsten Seite erläutert werden) ein Konfidenzintervall und die gegebene Wahrscheinlichkeit das Konfidenzniveau. Ein Konfidenzniveau von 95% z.B. bedeutet, dass in 95% aller Stichproben der Parameterwert der Grundgesamtheit innerhalb des Konfidenzintervalls liegt; dieses heißt dann das 95%-Konfidenzintervall. Da die Wahrscheinlichkeit der Übereinstimmung des Werts des Punktschätzers mit dem Parameterwert immer relativ klein ist, hat man mit einem Konfidenzintervall i.d.R. eine genauere Idee des wahrscheinlichen Parameterwerts.

Konfidenzintervalle für die Statistik einer Stichprobe

Es gibt verschiedene Methoden, Konfidenzintervalle zu berechnen, die jeweils verschiedene Vor- oder Nachteile haben. Für eine binomialverteilte Zufallsvariable X∼B(n, p), die die Voraussetzungen der Normal-Approximation erfüllt, gibt es eine einfache Berechnung des Konfidenzintervalls um die Auftretenswahrscheinlichkeit p (= die relative Häufigkeit X/n) mit Hilfe der Standardisierung:

Als Beispiele berechnen wir die drei 95%-Konfidenzintervalle für die relative Häufigkeit von Hund im DWDS-Kernkorpus:

Konfidenzintervalle für die Differenz der Statistiken zweier Stichproben

Man kann die obige Methode zur Berechnung von Konfidenzintervallen auch auf zwei Stichproben anwenden, um Konfidenzintervalle für die Differenz zweier relativen Häufigkeiten zu berechnen. Wenn die Differenz 0 ausschließt (d.h. die untere und die obere Grenze des Intervalls sind entweder beide < 0 oder beide > 0), kann man daraus schlussfolgern (mit der Wahrscheinlichkeit des Konfidenzniveaus), dass die Statistiken der zwei Stichproben aus unterschiedlichen Grundgesamtheiten (in Bezug auf das gemessene Merkmal) stammen. Wenn dagegen das Intervall 0 einschließt, gilt diese Schlussfolgerung nicht. (Solche Schlussfolgerungen sind Bestandteil von Zwei-Stichproben-Hypothesentests, auf die wir auf der nächsten Seite im Detail eingehen.)

Hier ist die entsprechende Formel für den z-Wert (die zwei Stichproben werden durch die Indizes 1 und 2 unterschieden):

Indem wir z mit dem für das gewählte Konfidenzniveau passenden Wert ersetzen und die Formel für π1 − π2 lösen, erhalten wir das entsprechende Konfidenzintervall, von dem wir mit der durch das Konfidenzniveau ausgedrückte Wahrscheinlichkeit behaupten können, dass die tatsächliche Differenz der Werte der Parameter der zwei Grundgesamtheiten (die vielleicht eine einzige sind) darin liegt.

Als Beispiele berechnen wir wieder die drei 95%-Konfidenzintervalle, jetzt für die Differenz der relativen Häufigkeiten von Hund im DWDS-Kernkorpus und im Korpus der Berliner Zeitung:

R-Funktionen für Konfidenzintervalle

Konfidenzintervalle werden in R üblicherweise berechnet und ausgegeben als Teil von Hypothesentests; darauf gehen wir auf der nächsten Seite im Detail ein. Aber anhand der obigen Formeln kann man eigene Funktionen für Konfidenzintervalle definieren und auch flexibler gestalten als die Standardausgaben in R, und das haben wir auch getan. Die Funktionen konfint.fr(), für Konfidenzintervalle um die Statistik einer Stichprobe, und konfint.fr.diff(), für Konfidenzintervalle für die Differenz der Statistiken zweier Stichproben, werden wie üblich mit dem bekannten source-Aufruf in R geladen:

Anmerkungen:

Hier sind einige Aufrufe und Ausgaben dieser Funktionen für die oben manuell berechneten 95%-Konfidenzintervalle bezüglich der relativen Häufigkeit des Worts Hund für eine bzw. zwei Stichproben:

Wahrscheinlichkeitsverteilungen mit R Sitemap Hypothesentests