Sitemap zur Website des HS Korpuslinguistik, WS 20/21
Startseite - Organisatorisches, Überblick
Themen und Abgabefristen der Übungsaufgaben
Allgemeine Begriffe der Korpuslinguistik
Korpus und Korpuslinguistik
Korpustypologie
Korpussuche
Korpusauswertung
Das DWDS-Abfragesystem
Arbeitsablauf mit DWDS
Die DWDS-Anfragesprache
Einleitung
Regel 1: Types
Regel 2: Lemmata
Regel 3: Zeichenmuster (i): Platzhalter
Regel 3: Zeichenmuster (ii): Reguläre Ausdrücke
Regel 4: Morphosyntaktische Annotationen (Tags)
STTS: Stuttgart-Tübingen-Tagset
Regel 5: Abstandsangaben
Regel 6: Logische Kombinationen
Übungsaufgaben zur DWDS-Anfragesprache
Häufigkeitsmaße für Korpora
Absolute Häufigkeit
Relative Häufigkeit
Proportionale Häufigkeit
Differenzenkoeffizient
Häufigkeitsklasse
Berechnung von Häufigkeitsmaßen mit R
Einstieg in R
R als Taschenrechner
R als Programmiersprache
Variablen
Funktionen
Selbst-definierte Funktionen
Exkurs: Funktionen definieren
Darstellung von Dezimalzahlen
R-Sitzung beenden, Daten aufräumen und speichern
Übungsaufgaben zu Korpushäufigkeitsmaßen
Häufigkeitsverteilungen in Korpora
Häufigkeitsverteilungen über verschiedene Korpora
Häufigkeitstabellen
Grafische Darstellungen
Häufigkeitsverteilungen über Teilkorpora eines Korpus
Häufigkeitstabellen
Grafische Darstellungen
Häufigkeitsverteilungen von Korpusmerkmalen
Beispiel Wortlänge
Maße von Häufigkeitsverteilungen
Skalenniveaus
Lagemaße (Maße der zentralen Tendenz)
Der Modalwert (Modus)
Der Median
Das arithmetische Mittel
Streuungsmaße (Dispersionsmaße)
Die Spannweite
Quartile und Quantile
Die Standardabweichung
Wann verwendet man welches Maß?
Übungsaufgaben zu Häufigkeitsverteilungen und Maßen von Häufigkeitsverteilungen
Datensätze
Datensätze mit R erstellen
Suchergebnisse aus DWDS exportieren
Suchergebnisse aus DWDS in R einlesen
Mit der Funktion
read.table()
Mit der Funktion
dwds.data.frame()
Beispiele der Verwendung von
dwds.data.frame()
Umgang mit Datensätzen in R
Datensatzspalten
Indizierung
Numerische Index-Vektoren
Logische Index-Vektoren
Die Funktionen
which()
,
which.min()
,
which.max()
Datensatzzeilen
Datensätze ändern
Auswertungen von Datensätzen: Zwei Beispiele
1. Beispiel: Wortverlaufsdiagramme
2. Beispiel: Maße von Häufigkeitsverteilungen
Übungsaufgaben zu Datensätzen
Statistik und Wahrscheinlichkeit
Grundgesamtheit und Stichprobe
Stichprobenverteilung
Zufallsexperiment und Zufallsvariable
Drei wichtige Wahrscheinlichkeitsverteilungen
Binomialverteilung
Exkurs: Wahrscheinlichkeitsfunktion
Grafische Darstellungen
Normalverteilung
Normal-Approximation der Binomialverteilung
Standardisierung
Chi-Quadrat-Verteilung
Wahrscheinlichkeitsverteilungen mit R
R-Funktionen für Wahrscheinlichkeitsverteilungen
Stichprobenverteilung von Korpushäufigkeiten
Simulierte Zufallswerte
Eine Folge des zentralen Grenzwertsatzes
Übungsaufgaben zu Wahrscheinlichkeitsverteilungen
Konfidenzintervalle
Konfidenzintervalle für die Statistik einer Stichprobe
Konfidenzintervalle für die Differenz der Statistiken zweier Stichproben
R-Funktionen für Konfidenzintervalle
Hypothesentests
Ablaufschema
Hypothesentests für binomialverteilte Zufallsvariablen
Beispiel eines Ein-Stichprobentests
Berechnung des p-Werts
R-Funktionen für Hypothesentests einer binomialverteilten Zufallsvariable
Beispiel eines Zwei-Stichprobentests
Berechnung des p-Werts
R-Funktionen für Hypothesentests mit Kontingenztafeln
Weitere Beispiele des Chi-Quadrat-Tests
Mehrfach-Stichproben-Hypothesentest
Hypothesentests mit proportionalen Häufigkeiten
Stichproben aus Korpora
Häufigkeiten komplexer linguistischer Merkmale am Beispiel Passiv
Der Effekt der Stichprobengröße
Übungsaufgaben zu statistischer Signifikanz
Klausur