Übung: Korpuslinguistik (050400)

Module

M.A.: AM Grammatik der Gegenwartssprache
M.A.: Forschungsmodul Germanistische Linguistik

Organisatorisches

Zeit

Mittwoch 10:00 – 12:00

Raum

IT-Pool (GB 03/149)

Dozent

Stephen Berman
E-mail: stephen.berman@rub.de
Homepage: http://homepage.rub.de/Stephen.Berman/Korpuslinguistik

Scheinerwerb

2 Credit Points für Regelmäßige Teilnahme und die Bearbeitung von Übungsaufgaben.

Inhalt

Überblick

Ein Korpus ist eine Sammlung von sprachlichen Daten, die nach linguistischen Kriterien zusammengestellt und meist annotiert sind, d.h. sie sind mit Informationen wie Wortart und Flexionsmerkmalen versehen. Manche Korpora – so genannte Baumbanken – enthalten darüber hinaus Annotationen zu syntaktischer Struktur und Funktion. Für viele Korpora gibt es spezielle Suchmaschinen, die für den Umgang mit den Annotationen programmiert sind und damit gezielte linguististisch interessante Suchanfragen ermöglichen.

Diese Übung, die sich insbesondere an MA-Studierende richtet, stellt die Suchmaschinen Cosmas II, DWDS und TIGERSearch und die dazugehörigen Korpora vor und führt in die linguistische Recherche mit diesen Werkzeugen ein. Die Korpora des IDS (für Cosmas II) und des Projekts DWDS stellen die größten morphosyntaktisch annotierten deutschsprachigen Korpussammlungen dar, die im Internet frei verfügbar sind. Das TIGER-Korpus ist eine der größten deutschsprachigen Baumbanken.

Themen

Allgemeines

Besondere Korpora und Abfragesysteme

Sitemap Definitionen und Begriffe