Allgemeine Begriffe Sitemap Die DWDS-Anfragesprache

Das DWDS-Abfragesystem

Das DWDS-Abfragesystem ist im Rahmen des Projekts „Digitales Wörtebuch der deutschen Sprache des 20. Jh.“ der Berlin-Brandenburgischen Akademie der Wissenschaften entstanden. Das internetbasierte Abfragesystem besteht aktuell in der 3. Version. Die Korpus-Sammlung umfasst Referenzkorpora, Zeitungskorpora und mehrere Spezialkorpora. Aktuell verfügt DWDS über mehr als zwanzig öffentlich recherchierbare Textkorpora mit einem Gesamtumfang von mehr als 23 Milliarden Tokens, wobei rund die Hälfte der Korpora nur mit Registrierung bei DWDS und Anmeldung zugänglich ist, der Rest ist auch ohne Anmeldung zugänglich.

Das DWDS-Kernkorpus ist das Hauptreferenzkorpus: Es besteht aus einer ausgewogenen Auswahl an Texten aus verschiedenen Bereichen, geschrieben zwischen den Jahren 1900 bis 1999 und hat einen Umfang von gut 100 Millionen Wörtern (Tokens ohne Satzzeichen). Ein zweites Referenzkorpus mit Texten des 21. Jahrhunderts ist im Aufbau. Die Zeitungskorpora enthalten auch viele Texte aus den Jahren seit 2000. Die DWDS-Korpora sind alle lemmatisiert und mit dem Stuttgart-Tübingen Tagset getaggt (morphosyntaktisch annotiert).

Arbeitsablauf mit DWDS

Es gibt in DWDS drei Recherchebereiche oder Ressourcen, wie es auf der DWDS Website heißt: Wörterbücher, Korpora und statistische Auswertungen.

Allgemeine Begriffe Sitemap Die DWDS-Anfragesprache