Die DWDS-Anfragesprache: Einleitung
Die Sucheigenschaften der DWDS-Anfragesprache richten sich nach der
linguistischen Aufbereitung der DWDS-Korpora:
- Die Korpusdaten bestehen aus einer Folge von Zeichen, die in Tokens
aufgeteilt ist, und an jedem Token hängen Markierungen, die durch die
Lemmatisierung und das Tagging hinzugefügt sind.
- Die Markierungen an einem beliebigen Token sind von den Markierungen
an allen anderen Tokens völlig unabhängig, d.h. es gibt keine
Querverweise zwischen den Markierungen.
- Folglich lassen die Markierungen keine über die Tokens
hinausgehenden strukturellen (d.h. syntaktischen) Einheiten im Korpus
erkennen. Das ist der wesentliche Unterschied zwischen (nur)
getaggten Korpora und geparsten Baumbanken.
Weil das Token der Ort der linguistischen Markierungen im Korpus ist,
ist es auch der Mittelpunkt der Suche in DWDS: Eine Anfrage in diesem
Abfragesystem ist eine Anweisung oder Regel, die zwei Festlegungen
macht: (a) welche Tokens gesucht werden sollen und (b) unter welchen
Bedingungen die gefundenen Tokens als Treffer gelten und somit in der
Anzeige der Suchergebnisse erscheinen.
- Eine Anfrage kann natürlich keine eigentlichen Tokens enthalten,
denn ein Token ist eine bestimmte Zeichenfolge an einer
bestimmten Stelle im Korpus. (Auch wenn ein Korpus normalerweise viele
Tokens enthält, die aus der gleichen Zeichenfolge bestehen und die
gleichen Markierungen haben, handelt es sich dennoch um
unterschiedliche Tokens, da sie ja an unterschiedlichen Stellen im
Korpus vorkommen.) Was in einer Anfrage vorkommt, ist der
schriftliche Stellvertreter eines Tokens, der Wortform
oder Worttype oder einfach Type heißt. Dieser steht für
alle möglichen Tokens im Korpus, die dieselbe Form haben (und
dieselben Markierungen, falls vorhanden).
- Eine Anfrage besteht also aus einem oder mehr vollständigen oder
partiellen Types, evtl. zusammen mit bestimmten Zeichen, die nicht
ihre normale Bedeutung haben sondern als Hilfsmittel dienen, um die
Festlegungen der Anfrage-Regel auszudrücken. Welche Zeichen wie
interpretiert werden, unterscheidet sich je nach Abfragesystem.
Die Anfragesprache eines Abfragesystems ist die Gesamtheit der
darin verwendeten Anfrage-Regeln. Die Regeln der DWDS-Anfragesprache,
die für dieses Seminar am sinnvollsten bzw. am nützlichsten sind, lassen
sich in sechs Gruppen einteilen:
Auf den folgenden Seiten werden diese Regeln und ihre unterschiedlichen
Ausprägungen erläutert und Beispiele ihrer Verwendungen gezeigt; es
empfiehlt sich, die Beispiele als Anfrage in DWDS einzugeben (auch die
klickbare Beispiele in der
DWDS-Schnellübersicht).
(Die hier verwendete Nummerierung der Regeln ist dabei beliebig und
kommt auch nicht in der DWDS-Website vor, sondern wird nur hier
verwendet, um den Querverweis innerhalb der Seminar-Website zu
erleichtern.)