Suchtechnologie

1. Kurzgefasst

Die im Deutschen Textarchiv verwendete Suchmaschine DDC (Dialing/DWDS-Concordancer) wurde im BBAW-Arbeitsvorhaben Digitales Wörterbuch der deutschen Sprache entwickelt. Sie ermöglicht neben der Suche im Volltext oder in den bibliographischen Metadaten auch linguistische Recherchemöglichkeiten, sowie eine Kombination der verschiedenen Suchmöglichkeiten.

2. Eigenschaften der Suchmaschine

Die Suchmaschine DDC ist eine linguistische Suchmaschine. Sie bietet die klassischen Suchmöglichkeiten wie Abstandssuche, Trunkierung, und die Boolesche Suchoperatoren UND, ODER und NICHT. Darüber hinaus ermöglicht sie auch die Suche nach Wortstämmen, so dass beispielsweise Treffer aller flektierten Formen eines bestimmten Verbes mit nur einer einzigen Suchanfrage gefunden werden können.

DDC kann beliebige Metadaten mitindizieren, die bei der Erstellung des Index als XPath-Ausdrücke angegeben werden können, auch Seitenangaben in Dokumenten können ausgegeben werden. Im DTA werden diese Eigenschaften der Suchmaschine für die Indizierung der bibliographischen Metadaten eingesetzt.

Jeder Indexeintrag kann mit beliebig vielen linguistischen Annotationen versehen sein, nach denen auch gesucht werden kann. Für die DTA-Suche wird derzeit die Suche nach Wortform und Wortstamm verwendet.

3. Suchsyntax

Die komplexen Suchmöglichkeiten im DTA stehen Ihnen formularbasiert unter dem Menüpunkt Erweiterte Suche zur Verfügung. Sie können die Anfragen auch direkt im einfachen Suchformular in der DDC-Suchsyntax formulieren. Nachfolgend erhalten Sie einen Überblick über die Suchmöglichkeiten im Volltext.

SuchanfrageBedeutungErgebnis
AugeNormale Suche, findet auch zugehörige Wortformen und historische orthografische Varianten"Auge", "Auges", "Augen" usw.
@Mond Suche nach exakter Wortform "Mond", aber nicht "Mondes", "Monde" usw.
Auge* Rechtstrunkierte Suche "Auge", "Augenlicht", "Augenzeugen", "Augenscheinlich" usw.
auge* Rechtstrunkierte Suche "augenscheinlicher", "augenblicklichen", "augentröstlich" usw.
*kopf Linkstrunkierte Suche "Dummkopf", "Kindskopf", "Kehlkopf" usw.
"gut Frau" Suche nach Wortfolge, findet auch flektierte Formen "gute Frau", "gute Frauen" usw.
"ein #1 Jahr" Abstandssuche, #x gibt den maximalen Abstand an "ein Jahr", "ein gutes Jahr", "ein neues Jahr" usw., aber nicht "ein gutes neues Jahr"
gut || Frau ODER-Verknüpfung auf Satzebene alle Sätze, in denen eine Form von "gut" oder "Frau" vorkommt
gut & & Frau UND-Verknüpfung auf Satzebene alle Sätze, in denen eine Form von "gut" und "Frau" vorkommt
gut && !Frau NICHT-Verknüpfung auf Satzebene alle Sätze, in denen eine Form von "gut", aber keine Form von "Frau" vorkommt
wollen && ((@Männer || @Mann) || (Frau || Weib)) Was Frauen und Männer wollen selber nachsehen

Bitte beachten Sie die Groß- und Kleinschreibung bei Ihrer Suche. Die DTA Suche ist case-sensitive.

4. Weiterführende Informationen

DDC ist unter der GNU Public License frei verfügbar und wird von Sourceforge gehostet. Weitere Informationen zur DDC Suchmaschine finden Sie auf der Website des DWDS.