grenzboten-Korpus

Die nationalliberale Zeitschrift „Die Grenzboten“ erschien zwischen 1841 und 1922 wöchentlich, zeitweise zweiwöchentlich. Das gesamte Korpus umfasst 270 Bände mit ca. 180 000 Einzelseiten.

Das DFG-Projekt „Die Grenzboten – Digitalisierung, Erschließung und Volltexterkennung einer der herausragenden deutschen Zeitschriften des 19. und 20. Jahrhunderts“ wurde als Kooperationsprojekt der Staats- und Universitätsbibliothek Bremen (SuUB) und des Zentrums Sprache der BBAW (Deutsches Textarchiv, DTA) angelegt. Im Rahmen des Projekts erfolgte die TEI-XML-Strukturierung des bereits vorhandenen OCR-Volltextes mit semiautomatischen Methoden und Werkzeugen des DTA sowie die automatische Korrektur von OCR-Fehlern in den Volltexten auf der Grundlage des DTA als Referenzkorpus. Die 270 Bände wurden nach XML/TEI P5 gemäß dem DTA-Basisformat annotiert und sodann sukzessive über die Qualitätssicherungsplattform DTAQ veröffentlicht sowie schließlich an verschiedene CLARIN-D-Plattformen (VLO, FCS) angebunden.

Das „grenzboten“-Korpus wurde nicht in das DTA-Korpus integriert, sondern stellt ein eigenständiges historisches Korpus des Zentrums Sprache dar. Es kann über die DTA-Schnittstelle recherchiert werden. Dabei sind ebenso komplexe Suchanfragen auf Grundlage linguistischer Voranalysen (Lemmatisierung, POS-Tagging, orthographische Normierung) möglich wie Korpusanalyse mit Wortverlaufskurven oder nach Kollokationen (Software: DiaCollo).

Links

Projektbeschreibung

Ansprechpartner

  • Dr. Manfred Nölte (SuUB Bremen)
  • Matthias Boenig (BBAW Berlin)

Zugang zu den Bänden

Kurztitel Jahr DTA