Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D


Deutsches Textarchiv

Grundlage für ein Referenzkorpus der neuhochdeutschen Sprache

Das Deutsche Textarchiv stellt einen disziplinen- und gattungsübergreifenden Grundbestand deutschsprachiger Texte aus dem Zeitraum von ca. 1600 bis 1900 bereit. Die Textauswahl erfolgte auf der Grundlage einer von Akademiemitgliedern erstellten und ausführlich kommentierten, umfangreichen Bibliographie. In Ergänzung wurden einschlägige Literaturgeschichten und (Fach-)Bibliographien ausgewertet. Aus der Gesamtliste der auf diesem Wege ermittelten Titel wurde von der DTA-Projektgruppe ein hinsichtlich der repräsentierten Textsorten und Disziplinen ausgewogenes Korpus zusammengestellt (weitere Informationen zur Textauswahl).

Um den historischen Sprachstand möglichst genau abzubilden, werden als Vorlage für die Digitalisierung in der Regel die Erstausgaben der Werke zugrunde gelegt. Das elektronische Volltextkorpus des DTA ist über das Internet frei zugänglich und dank seiner Aufbereitung durch (computer-)linguistische Methoden schreibweisentolerant über den gesamten jeweils verfügbaren Bestand durchsuchbar. Sämtliche Texte stehen zum Download zur Verfügung.    mehr …


Neuigkeiten aus dem Projekt

DTA und DWDS auf dem 3. Workshop der CLARIN-D Fach-Arbeitsgruppen (Leipzig)

CLARIN-D-LogoDas DTA wurde als wichtige Korpusressource innerhalb des Verbundprojekts CLARIN-D in mehreren Vorträgen auf dem 3. Workshop der CLARIN-D Fach-Arbeitsgruppen (Leipzig, 30.6.-1.7.2015) thematisiert. In dem Vortrag "Das DDR-Pressekorpus. Computerlinguistische Analysenverfahren als Anwendungsszenario für die Historische Semantik" stellten Prof. Dr. Martin Sabrow (Potsdam, ZZF) und Dr. Alexander Geyken (Berlin, BBAW: DWDS, DTA und CLARIN-D) gemeinsam computerlinguistische Werkzeuge für den Einsatz in der zeitgeschichtlichen Forschung vor.   mehr …

 

Das DTA in zwei Vorträgen auf der DHd-Jahrestagung 2015

DHd 2015 LogoDas DTA war in zwei Vorträgen auf der diesjährigen Tagung des Verbandes „Digital Humanities im deutschsprachigen Raum” (DHd) vertreten, die vom 23. bis 27. Februar in Graz (Österreich) stattfand. Die Tagung stand unter dem Motto Von Daten zu Erkenntnissen: Digitale Geisteswissenschaften als Mittler zwischen Information und Interpretation.   mehr …

 

Weitere Nachrichten finden Sie im News-Archiv.

Das DTA in Zahlen

1 636Werke
466 644digitalisierte Seiten
111 645 560fortlaufende Wortformen
780 804 512Zeichen (Unicode)
1099weitere Werke in DTAQ

Neue Werke im DTA




alle Titel …    

Stöbern im DTA

Download

Alle im DTA angebotenen Texte sind unter einer Creative-Commons-Lizenz zum Download verfügbar.