DWDS dlexDB CLARIN-D

Deutsches Textarchiv (DTA)

Das DTA stellt auf seiner Plattform disziplinen- und gattungsübergreifende Sammlungen und Korpora von deutschsprachigen Texten bereit. Als Grundlage für ein Referenzkorpus der neuhochdeutschen Sprache steht das rund 1500 Titel umfassende DTA-Kernkorpus im Zentrum.

Dieses zeichnet sich aus durch: eine ausbalancierte Textauswahl in den Textsorten, einen Publikationszeitraum, der ab dem frühen 17. Jahrhundert beginnt und bis zum frühen 20. Jahrhundert reicht, die Verwendung von Erstausgaben bei der Digitalisierung, die Wahrung des Sprachstandes sowie adäquater Textstrukturierung bei der Transkription.

DTA-Erweiterungen

Daneben wurden im Rahmen des Moduls DTA-Erweiterungen (DTAE) digitalisierte historische Quellen aus externen Projekten entsprechend den Richtlinien des DTA aufbereitet und in das DTA integriert. Die vorhandene Sammlung des DTA-Kernkorpus wurde so um ein ca. 4.000 Quellen starkes DTA-Erweiterungskorpus, wiederum schwerpunktmäßig aus Quellen des 17. bis 19. Jhs., ergänzt.

Status quo

Aktuell dient das DTA im Rahmen der Nationalen Forschungsdateninfrastruktur (NFDI) im Konsortium Text+ als Repositorium für strukturierte, historische Texte. Zudem stellt das DTA historische Textkorpora für die Wörterbucharbeit im Projekt Wortgeschichte digital – einem Teilprojekt des sich im Aufbau befindenden Zentrum für digitale Lexikographie der deutschen Sprache (ZDL) – zur Verfügung.

Zugänglichkeit und Nachnutzbarkeit

Die elektronischen Volltexte sind frei zugänglich und dank ihrer Aufbereitung durch (computer-)linguistische Methoden schreibweisentolerant über den gesamten Bestand durchsuchbar. Eine Textanalyse wird sowohl durch über das DWDS bereitgestellte Tools wie Wortverlaufskurven oder DiaCollo, also auch über die Anbindung externer Analysetools wie bspw. die Voyant Tools oder das Language Resource Switchboard (LRS) realisiert.

Alle Texte und Korpora des DTA-Grundbestandes (DTA-Kernkorpus und DTA-Erweiterungskorpus) sind entsprechend dem umfassend dokumentierten TEI-P5-Format DTABf aufbereitet und stehen über eine Text-Bild-Ansicht auf der DTA-Website sowie zum Download zur Verfügung.

Neben den auf dieser Seite verfügbaren Texten bieten wir Zugang zu weiteren Ressourcen:

Korpus	Zugang
Polytechnisches Journal	Projektseite, Quellen, Korpussuche im DWDS
Soldatenbriefe (1745–1872)	Quellen, Korpussuche im DWDS
Korpus Patiententexte (1834–1957)	Projektseite, Quellen, Korpussuche im DWDS
A. v. Humboldts Publizistik (dt., 1790–1859)	Projektseite, Quellen, Korpussuche im DWDS
Nachrichten aus der Brüdergemeine (1819–1894)	Korpussuche im DWDS
Der Neue Pitaval (1842–1890)	Korpussuche im DWDS
Briefe von Jean Paul (1780–1825)	Projektseite, Korpussuche im DWDS
Deutsche Kunst und Dekoration (1897–1932)	Korpussuche im DWDS
Neuer Deutscher Novellenschatz (1884–1887)	Quellen, Korpussuche im DWDS
stimm-los – Wiedergefundene Perlen der Literatur	Quellen, Korpussuche im DWDS

Das DTA in Zahlen

Sie können in 5 458 Werken recherchieren.
Weitere Zahlen finden Sie hier.

Neue Werke im DTA

alle Titel …

Stöbern im DTA

Textgattungen/-kategorien:
Veröffentlichungszeit:

Teilprojekte

Download

Alle im DTA angebotenen Texte sind unter einer Creative-Commons-Lizenz zum Download verfügbar.

Videos zum DTA

Klicken Sie auf ein Vorschaubild, um zum Video zu gelangen.

Alle Inhalte dieser Seite unterstehen, soweit nicht anders gekennzeichnet, einer Creative-Commons-Lizenz. Die Rechte an den angezeigten Bilddigitalisaten, soweit nicht anders gekennzeichnet, liegen bei den besitzenden Bibliotheken. Weitere Informationen finden Sie in den DTA-Nutzungsbedingungen.

Insbesondere im Hinblick auf die §§ 86a StGB und 130 StGB wird festgestellt, dass die auf diesen Seiten abgebildeten Inhalte weder in irgendeiner Form propagandistischen Zwecken dienen, oder Werbung für verbotene Organisationen oder Vereinigungen darstellen, oder nationalsozialistische Verbrechen leugnen oder verharmlosen, noch zum Zwecke der Herabwürdigung der Menschenwürde gezeigt werden. Die auf diesen Seiten abgebildeten Inhalte (in Wort und Bild) dienen im Sinne des § 86 StGB Abs. 3 ausschließlich historischen, sozial- oder kulturwissenschaftlichen Forschungszwecken. Ihre Veröffentlichung erfolgt in der Absicht, Wissen zur Anregung der intellektuellen Selbstständigkeit und Verantwortungsbereitschaft des Staatsbürgers zu vermitteln und damit der Förderung seiner Mündigkeit zu dienen.

2007–2024 Deutsches Textarchiv, Berlin-Brandenburgische Akademie der Wissenschaften. Kontakt: redaktion(at)deutschestextarchiv.de.

Zitierempfehlung: Deutsches Textarchiv. Grundlage für ein Referenzkorpus der neuhochdeutschen Sprache. Herausgegeben von der Berlin-Brandenburgischen Akademie der Wissenschaften, Berlin 2024. URL: https://www.deutschestextarchiv.de/.