Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D


Deutsches Textarchiv

Grundlage für ein Referenzkorpus der neuhochdeutschen Sprache

Das Deutsche Textarchiv stellt einen disziplinen- und gattungsübergreifenden Grundbestand deutschsprachiger Texte aus dem Zeitraum von ca. 1600 bis 1900 bereit. Die Textauswahl erfolgte auf der Grundlage einer von Akademiemitgliedern erstellten und ausführlich kommentierten, umfangreichen Bibliographie. In Ergänzung wurden einschlägige Literaturgeschichten und (Fach-)Bibliographien ausgewertet. Aus der Gesamtliste der auf diesem Wege ermittelten Titel wurde von der DTA-Projektgruppe ein hinsichtlich der repräsentierten Textsorten und Disziplinen ausgewogenes Korpus zusammengestellt (weitere Informationen zur Textauswahl).

Um den historischen Sprachstand möglichst genau abzubilden, werden als Vorlage für die Digitalisierung in der Regel die Erstausgaben der Werke zugrunde gelegt. Das elektronische Volltextkorpus des DTA ist über das Internet frei zugänglich und dank seiner Aufbereitung durch (computer-)linguistische Methoden schreibweisentolerant über den gesamten jeweils verfügbaren Bestand durchsuchbar. Sämtliche Texte stehen zum Download zur Verfügung.    mehr …


Neuigkeiten aus dem Projekt

Nachwuchsworkshop “Herausforderungen der Briefkodierung”, 29./30. Oktober 2018, BBAW Berlin

Am 29./30. Oktober 2018 findet an der BBAW der Nachwuchsworkshop “Herausforderungen der Briefkodierung” statt. Diese Veranstaltung wird ausgerichtet durch CLARIN-D und die TEI Correspondence SIG.    mehr …

 

Neues Textformat im DTA: XML (DTABf) mit linguistischer Annotation (TEI class att.linguistic)

We use TEI Seit Kurzem bietet das DTA für jeden DDC-indizierten Volltext mit „TEI/XML (inkl. att.linguistic)“ ein weiteres Datenformat zum Download an, das vielfältige Informationen aus der automatischen linguistischen Analyse mit den strukturellen und semantischen Annotationen aus dem DTA-Basisformat in einem einzelnen XML-Dokument kombiniert.   mehr …

 

Korpus Alpinistischer Texte im Deutschen Textarchiv

Text+Berg digital-Logo

Im Projekt »Text+Berg digital« wurden die Jahrbücher des Schweizer Alpen-Clubs (SAC) aus dem Zeitraum von 1864 bis 2015 digitalisiert. Dieses Korpus konnte nun in zwei Teilen in die Korpora des Zentrums Sprache der BBAW integriert werden.

   mehr …

 

Grimm’sche Kinder- und Hausmärchen, 1.–7. Auflage (1812–1857), jetzt vollständig im Deutschen Textarchiv verfügbar

Frontispiece and decorative title page of 1819 edition of Brothers Grimm Kinder- und Hausmarchen, illustrated by Ludwig Emil Grimm, engraved by L. Haas. (Wikimedia Commons)Die sogenannte Große Ausgabe der Grimm’schen Kinder- und Hausmärchen (14 Bände, 1812–1857) steht seit kurzer Zeit vollständig im Deutschen Textarchiv zur Verfügung.   mehr …

 

Dokumente aus dem Deutschen Textarchiv sind nun mit den Voyant Tools analysierbar

Voyant Tools Logo Ab sofort bietet das Deutsche Textarchiv (DTA) seinen Nutzerinnen und Nutzern die Möglichkeit, jeden DTA-Text mit den von Stéfan Sinclair und Geoffrey Rockwell entwickelten Voyant Tools zu analysieren. Die XML-Volltexte aus dem DTA werden zu diesem Zweck ohne weiteren nutzerseitigen Aufwand präprozessiert, um eine nahtlose Verwendung und optimale Analyseergebnisse zu gewährleisten.

   mehr …

 

Weitere Nachrichten finden Sie im News-Archiv.

Stellenausschreibung

Für die Weiterentwicklung von DTAQ und die Modularisierung der Komponenten im DTA suchen wir eine/n wissenschaftliche/n Mitarbeiter/in ab dem 1. Januar 2019 (100 %, E 13 TV-L Berlin). Weitere Informationen zur Ausschreibung …

Das DTA in Zahlen

Sie können in 3 821 Werken recherchieren.
Weitere Zahlen finden Sie hier.

Das DTA am 21. November 2018

Am 21. November 1768 wurde Friedrich Schleiermacher in Breslau geboren.

Neue Werke im DTA




alle Titel …    

Stöbern im DTA

Download

Alle im DTA angebotenen Texte sind unter einer Creative-Commons-Lizenz zum Download verfügbar.