Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D


Deutsches Textarchiv

Grundlage für ein Referenzkorpus der neuhochdeutschen Sprache

Das Deutsche Textarchiv stellt einen disziplinen- und gattungsübergreifenden Grundbestand deutschsprachiger Texte mit einem Schwerpunkt ab dem frühen 16. bis zum frühen 20. Jahrhundert bereit. Hauptziel des von der Deutschen Forschungsgemeinschaft (DFG) von 2007 bis 2016 geförderten Projekts war die Erstellung des sog. DTA-Kernkorpus. Dieses DTA-Kernkorpus umfasst etwa 1500 Titel aus dem Zeitraum von ca. 1600 bis 1900, die aufgrund ihrer herausragenden Bedeutung für die Entwicklung der deutschen Sprache bzw. der jeweiligen Genres und wissenschaftlichen Disziplinen ausgewählt wurden (weitere Informationen zur Textauswahl). Unter anderem aufgrund des sprachgeschichtlichen Fokus des DTA und um den historischen Sprachstand möglichst genau abzubilden, wurden dabei als Vorlage für die Digitalisierung in der Regel die historischen Erstausgaben ausgewählt (Auswahl der Exemplare für die Digitalisierung).

Über das DTA-Kernkorpus hinaus integriert das DTA eine Vielzahl weiterer Texte aus dem Zeitraum etwa von der Mitte des 15. bis etwa zur Mitte des 20. Jahrhunderts als DTA-Erweiterungen (DTAE), die aus kooperierenden Projekten und weiteren externen Quellen stammen.

Das elektronische Volltextkorpus des DTA ist über das Internet frei zugänglich und dank seiner Aufbereitung durch (computer-)linguistische Methoden schreibweisentolerant über den gesamten jeweils verfügbaren Bestand durchsuchbar. Sämtliche Texte stehen zum Download zur Verfügung.    mehr …


Neuigkeiten aus dem Projekt

DTA-Korpora jetzt noch freier nachnutzbar: „NonCommercial“-Einschränkung entfällt für etwa 2000 Dokumente

Open-Access-Logo, via Creative Commons

Nach einer umfassenden Änderung der Lizenzierung sind die DTA-Korpora nun noch freier und unkomplizierter für die Allgemeinheit nachnutzbar: Die etwa 1500 Texte des DTA-Kernkorpus sowie viele hundert Einzeltexte aus den den DTA-Erweiterungen (DTAE) stehen nun unter der freien Creative Commons-Lizenz CC BY-SA 4.0 zur Verfügung.

   mehr …

 

Handbuch „Encoding Correspondence“: Open Peer Review eröffnet

Screenshot der Encoding-Correspondence-WebsiteDas Handbuch „Encoding Correspondence. A Manual for Encoding Letters and Postcards in TEI-XML and DTABf“ ist seit kurzem mit den ersten Artikeln unter https://encoding-correspondence.bbaw.de online. Das Handbuch soll Editor/-innen dabei helfen, im Rahmen von digitalen Editionen und Projekten die Texte von Briefen und Postkarten mitsamt ihren Metadaten in TEI-XML und DTABf zu kodieren. Die wissenschaftliche Community ist herzlich und nachdrücklich eingeladen, die einzelnen Artikel kritisch zu lesen und ihr Feedback zu geben.   mehr …

 

Das erste „DTA-Buch“ ist erschienen – Humboldt/Kohlrausch: Die Kosmos-Vorlesung an der Berliner Sing-Akademie

Humboldt/Kohlrausch: Die Kosmos-Vorlesung an der Berliner Sing-Akademie (Insel, 2019)

Alexander von Humboldt, Henriette Kohlrausch: Die Kosmos-Vorlesung an der Berliner Sing-Akademie. Herausgegeben von Christian Kassung und Christian Thomas. Berlin: Insel Verlag, 2019.

2019, zum Jubiläum seines 250. Geburtstages, ist im im Suhrkamp/Insel Verlag eine Nachschrift der 1827/28 gehaltenen ›Kosmos-Vorträge‹ Alexander von Humboldts in einer gedruckten Ausgabe, herausgegeben von Christian Kassung (Humboldt-Universität zu Berlin) und Christian Thomas (BBAW), erschienen.

   mehr …

 

Neue Werkzeuge für das Deutsche Textarchiv über CLARINs Language Resource Switchboard (LRS) zugänglich

CLARIAH-DE Logo

Alle im DTA enthaltenen Texte können ab sofort an das Language Resource Switchboard (LRS) übermittelt und mit den dort zur Verfügung stehenden Werkzeugen analysiert werden.

   mehr …

 

Veröffentlichung des Korpus Digitale Sammlung Deutscher Kolonialismus im Deutschen Textarchiv

DSDK Fact Sheet

Das mehr als 1000 Titel mit ca. 180000 Seiten umfassende Korpus „Digitale Sammlung Deutscher Kolonialismus“ (DSDK) ist ab sofort in der Qualitätssicherungsplatform des Deutschen Textarchivs, DTAQ verfügbar.

   mehr …

 

Neues Forschungsprojekt „Die Evolution von komplexen Textmustern“

Im Juni/Juli 2019 startete am Zentrum Sprache der BBAW sowie am Lehrstuhl für Germanistische und Allgemeine Sprachwissenschaft der Universität Paderborn das Kooperationsprojekt Die Evolution von komplexen Textmustern: Entwicklung eines korpuslinguistischen Analyseverfahrens zur Erfassung der Mehrdimensionalität des Textmusterwandels. Das Projekt wird neu von der DFG gefördert und soll geeignete Indikatoren für historischen Textmusterwandel anhand einschlägiger Textsorten der Gebrauchsliteratur der jüngeren Sprachgeschichte (Erbauungsliteratur und Zeitungen) ermitteln.    mehr …

 

Das DTA-Basisformat bekommt Verstärkung

DTA-Basisformat Die Pflege und Weiterentwicklung des DTA-Basisformats (DTABf) wird nun durch eine Steuerungsgruppe begleitet. Erweiterungen des Formats, neue Features und Korrekturen werden öffentlich diskutiert und durch das Gremium verabschiedet.   mehr …

 

Neues Textformat im DTA: XML (DTABf) mit linguistischer Annotation (TEI class att.linguistic)

We use TEI Seit Kurzem bietet das DTA für jeden DDC-indizierten Volltext mit „TEI/XML (inkl. att.linguistic)“ ein weiteres Datenformat zum Download an, das vielfältige Informationen aus der automatischen linguistischen Analyse mit den strukturellen und semantischen Annotationen aus dem DTA-Basisformat in einem einzelnen XML-Dokument kombiniert.   mehr …

 

Korpus Alpinistischer Texte im Deutschen Textarchiv

Text+Berg digital-Logo

Im Projekt »Text+Berg digital« wurden die Jahrbücher des Schweizer Alpen-Clubs (SAC) aus dem Zeitraum von 1864 bis 2015 digitalisiert. Dieses Korpus konnte nun in zwei Teilen in die Korpora des Zentrums Sprache der BBAW integriert werden.

   mehr …

 

Grimm’sche Kinder- und Hausmärchen, 1.–7. Auflage (1812–1857), jetzt vollständig im Deutschen Textarchiv verfügbar

Frontispiece and decorative title page of 1819 edition of Brothers Grimm Kinder- und Hausmarchen, illustrated by Ludwig Emil Grimm, engraved by L. Haas. (Wikimedia Commons)Die sogenannte Große Ausgabe der Grimm’schen Kinder- und Hausmärchen (14 Bände, 1812–1857) steht seit kurzer Zeit vollständig im Deutschen Textarchiv zur Verfügung.   mehr …

 

Dokumente aus dem Deutschen Textarchiv sind nun mit den Voyant Tools analysierbar

Voyant Tools Logo Ab sofort bietet das Deutsche Textarchiv (DTA) seinen Nutzerinnen und Nutzern die Möglichkeit, jeden DTA-Text mit den von Stéfan Sinclair und Geoffrey Rockwell entwickelten Voyant Tools zu analysieren. Die XML-Volltexte aus dem DTA werden zu diesem Zweck ohne weiteren nutzerseitigen Aufwand präprozessiert, um eine nahtlose Verwendung und optimale Analyseergebnisse zu gewährleisten.

   mehr …

 

Weitere Nachrichten finden Sie im News-Archiv.

Das DTA in Zahlen

Sie können in 4 433 Werken recherchieren.
Weitere Zahlen finden Sie hier.

Neue Werke im DTA




alle Titel …    

Stöbern im DTA

Download

Alle im DTA angebotenen Texte sind unter einer Creative-Commons-Lizenz zum Download verfügbar.