Deutsches TextarchivGrundlage für ein Referenzkorpus der neuhochdeutschen SpracheDas Deutsche Textarchiv stellt einen disziplinen- und gattungsübergreifenden Grundbestand deutschsprachiger Texte mit einem Schwerpunkt ab dem frühen 16. bis zum frühen 20. Jahrhundert bereit. Hauptziel des von der Deutschen Forschungsgemeinschaft (DFG) von 2007 bis 2016 geförderten Projekts war die Erstellung des sog. DTA-Kernkorpus. Dieses DTA-Kernkorpus umfasst etwa 1500 Titel aus dem Zeitraum von ca. 1600 bis 1900, die aufgrund ihrer herausragenden Bedeutung für die Entwicklung der deutschen Sprache bzw. der jeweiligen Genres und wissenschaftlichen Disziplinen ausgewählt wurden (weitere Informationen zur Textauswahl). Unter anderem aufgrund des sprachgeschichtlichen Fokus des DTA und um den historischen Sprachstand möglichst genau abzubilden, wurden dabei als Vorlage für die Digitalisierung in der Regel die historischen Erstausgaben ausgewählt (Auswahl der Exemplare für die Digitalisierung). Über das DTA-Kernkorpus hinaus integriert das DTA eine Vielzahl weiterer Texte aus dem Zeitraum etwa von der Mitte des 15. bis etwa zur Mitte des 20. Jahrhunderts als DTA-Erweiterungen (DTAE), die aus kooperierenden Projekten und weiteren externen Quellen stammen. Das elektronische Volltextkorpus des DTA ist über das Internet frei zugänglich und dank seiner Aufbereitung durch (computer-)linguistische Methoden schreibweisentolerant über den gesamten jeweils verfügbaren Bestand durchsuchbar. Sämtliche Texte stehen zum Download zur Verfügung. mehr … Neuigkeiten aus dem ProjektDTA-Korpora jetzt noch freier nachnutzbar: „NonCommercial“-Einschränkung entfällt für etwa 2000 DokumenteNach einer umfassenden Änderung der Lizenzierung sind die DTA-Korpora nun noch freier und unkomplizierter für die Allgemeinheit nachnutzbar: Die etwa 1500 Texte des DTA-Kernkorpus sowie viele hundert Einzeltexte aus den den DTA-Erweiterungen (DTAE) stehen nun unter der freien Creative Commons-Lizenz CC BY-SA 4.0 zur Verfügung. mehr …Handbuch „Encoding Correspondence“: Open Peer Review eröffnet
Das erste „DTA-Buch“ ist erschienen – Humboldt/Kohlrausch: Die Kosmos-Vorlesung an der Berliner Sing-AkademieAlexander von Humboldt, Henriette Kohlrausch: Die Kosmos-Vorlesung an der Berliner Sing-Akademie. Herausgegeben von Christian Kassung und Christian Thomas. Berlin: Insel Verlag, 2019. 2019, zum Jubiläum seines 250. Geburtstages, ist im im Suhrkamp/Insel Verlag eine Nachschrift der 1827/28 gehaltenen ›Kosmos-Vorträge‹ Alexander von Humboldts in einer gedruckten Ausgabe, herausgegeben von Christian Kassung (Humboldt-Universität zu Berlin) und Christian Thomas (BBAW), erschienen. mehr …Neue Werkzeuge für das Deutsche Textarchiv über CLARINs Language Resource Switchboard (LRS) zugänglichAlle im DTA enthaltenen Texte können ab sofort an das Language Resource Switchboard (LRS) übermittelt und mit den dort zur Verfügung stehenden Werkzeugen analysiert werden. mehr …Veröffentlichung des Korpus Digitale Sammlung Deutscher Kolonialismus im Deutschen TextarchivDas mehr als 1000 Titel mit ca. 180000 Seiten umfassende Korpus „Digitale Sammlung Deutscher Kolonialismus“ (DSDK) ist ab sofort in der Qualitätssicherungsplatform des Deutschen Textarchivs, DTAQ verfügbar. mehr …Neues Forschungsprojekt „Die Evolution von komplexen Textmustern“Im Juni/Juli 2019 startete am Zentrum Sprache der BBAW sowie am Lehrstuhl für Germanistische und Allgemeine Sprachwissenschaft der Universität Paderborn das Kooperationsprojekt Die Evolution von komplexen Textmustern: Entwicklung eines korpuslinguistischen Analyseverfahrens zur Erfassung der Mehrdimensionalität des Textmusterwandels. Das Projekt wird neu von der DFG gefördert und soll geeignete Indikatoren für historischen Textmusterwandel anhand einschlägiger Textsorten der Gebrauchsliteratur der jüngeren Sprachgeschichte (Erbauungsliteratur und Zeitungen) ermitteln. mehr … Das DTA-Basisformat bekommt Verstärkung
Neues Textformat im DTA: XML (DTABf) mit linguistischer Annotation (TEI class att.linguistic)
Korpus Alpinistischer Texte im Deutschen TextarchivIm Projekt »Text+Berg digital« wurden die Jahrbücher des Schweizer Alpen-Clubs (SAC) aus dem Zeitraum von 1864 bis 2015 digitalisiert. Dieses Korpus konnte nun in zwei Teilen in die Korpora des Zentrums Sprache der BBAW integriert werden. mehr …Grimm’sche Kinder- und Hausmärchen, 1.–7. Auflage (1812–1857), jetzt vollständig im Deutschen Textarchiv verfügbar
Dokumente aus dem Deutschen Textarchiv sind nun mit den Voyant Tools analysierbar
Weitere Nachrichten finden Sie im News-Archiv. |
Das DTA in ZahlenStöbern im DTA
TeilprojekteDownloadAlle im DTA angebotenen Texte sind unter einer Creative-Commons-Lizenz zum Download verfügbar. |
Insbesondere im Hinblick auf die §§ 86a StGB und 130 StGB wird festgestellt, dass die auf diesen Seiten abgebildeten Inhalte weder in irgendeiner Form propagandistischen Zwecken dienen, oder Werbung für verbotene Organisationen oder Vereinigungen darstellen, oder nationalsozialistische Verbrechen leugnen oder verharmlosen, noch zum Zwecke der Herabwürdigung der Menschenwürde gezeigt werden. Die auf diesen Seiten abgebildeten Inhalte (in Wort und Bild) dienen im Sinne des § 86 StGB Abs. 3 ausschließlich historischen, sozial- oder kulturwissenschaftlichen Forschungszwecken. Ihre Veröffentlichung erfolgt in der Absicht, Wissen zur Anregung der intellektuellen Selbstständigkeit und Verantwortungsbereitschaft des Staatsbürgers zu vermitteln und damit der Förderung seiner Mündigkeit zu dienen.
2007–2021 Deutsches Textarchiv, Berlin-Brandenburgische Akademie der Wissenschaften.
Kontakt: redaktion(at)deutschestextarchiv.de. |