Integration und Aufwertung historischer Textressourcen des 15.–19. Jahrhunderts
in einer nachhaltigen CLARIN-D-Infrastruktur
Kurationsprojekt 1 der Facharbeitsgruppe 1 Deutsche Philologie

Seit September 2012 wird das Kurationsprojekt „Integration und Aufwertung historischer Textressourcen des 15.–19. Jahrhunderts in einer nachhaltigen CLARIN-Infrastruktur“ vom Deutschen Textarchiv (DTA) an der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) koordiniert. Bis einschließlich Februar 2014 arbeiten neben der BBAW die Herzog August Bibliothek Wolfenbüttel (HAB), die Justus-Liebig-Universität Gießen (JLU) und das Institut für Deutsche Sprache (IDS) gemeinsam an dem Projekt, das aus der Facharbeitsgruppe 1 Deutsche Philologie des Infrastrukturprojekts CLARIN-D (Common Language Resources and Technology Infrastructure – Deutschland) hervorgeht.
Das Kurationsprojekt „Integration und Aufwertung historischer Textressourcen des 15.–19. Jahrhunderts in einer nachhaltigen CLARIN-Infrastruktur“ wird im Rahmen des CLARIN-D-Projekts durch das BMBF gefördert.

Zielsetzung

Mit dem Kurationsprojekt soll der gegenwärtige Status quo des nur unzureichend vorhandenen sowie heterogenen Inventars an Textkorpora für das Frühneuhochdeutsche (14.−17. Jh.) und für die älteren Stadien des Neuhochdeutschen (17.−19. Jh.) verbessert werden. Die bestehenden Korpora sind unübersichtlich und systematisch nur schwer zu erschließen. Diese Lage ist durch zwei gegenläufige Befunde zu charakterisieren, einerseits durch das Fehlen von integrierten Korpusressourcen für das 15.−19. Jahrhundert, andererseits durch die Vielfalt der Vorlagen, der Transkriptionsrichtlinien und der Publikationsformate der verstreut vorhandenen Ressourcen unterschiedlicher Qualität für dieses Sprachstadium.

Ziel des Projekts ist die kriteriengestützte Auswahl von Volltexten anhand einer Bewertungsmatrix und die Integration von für geeignet befundenen Ressourcen in die Korpora des Deutschen Textarchiv und der Wolfenbütteler Digitalen Bibliothek.

Mit einem umfangreichen, homogen strukturierten und nachhaltig nutzbaren Volltextkorpus für deutschsprachige Texte des 15. bis 19. Jahrhunderts sollen die Forschungsbedingungen – beispielsweise für die historische Linguistik – optimiert werden und der Erkenntnisgewinn erweitert werden. Als Projektziel war eine Integration von insgesamt mindestens 35000 Druckseiten vorgesehen. Diese im Projektplan angestrebte Zahl wurde sogar überschritten, es ist dabei allerdings zu bedenken, dass „Kuration“ auch weitere Arbeit und Pflege an den Texten beinhaltet, die erst nach der Integration in die Qualitätssicherungsumgebung DTAQ des Deutschen Textarchivs erfolgt. Dort besteht die Möglichkeit, die Texte kollaborativ nachzubearbeiten und zu korrigieren. Durch die gemeinsame Arbeit und Pflege der Ressourcen soll die Kultur des Crowdsourcing stärker als bisher in der germanistischen Fachgemeinschaft etabliert werden.

Die geplante Infrastruktur soll nicht zuletzt auch die Langzeitarchivierung der historischen Textquellen in einem zentralen Repositorium garantieren.

Die bisher kuratierten Texte sowie Informationen zu Textquellen und bestehenden Kooperationen finden Sie unter „Texte“.

Mehr Informationen zur Aufbereitung der Texte finden Sie unter „Dokumentation“.

Beteiligte Institutionen

Projektkoordination: BBAW

Ausführlicheres zu Antragstellern und Mitarbeitern finden sie unter „Projektgruppe“.

Stand des Projekts (April 2024)

694	Werke
111 309	Seiten
36 373 769	Tokens
243 113 779	Zeichen

Stöbern

nach Veröffentlichungszeit
nach Textgattung/-kategorien

Stand dieser Seite: Mon Jan 27 17:36:14 2014

Alle Inhalte dieser Seite unterstehen, soweit nicht anders gekennzeichnet, einer Creative-Commons-Lizenz. Die Rechte an den angezeigten Bilddigitalisaten, soweit nicht anders gekennzeichnet, liegen bei den besitzenden Bibliotheken. Weitere Informationen finden Sie in den DTA-Nutzungsbedingungen.

Insbesondere im Hinblick auf die §§ 86a StGB und 130 StGB wird festgestellt, dass die auf diesen Seiten abgebildeten Inhalte weder in irgendeiner Form propagandistischen Zwecken dienen, oder Werbung für verbotene Organisationen oder Vereinigungen darstellen, oder nationalsozialistische Verbrechen leugnen oder verharmlosen, noch zum Zwecke der Herabwürdigung der Menschenwürde gezeigt werden. Die auf diesen Seiten abgebildeten Inhalte (in Wort und Bild) dienen im Sinne des § 86 StGB Abs. 3 ausschließlich historischen, sozial- oder kulturwissenschaftlichen Forschungszwecken. Ihre Veröffentlichung erfolgt in der Absicht, Wissen zur Anregung der intellektuellen Selbstständigkeit und Verantwortungsbereitschaft des Staatsbürgers zu vermitteln und damit der Förderung seiner Mündigkeit zu dienen.

2007–2024 Deutsches Textarchiv, Berlin-Brandenburgische Akademie der Wissenschaften. Kontakt: redaktion(at)deutschestextarchiv.de.

Zitierempfehlung: Deutsches Textarchiv. Grundlage für ein Referenzkorpus der neuhochdeutschen Sprache. Herausgegeben von der Berlin-Brandenburgischen Akademie der Wissenschaften, Berlin 2024. URL: https://www.deutschestextarchiv.de/.

Integration und Aufwertung historischer Textressourcen des 15.–19. Jahrhunderts in einer nachhaltigen CLARIN-D-Infrastruktur Kurationsprojekt 1 der Facharbeitsgruppe 1 Deutsche Philologie

Zielsetzung

Beteiligte Institutionen

Stand des Projekts (April 2024)

Stöbern

Integration und Aufwertung historischer Textressourcen des 15.–19. Jahrhunderts
in einer nachhaltigen CLARIN-D-Infrastruktur
Kurationsprojekt 1 der Facharbeitsgruppe 1 Deutsche Philologie