Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D

Vierter DTA-Workshop

Aufbau historischer Sprachressourcen: Arbeiten mit den Angeboten des Deutschen Textarchivs

7. Juli 2014, 9:00-17:00 Uhr, BBAW, Berlin

1  Kurzbeschreibung des Workshops

Am 7. Juli 2014 veranstaltet das Deutsche Textarchiv (DTA) einen Workshop zum Thema "Aufbau historischer Sprachressourcen: Arbeiten mit den Angeboten des Deutschen Textarchivs". Der Workshop wendet sich an Nutzerinnen und Nutzer des DTA ebenso wie an Interessierte, die die Angebote des DTA kennenlernen möchten. Es werden bewährte und zum Teil neu im DTA entwickelte Methoden und Hilfsmittel zum Aufbau und zur Analyse von Korpora vorgestellt und deren Anwendung im Rahmen praktischer Übungen eingeübt.

In zwei Themenblöcken werden die Aufbereitung von Ressourcen entsprechend den DTA-Richtlinien einerseits sowie die Arbeit mit den bestehenden DTA-Korpora andererseits näher beleuchtet.

Im Rahmen des ersten Themenblocks werden verschiedene Schritte der TEI/P5-kompatiblen Aufbereitung von Ressourcen gezeigt. Grundlage bilden dabei die im DTA-Basisformat (DTABf) zusammengefassten DTA-Richtlinien zur Transkription und zur Annotation historischer Texte. Ausgehend von verschiedenen Szenarien der Textaufbereitung (bestehende Transkriptionen aus unterschiedlichen Formaten; neue Transkriptionsvorhaben) werden Hinweise zur Zuverlässigkeit von Bildvorlagen und Transkription gegeben, Möglichkeiten der halbautomatischen Konvertierung in das DTA-Basisformat vorgeführt und anhand praktischer Übungen vermittelt; die DTABf-kompatible Textaufbereitung mithilfe des DTA-oXygen-Frameworks DTAoX wird erprobt. Darüber hinaus wird gezeigt, wie mithilfe des DTAE-Metadatenformulars ein TEI-Header mit ausführlichen Metadaten zu einem historischen Dokument erstellt werden kann. Schließlich werden Methoden der Kontrolle und Überarbeitung abgeschlossener XML-Textausgaben innerhalb der Qualitätssicherungsplattform DTAQ (Ticket-System, integrierte XML-/Text-Editoren) vorgestellt.

Der zweite Themenblock widmet sich den Inhalten der linguistischen Analyse im DTA und den Möglichkeiten der wissenschaftlichen Auswertung der DTA-Korpora. Die Teilnehmer/innen erhalten Einblicke in die Nutzung der im DTA verwendeten Suchmaschine DDC, welche die Auswertung des DTA-Gesamtkorpus sowie ausgewählter Teilkorpora in Hinblick auf bestimmte linguistische oder textstrukturelle Merkmale erlaubt. Über die im DTA verfügbaren Möglichkeiten der Visualisierung linguistischer Phänomene wird schließlich gezeigt, welche zusätzlichen Möglichkeiten die Integration von DTA-Korpustexten in die CLARIN-D-Infrastruktur bietet.

2  Anmeldung

Eine Anmeldung zur Teilnahme am Workshop wird bis zum 1. Juli 2014 erbeten. Bitte füllen Sie hierfür das Formular zur Anmeldung aus.

3  Veranstalter

DTA (Deutsches Textarchiv)
www.deutschestextarchiv.de, @textarchiv

4  Veranstaltungsort

Berlin-Brandenburgische Akademie der Wissenschaften
Jägerstr. 22/23, 10117 Berlin
- Einstein-Saal -

Hinweise zur Anfahrt

5  Programm

9:00-9:15 Matthias Boenig, Christian Thomas Einführung [Folien]
Themenblock 1: Aufbereitung von Ressourcen entsprechend den DTA-Richtlinien
9:15-9:35 Matthias Boenig Tutorial: Ausgangsszenarien: Bild, Text, Annotation
9:35-10:15 Susanne Haaf Tutorial: Die TEI-Textstrukturierung nach DTA-Basisformat [Folien]
10:15-10:45 Pause
10:45-11:15 Matthias Boenig, Susanne Haaf Tutorial: Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX [Folien]
11:15-11:45 Übung: DTABf-Strukturierung in oXygen und DTAoX
11:45-12:15 Frank Wiegand Tutorial: Konvertierung aus verschiedenen Formaten in das DTA-Basisformat [Folien]
12:15-12:45 Übung: Konvertierung
12:45-13:45 Mittagspause
13:45-14:20 Frank Wiegand Tutorial & Übung: Erhebung von Metadaten nach DTABf [Folien]
Themenblock 2: Arbeit mit den bestehenden DTA-Korpora
14:20-15:00 Christian Thomas Tutorial & Übung: Qualitätssicherung (DTAQ) [Folien]
15:00-15:30 Pause
15:30-16:00 Christian Thomas Tutorial: Korpusrecherche im DTA mithilfe von DDC [Folien], siehe auch [Hilfe zur linguistischen Suche im DTA]
16:00-16:30 Übung: Suchanfragen mittels DDC
16:30-17:00 Susanne Haaf Tutorial: Die DTA-Korpora in CLARIN-D [Folien]
17:00-17:15 Matthias Boenig Ausblick

6  Vorabinformationen für angemeldete TeilnehmerInnen

Die Teilnehmenden werden gebeten, für den Workshop einige Vorbereitungen zu treffen, die für die Durchführung der Veranstaltung notwendig sind.

  1. Bitte bringen Sie einen internetfähigen Laptop mit. WLAN steht im Konferenzraum zur Verfügung; Internet via LAN-Buchse ist ebenfalls verfügbar.
  2. Installieren Sie auf Ihrem Laptop den oXygen-XML-Editor. Für den Workshop genügt die Installation der Trialversion, die Sie sich kostenfrei herunterladen können. Sie können uns gern kontaktieren, falls Sie Probleme bei der Installation haben. Sollte eine Installation des oXygen-Editors überhaupt nicht möglich sein, empfehlen wir Ihnen die Installation eines Texteditors, der XML-Dateien mit Syntaxhighlighting darstellen kann.
  3. Bitte registrieren Sie sich auf der Qualitätssicherungsplattform des Deutschen Textarchivs DTAQ.
  4. Bitte speichern Sie die DTABf-Vorlagendatei. Sie wird für die praktischen Übungen während des Workshops benötigt.
  5. Fakultativ können Sie in Vorbereitung auf den Workshop in die Dokumentationen zu den DTA-Richtlinien zur Texterfassung bzw. zum DTA-Basisformat schauen.
  6. Schließlich möchten wir Sie bitten, uns zu informieren, falls sich nach Anmeldung herausstellt, dass Sie doch nicht teilnehmen können. In diesem Fall können wir den freigegebenen Platz an mögliche Nachrücker vergeben.

7  Weitere Informationen

8  Kontakt

Deutsches Textarchiv
Berlin-Brandenburgische Akademie der Wissenschaften
Jägerstr. 22/23
10117 Berlin

E-Mail: dta@bbaw.de
Tel.: +49 (0)30 20370 523

Stand dieser Seite: Mon Jul 21 16:01:41 2014