Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D

DTA-Basisformat – Überblick (Elemente innerhalb von text)

Sprache: deu, eng · Stand: Thu Feb 12 15:27:13 2015

Die folgende Tabelle bietet einen Überblick über alle Elemente, die das DTA-Basisformat für den <text>-Bereich vorsieht. Jedem Element sind die jeweils laut DTA-Basisformat möglichen Attribute und (falls invariabel) Werte zugeordnet. Jedem Element ist ein Level zugeordnet, welches dessen Verwendungsstatus im DTA-Kernkorpus spezifiziert. Den Elementen sind weiterhin funktionale Kategorien zugeordnet, welche über deren Verwendungskontexte informieren. Die Attribute des DTA-Basisformats, die in den meisten der DTA-Elemente verwendet werden können (Universalattribute), sind im Anschluss an die Tabelle dokumentiert. Eine nähere Dokumentation der Levels und Kategorien befindet sich ebenfalls im Anschluss an die Tabelle.



Filter aufheben

Element Beschreibung Attribute/Anmerkungen Funktionale Kategorie Level
ab  [doc] Anonymer Block/Container stattdessen div, floatingText oder p benutzen textStructure
4 – unzulässig
abbr  [doc] Abkürzung phraseStructure
editorial
3 – fakultativ
actor  [doc] Name eines Schauspielers innerhalb einer Darstellerliste drama
phraseStructure
2 – empfohlen
argument  [doc] Inhaltszusammenfassung textStructure
2 – empfohlen
back  [doc] Anhang documentStructure
1 – notwendig
bibl  [doc] bibliographische Angabe citations
textStructure
2 – empfohlen
body  [doc] Textkörper documentStructure
1 – notwendig
byline  [doc] Angabe zur Urheberschaft textStructure
2 – empfohlen
c  [doc] ein Zeichen wird im DTA-Korpus standoff annotiert phraseStructure
4 – unzulässig
castGroup  [doc] Gruppe von Personen (Drama) drama
textStructure
2 – empfohlen
castItem  [doc] Beschreibung einer Rolle (Drama) drama
textStructure
2 – empfohlen
castList  [doc] Liste der handelnden Personen (Drama) drama
textStructure
2 – empfohlen
cb  [doc] Spaltenumbruch
@n Spaltennummer
@type ["end", "start"]
textStructure
1 – notwendig
cell  [doc] Tabellenzelle
@cols Spaltenumfang
@role Funktion des Zelleninhalts für die Tabelle ["label"]
@rows Zeilenumfang
tables
1 – notwendig
choice  [doc] Auswahl bei Änderungen gegenüber der Vorlage (Transkription/Encoding) editorial
3 – fakultativ
cit  [doc] Zitat citations
textstructure
2 – empfohlen
closer  [doc] beschließender Text (Brief) letter
textStructure
2 – empfohlen
corr  [doc] (bei Korrekturen:) korrigierte Form
@resp Manuskripte: Person, die verantwortlich ist für die Ergänzung ["[pointer]"]
@type Ursprung der Korrektur ["addenda", "corrigenda", "editorial"]
editorial
3 – fakultativ
date  [doc] Datumsangabe
@when Datum in ISO-8601-Form
phraseStructure
3 – fakultativ
dateline  [doc] Abfassungsort und -zeit im Brief letter
textStructure
2 – empfohlen
div  [doc] Textabschnitt
@n Strukturtiefe des Textabschnittes
@type Art des Textabschnittes ["abbreviations", "act", "advertisement", "appendix", "bibliography", "chapter", "contents", "copyright", "corrigenda", "dedication", "diaryEntry", "edition", "figures", "frontispiece", "imprimatur", "imprint", "index", "letter", "lexiconEntry", "poem", "postface", "preface", "recipe", "scene", "session"]
textStructure
documentStructure
1 – notwendig
div1  [doc] Textabschnitt mit Strukturtiefe 1 stattdessen <div n="1"> benutzen textStructure
documentStructure
4 – unzulässig
div2  [doc] Textabschnitt mit Strukturtiefe 2 stattdessen <div n="2"> benutzen textStructure
documentStructure
4 – unzulässig
div3  [doc] Textabschnitt mit Strukturtiefe 3 stattdessen <div n="3"> benutzen textStructure
documentStructure
4 – unzulässig
div4  [doc] Textabschnitt mit Strukturtiefe 4 stattdessen <div n="4"> benutzen textStructure
documentStructure
4 – unzulässig
div5  [doc] Textabschnitt mit Strukturtiefe 5 stattdessen <div n="5"> benutzen textStructure
documentStructure
4 – unzulässig
div6  [doc] Textabschnitt mit Strukturtiefe 6 stattdessen <div n="6"> benutzen textStructure
documentStructure
4 – unzulässig
div7  [doc] Textabschnitt mit Strukturtiefe 7 stattdessen <div n="7"> benutzen textStructure
documentStructure
4 – unzulässig
docAuthor  [doc] Autor (Dokument) titlepage
2 – empfohlen
docDate  [doc] Erscheinungsjahr (Dokument)
@when Datum in ISO-8601-Form
titlepage
2 – empfohlen
docEdition  [doc] Angaben zur Ausgabe (Dokument) titlepage
2 – empfohlen
docImprint  [doc] Impressum (Dokument) titlepage
2 – empfohlen
docTitle  [doc] Titel (Dokument) titlepage
2 – empfohlen
epigraph  [doc] Epigraph citations
textStructure
2 – empfohlen
expan  [doc] Abkürzungsausschrift
@resp Manuskripte: Person, die verantwortlich ist für die Ergänzung ["[pointer]"]
editorial
3 – fakultativ
figure  [doc] Abbildung
@facs Link zu einer Darstellung der Original-Abbildung ["[pointer]"]
@type Art der Abbildung ["notatedMusic"]
floats
1 – notwendig
floatingText  [doc] unterbrechender Textabschnit floats
2 – empfohlen
foreign  [doc] fremdsprachliches Material
@xml:lang Sprachcode (ISO 639-3)
phraseStructure
3 – fakultativ
formula  [doc] Formel
@facs verweist auf eine graphische Darstellung der Formeltranskription
@notation Art der Notierung ["MathML", "TeX"]
floats
phraseStructure
1 – notwendig
front  [doc] Titelei (Werk) documentStructure
1 – notwendig
fw  [doc] Elemente der Druckplatte
@place Position ["bottom", "top"]
@type Art des Elements ["catch", "header", "pageNum", "sig"]
floats
2 – empfohlen
g  [doc] Sonderzeichen (außerhalb von Unicode) stattdessen U+FFFC benutzen phraseStructure
4 – unzulässig
gap  [doc] fehlendes Textmaterial
@quantity Umfang des Textverlusts
@reason Grund des Textverlusts ["fm", "illegible", "insignificant", "lost"]
@unit Einheit, in welcher der Umfang des Textverlusts angegeben wird ["chars", "lines", "pages", "words"]
editorial
1 – notwendig
head  [doc] Überschrift textStructure
1 – notwendig
hi  [doc] Hervorhebung
@rendition das Mittel der Hervorhebung
phraseStructure
2 – empfohlen
imprimatur  [doc] Druckgenehmigung textStructure
2 – empfohlen
item  [doc] Listenelement textStructure
1 – notwendig
l  [doc] Zeile bzw. Vers
@n Versnummer (aus der Vorlage)
textStructure
verse
1 – notwendig
label  [doc] Einleitung eines Postscriptums sollte mit im postscript stehen letter
phraseStructure
4 – unzulässig
lb  [doc] Zeilenumbruch
@n gedruckte Zeilennummer
textStructure
2 – empfohlen
lg  [doc] Gruppe von Versen
@n (bei Strophen:) Strophennummer
@type Art der Versgruppe ["poem"]
verse
textStructure
1 – notwendig
list  [doc] Liste floats
textStructure
1 – notwendig
listBibl  [doc] Liste bibliographischer Angaben textStructure
3 – fakultativ
milestone  [doc] Text-/Abschnittsseparator
@rendition Gestalt der Textunterbrechung ["#hr", "#hrBlue", "#hrRed", "#vr"]
@unit Textunterbrechung (horizontale Linie) ["section"]
textStructure
2 – empfohlen
name  [doc] Eigenname (alles außer Personen, Orte und Organisationen)
@full Vollständigkeit des Namens ["abb"]
@ref Referenz auf eine externe Ressource, die den jeweiligen Eigennamen näher spezifiziert ["[URI]"]
@type Art des Eigennamens ["artificialWork"]
phraseStructure
3 – fakultativ
note  [doc] Anmerkung (Fußnote, Endnote, Marginalie)
@n Fuß-/Endnotenzeichen/-nummer
@place Position ["end", "foot", "left", "right"]
@type Art der Anmerkung ["editorial"]
floats
1 – notwendig
opener  [doc] Briefbeginn/-kopf letter
textStructure
2 – empfohlen
orgName  [doc] Eigenname (Organisation)
@full Vollständigkeit des Namens ["abb"]
@ref Referenz auf eine externe Ressource, die den jeweiligen Eigennamen näher spezifiziert ["[URI]"]
phraseStructure
3 – fakultativ
orig  [doc] (bei Normalisierungen:) der Vorlage entsprechende Schreibung phraseStructure
editorial
3 – fakultativ
p  [doc] Absatz textStructure
1 – notwendig
pb  [doc] Seitenumbruch
@facs Verweis auf Faksimile
@n Seitennummer
documentStructure
1 – notwendig
persName  [doc] Eigenname (Person)
@full Vollständigkeit des Namens ["abb"]
@ref Referenz auf eine externe Ressource, die den jeweiligen Eigennamen näher spezifiziert ["[URI]"]
phraseStructure
3 – fakultativ
placeName  [doc] Eigenname (Ort)
@full Vollständigkeit des Namens ["abb"]
@ref Referenz auf eine externe Ressource, die den jeweiligen Eigennamen näher spezifiziert ["[URI]"]
phraseStructure
3 – fakultativ
postscript  [doc] Postskriptum (Brief)
@n (bei mehreren Postscripta:) Nummer
letter
textStructure
2 – empfohlen
publisher  [doc] Herausgeber/Drucker titlepage
2 – empfohlen
pubPlace  [doc] Veröffentlichungsort titlepage
2 – empfohlen
q  [doc] wörtliche Rede phraseStructure
3 – fakultativ
quote  [doc] (im Zitat:) Zitattext
@type Art des Zitattexts ["translation"]
citations
phraseStructure
2 – empfohlen
ref  [doc] Verweis
@target Referenz auf eine externe Ressource ["[URI]"]
@type Textpassage, auf die sich ein editorischer Kommentar bezieht ["editorialNote"]
phraseStructure
3 – fakultativ
reg  [doc] (bei Normalisierungen:) regularisierte Form editorial
3 – fakultativ
role  [doc] Rollenname
@xml:id ID für eine Rolle (Drama)
drama
phraseStructure
2 – empfohlen
roleDesc  [doc] Beschreibung einer Rolle (Drama) drama
phraseStructure
2 – empfohlen
row  [doc] Tabellenzeile tables
1 – notwendig
s  [doc] ein Satz wird im DTA-Korpus standoff annotiert phraseStructure
4 – unzulässig
salute  [doc] Grußformel (Brief) letter
textStructure
2 – empfohlen
seg  [doc] Textsegment stattdessen @corresp, @prev und @next benutzen textStructure
documentStructure
4 – unzulässig
sic  [doc] (bei Korrekturen:) inkorrekte Schreibweise in der Vorlage phraseStructure
editorial
3 – fakultativ
signed  [doc] Unterschrift, Signatur (Brief) letter
textStructure
2 – empfohlen
sp  [doc] Sprechakt
@who Sprecher-ID (wie der Rolle zugewiesen)
drama
textStructure
2 – empfohlen
space  [doc] signifikanter Leerraum
@dim Ausdehnung ["horizontal", "vertical"]
@quantity Umfang des Leerraums
@unit Einheit, in welcher der Umfang des Leerraums angegeben wird ["chars", "lines", "words"]
textStructure
2 – empfohlen
speaker  [doc] Sprecher eines Sprechaktes (Drama) drama
2 – empfohlen
spGrp  [doc] Gruppe von Sprechakten drama
textStructure
2 – empfohlen
stage  [doc] Bühnenanweisung drama
2 – empfohlen
supplied  [doc] bei Transkription ergänzter Text
@resp Person, die verantwortlich ist für eine Ergänzung ["[pointer]"]
editorial
1 – notwendig
table  [doc] Tabelle floats
1 – notwendig
titlePage  [doc] Titelseite innerhalb der Titelei
@type Art der Titelseite ["halftitle", "heading", "main", "series"]
documentStructure
1 – notwendig
titlePart  [doc] Teil eines Titels
@type Art des Titelteils ["copyright", "dedication", "desc", "main", "price", "series", "sub", "volume"]
titlepage
1 – notwendig
trailer  [doc] beschließender Text am Ende einer Texteinheit textStructure
3 – fakultativ
w  [doc] ein Wort wird im DTA-Korpus standoff annotiert phraseStructure
4 – unzulässig

Tagging-Level

Level 1

Elemente, die verwendet werden müssen, um das DTA-Basisformat zu erfüllen. Diese Elemente werden konsequent im DTA-Kernkorpus verwendet.

alle Elemente dieses Levels anzeigen

Level 2

Elemente, deren Verwendung lt. DTA-Basisformat empfohlen wird, auf die jedoch verzichtet werden kann. Diese Elemente werden in allen Texten des DTA-Kernkorpus verwendet.

alle Elemente dieses Levels anzeigen

Level 3

Elemente, die im DTA-Basisformat enthalten sind, jedoch nicht konsequent in den Texten des DTA-Kernkorpus angewandt werden. Die Verwendung dieser Elemente ist fakultativ.

alle Elemente dieses Levels anzeigen

Level 4

Elemente, die explizit nicht in das DTA-Basisformat aufgenommen wurden. Sie sollten daher zugunsten der jeweiligen Lösung des DTA-Basisformats vermieden werden.

alle Elemente dieses Levels anzeigen

Funktionale Kategorien

citations

Elemente, die Zitate u. ä. kennzeichnen.

alle Elemente dieser Kategorie anzeigen

documentStructure

Elemente, die Strukturierungen der Vorlage kennzeichnen, welche den äußeren Zugang zur Quelle ermöglichen.

alle Elemente dieser Kategorie anzeigen

drama

Elemente, die dramenspezifische Texteinheiten kennzeichnen.

alle Elemente dieser Kategorie anzeigen

editorial

Elemente, die editorische Eingriffe kennzeichnen.

alle Elemente dieser Kategorie anzeigen

floats

Elemente, die Blöcke kennzeichnen, welche den Fließtext auf Dokument- oder Elementebene unterbrechen.

alle Elemente dieser Kategorie anzeigen

letter

Elemente, die briefspezifische Texteinheiten kennzeichnen.

alle Elemente dieser Kategorie anzeigen

phraseStructure

Elemente, die die Funktion oder das Erscheinungsbild einzelner Wörter oder Phrasen spezifizieren.

alle Elemente dieser Kategorie anzeigen

tables

Elemente, die die Struktur von Tabellen beschreiben.

alle Elemente dieser Kategorie anzeigen

textStructure

Elemente, die die Funktion oder das Erscheinungsbild von Textpassagen innerhalb des Gesamttextes spezifizieren.

alle Elemente dieser Kategorie anzeigen

titlepage

Elemente, die Textabschnitte auf der Titelseite eines Werkes beschreiben.

alle Elemente dieser Kategorie anzeigen

verse

Elemente, die lyrikspezifische Texteinheiten kennzeichnen.

alle Elemente dieser Kategorie anzeigen

Generische Attribute

@corresp verweist auf korrespondierende interne Elemente oder externe Objekte ["[xml:id]", "[URI]"]
@next verweist auf den Nachfolger in einem mehrteiligen Element ["[xml:id]"]
@prev verweist auf den Vorgänger in einem mehrteiligen Element ["[xml:id]"]
@rend beschreibt die Art der Hervorhebung einer Zeichenkette
@rendition Art der Hervorhebung eines Blocks ["#aq", "#b", "#blue", "#bottomBraced", "#c", "#et", "#et2", "#et3", "#f", "#fr", "#g", "#i", "#in", "#k", "#larger", "#leftBraced", "#red", "#right", "#rightBraced", "#s", "#smaller", "#sub", "#sup", "#topBraced", "#u", "#uu", "#v"]
@sameAs verweist auf ein Element identischen Inhalts ["[xml:id]"]
@xml:id Element-ID
@xml:lang Sprache-Code (ISO 639-3)