TEI-Implementation

Das Original wurde in Form eines zu TEI P5 Lite konformen XML-Dokuments transkribiert. Die dabei verwendeten Tags und ihre Verwendung werden im Folgenden dargestellt. (Nicht aufgeführt sind hier die Angaben im TEI-Header sowie diverse verwendete Attribute und Attributwerte.)

Bände

  • Alle drei Bände der »Teutschen Academie« sind jeweils in einem <text>-Block eingefasst, welche mittels <group> in einem TEI-Dokument gruppiert sind.
  • Die Bände sind in sich jeweils durch <front> und <body> grobgegliedert.

Seiten

  • <pb/>-Tag zu Beginn jeder Seite des Originaltextes; das Attribut »n« enthält die eindeutige Seitenbenennung

Spalten

  • Beginn von Inhalt über ganze Breite: <milestone unit="column" n="none"/>
  • Beginn einer linken Spalte: <milestone unit="column" n="left"/>
  • Beginn einer mittleren Spalte: <milestone unit="column" n="middle"/>
  • Beginn einer rechten Spalte: <milestone unit="column" n="right"/>
  • Diese Tags werden bei jedem Spaltenwechsel verwendet sowie zu Beginn jeder Seite

Inhaltliche Textstruktur

  • Die Titelseiten der Bände sind durch <titlePage>ausgezeichnet. Darin sind die betreffenden Inhalte mit <byline>, <docAuthor>, <docDate>, <docImprint>, <docTitle>, <pubPlace>, <publisher> und <titlePart> markiert.
  • Die inhaltliche Gliederung wird durch <div>-Tags wiedergegeben (gemäß der Textstruktur hierarchisch verschachtelt), die teils durch »type«-Attribute genauer beschrieben sind; vorkommende Werte für »type« sind »frontispiece« und »title«.
  • Überschriften dieser Gliederungselemente sind durch <head>...</head>-Tags markiert.
  • Für Inhaltsübersichten zu Beginn von Kapiteln wurde <argument> verwendet.
  • Einige Teile des Textes sind recht kleinteilig gegliedert und besitzen Überschriften, die im Textfluss (innerhalb von Spalten) auftreten. Um die Textstruktur überschaubar zu halten, wurden an diesen Stellen keine <div>-Blöcke plus <head> verwendet, sondern <p rend="headline">...</p>. Entsprechend wurde an den (wenigen) Stellen, an denen eine Inhaltsübersicht des Nachfolgenden gegeben wird, nicht mit <argument> gearbeitet, sondern mit <p rend="argumentlike">.
  • Absätze sind mit <p> ausgezeichnet, Verszeilen mit <l>, Verszeilen-Gruppen mit <lg>. Für Registerseiten kamen <list>-Tags und <item>-Tags zum Einsatz.
  • Text in Marginalspalten: Ist ausgezeichnet mittels <note place="margin" anchored="0">. Der betreffende Text ist vor Beginn derjenigen Zeile in den Haupttext eingebettet, die auf gleicher Höhe mit der ersten Zeile der Marginalspalte steht; in Einzelfällen wurde diese Position leicht geändert, um Überschneidungen mit Auszeichnungen im Haupttext zu vermeiden.
  • Fußnoten: <note place="foot">...</note> – das Zeichen, das auf die Fußnote verweist, wird dabei entfernt. Wir unterscheiden nicht zwischen Fußnoten, die unter dem Fließtext oder neben diesem (d.h. in der Marginalspalte) erscheinen.

Personen, Orte, Kunstwerke

  • Nennung bzw. Umschreibung von Personen: <rs type="person">
  • Nennung bzw. Umschreibung von Ortsangaben: <rs type="place">
  • Nennung bzw. Umschreibung von Kunstwerk-Nennungen: <rs type="artwork">
  • Nennung bzw. Umschreibung von Büchern, Schriften: <rs type="bibliography">
  • Das Attribut »key« in <rs>-Tags verweist auf Datensatz-IDs betreffender Entitäten, die in einer relationalen Datenbank gespeichert sind.
  • In Fällen, wo solche Markierung von disparatem Inhalt durchtrennt sind (konkret v.a. ganzen Kupferstichseiten), wurden zwei Markierungen verwendet.

Bilder / Texte in Bildern

  • Eigenständige Abbildungen wurden mittels <figure>-Tags kodiert (darin u.a. <graphic>), Inline-Symbole nur mittels <graphic>
  • Bildtitel wurden mit <p rend="caption"> markiert.
  • Text im Bild ist umschlossen von <p>-Tags, wobei jeder eigenständige Textblock mit eigenen <p>-Tags kodiert wurde. Die Anordnung dieser Texte folgt der mitteleuropäischen Leserichtung (die auch teils von Sandrart für Numerierungen mehrteiliger Kupferstiche angewandt wurde): von links oben zeilenweise nach rechts unten, wobei diese Reihenfolge aufgrund offenbar zusammengehörigen Textes auch durch den Nachbearbeiter aufgebrochen werden kann.
  • Signatur als Bildunterschrift: <seg type="signature">...</seg>
  • Privilegien/Widmungen in Bildunterschriften: <seg type="dedication">...</seg>

Schriften

  • Aller nicht anderweitig markierter Text ist als Fraktur anzusehen; ansonsten wird lediglich Antiqua und kursive Antiqua unterschieden. Ausnahme von der Regel: Zahlen – diese bestehen überwiegend aus Mediävalziffern (also Antiqua-Ziffern), sind aber nicht als Antiqua markiert, sofern sie nicht in einem ohnehin als Antiqua ausgezeichneten Textabschnitt stehen. Gleiches gilt für Kommata, die im Text lediglich innerhalb bzw. am Ende von Antiqua-Abschnitten verwendet werden, wohingegen ansonsten Virgeln Verwendung finden.
  • Antiqua-Text ist mit <hi rend="antiqua">...</hi> kenntlich gemacht, kursiver Text wird mittels <hi rend="italic">...</hi>. Verschiedene Antiqua-Schriften werden – mit Ausnahme von Kursivierungen – nicht unterschieden. Alle kursiven Textstellen sind implizit als in Antiqua gesetzt zu verstehen.
  • Es wird nicht zwischen verschiedenen Fraktur-Varianten differenziert.
  • Schmuckinitialen: <hi rend="initial">N</hi>Achdem
  • Bei Kupferstich-Signaturen und -widmungen wurde generell nicht zwischen Schriften unterschieden (diese sind ohnehin fast immer kursiv)

Interne Links / Querverweise

  • Links werden durch <ref target="...">...</ref>-Tags formuliert.
  • Als Link-Ziel können alle vorkommenden Tags verwendet werden; Ausnahmen sind <corr>...</corr>, <sic>...</sic>, <choice>...</choice> und <milestone/>.
  • In Fällen, wo Textstellen wo Stellen im Text als Linkziel adressiert werden müssen, an denen keine Tags vorhanden sind, kommen <anchor/>-Tags zum Einsatz.
  • Daneben werden <anchor />-Tags mit »vita-start« als Wert des type-Attributs verwendet, um den Beginn von Künstlerviten zu markieren. In diesen Fällen ist die Personen-ID des jeweiligen Künstlers als Wert des n-Attributs enthalten.

Sprachen

  • Die Markierung fremdsprachigen Textes erfolgt entweder mittels <foreign xml:lang="...">...</foreign> oder der Hinzufügung eines xml:lang-Attributes, sofern exakt der betreffende Text bereits von Tags umschlossen ist. Aller Text, dessen Sprache nicht deklariert ist, ist als Deutsch anzusehen.
  • Diese ISO-Sprachcodes wurden verwendet:
    • Deutsch: de (nur bei Einschüben in nicht deutschsprachigen Textteilen)
    • Dänisch: da
    • Englisch: en
    • Französisch: fr
    • Griechisch: el. Griechisch beinhaltet Aspekte von Alt- und Neugriechisch sowie Buchstaben aus der Antike, vieles davon orthographisch und/oder grammatikalisch inkorrekt; wir haben daher entschieden, dies unterschiedslos als Neugriechisch auszuzeichnen.
    • Hebräisch: he
    • Italienisch: it
    • Koptisch: cop
    • Latein: la
    • Niederländisch: nl
    • Portugiesisch: pt
    • Spanisch: es
  • Generell sind komplette Phrasen markiert, im Fall von anderen Schriftsystemen (z.B. Griechisch) aber auch einzelne Wörter oder Buchstaben. Im Fall von Latein sind einzelne Wörter aufgrund der Häufigkeit der Verwendung in der damaligen Zeit nicht ausgezeichnet; auch wiederkehrende Phrasen in Bildunterschriften (»Sandrart delineavit«, »Waldreich sculpsit«, »Cum Gratia et Privilegio«) wurden nicht markiert.

Fehler, Unklarheiten etc.

  • Markierung eindeutiger Satzfehler: <choice><sic>mistake</sic> <corr>correction</corr></choice>
  • Wörter bzw. Teilwörter, die im Originaltext überflüssig sind: <del>Wort</del>
  • Nicht lesbar: <gap reason="..."/>. Wenn Teil eines Wortes, ist dieses zudem von <unclear>...</unclear> umschlossen. <gap/> wird auch eingesetzt, um innerhalb von <sic>...</sic> Zeichen außerhalb von UTF-8 zu kodieren.
  • Nicht eindeutig lesbare Stellen: <unclear reason="...">...</unclear>, z.T. mit separater Anmerkung versehen
  • Sonderzeichen / Zeichen außerhalb UTF-8 sind in Form von <graphic>-Elementen eingefügt.
  • Darüber hinaus sind einige Unicode-Zeichen (etwa U2183) enthalten, die in der Ausgabe der Edition durch Bilder ersetzt werden, um Client-seitige Darstellungsprobleme zu vermeiden.
  • In lateinischen Wörtern, die ein »q« mit Akzent enthalten, wurde dieses als einfaches »q« transkribiert und das betreffende Wort mit <reg>-Tags umschlossen.

Sonstiges

  • Zitate: <q>...</q>
  • Explizite Datumsangaben – nicht aber z.B. Angaben, die sich an Patronatstagen orientieren sowie keine ungefähren Angaben – wurden mit <date value="...">-Elementen markiert. Diese Daten sind immer als Angabe Sandrarts zu verstehen und nicht an den heutigen Wissensstand angepasst.