Digitale Arbeitsumgebung für das Editionsvorhaben »Schleiermacher in Berlin 1808–1834«

Für das Forschungsvorhaben »Schleiermacher in Berlin 1808–1834« an der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) wurde von TELOTA eine digitale Arbeitsumgebung eingerichtet, in der die Transkriptionen inkl. Text- und Sachapparat in TEI-konformem XML bearbeitet und zentral in einer Datenbank gespeichert werden. Eine Website macht den gesamten Datenbestand für die Bearbeiter leicht zugänglich und durchsuchbar. Darüber hinaus wurde eine PDF-Ausgabe implementiert, die den jeweiligen Text in Gestalt der bisherigen Druckausgaben ausgibt. Bei dem Projekt wurde insbesondere auf die Benutzerfreundlichkeit der Arbeitsumgebung Wert gelegt.

Das Arbeitsvorhaben »Schleiermacher in Berlin 1808–1834« wurde Anfang dieses Jahres an der BBAW begonnen. Das zu editierende Archivmaterial umfasst Briefe, Vorlesungsmanuskripte, Nachschriften, Notizen und Tageskalender des evangelischen Theologen Friedrich Daniel Ernst Schleiermachers.

TEI P5

Grundlage der neuen digitalen Edition sind die Schemata, die größtenteils in Relax NG bereitgestellt werden und auf den Richtlinien der TEI P5 basieren. Es wurden nur Elemente und Attribute benutzt, die die TEI P5-Richtlinie enthält. Alle Schemata für die transkribierten und annotierten Manuskripte sind also Teilmengen der TEI P5 und die danach kodierten Dokumente sollten nach Abschluss der Editionsarbeiten gegen TEI P5 validieren. Ausgangspunkt bei der Erstellung dieser Schemata waren die Editionsrichtlinien der Kritischen Gesamtausgabe Friedrich Schleiermachers.

Oxygen XML Author

Für das Arbeitsvorhaben „Schleiermacher in Berlin 1808–1834“ angepasste Programmoberfläche von Oxygen XML Author

Als zentrale Softwarekomponente der neuen Arbeitsumgebung wird »Oxygen XML Author« eingesetzt. Dabei handelt es sich um eine speziell auf den XML-Endanwender zugeschnittene Variante der Software Oxygen XML Editor. Diese wird seit 1998 von der rumänischen Firma Syncro Soft Ltd. entwickelt und ist derzeit in der Version 14 erhältlich. Da das Programm auf Java basiert, läuft es auf den Betriebsystemen Windows, Mac OS X und Linux. Der ausgereifte Entwicklungsstand, ein schneller Innovationszyklus, der ausgezeichnete Support und die sehr überschaubaren Kosten sprachen für den Einsatz dieser Software. Ausschlaggebend war die Möglichkeit, eigene Werkzeugleisten und Funktionen in die Programmoberfläche zu integrieren.

Die Bearbeiter arbeiten in Oxygen XML Author also nicht in einer Codeansicht, sondern in einer »Autorenansicht«, die über Cascading Stylesheets (CSS) gestaltet wird. Dem Bearbeiter stehen dabei mehrere CSS, also Ansichten, zur Auswahl, so dass per Mausklick die für den Arbeitsschritt geeignetste Ansicht ausgewählt werden kann. So können beispielsweise neben dem reinen Manuskripttext nur die indizierten Stellen hervorgehoben werden. In den Cascading Stylesheets selbst können neben CSS-Standardeigenschaften auch Eigenschaften benutzt werden, die von Oxygen XML selbst bereitgestellt werden. Diese ermöglichen beispielsweise, dass als »persName« ausgezeichnete Namen einen Link zum dazugehörigen Registereintrag haben, den die Bearbeiter anklicken können.

Werkzeugleiste in Oxygen XML Author mit eigenen Funktionen für die Bearbeitung der Materialien im Arbeitsvorhaben

Mit der sogenannten Dokumententyp-Zuordnung können in Oxygen XML Author eigens definierte Funktionen bereitgestellt werden, die der Endanwender über eine Schaltfläche in der Werkzeugleiste auslösen kann. So können per Knopfdruck zum Beispiel Streichungen markiert oder eine Sachanmerkung eingegeben werden. Der gesamte Manuskripttext kann dadurch einfach und schnell mit XML ausgezeichnet werden. Dabei ist es möglich, kontextabhängige Varianten in der selben Funktion unterzubringen. Der Kontext wird dabei durch einen XPath-Ausdruck definiert, so dass man beispielsweise überprüfen kann, wo der Cursor sich gerade befindet oder ob ein bestimmtes Element schon vorhanden ist oder nicht. Zusätzlich überprüft Oxygen XML, ob die auszuführende Funktion im aktuellen Kontext schemakonform ist oder nicht. Dadurch wird letztendlich ein hohes Maß an Benutzerfreundlichkeit erreicht, da der Bearbeiter beim Klick auf die jeweilige Schaltfläche immer die passende Funktionsvariante bekommt. Die Grundlage der Funktion sind dabei Java-Klassen, die größtenteils schon in Oxygen XML Author enthalten sind. Für die digitale Arbeitsumgebung wurden diese Klassen aber noch mit Hilfe der Oxygen Author API durch eigene ergänzt. Dies war insbesondere für alle Funktionen notwendig, die auf eines der drei zentralen Register zurückgreifen.

Zentrales Register

Neben den eigentlichen Transkriptionen enthält die Datenbank auch drei zentrale Register zu Personen, Werken und Orten. Die Registereinträge wurden – ohne die Verweise zu den Briefen – vom Arbeitsvorhaben in einer über 350 Seiten starken Worddatei gesammelt. Dieses Dokument wurde von TELOTA manuell in eine XML-Struktur überführt und weiterverarbeitet. Die XML-Struktur des neuen Personenregisters wurde dabei kompatibel zum Personendatenrepositorium der BBAW gehalten, so dass die Daten aus dem Arbeitsvorhaben irgendwann auch dort importiert werden können.

Das Register liegt nun in drei XML-Dateien (Personen, Werke und Orte) vor und kann laufend innerhalb von Oxygen XML Author ergänzt und von den transkribierten Texten aus verlinkt werden. Will man z.B. einen Personennamen auszeichnen, wird das Register ausgelesen und dem Bearbeiter eine Auswahlliste angezeigt, aus der er die betroffene Person auswählen kann. Die eigens geschriebene Javafunktion fügt daraufhin zusammen mit dem Element persName die korrekte Identifikationsnummer der Person ein. Aus den so ausgezeichneten Dokumenten kann nachher für Druck- und Webausgabe das Register vollautomatisch erstellt werden.

eXist-Datenbank

Die in Oxygen XML Author zu bearbeitenden Dateien werden zentral in einer XML-Datenbank gespeichert. Zum Einsatz kommt hier die Open-Source-Software eXist in der Version 2.0. Über einen WebDAV-Zugriff wird die Datenbank in einer Ordnerstruktur direkt in Oxygen XML Author den Nutzern zugänglich und durchsuchbar gemacht. Der WebDAV-Zugriff hat den Vorteil, dass von einem Benutzer geöffnete Dateien für alle anderen Nutzer gesperrt sind. Bearbeitungskonflikte werden so vermieden. Mehrmals täglich werden automatisch Backups der Datenbank erstellt. Zusätzliche eigens erstellte XQuery-Skripte werden regelmäßig von der eXist-Datenbank automatisch gestartet und erstellen diverse Berichte, die die Editionsarbeit unterstützen sollen, wie z.B. eine Auflistung aller Dateien, in denen noch notwendige Angaben zur Korrespondenz fehlen.

Website

Neben der eigentlichen Arbeitsumgebung in Oxygen XML Author, wurde für das Vorhaben auch eine Website erstellt, die direkt auf der Datenbank aufsetzt und im Browser abrufbar ist. In ihr kann von den Bearbeitern der Datenbestand leicht durchblättert bzw. durchsucht werden. So können z.B. die Briefe nach Korrespondenzpartnern und Jahren gefiltert werden. Außerdem kann der Nutzer dem Korrespondenzverlauf mit einer bestimmten Person folgen oder aus dem Register heraus die jeweiligen Stellen aufrufen. Die Website ist derzeit nur den Bearbeitern zugänglich, stellt aber dennoch den Prototyp einer zukünftigen öffentlichen Website dar.

Technisch gesehen besteht die Website vor allem aus XQuery-Skripten, deren Ergebnisse durch eine XSL-Transformation in HTML5 ausgegeben werden. Die Skripte und Transformationen werden hierbei direkt über die REST-Schnittstelle von eXist aufgerufen und durch den eXist-internen Parser verarbeitet. Die einzelnen Webseiten werden also jeweils komplett serverseitig ausgegeben.

Druckausgabe

Zwei Beispielseiten der PDF-Druckausgabe für das Arbeitsvorhaben „Schleiermacher in Berlin 1808–1824“

Neben der Website wurde auch eine Druckausgabe implementiert, die aus den aktuellen Daten ein PDF in Gestalt der bisherigen Druckausgabe erstellt. Diese Druckausgabe ist in ConTeXt geschrieben, einer Satzsprache, die auf TeX basiert. Die erstellten Contextskripte verarbeiten die XML-Datei(en) automatisch zu einem druckfähigen PDF. Die Gestaltung und Formatierung entspricht den bisher gedruckten Bänden der »Kritischen Gesamtausgabe« von Friedrich Schleiermachers Werken. So werden Text- und Sachapparat als Fußnoten dargestellt, die mit Hilfe von Zeilennummerierung und Lemmata auf den Fließtext verweisen. Die Druckausgabe erstellt bei Bedarf auch das passende Register zu den jeweiligen Transkriptionen und löst Querverweise zwischen Manuskripten auf. Die Druckausgabe dient zum einen der Kontrolle der edierten Texte durch die Mitarbeiter, zum anderen könnte sie bei einer zukünftigen Drucklegung den dann eigentlich nötigen separaten Satz ersetzen.

Nutzererfahrungen

Der Einstieg in die neue Arbeitsumgebung gelang den Mitarbeiterinnen und Mitarbeitern nach eigenen Angaben ohne größere Probleme. Natürlich ist die Eingabe nun nicht mehr so flexibel wie in MS Word, da die Texte jetzt als TEI-XML gespeichert werden. An die etwas restriktivere Eingabe mussten sich die Bearbeiter zwar gewöhnen, das stellte aber letztendlich kein größeres Umstellungshindernis dar. Auftretende Probleme bei der Eingabe waren oft »Kinderkrankheiten«, die mit dem nächsten Update der Arbeitsumgebung behoben werden konnten. Die anderen Probleme konnten durch neue Funktionen behoben werden.

Nach zwei Monaten Arbeit nach ihrer Meinung befragt, äußerten sich die Nutzer ganz überwiegend positiv über die neue Arbeitsumgebung. Kritisch angemerkt wurde nur, dass die Anzeige des Textes bei fortgeschrittener Auszeichnung unübersichtlich wird. Dem wurde von TELOTA Rechnung getragen, in dem weitere Cascading Stylesheets hinzugefügt wurden, um die Ansicht jeweils auf eine bestimmte Gruppe von Elementen zu beschränken.

Demgegenüber wurden die erwarteten Vorteile der neuen Arbeitsumgebung auch von den Nutzern selbst bestätigt: so waren sich die Befragten darin einig, dass durch die neue Arbeitsumgebung die Editionsarbeit erleichtert und viel Zeit gespart wird. Auch die Möglichkeit, die Ergebnisse der Arbeit direkt in einer Webpräsentation oder Druckausgabe zu kontrollieren, wurde positiv gesehen. Sehr erleichtert äußerten sich die Mitarbeiterinnen und Mitarbeiter darüber, dass ihnen keine Arbeit im XML-Code selbst zugemutet wird, sondern alle Texte in einer grafischen und einfach zu bedienenden Programmoberfläche mit XML ausgezeichnet werden können.

Stefan Dumont und Martin Fechner

Update 06.11.2013: Die hier vorgestellte Arbeitsumgebung wird mittlerweile „ediarum“ genannt und in weiteren Forschungsvorhaben der BBAW eingesetzt, so z.B. im Akademienvorhaben „Commentaria in Aristotelem Graeca et Byzantina“ (CAGB) oder bei den „Regesta Imperii – Die Regesten Kaiser Friedrichs III.“ Derzeit ist der Einsatz in einem weiteren (externen) Editionsvorhaben geplant. Weitere Informationen zu „ediarum“ finden Sie auf der Website des Projekts.

Kommentare

3 Kommentare zu “Digitale Arbeitsumgebung für das Editionsvorhaben »Schleiermacher in Berlin 1808–1834«”

  1. Digitale Arbeitsumgebung für das BBAW-Editionsvorhaben »Schleiermacher in Berlin 1808–1834« | DHd-Blog am Oktober 11th, 2012 15:46

    […] Weiterlesen auf digiversity Teilen: Porträt (Projekt)Digitale Edition, TEI, Virtuelle Forschungsumgebung ← Wissenschaftliche/r Mitarbeiter/in im Bereich Digital Humanities & TYPO3 […]

  2. Tutorial: Wie baue ich ein eigenes Framework für Oxygen XML? | DHd-Blog am Oktober 30th, 2013 12:38

    […] »ediarum«, wird als benutzerfreundliche Eingabeoberfläche die Software Oxygen XML Author eingesetzt. Die Bearbeiter arbeiten dort nicht in einer Codeansicht, sondern in einer übersichtlichen […]

  3. Indexfunktionen in Oxygen XML Frameworks (Tutorial & Download) | DHd-Blog am Dezember 16th, 2013 10:55

    […] an der Berlin-Brandenburgischen Akademie der Wissenschaften »ediarum« entwickelt und eingesetzt. Dabei handelt es sich um ein Paket aus drei Softwarelösungen (Oxygen XML, eXistdb und ConTeXt), […]