Perspectives of the further development of the Correspondence Metadata Interchange Format (CMIF)

Historical correspondences are generally only partially edited—focusing often on one person or only on the correspondence between two persons. Thus edited letters[1] remain isolated in the context of a certain scholarly edition. Searches across scholarly projects and editions are time-consuming and difficult.

To solve this problem[2], the Correspondence Metadata Interchange Format (CMIF), based on the TEI Guidelines, was developed. With the help of the CMIF scholarly editions should be enabled to provide the metadata of their edited letters in a machine-readable way – online and under a free license. These files can be retrieved and processed by digital scholarly editions, databases or web services (like correspSearch).

This article presents the current state of the CMIF and outlines the possibilities of the further development. Interested scholars are invited to give feedback in the comment section below or on the mailing list of the TEI Correspondence SIG.

Den ganzen Beitrag lesen

Tutorial: Indexfunktionen für Oxygen XML Frameworks

Auswahl eines Registereintrags in ediarum

Bequeme Auswahl eines Registereintrags und mit dem nächsten Klick wird das entsprechende XML-Element samt ID eingefügt.

Für Wissenschaftler/-innen ist bei der Transkription mit TEI-XML – neben anderem – die Möglichkeit interessant, Personen, Orte, Werke etc. mit einem zentralen Register zu verknüpfen. Dies geschieht über eine eindeutige Identifikationsnummer, die einer Person oder einem Ort etc. zugeordnet ist. Arbeitet man direkt im XML-Code muss man diese Nummer sich händisch raussuchen und dann in den Wert des entsprechenden Attributs kopieren. Das ist unpraktisch und zeitraubend.

Im Rahmen der digitalen Arbeitsumgebung „ediarum“ hat TELOTA nun die Funktionalitäten von Oxygen XML Frameworks so erweitert, dass die Wissenschaftler/-innen nun Textstellen in einem XML-Dokument schnell und bequem mit einem entsprechenden Indexeintrag verknüpfen können. Dafür wurden von TELOTA eigene Javaoperationen programmiert. Sowohl die JAR-Datei als auch der Sourcecode stehen ab sofort unter den Bedingungen der LGPL auf github zum Download zur Vefügung. Dieses Tutorial zeigt, wie Sie damit Indizierungsfunktionen in Oxygen XML Author integrieren können. Den ganzen Beitrag lesen

Zusätzliche Javaoperationen für Oxygen XML Frameworks veröffentlicht

Ab sofort sind zusätzliche Javaoperationen für Oxygen XML Frameworks als Java-Archive (JAR) und als Quellcode zur freien Verwendung verfügbar. Die Javaoperationen wurden von der TELOTA-Initiative an der Berlin-Brandenburgischen Akademie der Wissenschaften im Rahmen der Softwarelösung „ediarum“ entwickelt und ergänzen die Javaoperationen für sog. „Frameworks“, die Oxygen XML out-of-the-box mitbringt. Mit den Funktionen aus dem Java-Archive ediarum.jar können u.a. Schaltflächen in Oxygen XML Author erstellt werden, die es Wissenschaftlern ermöglichen, einfach und schnell Textstellen, Personen- und Ortsnamen etc. zu indizieren.

Sowohl das Java-Archive ediarum.jar als auch der zugrunde liegende Quellcode wurden auf github/telota veröffentlicht und können von dort heruntergeladen oder geforkt werden. Alle Dateien sind unter der GNU Lesser General Public Licence lizenziert und können unter diesen Bedingungen genutzt werden. Wie man die Indexfunktionen implementiert wird in  einem neuen Tutorial auf digiversity Schritt für Schritt erklärt. Informationen zu weiteren Funktionen sind außerdem der Dokumentationsseite auf github zu entnehmen.

Tutorial: Wie baue ich ein eigenes Framework für Oxygen XML?

Seit 2012 wird von der TELOTA-Initiative an der Berlin-Brandenburgischen Akademie der Wissenschaften »ediarum« entwickelt und eingesetzt. Dabei handelt es sich um ein Paket aus drei Softwarelösungen (Oxygen XML, eXistdb und ConTeXt), das es Wissenschaftlern in verschiedenen Editionsvorhaben ermöglicht, ihre Ergebnisse in TEI-XML zu bearbeiten, zu speichern und zu präsentieren. Damit die Eingabe und Bearbeitung möglichst komfortabel und einfach geschieht, wird als Eingabeoberfläche in ediarum die proprietäre Software Oxygen XML Author eingesetzt. Diese Software hat den Vorteil, dass die Bearbeiter nicht mehr direkt im XML-Code arbeiten, sondern in einer benutzerfreundlichen Oberfläche, die zum einen die XML-Datei optisch aufbereitet präsentiert und zum anderen Werkzeugleisten bereitstellt, mit denen per Knopfdruck XML-Elemente eingefügt bzw. Textteile ausgzeichnet werden können.

Da jedes XML-Schema andere Elemente verlangt, gibt es in Oxygen XML Author natürlich nicht die eine Werkzeugeleiste. Stattdessen werden sog. Frameworks (auch »Dokumenttypzuordnungen« genannt) benutzt. In ihnen werden die Ansichten und Werkzeugleisten definiert, die auf eine ganz bestimmte Sorte von XML-Dokumenten angewendet werden können. Oxygen XML liefert einige Frameworks für weit verbreitete XML-Schemata schon mit, so z.B. für Docbook und DITA – oder eben für die TEI. Viel spannender ist aber die Möglichkeit, selbst eigene Frameworks zu erstellen, die genau für das eigene XML-Schema passen und maßgeschneiderte Werkzeugleisten und Ansichten mitbringen. Dieses Tutorial gibt Ihnen einen Überblick darüber, wie ein solches Oxygen-Framework erstellt wird. Den ganzen Beitrag lesen

Datenarchäologie und Datenaufbereitung

von Fabian Körner

Die Idee vom Begriff der Datenarchäologie entwickelte sich im Laufe der Arbeit an diversen Projekten, die eine Nutzung bestehender Datenmengen im Rahmen neu zu entwickelnder Anwendungen für deren Präsentation bzw. Weiterverarbeitung zum Ziel hatten. Er ist nicht neu, soll aber im hier beschriebenen Kontext anders verstanden werden als technische Verfahren zur Rettung sonst verlorener Daten z.B. von veralteten Datenträgern. Bei der Arbeit mit elektronischen geisteswissenschaftlichen Datenquellen zeigt sich unter anderem, dass ihre Übertragung in eine dem neuartigen Zweck entsprechende Form oftmals mit größerem Aufwand verbunden ist, als man zunächst annimmt. Nichtsdestotrotz ist eine allgemeine Methode erkennbar, die in angepasster Form auf eine Vielzahl von zu transformierenden Datenbeständen anwendbar ist und neben der praktischen Durchführung die Abschätzung des Bedarfs an Zeit und Kompetenz für ein derartiges Vorhaben erleichtern kann.

Den ganzen Beitrag lesen

SDH – NEERI 2010 in Wien

In Wien finden vom 19. bis zum 21. Oktober 2010 die gekoppelten Veranstaltungen SDH und NEERI statt.

Den ganzen Beitrag lesen

Zotero 2.0 verfügbar

Seit gestern ist die stabile Version 2.0 von Zotero verfügbar. Zotero ist ein Add-on für den Browser Firefox, mit dessen Hilfe gedruckte Literatur, sowie Webseiten und PDFs verwaltet bzw. gespeichert werden können. Außerdem können Notizen hinzugefügt werden. Plugins für Microsoft Word und Open Office erlauben das Zitieren von in Zotero gespeicherten Titeln aus den gängigen Textanwendungen heraus. Neu in Version 2.0 sind u.a. die Synchronisierungsfunktionen, um von mehreren Rechnern Zugriff auf die eigene Bibliothek zu haben sowie die Möglichkeit, „Gruppen“ auf zotero.org einzurichten, um kollaborativ Bibliographien zu erstellen und öffentlich zugänglich zu machen.

Zotero wird vom „Center for History and New Media“ an der George Mason University in der Nähe von Washington D.C. entwickelt und unter einer Open-Source-Lizenz veröffentlicht.