von Tanja Schmutzer

Theseus und der rote Faden - eine Geschichte mit Happy-End. Neue Wege durchs Web weist das gleichnamige Forschungsprogramm. © http://www.flickr.com/photos/josef_tuerk/
Informationen und Wissen aus vorhandenen Daten besser als bisher nutzen zu können – dies ist das Ziel der 60 Partner des Forschungsprogramms THESEUS. Benannt ist dieses Leuchtturmprojekt in der Hightech-Strategie der Bundesregierung nach einem Helden der griechischen Mythologie, der seinen Weg aus dem Labyrinth des Minotaurus mit einem roten Faden fand. Ebenso soll das Forschungsprogramm THESEUS künftig Anwendern den Weg im Web weisen.
Auf der Suche nach Ariadnes rotem Faden, oder in diesem Fall nach einem anschaulichen Anwendungsbeispiel, hilft Michael Eble vom Fraunhofer IAIS: Wir stellen uns vor, wir sind ein Zeitungsverlag. Alle unsere Ausgaben seit dem Ersterscheinungstag lagern in einem gigantischen Archiv. Um die darin enthaltenen Infos öffentlich zugänglich zu machen, müssen sie digitalisiert und mit Metadaten versehen werden. Nun sind wir vielleicht kein großes, sondern ein kleines Verlagshaus – und können die erforderliche IT-Infrastruktur nicht selbst aufbauen und unterhalten. Dank THESEUS könnten wir uns an eine Dienstplattform wenden, wie sie in einem der THESEUS-Anwendungsszenarien, dem Use Case CONTENTUS, entwickelt wurde. Ähnlich wie sich die Nutzer aus vorgegebenen Strukturen bei einem Provider ihre eigene Homepage aufbauen können, bietet die “Diensteplattform Medienerschließung” eine Anlaufstelle im Web, welche die digitalisierten Inhalte unseres Archivs aufnimmt und für unsere Kunden nutzbar macht. Dabei können wir zum Beispiel wählen, in welchen Sprachen die Inhalte zur Verfügung gestellt werden, oder ob auch Schriften in Fraktur eingespeist werden. In der Diensteplattform werden dann beschädigte Schriften gleich repariert. So entstehen bei verhältnismäßig geringem Aufwand hochwertige digitale Ausgaben und Metadaten, die für die gezielte Suche nach Themen und Beiträgen unerlässlich sind. Die gewonnenen Daten können im Anschluss auf vielfältige Weise den Endnutzern zur Verfügung gestellt werden – beispielsweise als durchsuchbares Archiv im Web oder auch als themen-fokussiertes Archiv auf DVD.
Weiteres Plus der Medienerschließung mit THESEUS-Know-how: Inhalte können medienübergreifend gesucht werden – egal ob in Text-, Bild-, Audio- oder Videodateien. Sucht man etwa nach der Dreigroschenoper von Brecht, werden Originaltexte, Kritiken, Vertonungen und Mitschnitte von Inszenierungen gleichermaßen gefunden. Dafür werden die Inhalte bei der Digitalisierung nach Entitäten durchsuchbar gemacht, quasi getagged: Das stellt sicher, dass ein Disput zwischen Kohl und Strauß dem Zusammenhang der Politik zugeordnet wird und nicht dem Kontext Flora und Fauna. Großen Wert legten Auftraggeber und Entwickler auf die “Anschlusskommunikation”: So können zum Beispiel Zitate der Bundeskanzlerin zu einem Thema wie Griechenlandhilfe einfach in Netzwerkplattformen wie Facebook eingespeist werden. Medienanstalten könnten dann nicht nur Zugriffe zählen, sondern auch beobachten, welche Reaktionen ihre Berichterstattung auslöst. Elemente dieser in THESEUS entwickelten Technologien setzt beispielsweise das Fraunhofer IAIS schon heute in der Praxis ein: in der ARD-Mediathek oder im Videolexikon der Pro7-Sendung Galileo.
Eine enge Kooperation besteht zwischen den Anwendungsszenarien CONTENTUS unter Leitung der Deutschen Nationalbibliothek sowie ALEXANDRIA unter Leitung der Berliner neofonie GmbH. In beiden Szenarien werden Technologien entwickelt, die künftig in der Deutschen Digitalen Bibliothek Anwendung finden sollen. So wird es möglich, auf das Wissen in den Millionen von Büchern, Bildern, Tonbändern und Filmen der bundesweit rund 30.000 Kultur- und Wissenschaftseinrichtungen über ein zentrales Webportal zuzugreifen. Dann haben es die Entwickler und Institutionen geschafft, Ariadnes roten Faden ins Web einzustricken.
