Aktuelles
Suchportale für historische Zeitungen und zeitgenössische Südtiroler Texte
Durch Digitalisierung können historische Zeitungen nicht nur konserviert, sondern auch einfacher zugänglich gemacht werden. Gemeinsam mit der Landesbibliothek Friedrich Teßmann haben Computerlinguisten der Eurac zwei digitale Suchportale für Südtiroler Kulturdokumente entwickelt und heute (30. März) vorgestellt.
Die Kombination und Weiterentwicklung neuester Technologien aus der Computerlinguistik, Statistik und Informationsvisualisierung, um Suchportale für Textsammlungen zu erweitern und verbessern: An diesem gemeinsamen Anliegen haben Computerlinguisten der Europäischen Akademie mit Bibliothekaren der Teßmann und Wissenschaftlern des Instituts für Corpuslinguistik und Texttechnologie der Österreichischen Akademie der Wissenschaften in Wien gearbeitet. Ausgehend von den Anforderungen der verschiedenen Nutzer wurde dabei ein System entwickelt, das den gesamten Arbeitsablauf abdeckt: von der Gewinnung der Daten über die Verarbeitung bis hin zu ihrer Präsentation über Nutzerportale.
Heute finden sich in der Landesbibliothek Teßmann bereits ein Dutzend deutschsprachiger historischer Tageszeitungen aus dem Alpenraum für den Zeitraum 1910 bis 1920 in dem digitalen Zeitungsarchiv, das unter http://digital.tessmann.it zugänglich ist. Durch die beigefügten Volltextdaten ergeben sich so nicht nur für Historiker, Chronisten und Ahnenforscher neue komfortable Forschungsansätze und Recherchewege.
"Durch die Zusammenarbeit mit den Computerlinguisten", betonte Teßmann-Direktor Johannes Andresen bei der heutigen Vorstellung, "ist uns bewusst geworden, was uns Sprachtechnologien an neuen Möglichkeiten bieten, die Dienste für unsere Bibliotheksnutzer noch weiter zu verbessern. Wir möchten auch weiterhin in diese Richtung arbeiten, da wir überzeugt sind, dass dies die Zukunft ist." "Die Suchportale und die dahinterstehende Technologie", erklärte Eurac-Computerlinguistin Verena Lyding, "sind so konzipiert, dass sie auch von ähnlich gelagerten Projekten nachgenutzt werden können, insbesondere in Zusammenarbeit von Wissenschaft, Archiv und Bibliothek".
Neben dem digitalen Zeitungsarchiv gibt es auch ein neues Portal zur linguistischen Analyse von zeitgenössischen Südtiroler Texten wie zum Beispiel Romane, Fachartikel oder auch Rezepte. Auf der Plattform können Linguisten etwa untersuchen, welche Wörter häufig zusammen verwendet werden oder auch, wie sich der Wortgebrauch verändert. Dazu stehen verschiedene graphische Darstellungsformen, sogenannte Visualisierungen, zur Verfügung. Über Liniendiagramme wird aufgezeigt, wie sich die Häufigkeiten von Wörtern in verschiedenen Texten und über die Zeit verhalten. Bäumchenartige Visualisierungen hingegen zeigen, welche Kontexte für ein Suchwort besonders typisch sind. "Für uns war es sehr spannend, an den verschiedenen Visualisierungsformen zu arbeiten und diese so zu gestalten, dass man damit einen schnellen Überblick über die Rechercheergebnisse gewinnt", unterstrich Computerlinguistin Lyding.
Einstiegsseite zu den zwei Suchportalen: http://commul.eurac.edu/opatch/
Das Projekt wurde über das Landesgesetz 14 durch die Autonome Provinz Bozen – Südtirol, Abteilung 34. Innovation, Forschung und Universität finanziert.
mac