Transkribus. Eine Forschungsplattform für die automatische Transkription, Erkennung und Suche in historischen Dokumenten
Dr. Günter Mühlberger, Universität Innsbruck
War es bis vor wenigen Jahren unvorstellbar, dass historische Handschriften automatisiert texterkannt werden können, so haben maschinenlernende Verfahren nunmehr den Durchbruch gebracht. Ob mittelalterlicher Codices oder frühneuzeitliche Handschrift, ob Arabisch, Hebraeisch oder Bangla - mit einigen Dutzend Seiten können die zugrundeliegenden neuronalen Netze so trainiert werden, dass die Transkription für die weitere Verarbeitung brauchbar ist. Um die Technologie einem großen Kreis an Nutzerinnen und Nutzern verfügbar zu machen, wurde im Rahmen zweier EU Projekte die Froschungsplattform Transkribus entwickelt. Mit Transkribus erhalten Nutzerinnen und Nutzer ein Werkzeug, mit dem sie selbst alle Schritte im Workflow abdecken können. Mehr als 18.000 Benutzer haben sich in der Plattform bereits registriert und vielfach das Programm ausprobiert. Der Vortrag wird anhand konkreter Beispiele die Leistungsfähigkeit moderner Texterkennungsverfahren geben, sowie einen Ausblick auf die künftigen Entwicklungen bieten.
Günter Mühlberger ist Koordinator des E-Infrastruktur-H2020-Projekts READ (Recognition and Enrichment of Archival Documents). Zugleich leitet er das Forschungszentrum Digital Humanities an der Universität Innsbruck. G. Mühlberger arbeitet seit über 20 Jahren in den Bereichen Digitalisierung, digitale Archivierung, digitale Bibliothek und Digital Humanities. Er initiierte und leitete eine Vielzahl an nationalen und internationalen Forschungs- und Digitalisierungsprojekten. Zur Zeit koordiniert er die Transformation einer öffentlich finanzierten Forschungsinfrastruktur in ein Spin-Off-Unternehmen, damit die Forschungsinfrastruktur auch unabhängig von der öffentlichen Finanzierung bestehen bleiben kann.