E-​Periodica – Next Level Access

Ziel des Projektes

Basierend auf Named Entity Recognition, Named Entitiy Linking sowie anhand von automatisierter OCR‐Korrektur werden auf der Plattform E‐Periodica erweiterte und  verbesserte Recherchefunktionen implementiert.

Beschreibung des Projektes

Im Projekt Periodica: Next Level Access werden anhand automatisierter Textanreicherung zusätzliche Recherche‐ und Analysemöglichkeiten entwickelt. Aus einem Backend‐System resultieren Funktionen wie zum Beispiel Named Entity Recognition von Personen, Orts‐ und Ländernamen sowie Named Entity Linking (GND) der erkannten Entitäten. Zudem sollen automatisierte OCR‐Korrekturen auf den Gesamtbestand der Zeitschriften angewendet werden. Auf Ebene des  Frontends sollen die Anreicherungen und damit verbundene Features wie Verlinkungen zu weiterführenden  Informationen sicht‐ und nutzbar gemacht werden. 

Synergien und Kontext

  • Vorhandener Datenbestand E-Periodica (Volltextdateien, 7 Mio. Seiten)
  • Pilotprojekt im Bereich Texterkennung, durchgeführt 2017
  • Forschungszusammenarbeit im Bereich Texterkennung

Zeitrahmen

  • Bis Ende 2019: Umsetzung der ersten Konzeptphase; über die Umsetzung der weiteren Phasen wird anschliessend entschieden.
  • Bis Ende 2021/2022: Entwicklung des Backend-Systems und Implementierung erweiterter Recherchemöglichkeiten im Frontend.

Kontakt

Regina Wanger
Leitung DigiCenter
  • +41 44 632 69 10
Portrait Regina Wanger
JavaScript wurde auf Ihrem Browser deaktiviert