E-Periodica – Next Level Access
Ziel des Projektes
Basierend auf Named Entity Recognition, Named Entitiy Linking sowie anhand von automatisierter OCR‐Korrektur werden auf der Plattform E‐Periodica erweiterte und verbesserte Recherchefunktionen implementiert.
Beschreibung des Projektes
Im Projekt Periodica: Next Level Access werden anhand automatisierter Textanreicherung zusätzliche Recherche‐ und Analysemöglichkeiten entwickelt. Aus einem Backend‐System resultieren Funktionen wie zum Beispiel Named Entity Recognition von Personen, Orts‐ und Ländernamen sowie Named Entity Linking (GND) der erkannten Entitäten. Zudem sollen automatisierte OCR‐Korrekturen auf den Gesamtbestand der Zeitschriften angewendet werden. Auf Ebene des Frontends sollen die Anreicherungen und damit verbundene Features wie Verlinkungen zu weiterführenden Informationen sicht‐ und nutzbar gemacht werden.
Synergien und Kontext
- Vorhandener Datenbestand E-Periodica (Volltextdateien, 7 Mio. Seiten)
- Pilotprojekt im Bereich Texterkennung, durchgeführt 2017
- Forschungszusammenarbeit im Bereich Texterkennung
Zeitrahmen
- Bis Ende 2019: Umsetzung der ersten Konzeptphase; über die Umsetzung der weiteren Phasen wird anschliessend entschieden.
- Bis Ende 2021/2022: Entwicklung des Backend-Systems und Implementierung erweiterter Recherchemöglichkeiten im Frontend.