Willem Prins

Über Geschichte, Technologie und das L(andl)eben

Digitales Archiv mit Elasticsearch für Amstelodamum

2015 wandte sich der Vorstand der Amsterdamer Geschichtsgesellschaft Amstelodamum an mich, um ihr digitales Archiv mit Zeitschriften und Jahrbüchern, die bis ins Jahr 1902 zurückreichen, wieder online zu stellen.

Über das Projekt

Dies sind einige der wichtigsten Herausforderungen für dieses Projekt:

  • Einsatz von OCR-Texterkennungssoftware zur Erstellung von Volltext-Assets für jede digitalisierte Ressource
  • Erstellung eines Elasticsearch-Index und einer einfachen, eigenständigen API-Anwendung auf der Grundlage von Express (NodeJS), um diesen Index auf der Website verfügbar zu machen
  • Erstellung eines WordPress-Plugins zur Authentifizierung mit der Elasticsearch-Anwendung, um jedem Besucher der Website der Gesellschaft eine Archivübersicht und eine Volltextsuchfunktion zur Verfügung zu stellen.

Drei Jahre nach der Einführung der Anwendung wurde das Archiv der Gesellschaft in ein groß angelegtes Digitalisierungsprojekt des Stadtarchivs(archief.amsterdam) einbezogen, wodurch das digitale Archiv überflüssig wurde.

Was ich aus diesem Projekt gelernt habe

Durch dieses Projekt konnte ich praktische Erfahrungen mit verschiedenen Aspekten der digitalen Archivierung sammeln. Es erforderte auch einen tiefen Einblick in die Entwicklung von NodeJS-Anwendungen:

  • Aufbau einer API-Architektur mit Express
  • Umgang mit der Indizierung von Elasticsearch und Interaktionen mit der offiziellen JS-Bibliothek
  • Aufbau einer API-Integration in ein eigenständiges WordPress-Plugin

Bilder