Automatisches Lesen aus handschriftlichen Kirchenbuchaufzeichungen

Beteiligte Personen:
Markus Feldbach
Teil von Forschungsprojekt:

Heutzutage existiert eine sehr große Zahl alter Dokumente und Aufzeichnungen der vergangenen Jahrhunderte. Vor allem Kirchenbücher beinhalten Informationen, die für Historiker und Genealogen von großer Bedeutung sind (siehe z.B. unter www.genealogy.net). Darin sind die wichtigen Ereignisse festgehalten, wie Geburt, Heirat oder Tod der Menschen, die in dieser Gemeinde lebten. Bevor diese Daten in einem Informationssystem archiviert werden können, besteht das Problem der Transkription dieser Inhalte in eine elektronische Form. Zur Zeit ist dazu ein relativ hoher personeller und damit auch finanzieller Aufwand verbunden. Die Daten müssen entweder manuell eingegeben werden, oder der Text wird laut vorgelesen und von einer Spracherkennungssoftware verarbeitet. Voraussetzung ist in jedem Fall eine Person, die diese Schrift lesen kann.

Ziel unserer Forschung ist die Entwicklung eines halbautomatischen Erkennungssystems für diese alten Aufzeichnungen der Kirchenbücher. Die Aufgabe besteht aus einer Erkennung der Schriftzeilen, der Zuordnung der Schrift zu den einzelnen Zeilen, der Identifikation von zu interpretierenden Wortfolgen und letztendlich der Interpretation dieser Wortketten. Das System wird sich aus automatisch arbeitenden und interaktiven Modulen zusammensetzen, die möglichst ergonomisch gestaltet werden.

Im Bezug auf die Schriftmerkmale stehen folgende Fragen im Mittelpunkt:

  • Für viele handschriftliche Aufzeichnungen existieren bereits Lösungen (z.B. das automatische Lesen von Schecks oder Adressen auf Briefen). Was unterscheidet Kirchenbuchaufzeichnungen von diesen Schriften und welche Konsequenzen ergeben sich daraus für das Modell, das der Analyse zugrunde liegt?
  • Welche Modellannahmen ergeben sich aus der verwendeten Schreibschrift wie Gotische Kursive oder Sütterlin in Bezug auf gängige Strategien zum automatischen Lesen von Texten?
  • Welche Modellannahmen ergeben sich aus dem Zweck der Kirchenbücher (Notation von Eintragungen über Geburten, Heiraten und Todesfällen) und der Art des Entstehens (Aufzeichnungen entstanden über einen langen Zeitraum von derselben Person)?
  • Lassen sich der Einfluss der Entstehungszeit auf die Schrift und die inter- und intrapersonellen Variationen explizit in das Modell einbringen?