KI Lectures Wie mit Künstliche Intelligenz antiker Literatur erforscht wird

Vorlesen

Eine der ältesten Schriften der Welt, die sumerische Keilschrift, entstand im späten vierten Jahrtausend vor Christus im antiken Mesopotamien. "Diese Schrift wurde auf Ton eingraviert", erklärt der Assyriologe Professor Enrique Jiménez bei den vierten virtuellen "KI Lectures" der LMU. "Ton ist das billigste und langlebigste Material für Schrift. Einmal getrocknet, ist es jedoch sehr zerbrechlich, sodass uns nur Fragmente erhalten geblieben sind."

Ein mit verschiedenen Datenmodellen gefütterter Algorithmus kann helfen, antike Textfragmente wie die des berühmten Gilgamesch-Epos zu einem vollständigen Text zusammenzuführen. Dadurch wurden bisher etwa 60 Prozent des Werks wiederhergestellt; jedes Jahr werden neue Fragmente gefunden, die richtig zugeordnet werden müssen.

Gleiches Zeichen, mehrere Bedeutungen

Bei solchen schwierigen Textrekonstruktionsaufgaben kann die Künstliche Intelligenz eine große Hilfestellung bieten. Denn eines der Kernprobleme bei der Entschlüsselung babylonischer Literatur ist die Polyvalenz der Keilschriftzeichen: "Das gleiche Zeichen kann mehrere Bedeutungen haben", erklärt Professor Jiménez von der LMU. "Ohne Kontext ist ein Keilschriftzeichen somit nicht übersetzbar."

Abhilfe schaffen mit verschiedenen Datenmodellen gefütterte Computer-Applikationen. So kann die wahrscheinlichste Lesung vorhergesagt werden - mit einer Genauigkeit von bis zu 98 Prozent, anders als beim traditionellen Textrekonstruktionsverfahren. "Das traditionelle Verfahren basiert auf dem guten Gedächtnis der Forscher und natürlich auch auf dem Zufallsprinzip", erläutert Jiménez. "Das moderne, KI-basierte Rekonstruktionsverfahren setzt hingegen auf Forscher-Datenbanken, die Tausende von Zeichen sammeln. Mithilfe von Künstlicher Intelligenz können alle bekannten Varianten eines babylonischen Textes schnell analysiert und passend eingesetzt werden."

Unterstützung bietet hier unter anderem die Sequenzanalyse, ein Verfahren aus der Molekularbiologie und Bioinformatik, das die computergestützte Bestimmung von charakteristischen Abschnitten einer DNA-Sequenz ermöglicht. Diesen Algorithmus passten Professor Jiménez und sein Team auf die Keilschrift an, um bestehende Lücken zu füllen und jedem Fragment den richtigen Text zuordnen zu können.

Algorithmen brauchen große Datenmengen

Doch damit die automatisierte Zeichenerkennung gut funktioniert, muss das System mit vielen Daten bespeist werden: "Deep Learning setzt sehr große Datenmengen voraus, die wir leider momentan in diesem Bereich noch nicht haben", sagt Jiménez. "Wir müssten als Sprachforscher viel mehr Textfragmente abfotografieren und in Datenbanken speichern. Wir haben daher mit den wichtigsten Keilschriftsammlungen der Welt, nämlich dem British Museum und dem Iraq Museum, Vereinbarungen für die Aufnahme großer Teile ihrer Sammlungen getroffen."

Mithilfe von Partnerinstitutionen hat das Team um Enrique Jiménez nichtsdestotrotz eine riesige Fragmente-Datenbank erstellt, die internationalen Wissenschaftlern zur Verfügung steht. Für den Alt-Orientalisten der LMU ein ganz klarer Hinweis, dass Informatik in Zukunft eine wichtigere Rolle auch bei der Ausbildung von Assyriologen spielen wird, da viele Aufgaben durch Voll- oder Teilautomatisierungsprozesse leichter gelöst werden können.

Gefällt mir
2
 

Topnews

Aktuelles

Rezensionen