Zum Hauptinhalt springen

Musterhaft – Wie künstliche neuronale Netzwerke die Geoforschung revolutionieren können

Dr. Hannes Vasyura-Bathke. Foto: Tobias Hopfgarten.
Foto :
Dr. Hannes Vasyura-Bathke. Foto: Tobias Hopfgarten.

Geoforscher haben ein Problem: Die Phänomene, die sie untersuchen, sind derart komplex, dass ihnen nur schwer auf die Spur zu kommen ist. Mit neuen Sensortechnologien, Satellitenüberwachung und Computermodellen der Prozesse im Erdinneren kommen sie ihnen zwar näher. Aber dabei baut sich eine andere Hürde auf: Selbst modernste Hochleistungscomputer brauchen sehr lange, die vielschichtigen Modelle zu berechnen. Abhilfe könnte der Einsatz Künstlicher Intelligenz (KI) schaffen. Dr. Hannes Vasyura-Bathke entwickelt ein System, das Modellierungen, die bislang einen Rechner wochenlang beschäftigen, in wenigen Sekunden bewältigt – und das auch noch genauer.

Hannes Vasyura-Bathke ist Geowissenschaftler, seine Schwerpunkte sind Erdbeben- und Vulkanphysik. Ein Forschungsfeld, das in den vergangenen Jahren stark von den technischen Entwicklungen profitiert hat. Mit Computerprogrammen lassen sich Prozesse und Phänomene modellieren, die mit Messinstrumenten nur indirekt erfassbar sind, weil sie teilweise mehrere Kilometer tief in der Erdkruste ablaufen. Inzwischen sind sie in der Lage, erste Aussagen darüber zu treffen, was im Erdinneren passiert, wenn es an der Oberfläche bebt. Wo brechen Gesteinsmassen? Wohin verschieben sie sich und wie weit? Ausdehnung, Verschiebung und Magnitude von seismischen Vorgängen lassen sich auf der Grundlage von Messdaten simulieren. Doch obwohl ihnen Big Data und Computermodelle größere Möglichkeiten eröffnet haben, stoßen Geoforscher bereits an neue Grenzen. Und wieder sind sie technischer Natur: Die mathematische Modellierung am Computer, d.h. die Suche nach den Erdbebenquellparametern und ihren Ungenauigkeiten, die die Messdaten ähnlich gut erklären, ist komplex und dauert mitunter wochenlang. Denn dabei müssen Millionen Modelle mit leicht veränderten Parametern immer und immer wieder gerechnet werden. „Das ist ein Flaschenhals, der uns am Fortkommen hindert“, ärgert sich Vasyura-Bathke. „Eigentlich möchte man dieselbe Rechnung nicht immer und immer wieder machen, sondern gleich zur Lösung kommen.“

Die KI lernt, Muster wiederzuerkennen

Ein Wunsch, den sich der Geophysiker mittlerweile in einem eigenen Forschungsprojekt zu erfüllen versucht: Er entwickelt ein KI-System, das die Modellierung übernimmt – und mit jedem Durchlauf schlauer wird. „Wir errechnen damit keine anderen Lösungen. Wir modellieren die gleiche Physik, nur schneller“, so der Forscher. Wenn die Methode funktioniert, könnten bald ein paar Sekunden reichen, um aus neuen Daten ein Modell zu erstellen. Das „System“ ist ein künstliches neuronales Netzwerk. „Man könnte es sich wie ein kleines Gehirn vorstellen“, erklärt Vasyura-Bathke. Das Besondere: Die KI speichert nicht die millionenfach ausgeführten Rechnungen, um sie bei Bedarf schnell abrufen zu können. Sie lernt vielmehr, Muster in den Daten zu erkennen. „Um eine Banane zu identifizieren, brauchen wir ja auch nicht 30 Bilder einer Banane, sondern die charakteristischen Merkmale, die eine Banane ausmachen.“ Genau diese Kriterien sind es, die das Netzwerk identifizieren und sich merken soll – und die es lernen muss.
Technisch gesehen besteht die KI aus mathematischen Algorithmen, Filtern, die auf Messdaten angewendet werden. Erst viele hintereinandergeschichtete Filter bilden zusammen das neuronale Netzwerk. Damit funktioniert es ähnlich wie etwa das Tool zur Gesichtserkennung bei Facebook oder zur Entsperrung von Smartphones – nur eben mit Satellitenbildern und seismischen Wellenaufzeichnungen. Um die Muster zu lernen, muss das KI-System trainiert werden. „Bei bisherigen Methoden werden die Messdaten in ein Programm eingegeben und dann geschaut, ob das errechnete Modell zu den Messungen passt. Für das Training der KI drehen wir diesen Prozess um“, erklärt der Forscher. Zum Anfang „füttert“ er das System mit validierten Daten, also Paaren von Messdaten und errechneten Modellen, von denen bekannt ist, dass sie stimmen.
„Davon haben wir aber tatsächlich nur ein paar Hundert.“ Eigentlich brauche man aber viel mehr. Dafür würden die Daten simuliert und ein „Rauschen“ hinzugefügt – Fehlerquellen, Abweichungen, die real vorkommen und stets auch die Messungen beeinflussen. „Anfangs liegt das System oft daneben. Aber dann sagt man ihm, um wie viel – und es korrigiert die Filter.“ Auf der Basis der bekannten Datenpaare rechnet die KI Millionen leicht variierte Modelle durch und verfeinert – angeleitet durch ihre Trainer – die Filter immer weiter. Ein Prozess, der lange dauert, aber letztlich viel Zeit sparen soll. Denn wenn sie erfolgreich trainiert ist, kann die KI die Daten den physikalischen Größen eines Erdbebens zuordnen. Dabei trainiert Hannes Vasyura-Bathke keinen raumfüllenden Supercomputer, sondern letztlich ein Computerprogramm, das kaum mehr als ein paar Megabyte groß ist.

An der Schnittstelle verschiedener Disziplinen

Auf die Idee kam der Wissenschaftler beim Lernen: „Inzwischen muss man ja sowieso alles selbst programmieren. Und wenn man sich in den dazugehörigen Foren herumtreibt, stößt man früher oder später unweigerlich auf ‚Machine Learning‘.“ Erst jetzt sei die technische Entwicklung aber reif für ein solches Vorhaben, erklärt der junge Geowissenschaftler. „Das Machine Learning hat in den vergangenen Jahren entscheidende Fortschritte gemacht, etwa was die Methoden angeht, wie sich die KI die Muster merken kann.“ Das Vorhaben ist Neuland, nicht nur für den Geoforscher. Die Schwierigkeit besteht darin, dass dafür Expertise aus überaus verschiedenen Fachgebieten nötig ist. Am besten ist man Geodät, Geophysiker und Informatiker in einem. Um sich in all diese Felder einzuarbeiten, habe er Jahre gebraucht, sagt Vasyura-Bathke. Zugleich hat er sich kompetente Partner gesucht: an der Uni Potsdam die Machine Learning Group um Prof. Dr. Tobias Scheffer vom Institut für Informatik und Computational Science sowie den Geophysiker Dr. Matthias Ohrnberger vom Institut für Erd- und Umweltwissenschaften. Dazu kommt die Arbeitsgruppe für Seismologie um Prof. Dr. Torsten Dahm am GFZ. Sie alle helfen ihm dabei, sein KI-System weiterzuentwickeln und zu schulen.
Denn wie jeder Schüler hat auch die KI Lernprobleme zu bewältigen. Derzeit „kämpft“ sie mit der Komplexität der Aufgabe. „Das Netzwerk hat Schwierigkeiten damit, Parameter mit unterschiedlichen mathematischen Einheiten gleichzeitig zu lernen“, sagt Hannes Vasyura-Bathke. Während die Orientierung einer Erdbebenfläche im Raum in Grad bestimmt wird, lassen sich Verschiebungen von Gesteinsmassen in Metern beziffern. Sie zu kombinieren, ist eine Herausforderung. Wie viele Modellierungsalgorithmen sich in einem KI-System zusammenführen lassen, wissen die Forscher bislang nicht. „Wir sind die ersten, die so etwas machen – die Verbindung aus Geowissenschaften und Machine Learning steht noch ganz am Anfang. Gut möglich, dass man verschiedene Netzwerke für verschiedene Probleme entwickelt. Es ist aber auch denkbar, dass am Ende ein Netzwerk alles macht.“

Erdbeben schneller und genauer lokalisieren

Bislang hat der Geophysiker gemeinsam mit den beiden Wissenschaftlern Marius Kriegerowski von der Uni Potsdam und Gesa Petersen vom Geoforschungszentrum Potsdam einem KI-System die Lokation anhand der drei Ortskoordinaten im Raum – Latitude, Longitude, Tiefe – beigebracht. Als erste Prüfung sollte es Daten zur Lokalisierung von Erdbeben im Vogtland auswerten. Dort werden über lange Zeiträume hinweg an verschiedenen Messstationen seismische Wellen aufgezeichnet. Deren Analyse lässt Rückschlüsse darauf zu, wo und wann es Erdbeben gab. Bislang erfolgt die Lokalisation von Erdbeben mit viel Handarbeit und mithilfe von Standardmethoden, die zwar eine sehr genaue Analyse erlauben, allerdings auch mit erheblichem Arbeitsaufwand verbunden sind, so Vasyura-Bathke. „Unser neuronales Netzwerk kann die Aufgabe mit ähnlicher Genauigkeit erledigen, dies jedoch etwa 100 bis 1000 Mal schneller als vergleichbare Methoden! Das ermöglicht eine zukunftsfähige, ganzheitliche Datenauswertung auch bei zunehmend größeren seismologischen Datenmengen.“ Nun schickt der Geoforscher ein weiteres Netzwerk auf die Schulbank, denn es muss für jede Fragestellung ein neues trainiert werden. Bis eines von ihnen wirklich zum automatisierten, operativen Einsatz kommen kann, dürften noch einige Jahre vergehen, schätzt der Wissenschaftler. Aber dann könnten sie wahrscheinlich auch komplexere Phänomene modellieren – und weiter lernen.

Das Projekt

Artificial Intelligence support for rapid analysis of earthquakes and volcanic activity. (Unterstützung von künstlicher Intelligenz für die schnelle Auswertung von Erdbeben und Vulkanaktivitäten)
Laufzeit: 2017–2019
Förderung: Geo.X The Research Network for Berlin and Brandenburg
Beteiligt: Universität Potsdam; Helmholtz Zentrum Potsdam – Deutsches GeoForschungsZentrum GFZ

Der Wissenschaftler

Dr. Hannes Vasyura-Bathke studierte Geophysik und promovierte 2013 an der Universität Potsdam über Geophysik. Seit 2017 ist er Wissenschaftlicher Mitarbeiter am Institut für Erd- und Umweltwissenschaften.
hvasbathuni-potsdamde

Die Arbeit zur Lokalisiation der Beben mithilfe eines Convolutional Neural Networks wurde 2018 publiziert:

Marius Kriegerowski, Gesa M. Petersen, Hannes Vasyura‐Bathke, Matthias Ohrnberger (2018); A Deep Convolutional Neural Network for Localization of Clustered Earthquakes Based on Multistation Full Waveforms. Seismological Research Letters ; 90 (2A): 510–516. doi: https://doi.org/10.1785/0220180320

Text: Matthias Zimmermann
Online gestellt: Marieke Bäumer
Kontakt zur Online-Redaktion: onlineredaktionuni-potsdamde