Neue Datenquellen mit ChatGPT und Co. erkunden

Participants of the first Text-as-Data workshop hosted by the University of Potsdam — Foto: Deva Charan Jarajapu

Stellen Sie sich vor, Sie versuchen die öffentliche Meinung zum Klimawandel zu verstehen. Wie gehen die Menschen mit einer Hitzewelleum? Welche Auswirkungen haben Dürren auf die Land- und Forstwirtschaft, den Tourismus oder die Energiesysteme? Sie könnten Umfragen durchführen, um das herauszufinden, oder Sie könnten auf bereits vorhandene Informationen zurückgreifen. In Zeitungen, sozialen Medien, Regierungsberichten und wissenschaftlichen Artikeln wird viel über diese Themen geschrieben, so dass wir eine Fülle von Informationen zur Verfügung haben. Angesichts des zunehmenden Risikos von Naturkatastrophen aufgrund des Klimawandels müssen wir alle uns zur Verfügung stehenden Informationen nutzen, um Lösungen zu finden. Text-als-Daten ist der Name für eine Vielzahl von Methoden (z. B. Sprachmodelle wie ChatGPT), die unstrukturierte Textdaten analysieren, um aussagekräftige Informationen und Muster zu extrahieren.

Die Gemeinschaft der Experten, die Text-als-Daten-Methoden in der Hydrologie, im Klimawandel und in der Naturgefahrenforschung anwenden, ist klein, aber sie wächst. Im März fand der erste Workshop zum Thema "Text-as-data in Hydrology, Natural Hazards, and Climate Change Research: exploring challenges and opportunities" statt, der von der Arbeitsgruppe "Analysis of Hydrologic Systems" der Universität Potsdam (Dr. Lina Stein) ausgerichtet und vom Helmholtz-Zentrum für Umweltforschung (Dr. Mariana De Brito) und dem Potsdam-Institut für Klimafolgenforschung (Jakob Lochner) mitorganisiert wurde und eine Vielzahl von Forschern zu einem Tag der Vernetzung und interdisziplinären Diskussion zusammenführte.

Nach zwei Hauptvorträgen, die sich auf die jüngsten technischen Entwicklungen konzentrierten, war es an der Zeit, dass die Teilnehmer diskutierten. Welche Möglichkeiten gibt es, Text-als-Daten in den Umweltwissenschaften zu nutzen? Welche Hindernisse oder Vorurteile müssen wir beseitigen, um diese Möglichkeiten zu verwirklichen? Und was sind die konkreten Schritte, die die Text-as-Data-Gemeinschaft unternehmen könnte, um ihr Gebiet weiterzuentwickeln?

Insgesamt bot der Workshop Wissenschaftlern eine wertvolle Gelegenheit zur Zusammenarbeit und zur Erforschung des enormen Potenzials der Textdatenanalyse bei der Lösung dringender gesellschaftlicher Probleme im Zusammenhang mit Wasserressourcen, Klimaschwankungen und Katastrophenrisikomanagement. Zukünftige Treffen sind bereits in Planung, darunter der nächste Workshop im Frühjahr 2025, der am Helmholtz-Zentrum für Umweltforschung in Leipzig stattfinden wird.