Google nutzt alte Nachrichten und große Modelle, um neue Methoden zur Vorhersage von Sturzfluten zusammenzufassen

Sturzfluten gehören zu den tödlichsten Wetterkatastrophen der Welt und fordern jedes Jahr mehr als 5.000 Todesopfer. Aufgrund ihres schnellen Einsetzens, ihres geringen Umfangs und ihrer kurzen Dauer war es jedoch lange Zeit schwierig, sie genau vorherzusagen. Angesichts dieses Problems besteht die neue Antwort von Google darin, „KI Nachrichtenberichte lesen zu lassen“.

Bei der herkömmlichen meteorologischen Überwachung wurden große Mengen an Daten wie Temperatur, Niederschlag und Flussfluss gesammelt. Bei plötzlichen und extrem starken Sturzflutereignissen verfügt der Mensch jedoch nicht über so vollständige und kontinuierliche Beobachtungsaufzeichnungen wie bei anderen meteorologischen Elementen. Dies hat dazu geführt, dass Deep Learning zwar im Bereich der Wettervorhersage immer leistungsfähiger wird, bei der Vorhersage von Sturzfluten jedoch nicht die gleiche Leistung erbringen kann, da nicht genügend Daten mit „wahrem Wert“ zum Trainieren des Modells vorhanden sind.

Um diese Datenlücke zu schließen, nutzte das Google-Forschungsteam sein großes Sprachmodell Gemini, um etwa 5 Millionen Nachrichtenberichte aus der ganzen Welt zu durchsuchen, automatisch etwa 2,6 Millionen verschiedene Überschwemmungsereignisse zu identifizieren und zu extrahieren und diese Textberichte dann in einen Sequenzdatensatz „Groundsource“ mit Zeit- und geografischen Tags umzuwandeln. Gila Loike, Forschungsproduktmanagerin bei Google, sagte, dies sei das erste Mal, dass das Unternehmen ein großes Sprachmodell verwende, um diese Art quantitativer Datenkonstruktionsarbeiten abzuschließen. Die entsprechenden Forschungsergebnisse und Datensätze wurden am frühen Donnerstagmorgen öffentlich veröffentlicht.

Nachdem sie diese „reale Basislinie“ erhalten hatten, trainierten die Forscher ein neues Modell zur Vorhersage von Sturzfluten auf der Grundlage eines neuronalen Netzwerks mit langem Kurzzeitgedächtnis (LSTM), das es ermöglichte, globale Wettervorhersagedaten einzugeben und die Wahrscheinlichkeit von Sturzfluten in einem bestimmten Gebiet auszugeben. Derzeit hat das Sturzflutvorhersagemodell von Google auf seiner Flood Hub-Plattform Risikotipps für städtische Gebiete in 150 Ländern bereitgestellt und Daten für viele Notfallmanagementbehörden auf der ganzen Welt zugänglich gemacht. António José Beleza, ein Notfallbeauftragter der Southern African Development Community (SADC), sagte in einem Test mit Google, dass das Modell seinem Team geholfen habe, schneller auf Überschwemmungen zu reagieren.

Dieses System weist jedoch immer noch offensichtliche Einschränkungen auf. Einerseits ist seine räumliche Auflösung relativ gering und es kann derzeit nur eine Risikobewertung auf einer Skala von etwa 20 Quadratkilometern liefern; Andererseits ist seine Genauigkeit nicht so genau wie die des bestehenden Hochwasserwarnsystems des National Weather Service in den Vereinigten Staaten, da es keine Echtzeit-Niederschlagsüberwachungsdaten wie lokales Radar einbezieht.

Google betonte, dass eine der ursprünglichen Absichten dieses Projekts darin bestand, eine Rolle bei der Entwicklung von Gebieten zu spielen, in denen es an teurer Wetterbeobachtungsinfrastruktur mangelt und über keine langfristigen Wetteraufzeichnungen verfügt. Durch die Aggregation von Millionen von Nachrichtenberichten aus der ganzen Welt „balanciert“ der Groundsource-Datensatz die Karte in einem Ausmaß neu, das es Modellen ermöglicht, Vorhersagen auf Bereiche zu extrapolieren, in denen es sonst nur wenige Daten gibt. Juliet Rothenberg, Programmmanagerin im Resilienz-Team von Google, sagte, dieser Ansatz ermögliche es dem Team, Bereiche abzudecken, in denen es zuvor stark an Informationen mangelte.

Rothenberg sagte auch, dass die Idee, große Sprachmodelle zu verwenden, um Texterzählungen in strukturierte quantitative Daten umzuwandeln, nicht auf Sturzfluten beschränkt sei. Es wird erwartet, dass ähnliche Technologien in Zukunft zur Erstellung von Datensätzen zu ebenso kurzlebigen, aber äußerst wichtigen Naturphänomenen wie Hitzewellen und Schlammlawinen eingesetzt werden und eine Grundlage für die Vorhersage weiterer extremer Wetterereignisse und geologischer Katastrophen bilden.

Laut Brancheninsidern ist Googles Versuch ein wichtiger Schritt, die Entwicklung von Deep-Learning-Wettervorhersagen durch kreative Datenerfassung voranzutreiben. Marshall Moutenot, CEO von Upstream Tech, einem Unternehmen, das Deep Learning auch zur Vorhersage von Flussabflüssen für Kunden wie Wasserkraftunternehmen einsetzt, wies darauf hin, dass der aktuelle Bereich der Geowissenschaften mit dem anhaltenden Problem der „Datenknappheit“ konfrontiert sei: Einerseits seien Erdbeobachtungsdaten äußerst komplex, andererseits gebe es nur sehr begrenzte qualitativ hochwertige „Wahrheitswerte“, die zur Kalibrierung und Validierung von Modellen verwendet werden könnten. Moutenot ist außerdem Mitbegründer von Dynamical.org, einer Organisation, die sich der Organisation von Wetterdatensätzen für Forscher und Startups widmet, die direkt im maschinellen Lernen verwendet werden können. Er glaubt, dass die Arbeit von Google ein typisches Beispiel für die Gewinnung wertvoller Daten durch „sehr kreative Methoden“ ist.