Poplave su među najsmrtonosnijim vremenskim događajima u svijetu, ubijajući više od 5.000 ljudi svake godine. Također su među najtežima za predviđanje. No, Google smatra da je pronašao rješenje problema na neobičan način – proučavanjem vijesti.
Dok su ljudi skupili mnogo podataka o vremenu, poplave su prekratke i lokalizirane da bi se mogle mjeriti sveobuhvatno, kao što se to radi s temperaturama ili protokom rijeka tijekom vremena. Taj podatkovni jaz znači da modeli dubokog učenja, koji su sve sposobniji u predviđanju vremena, nisu u mogućnosti predvidjeti poplave.
Kako bi riješili taj problem, Googleovi istraživači koristili su Gemini – Googleov veliki jezični model – kako bi pregledali 5 milijuna članaka iz cijelog svijeta, izolirajući izvještaje o 2,6 milijuna različitih poplava i pretvarajući te izvještaje u geo-označenu vremensku seriju nazvanu “Groundsource.” Ovo je prvi put da je tvrtka koristila jezične modele za ovakvu vrstu posla, prema riječima Gile Loike, menadžerice proizvoda u Google Researchu. Istraživanje i skup podataka javno su podijeljeni u četvrtak ujutro.
Koristeći Groundsource kao stvarnu osnovicu, istraživači su obučili model temeljen na neuronskoj mreži Long Short-Term Memory (LSTM) kako bi unosili globalne vremenske prognoze i generirali vjerojatnost poplava u određenom području.
Googleov model za predviđanje poplava sada ističe rizike za urbana područja u 150 zemalja na tvrtkinoj Flood Hub platformi i dijeli svoje podatke s agencijama za hitne intervencije diljem svijeta. António José Beleza, službenik za hitne intervencije u Južnoafričkoj razvojnog zajednici koji je testirao model predviđanja s Googleom, rekao je da je to pomoglo njegovoj organizaciji da brže reagira na poplave.
Ipak, postoje ograničenja modela. Naime, ima prilično nisku razlučivost, identificirajući rizik na područjima od 20 četvornih kilometara. Također, nije toliko precizan kao sustav upozorenja na poplave Nacionalne meteorološke službe SAD-a, dijelom zato što Googleov model ne uključuje lokalne radarske podatke, koji omogućuju praćenje oborina u stvarnom vremenu.
Jedan od ciljeva projekta je rad u mjestima gdje lokalne vlasti ne mogu priuštiti skupu infrastrukturu za mjerenje vremena ili nemaju opsežne evidencije meteoroloških podataka.
Juliet Rothenberg, menadžerica programa u Googleovom timu za otpornost, izjavila je da skup podataka Groundsource zapravo pomaže u ravnoteži karte, omogućujući extrapolaciju na druga područja gdje nema dovoljno informacija. Tim se nada da će korištenje LLM-ova za razvoj kvantitativnih skupova podataka iz pisanih, kvalitativnih izvora moći primijeniti na izradu skupova podataka o drugim prolaznim, ali važnim fenomenima za predviđanje, poput toplinskih valova i klizišta.
Marshall Moutenot, izvršni direktor Upstream Techa, tvrtke koja koristi slične modele dubokog učenja za predviđanje protoka rijeka, rekao je da je Googleov doprinos dio rastuće inicijative za prikupljanje podataka za modele predviđanja vremena temeljenih na dubokom učenju. Moutenot je suosnivač dynamical.org, grupe koja kurira zbirku podataka o vremenu spremnih za strojno učenje za istraživače i startupe.
“Nedostatak podataka jedan je od najtežih izazova u geofizici,” rekao je Moutenot. “Istovremeno, postoji previše podataka o Zemlji, a kada želite procijeniti istinitost, nema dovoljno. Ovo je zaista kreativni pristup za dobivanje tih podataka.”



