Штучний інтелект від DeepMind передбачив дощ

Розробники штучного інтелекту DeepMind у співпраці із метеорологами навчили на радарних даних алгоритм передбачати час і місце утворення опадів у найближчі півтори години. Більш як 50 експертів допомагали оцінювати ефективність нейромережі, яка перевищила 90 відсотків порівняно із традиційними методами прогнозування погоди. Результати компанія опублікувала у Nature.

Blade Runner / Warner Bros., 1982

Blade Runner / Warner Bros., 1982

Як передбачати погоду?

Синоптики складають прогноз погоди за даними цілої мережі для відстеження того, що відбувається на Землі. Це сукупність інформації з гідрологічних і агрометеорологічних станцій, а також спостережень за змінами на землі, в повітрі і воді. І хоча зараз ми легко можемо дізнатися, чи варто брати парасольку, вченим все ще складно справлятися з таким поняттям, як поточна погода — точність прогнозу до двох годин. Прогноз поточної погоди впливає на діяльність майже всіх сфер життя, у тому числі служб екстреної допомоги, енергоменеджмент, торгівлю, системи раннього попередження про повені, авіадиспетчерські і морські служби. Ефективний прогноз поточної погоди має містити точні прогнози у декількох просторових і часових масштабах, враховувати невизначеність і перевірятися імовірнісно. Особливо важливо, щоб він міг визначити ймовірність сильних опадів, які зустрічаються рідше, але набагато більш критично впливають на життя. Сучасні оперативні методи прогнозування поточної погоди зазвичай звертають увагу на адвекцію холодних, теплих, сухих і вологих повітряних мас за допомогою радіолокаційних оцінок вітру. Однак, вони не дають змоги вловити важливі нелінійні події — конвективні явища, пов'язані з спадними потоками повітря у зонах купчасто-дощових хмар. До таких відносяться і небезпечні явища шквалів вітру, смерчів, граду та злив.

Хіба прогноз погоди не задача для ШІ?

Дійсно, коли нам потрібно враховувати велику кількість параметрів і на їхній основі будувати припущення, найкраще це довірити штучному інтелекту. Нейронні мережі вже вміють це робити і їх активно використовують. Однак не зважаючи на те, що вони точно пророкують опади низької інтенсивності, їх можливості обмежені розмитими прогнозами. Вся справа у тому, що популярні і набагато більш точні методи ансамблевого прогнозування, які дозволяють не тільки більш точно прогнозувати стан атмосфери, а й оцінити достовірність оцінки, на відміну від детермінованого прогнозу, багаторазово відтворюють кілька моделей атмосфери. І так у довгостроковій перспективі вони дійсно набагато більш ефективні, але не можуть точно прогнозувати погоду на найближчі дві години просто тому що не встигають «розігнати» передбачувальні алгоритми для створення декількох реалістичних прогнозів опадів з даних про стан атмосфери.

Альтернативою здалося використання додатково даних з радарів. Метеорологічна служба Великобританії отримує радарні зображення кожні п'ять хвилин, а алгоритми імовірнісного прогнозування поточної погоди, такі як PySTEPS, наприклад, моделюють за ними опади, порівнюючи фізику руху повітряних мас з радіоданими. Однак інформацію про нелінійні події несподіваного виникнення конвекції і опадів вони надати не можуть. Їхні прогнози здатні або передбачити конкретне місце, де варто очікувати опадів, або час, але не здатні робити це одночасно, що зменшує цінність їхніх прогнозів. Вчені вважають, що одночасні узгоджені передбачення і у просторі, і у часі, можна отримати навчаючи ці моделі на великих масивах радіолокаційних спостережень, а не покладаючись на вбудовані фізичні припущення. На цьому і заснована нова робота розробників DeepMind.

Що пропонує DeepMind?

Щоб створювати більш точні прогнози, у DeepMind використовували глибинні генеративні моделі (deep generative models, DGMs). Це статистичні моделі, які вивчають ймовірність розподілу даних і дають змогу легко створювати вибірки з отриманих ними розподілів. Оскільки генеративні моделі є ймовірнісними, вони можуть моделювати безліч вибірок з даних спостережень радарів, створюючи набір прогнозів, подібно ансамблевим методам. Нова нейромережа робить прогноз погоди, моделюючи можливі дані радара, з огляду на попередні радіолокаційні оцінки. Так вона бере чотири послідовних набори даних з радарів (попередні 20 хвилин), а потім намагається зрозуміти, якими вони будуть у наступні півтори години. Для цього їй необхідні дві генеративні змагальні нейромережі. Мета першої — відрізняти окремі спостережувані радіолокаційні дані від згенерованих, а другої — розрізняти спостережувані і згенеровані радіолокаційні послідовності. Це забезпечує часову і просторову узгодженість, а також перешкоджає помилковим прогнозам. Підхід дуже схожий на нейромережі, які здатні створювати відео — по суті, послідовність кадрів.

Порівняння прогнозів алгоритму DeepMind (зліва вгорі ) з дійсними даними радара (справа вгорі), а також з передбаченнями інших алгоритмів (внизу) / DEEPMIND

Порівняння прогнозів алгоритму DeepMind (зліва вгорі ) з дійсними даними радара (справа вгорі), а також з передбаченнями інших алгоритмів (внизу) / DEEPMIND

Так створена модель може передбачати погодні явища меншого масштабу, які за своєю природою важко передбачити, а також пророкує місце випадання опадів так само точно, як і системи, налаштовані на цю задачу, зберігаючи при цьому просторово-часові характеристики. Вона змогла передбачити середні (інтенсивність більше 5 міліметрів на годину) і сильні (інтенсивність більше 10 міліметрів на годину) дощі за пів години, годину і півтори години, що вчені порівнювали з даними про погоду за 2019 рік. Потім вони провели двоетапне опитування групи з 56 експертів-метеорологів з Метеорологічного бюро Великобританії. Їх попросили порівняти прогнози нової нейромережі, прогнози вже існуючих моделей, а також і самим надали радарні дані. У підсумку, у 93 відсотках випадків метеорологи обирали прогнози поточної погоди від створеної DeepMind моделі. Хоча зазначили, що такий генеративний метод хоч і обійшов попередні моделі, прогнозувати сильні опади йому все ще вдається погано.

Ми встигли описати вже багато успіхів алгоритмів від DeepMind. Вони стали авторами проривного для науки алгоритму AlphaFold, що зміг передбачити структури білків за кілька днів, що раніше могло займати роки. Затим цей же AlphaFold передбачив структуру близько 20 тисяч білків, що кодуються людським геномом, а також ще 20 організмів — від плодової мушки до кишкової палички. А їхня ігрова нейромережа навчилася грати в ігри без знання правил — їй піддалися шахи, ґо, а також 57 ігор на приставці Atari.