Вчені залучили машинне навчання для з’ясування руху чорних дір з гравітаційних хвиль
Запропоновано інверсний підхід для визначення руху бінарних чорних дір - метод на основі машинного навчання, що вимагає невисокої обчислювальної потужності.
Про це розповідають у Ліверморській національній лабораторії ім. Е. Лоуренса (LLNL) у Каліфорнії, США.
Повідомлення про те, що Лазерна інтерферометрична гравітаційно-хвильова обсерваторія (LIGO) виявила гравітаційні хвилі під час злиття двох чорних дір, пройшлося брижами по всій науковій спільноті у 2016 році. Землетрусні новини не тільки підтвердили одне з ключових передбачень Альберта Ейнштейна в його загальній теорії відносності, але також відкрили шлях до кращого розуміння руху чорних дір та інших явищ, що викривляють простір-час.
Катаклізмічні події, такі як зіткнення чорних дір або нейтронних зір, породжують найбільші гравітаційні хвилі. Бінарні чорні діри обертаються одна навколо іншої мільярди років, перш ніж врешті зіткнуться, створивши єдину масивну чорну діру. Під час останніх моментів свого злиття їх маса перетворюється на гігантський сплеск енергії — відповідно до рівняння Ейнштейна E=mc^2 — який потім можна виявити у вигляді гравітаційних хвиль.
Щоб зрозуміти рух бінарних чорних дір, дослідники традиційно спрощували рівняння поля Ейнштейна й розв’язували їх для розрахунку випромінюваних гравітаційних хвиль. Цей підхід є складним і вимагає дороговартісного, тривалого моделювання на суперкомп’ютерах або методів наближення, які можуть призвести до помилок або невдачі при застосуванні до більш складних систем чорних дір.
Разом зі співробітниками з Массачусетського університету, Дартмута та Університету Міссісіпі, математик з LLNL відкрив інверсний підхід до проблеми – метод на основі машинного навчання, здатний автоматично виводити математичну модель руху бінарних чорних дір із необроблених даних гравітаційних хвиль, що вимагає лише обчислювальної потужності ноутбука. Робота була опублікована в журналі "Physical Review Research".
Працюючи у зворотному напрямку, використовуючи дані гравітаційних хвиль з числових симуляцій відносності, команда розробила алгоритм, який міг би навчитися виводити диференціальні рівняння, що описують динаміку злиття чорних дір для ряду випадків. Стратегія з інверсією форми хвилі може швидко вивести просте рівняння з такою ж точністю, що й рівняння, на розробку яких у людей знадобилися роки, або моделі, на прогін яких на суперкомп’ютерах потрібні тижні.
«У нас є всі ці дані, які стосуються складніших систем чорних дір, і ми не маємо повних моделей, щоб описати весь спектр цих систем, навіть після десятиліть роботи», — сказав провідний автор Брендан Кіт, постдокторант в Центрі прикладних наукових обчислень LLNL. «Машинне навчання підкаже нам рівняння автоматично. Воно візьме ваші дані й виведе рівняння за кілька хвилин - годину, і це рівняння може бути таким же точним, як те, над яким людина працювала протягом 10 до 20 років».
Кіт та двоє інших членів міждисциплінарної команди зустрілися на семінарі з обчислювальної відносності в Інституті обчислювальних та експериментальних досліджень у математиці Університету Брауна. Вони хотіли перевірити ідеї з нещодавніх робіт, що описують подібний тип проблеми машинного навчання — виведення рівнянь на основі траєкторій динамічної системи — з даних нижчих вимірів, таких як гравітаційні хвилі.
Кіт, науковець у галузі обчислювальної техніки та на додачу математик, написав інверсну задачу та комп’ютерний код, а його академічні партнери допомогли отримати дані та додали фізику, необхідну для масштабування від одновимірних даних до багатовимірної системи рівнянь та інтерпретації моделі.
«У нас була деяка впевненість, що якщо ми перейдемо з одного виміру в інший, це спрацює — саме так було зроблено у попередніх роботах — але гравітаційна хвиля — це дані нижчого виміру, ніж траєкторія чорної діри», — сказав Кіт. «Це був великий, бентежливий момент, коли ми дізналися, що це працює».
Цей підхід не потребує складної загальної теорії відносності, лише застосування законів Кеплера про рух планет та математики, необхідної для розв'язання інверсної задачі. Починаючи лише з базової ньютонівської нерелятивістської моделі (наприклад, Місяць, що обертається навколо Землі) та системи диференціальних рівнянь, параметризованих нейронними мережами, команда виявила, що алгоритм може вчитися на відмінностях між базовою моделлю та моделлю, що поводитися значно по-іншому (як дві чорні діри, що рухаються по орбіті), щоб заповнити відсутню релятивістську фізику.
«Це абсолютно новий спосіб підійти до проблеми», – сказав співавтор Скотт Філд, доцент математики та науковець у галузі гравітаційних хвиль в Університеті Массачусетсу в Дартмуті. «Спільнота моделювання гравітаційних хвиль рухається до підходу, який більше керується даними, і наша робота є найбільш екстремальною версією цього підходу, коли ми покладаємося майже виключно на дані та складні інструменти машинного навчання».
Застосовуючи цю методологію до ряду бінарних систем чорних дір, команда показала, що отримані диференціальні рівняння автоматично враховують релятивістські ефекти в чорних дірах, такі як прецесія перигелію, радіаційна реакція та орбітальне занурення. У порівнянні з найсучаснішими моделями орбітальної динаміки, які наукова спільнота використовувала протягом десятиліть, команда виявила, що їхня модель машинного навчання була однаково точною й могла б бути застосована до більш складних систем чорних дір, в т.ч. ситуації з даними більшої вимірності, але обмеженою кількістю спостережень.
«Найбільш дивовижною частиною результатів було те, наскільки добре модель могла екстраполювати за межі навчального набору», — сказав співавтор Акшай Хадсе, аспірант фізичного факультету в Університеті Міссісіпі. «Це може бути використано для генерування інформації в режимі, коли детектори гравітаційних хвиль не дуже чутливі або якщо ми маємо обмежений об'єм сигналу гравітаційної хвилі».
Дослідникам потрібно буде провести більше математичного аналізу та порівняти свої прогнози з більшою кількістю числових даних відносності, перш ніж метод буде готовий до використання з поточними гравітаційними даними, зібраними з установок LIGO, сказала команда. Вони сподіваються розробити підхід байєсівської інверсії для кількісної оцінки невизначеностей та застосувати цю техніку до більш складних систем та орбітальних сценаріїв, а також використовувати її для кращого калібрування традиційних гравітаційно-хвильових моделей.
! Читайте ще цікаві новини про космос на сайті, або слідкуйте за ними на Facebook.