V-kosmose.com

Глядя на звезды с помощью компьютеров: чему машинное обучение может научить нас о космосе?

В обсерватории Vera Rubin будет установлена камера LSST, которая будет собирать данные о 37 миллиардах галактик и звезд в течение 10 лет. Ученые разрабатывают программы машинного обучения для анализа потока данных. Фото: https://www.nytimes.com/

Если вы взгляните на ночное небо вдали от ярких городов, вы спокойно сможете увидеть Луну с парой десятков звезд. Правда если у вас острое зрение и повезет с погодой,  вы также сможете разглядеть мутное пятнышко – галактику Андромеда, которая является нашим ближайшим соседом. Но это лишь малая часть звездных объектов. Камера Legacy Survey of Space and Time (LSST), запуск которой планируется в 2022 году, позволит сделать снимки 37 миллиардов галактик и звезд в течение десятилетия.

Результатом этого проекта будет огромное число данных. За эти 10 лет камера LSST сделает порядка 2000 изображений южного полушария, при этом каждое изображение будет содержать до миллиона объектов.

«Это будет самый большой объем данных, который мы когда-либо получали», - сказала Рейчел Мандельбаум, профессор Университета Карнеги-Меллона. «Это бескрайнее поле для будущих открытий».

Но астрономы планируют использовать камеру LSST не для того, чтобы просто получать красивые снимки ночного неба. Они хотят тщательно их проанализировать, чтобы классифицировать и измерить объекты, которые могут дать ключ к эволюции Вселенной. Изучение темной энергии и материи, далеких квазаров, черных дыр и ярких сверхновых – все это требует множество данных. Даже есть вероятность того, что исследователи смогут обнаружить новый тип объектов.

Галактики, галактики везде – насколько позволяет видеть космический телескоп Хаббл. Такой взгляд на почти 10000 галактик является максимально глубоким на сегодняшний момент. Так называемая Ультра Глубокая Область Хаббла (Hubble Ultra-Deep Field или HUDF) представляет собой глубокий центр Вселенной, который находится на расстоянии миллиарда световых лет. Фото: https://hubblesite.org/

Галактики, галактики везде – насколько позволяет видеть космический телескоп Хаббл. Такой взгляд на почти 10000 галактик является максимально глубоким на сегодняшний момент. Так называемая Ультра Глубокая Область Хаббла (Hubble Ultra-Deep Field или HUDF) представляет собой глубокий центр Вселенной, который находится на расстоянии миллиарда световых лет. Фото: https://hubblesite.org/

«Возможно, нам посчастливиться обнаружить новые объекты», - сказала Рене Гложек, доцент кафедры астрофизики в Университете Торонто. «Мы сможем обнаружить кучу того, что мы называем странностями или аномалиями».

Однако огромный объем данных затрудняет анализ. Астрономы разрабатывают новое программное обеспечение, основанное на машинном обучении, для анализа данных LSST.

Компьютерные программы, которые учатся

Быстрая обработка данных является крайне важной при изучении темной материи и энергии. Ученым крайне важно знать, что могло измениться в заданном участке неба при сравнении двух фотографий, сделанных с разницей по времени. Любые изменения могут указывать на небесный объект или явление.

Кроме того, новое ПО должно будет уметь объединять несколько фотографий в единое целое. Камера LSST способна будет различить самые тусклые и далекие объекты, и для того, чтобы повысить их яркость и контрастность, необходима возможность складывать несколько фотографий в единое целое. Помимо этого, новое ПО должно будет также компенсировать эффект искажения изображения из-за атмосферы.

«Многие астрономы полагают, что машинное обучение является обязательным при классификации вновь открытых объектов на основе фотометрических измерений», - говорит Ив Ковач, физик из Аргоннской национальной лаборатории Министерства энергетики.

Но машинное обучение должно научиться определять объекты самостоятельно, прежде чем приступать к анализу новых данных. Существует два способа это сделать: неконтролируемый и контролируемый.

Эта фотография космоса, называемая Экстремально глубоким взглядом Хаббла (Hubble Deep Field), сочетает в себе наблюдения космического телескопа Хаббл, проводимые в течение последнего десятилетия, за небольшим участком неба в созвездии Печь. Это наиболее глубокое отображение Вселенной из когда-либо сделанных, наделенное экспозицией более двух миллионов секунд. Фото: https://hubblesite.org/

Эта фотография космоса, называемая Экстремально глубоким взглядом Хаббла (Hubble Deep Field), сочетает в себе наблюдения космического телескопа Хаббл, проводимые в течение последнего десятилетия, за небольшим участком неба в созвездии Печь. Это наиболее глубокое отображение Вселенной из когда-либо сделанных, наделенное экспозицией более двух миллионов секунд. Фото: https://hubblesite.org/

При неконтролируемом обучении ПО будет учиться на основе обнаружения некаталогизированных объектов. В то время как при управляемом обучении астрономы первоначально предоставить ему огромный массив данных, помеченных классами каждого объекта. Анализируя полученные данные, машина будет сравнивать их с ранее приобретенной информацией. Этот метод особенно полезен для классификации объектов в известные группы.

Точность контролируемого обучения будет зависеть как от объема предоставленных данных, так и от её четкой структуризации.

«Мы должны предоставить машине как можно больше точных данных, разбитых по группам и классам», - сказала Мандельбаум.

Маркеры расстояния на космическом шоссе

Многие из интересных объектов Вселенной являются динамичными процессами. Они могут быть очень яркими, которые со временем тускнеют и затем полностью исчезают. Одним из примеров подобных объектов является взрыв сверхновой. Они теряют свою яркость с течением времени согласованным образом. Поэтому их можно рассматривать как «стандартные свечи», используемые для измерения расстояний в космосе. Таким образом, они могут предоставить информацию о размерах и эволюции Вселенной.

Но не все сверхновые можно использовать в качестве стандартных свечей. Тип сверхновой Ia могут выступать подобными свечами. Также как знания подскажут опытному астроному – любителю отличить на ночном небе Марс, скажем от Венеры, так и компьютерную программу можно обучить находить определенный тип сверхновых.

«Однако есть небольшая загвоздка во всем этом. Сверхновые типа Ia являются не совсем стандартными свечами. Они имеют определенное число вариаций», - сказал Ковач. «Самое сложное – научить этому машину».

Команда исследователей, возглавляемая Ковачом, создала программу, которая классифицирует сверхновые по различным группам на основе их цвета. Ранее, ученые пробовали обучить программу определять тип сверхновой по её яркости, однако ПО могло неправильно интерпретировать объект.

Сверхновая SN 2014J в созвездии Большая Медведица. Фото: https://hubblesite.org/

Сверхновая SN 2014J в созвездии Большая Медведица. Фото: https://hubblesite.org/

Определение расстояния до космических объектов – еще одна первостепенная задача для машинного обучения. Ранее ученые использовали лишь спектроскопические телескопы для точного измерения расстояний до этих объектов. Однако камера LSST способна будет определить до 1000 подобных объектов всего за одну ночь. Это слишком большой объем данных для данной методики. Мандельбаум и ее команда разработали специальную программу, которая способна будет определить точное расстояние до этих объектов с помощью лишь одной фотографии. Она также может использовать и спектроскопические данные для большей точности.

Однако сверхновые могут быть не единственными объектами, выступающие в роли стандартных свечей. На самом деле астрофизики часто используют другие объекты для калибровки своих измерения расстояния. Мандельбаум и ее команда использовали машинное обучение, чтобы найти другие потенциальные стандартные свечи. Загрузив в программное обеспечение массив данных о переменных звездах, они с удивлением обнаружили, что программа способна сама определить стандартную свечу, без необходимости её классификации. Это поможет значительно сократить время и уменьшить число потенциальных ошибок. Программа сумела подобрать группу звезд, которые были такими же хорошими свечами, как цефеиды – редкий класс переменных звезд. Используемые звезды были ярче, и их было больше.

«Машинное обучение поможет нам в этом направлении, так как человеку тяжело мыслить в более чем в трех измерениях», - сказал Ковач.

Выбор на галактическом уровне

Изучение отдельных звезд очень полезно, но иногда ученым требуется получить информацию сразу о целой галактике. Используя машинное обучение и лишь одни фотографии, астрономы планируют точно определять расстояние до галактики – хозяина сверхновой. Главное лишь выбрать правильную принимающую галактику. Раньше исследователи делали это вручную, однако камера LSST предоставляет слишком большой объем данных. На помощь ученым прилет алгоритм, разработанный группой исследователей под руководством Ковача, который с 90% точностью определяет галактику - хозяина. Однако это недостаточная точность. С помощью машинного обучения они планируют повысить эту точность в разы.

Все это происходит за годы до того, как камера LSST начнет собирать первые данные. Программы машинного обучения наверняка раскроют еще больше, когда данные начнут поступать. Хотя компьютеры не могут удивленно смотреть на звезды, они обеспечат еще большее понимание небесных объектов, которые вызывают у нас такой страх.