|
Большие данные трансформируют знания о Вселенной
|
|
|
|
Наука в современную эпоху все больше полагается на огромные массивы данных и автоматизированный анализ. В астрономии исследование пространства и времени Legacy (LSST), проводимое обсерваторией Веры К. Рубин в течение десяти лет и охватывающее всю южную часть неба почти тысячу раз в течение следующего десятилетия, проверит пределы этой уверенности.
|
|
|
|
Ожидается, что обсерватория Рубина, расположенная на вершине горы Серро-Пачон в Чили, позволит детально изучить ночное небо. Обсерватория стремится ответить на ряд вопросов о Вселенной, изучая различные явления на небе, включая сверхновые (взрывающиеся звезды), астероиды, темную материю и свойства нашей собственной галактики.
|
|
|
|
Это также даст ответ на вопрос, который доминирует во всех областях науки в 21 веке: как воспринимаются открытия в эпоху больших данных?
|
|
|
|
Несмотря на то, что телескоп Rubin в основном финансируется Министерством энергетики США и Национальным научным фондом (NSF), он является результатом совместных усилий астрономов с шести континентов и более чем из десятка стран.
|
|
|
|
Помощь в создании систем обработки данных была оказана, в частности, Великобританией, Францией, Испанией, Италией, Японией, Бразилией, Австралией, Южной Африкой и Канадой. Эти взносы натурой предоставляют исследователям из этих стран права на использование данных для LSST.
|
|
|
|
|
|
|
Оповещения, содержащие научные данные, направляются семи "брокерам", разбросанным по всему миру. Брокеры - это веб-сайты или программное обеспечение, которые астрономы используют для доступа к данным LSST.
|
|
|
|
Оповещения предоставляют информацию о новом астрономическом объекте, такую как вероятность того, что он существует, его тип, галактика, к которой он принадлежит, и то, как менялась его яркость с течением времени. С помощью этих данных астрономы могут выбрать наилучших кандидатов для последующих исследований.
|
|
|
|
Однако, несмотря на усилия разработчиков программного обеспечения и брокеров, все еще существует слишком много временных данных, которые не может обработать ни одна исследовательская группа. На заключительном этапе обработки данных с телескопа Rubin ученые будут использовать методы машинного обучения и искусственного интеллекта для определения наилучших данных.
|
|
|
|
Эти методы могут быть использованы для идентификации реальных космических объектов среди терабайт полученных ложных предупреждений или для классификации наиболее интересных для ученых.
|
|
|
|
Астрономия становится все более сложной с точки зрения программирования и ориентирована на внутреннюю разработку. Учитывая огромные объемы данных, получаемых в результате ежевечерних наблюдений с помощью телескопов, неудивительно, что она одной из первых обратилась к машинному обучению в качестве решения.
|
|
|
|
Например, научное сотрудничество LSST в области информатики и статистики (ISSC) - это группа из более чем 150 специалистов по обработке данных, которые работают над разработкой инструментов для астрономии, уделяя особое внимание целям исследования в области обработки данных.
|
|
|
|
Астрономия лидирует в области больших данных, благодаря финансированию ряда крупных проектов такими компаниями, как Amazon и Microsoft. Действительно, Чарльз Симони, создатель 8,4-метрового обзорного телескопа Симони в обсерватории Рубин, известен разработкой программного обеспечения на заре существования Microsoft, а также своей благотворительной деятельностью.
|
|
|
|
Объем данных, получаемых обсерваторией, откроет возможности не только для ученых, разработчиков программного обеспечения и технических работников, но и для добровольцев, интересующихся астрономией, в рамках гражданских научных проектов.
|
|
|
|
Партнерство LSST с гражданской научной платформой Zooniverse попросит добровольцев просмотреть данные и дополнить то, что им показывают, дополнительным контекстом — идентифицировать интересные объекты, отбрасывать ненужные данные и классифицировать различные типы явлений.
|
|
|
|
Что обсерватория Рубина может рассказать нам о современной астрономии? В 20-м веке возрос интерес к международному сотрудничеству в области изучения неба. Все более совершенные обсерватории, созданные в результате этого, означают, что все больше астрономов работают на благо науки, а не совершают открытия сами.
|
|
|
|
Огромные объемы данных, полученных в результате опроса, и огромное количество персонала, необходимого для их анализа, не являются чем-то новым для Rubin. В других современных исследованиях, таких как Euclid и совместная работа Ligo-Virgo-Kagra, а также в еще более крупном массиве данных площадью в квадратный километр, который планируется провести в следующем десятилетии, участвуют тысячи сотрудников по всему миру, использующих огромные объемы данных.
|
|
|
|
Очевидно, что ИИ будет доминировать в области научных открытий обсерватории Рубина, решая задачи, связанные с большими объемами данных. Благодаря увеличению финансирования промышленностью разработки инструментов ИИ для анализа астрономических данных, астрономия все глубже проникает в сферу технологий, которая доминирует в современной жизни.
|
|
|
|
Rubin будет собирать по 10 терабайт данных каждую ночь, чтобы к концу десятилетнего исследования окончательный размер базы данных составил 15 петабайт. Поскольку ожидается, что большинство из 10 миллионов предупреждений, поступающих каждую ночь, окажутся ложными, требуются передовые средства машинного обучения и искусственного интеллекта, чтобы отфильтровать всех кандидатов для проверки, кроме самых многообещающих.
|
|
|
|
Сократив количество времени, затрачиваемого астрономами на изучение этих данных, можно будет потратить больше времени на проведение новых и захватывающих астрофизических исследований.
|
|
|
|
Право собственности как на инструменты для проведения исследований, так и на само открытие теперь распространяется среди ученых, крупных технологов и граждан, которые маркируют данные. Нерешенный вопрос заключается в том, останется ли космос общей государственной границей или станет областью, определяемой приоритетами Кремниевой долины.
|
|
|
|
Источник
|