Что может узнать ИИ о Вселенной
|
|
Искусственный интеллект и машинное обучение получили повсеместное распространение, их применение варьируется от анализа данных до кибербезопасности, разработки фармацевтических препаратов, создания музыкальных композиций и художественной визуализации. В последние годы также появились большие языковые модели (LLM), которые добавили к длинному списку приложений взаимодействие с человеком и написание текстов. Сюда входит ChatGPT, LLM, которая оказала огромное влияние с момента своего появления менее двух лет назад. Это приложение вызвало значительные дебаты (и противоречия) о потенциальном использовании и последствиях искусственного интеллекта. Огромную пользу принесла также астрономия, где машинное обучение используется для сортировки огромных объемов данных в поисках признаков прохождения планет, коррекции атмосферных помех и выявления закономерностей в шуме. По мнению международной команды астрофизиков, это может быть только началом того, что искусственный интеллект может сделать для астрономии.
|
|
В недавнем исследовании команда усовершенствовала генеративную модель предварительно обученного трансформатора (GPT), используя наблюдения за астрономическими объектами. В ходе этого процесса они успешно продемонстрировали, что модели GPT могут эффективно помогать в научных исследованиях. Исследование было проведено Сетью Международного центра релятивистской астрофизики (ICRANet), международным консорциумом, состоящим из исследователей из Международного центра релятивистской астрофизики (ICRA), Национального института астрофизики (INAF), Университета науки и технологий Китая, Института высоких технологий Китайской академии наук. Физики энергии (CAS-IHEP), Университета Падуи, Технологического университета Исфахана и Университета Ферреры. Их статья "Может ли искусственный интеллект понять нашу Вселенную? Тест на точную настройку GPT по астрофизическим данным" была недавно опубликована на сервере препринтов arXiv. Как уже упоминалось, астрономы широко полагаются на алгоритмы машинного обучения, чтобы разобраться в объемах данных, полученных с помощью современных телескопов и приборов.
|
|
Эта практика началась около десяти лет назад и с тех пор стремительно развивалась до такой степени, что искусственный интеллект был интегрирован во весь исследовательский процесс. Как сообщил Universe Today по электронной почте президент ICRA и ведущий автор исследования Ю Ванг: "Астрономия всегда основывалась на данных, и астрономы являются одними из первых ученых, которые внедрили машинное обучение. Теперь машинное обучение интегрировано во весь процесс астрономических исследований, начиная с производства и управления наземными и космическими телескопами (например, для оптимизации работы адаптивных оптических систем, улучшения инициирования определенных действий (триггеров) спутников при определенных условиях и т.д.) и заканчивая обработкой данных. анализ (например, снижение уровня шума, вычисление данных, классификация, моделирование и т.д.), а также создание и валидация теоретических моделей (например, тестирование модифицированной гравитации, ограничение уравнения состояния нейтронных звезд и т.д.)."
|
|
Анализ данных остается наиболее распространенным среди этих приложений, поскольку это самая простая область, в которую можно интегрировать машинное обучение. Традиционно десятки исследователей и сотни гражданских ученых анализировали объемы данных, полученных в ходе кампании наблюдений. Однако это нецелесообразно в эпоху, когда современные телескопы ежедневно собирают терабайты данных. Это включает в себя обзоры всего неба, такие как Very Large Array Sky Survey (VLASS) и многочисленные этапы, проводимые Sloan Digital Sky Survey (SDSS). До настоящего времени LLM применялись в астрономических исследованиях лишь эпизодически, учитывая, что они были созданы относительно недавно. Но, по мнению таких сторонников, как Ван, они оказали огромное влияние на общество и обладают потенциалом, эквивалентным "промышленной революции". Что касается верхнего предела, Ванг прогнозирует, что он может значительно варьироваться и, возможно, приведет к "просвещению или уничтожению человечества". Однако, в отличие от промышленной революции, темпы изменений и интеграции в области искусственного интеллекта намного выше, что вызывает вопросы о том, как далеко зайдет его внедрение.
|
|
По словам Вана, чтобы определить его потенциал в области астрономии, он и его коллеги использовали предварительно подготовленную модель GPT и доработали ее для идентификации астрономических явлений: "OpenAI предоставляет предварительно обученные модели, и то, что мы сделали, - это тонкая настройка, которая включает в себя изменение некоторых параметров на основе исходной модели, что позволяет ей распознавать астрономические данные и вычислять результаты на основе этих данных. Это похоже на то, как если бы OpenAI предоставил нам студента-старшекурсника, которого мы затем обучили, чтобы он стал аспирантом по астрономии. "Мы предоставили ограниченные данные со скромным разрешением и обучили GPT меньшее количество раз по сравнению с обычными моделями. Тем не менее, результаты впечатляют, достигая точности около 90%. Такой высокий уровень точности обусловлен надежной основой GPT, которая уже понимает процесс обработки данных и обладает возможностями логического вывода, а также коммуникативными навыками".
|
|
Чтобы усовершенствовать свою модель, команда использовала наблюдения различных астрономических явлений, полученные из различных каталогов. Это включало 2000 образцов квазаров, галактик, звезд и широкой линии поглощения (BAL) из SDSS (по 500 в каждом). Они также объединили наблюдения коротких и длинных гамма-всплесков (GRB), галактик, звезд и моделирование черных дыр. После тестирования их модель успешно классифицировала различные явления, различала типы квазаров, определяла расстояние до них на основе красного смещения и измеряла вращение и наклон черных дыр. "Эта работа, по крайней мере, демонстрирует, что LLM способны обрабатывать астрономические данные", - сказал Ван. "Более того, способность модели обрабатывать различные типы астрономических данных - это способность, которой не обладают другие специализированные модели. Мы надеемся, что LLMS сможет интегрировать различные виды данных и затем определить общие основополагающие принципы, которые помогут нам понять окружающий мир. Конечно, это сложная задача, и астрономы не смогут справиться с ней в одиночку".
|
|
Конечно, команда признает, что набор данных, с которым они экспериментировали, был очень мал по сравнению с данными, получаемыми современными обсерваториями. Это особенно верно в отношении объектов нового поколения, таких как обсерватория Веры Рубин, которая недавно получила свою камеру LSST, самую большую цифровую камеру в мире! Как только Rubin заработает, он проведет 10-летнее исследование наследия пространства и времени (LSST), которое, как ожидается, позволит получать 15 терабайт данных за ночь! По словам Ванга, удовлетворение потребностей будущих кампаний потребует улучшений и сотрудничества между обсерваториями и профессиональными компаниями в области искусственного интеллекта. Тем не менее, можно с уверенностью сказать, что в ближайшем будущем будет больше приложений LLM для астрономии. Это не только вероятное развитие событий, но и необходимое, учитывая огромные объемы данных, которые сегодня получают астрономические исследования. И поскольку в ближайшем будущем этот показатель, вероятно, будет расти в геометрической прогрессии, искусственный интеллект, скорее всего, станет незаменимым в этой области исследований.
|
|
Источник
|