Новый взгляд на исследование Марса
|
|
Новый алгоритм, протестированный на марсоходе НАСА "Персеверанс" на Марсе, может улучшить прогнозирование ураганов, лесных пожаров и других экстремальных погодных явлений, которые влияют на миллионы людей во всем мире.
|
|
Аспирант Технологического института Джорджии Остин П. Райт (Austin P. Wright) является первым автором статьи, в которой рассказывается о вложенном синтезе. Новый алгоритм улучшает способность ученых искать признаки жизни на поверхности Марса в прошлом.
|
|
Это нововведение поддерживает миссию НАСА "Марс-2020". Кроме того, ученые из других областей, работающие с большими, перекрывающимися наборами данных, могут использовать методы Nested Fusion для своих исследований.
|
|
Райт представил Nested Fusion на Международной конференции по поиску знаний и интеллектуальному анализу данных (KDD 2024) 2024 года, где он занял второе место в номинации "Лучшая статья". Работа опубликована в журнале Proceedings of the 30th ACM SIGKDD Conference по поиску знаний и интеллектуальному анализу данных.
|
|
"Nested Fusion действительно полезен для исследователей в самых разных областях, а не только для ученых НАСА", - сказал Райт. "Этот метод визуализирует сложные наборы данных, о которых может быть сложно получить общее представление на начальных этапах анализа".
|
|
Nested Fusion объединяет наборы данных с разным разрешением для получения единого визуального распределения с высоким разрешением. Используя этот метод, ученые НАСА могут с большей легкостью анализировать несколько наборов данных из разных источников одновременно. Это может ускорить изучение состава поверхности Марса в поисках признаков прошлой жизни.
|
|
Алгоритм демонстрирует, как наука о данных влияет на традиционные научные области, такие как химия, биология и геология.
|
|
Кроме того, Wright разрабатывает приложения Nested Fusion для моделирования меняющихся климатических условий, жизни растений и животных, а также других концепций в науках о земле. Одним и тем же методом можно объединить перекрывающиеся наборы данных из спутниковых снимков, биомаркеров и климатических данных.
|
|
"Пользователи расширили возможности Nested Fusion и аналогичных алгоритмов в контексте науки о Земле, и мы получили очень положительные отзывы", - сказал Райт, который изучает машинное обучение (ML) в Технологическом институте Джорджии.
|
|
"Кросс-корреляционный анализ требует много времени и не проводится на начальных этапах исследования, когда появляются закономерности и формируются новые гипотезы. Вложенное слияние позволяет людям обнаружить эти закономерности гораздо раньше".
|
|
Райт является ведущим специалистом в области анализа данных PIXLISE, программного обеспечения, которое ученые НАСА используют для изучения данных, полученных с марсохода Perseverance.
|
|
Компания Perseverance использует свой планетарный инструмент для рентгеновской литохимии (PIXL) для сбора данных о минеральном составе поверхности Марса. Двумя основными инструментами PIXL, которые позволяют это сделать, являются рентгенофлуоресцентный спектрометр (XRF) и мультиконтекстная камера (MCC).
|
|
Когда PIXL сканирует целевую область, он создает два совмещенных набора данных из компонентов. Рентгенографический анализ позволяет получить детальный элементный состав образца. MCC создает изображения образца для сбора визуальных и физических деталей, таких как размер и форма.
|
|
Один рентгеновский спектр соответствует примерно 100 пикселям изображения MCC для каждой точки сканирования. Уникальное разрешение каждого инструмента затрудняет сопоставление перекрывающихся слоев данных. Однако Райт и его коллеги разработали Nested Fusion, чтобы преодолеть это препятствие.
|
|
Nested Fusion не только улучшает работу с данными, но и улучшает рабочий процесс ученых НАСА. Используя этот метод, один ученый может составить первоначальную оценку минерального состава образца за считанные часы. До Nested Fusion для решения той же задачи требовались дни совместной работы групп экспертов с каждым отдельным прибором.
|
|
"Я думаю, что один из самых важных уроков, который я извлек из этой работы, заключается в том, что важно всегда основывать свои задачи ML и data science на реальных примерах использования нашими сотрудниками", - сказал Райт.
|
|
"От сотрудников я узнаю, какие аспекты анализа данных важны для них и с какими трудностями они сталкиваются. Понимая эти проблемы, мы можем найти новые способы формализации и формулирования проблем в области науки о данных".
|
|
Nested Fusion заняла второе место в номинации "Лучшая работа в области прикладной науки о данных". Сотни других докладов были представлены в рамках исследовательской программы конференции, семинаров и учебных пособий.
|
|
Наставники Райта, Скотт Давидофф и Поло Чау, были соавторами статьи о термоядерном синтезе Nested. Давидофф - главный научный сотрудник Лаборатории реактивного движения НАСА. Чау - профессор технической школы вычислительных наук и инженерии Джорджии (CSE).
|
|
"Я был чрезвычайно рад, что эта работа была отмечена наградой за лучшую работу, занявшую второе место", - сказал Райт. "Для такого рода прикладных работ иногда бывает трудно найти подходящую научную базу, поэтому поиск сообществ, которые оценят эту работу, очень обнадеживает".м
|
|
Источник
|