Универсальная структура для пространственной биологии
|
|
Биологические процессы определяются контекстом, в котором они протекают. Новый инструмент, разработанный группой Stegle из EMBL в Гейдельберге и Немецким онкологическим исследовательским центром (DKFZ), помогает лучше представить результаты исследований в области молекулярной биологии в контексте клеточного окружения, интегрируя различные формы пространственных данных. В ткани каждая отдельная клетка окружена другими клетками, и все они постоянно взаимодействуют друг с другом, обеспечивая выполнение биологических функций. Чтобы понять, как ткани функционируют или нарушают работу при таких заболеваниях, как рак, важно не только изучить характеристики каждой клетки, но и учитывать их пространственный контекст. Количественная характеристика клеток в контексте физического пространства, в котором они обитают, является ключом к пониманию сложных систем.
|
|
Технологии, позволяющие проводить подобные исследования, называются технологиями пространственной омики, и их поступательное развитие способствует росту популярности пространственной биологии. Такие технологии могут предоставить подробную информацию о молекулярном составе отдельных клеток и их пространственном расположении. Однако эти технологии ориентированы на различные характеристики клетки, такие как уровень РНК или белка, и результирующие наборы данных обрабатываются и хранятся различными способами. Для решения этой задачи совместный проект, возглавляемый Ste-gle Group, разработал SpatialData - стандарт данных и программную платформу, которая позволяет ученым унифицировать данные из широкого спектра технологий пространственной биологии.
|
|
За последнее десятилетие как научными кругами, так и промышленностью было разработано множество технологий для пространственной визуализации тканей, клеток и субклеточных компартментов. Однако каждый метод фокусируется на небольшом количестве желаемых характеристик и требует соответствующих компромиссов. Например, Visium от 10x Genomics собирает информацию об экспрессии всех генов в ткани, но не обеспечивает разрешение по отдельным клеткам. Напротив, 10-кратный геномный анализ Xenium, MERFISH или платформа MERSCOPE от Vizgen позволяют получить детализированные карты экспрессии генов с субклеточным разрешением. Однако в настоящее время эти анализы ограничены несколькими сотнями предварительно отобранных генов. И список таких технологий, каждая из которых представляет собой небольшой фрагмент полной картины, продолжает расти.
|
|
Эта неоднородность технологий отражается на вычислительной стороне еще большей неоднородностью форматов файлов: каждая технология имеет свой собственный формат хранения, и часто данные, сгенерированные с помощью одной и той же технологии, могут храниться в нескольких форматах. На практике это создает ряд проблем при анализе данных пространственной статистики. Методы визуализации и анализа обычно адаптированы к конкретной технологии, что ограничивает совместимость данных и затрудняет интеграцию различных методов в единый конвейер анализа. Однако для целостного понимания биологической системы важно одновременно рассматривать различные характеристики клеток или образцы из разных мест.
|
|
Технологии Omics генерируют огромные объемы данных (терабайты изображений, миллионы клеток, миллиарды отдельных молекул), что требует оптимизированных инженерных решений. Следовательно, пространственная биология срочно нуждается в универсальной платформе, которая может интегрировать данные экспериментов и технологий и обеспечить целостное понимание здоровья и болезней. Вот тут-то и вступают в действие SpatialData. "Существует острая необходимость в разработке общинных решений для управления данными пространственной омики и их хранения. В частности, существует необходимость в разработке новых стандартов обработки данных и вычислительных основ, которые позволят унифицировать подходы к анализу всего спектра различных появляющихся технологий пространственной омики", - сказал Оливер Стегл, руководитель группы EMBL в отделе геномной биологии и руководитель отдела вычислительной геномики и системной генетики в EMBL. Немецкий онкологический исследовательский центр (DKFZ).
|
|
"Первым важным шагом в этом направлении является SpatialData, стандарт данных и программная платформа, которая объединяет и адаптирует предыдущие концепции управления данными от одноячеечной мультиомики к пространственной области". SpatialData объединяет и интегрирует данные из различных технологий omics, объединяя самые современные технологии с платформой, которая обеспечивает эффективный с точки зрения вычислений доступ к данным и манипулирование ими. Этот инструмент был представлен в публикации Nature Methods, автором которой является Лука Марконато, защитивший докторскую диссертацию в EMBL в группе Stegle, совместно с факультетом биологических наук Гейдельбергского университета.
|
|
"Мы разработали платформу SpatialData framework, чтобы облегчить проблемы с представлением данных при изучении пространственной биологии, чтобы исследователь мог сосредоточиться на биологическом анализе, а не на утомительных манипуляциях с данными, которые в противном случае потребовались бы даже для простой визуализации данных. Фреймворк обеспечивает унифицированное представление и реализует эргономичные операции для удобной обработки данных пространственной информатики", - сказал Марконато. Этот инструмент позволяет любому исследователю импортировать свои данные и выполнять такие задачи, как представление, обработка и визуализация данных. Кроме того, это дает возможность интерактивно комментировать данные и сохранять их в формате, не зависящем от языка, что способствует появлению стратегий анализа, сочетающих методы из разных языков программирования или аналитических сообществ.
|
|
Фреймворк был разработан в рамках совместного проекта нескольких учреждений, таких как DKFZ, Мюнхенский технический университет, Мюнхенский центр Гельмгольца, Немецкая биоимиджинговая лаборатория, ETH Zurich, Центр исследований воспаления VIB в Бельгии, а также группы Huber и Saka в EMBL. "Мы проводили наши исследования и технологические разработки с учетом интересов всего научного сообщества", - сказал Джованни Палла, соавтор и аспирант Мюнхенского центра Гельмгольца. "Мы не только организовали междисциплинарный проект сотрудничества между исследовательскими институтами, но и тесно сотрудничали с разработчиками, работающими с различными пространственными технологиями и на разных языках программирования, чтобы решить проблему совместимости. В результате наша платформа совместима с подавляющим большинством методов анализа пространственных данных, используемых научными кругами и промышленностью.
|
|
- Благодаря открытой публикации другие исследователи теперь могут свободно использовать SpatialData для управления своими собственными данными и имеют возможность сотрудничать в рамках различных технологий и исследовательских тем". "В нашей статье мы проиллюстрируем три важные особенности пространственных данных", - пояснил Кевин Ямаути, соавтор исследования и научный сотрудник ETH Zurich. "Во-первых, мы представляем стандартизированный интерфейс и унифицированный формат хранения (основанный на OME-NGFF) для всех технологий пространственной омики. Во-вторых, используя унифицированное представление, мы интегрируем сигналы из нескольких модальностей. Здесь мы передаем аннотации по модальностям и количественно оцениваем сигналы, используя эти переданные аннотации. Наконец, мы представляем способ интерактивного аннотирования изображений (патологий) и использования аннотаций для анализа соответствующих молекулярных профилей."
|
|
SpatialData предоставляет интерактивное представление данных как на вашем жестком диске, так и в оперативной памяти вашего компьютера, что позволяет анализировать большие изображения, а также различные геометрические формы или ячейки. Другой важной особенностью платформы является возможность выравнивать и комментировать данные omics в общей системе координат. Таким образом, SpatialData позволяет эффективно управлять наборами пространственных данных и манипулировать ими, включая определение общей системы координат для технологий, основанных на секвенировании и визуализации. Междисциплинарная команда использовала платформу SpatialData для повторного анализа мультимодального набора данных о раке молочной железы из 10X Genomics в качестве доказательства концепции. Этот набор данных состоит из последовательных разделов одного и того же блока по раку молочной железы, где каждый раздел анализируется с использованием различных технологий, таких как Visium, Xenium и отдельного набора данных scRNA-seq.
|
|
Исследование демонстрирует взаимодополняющий характер этих технологий. "Интегрируя 10X Xenium и scRNAseq, мы сопоставили типы клеток в пространстве", - сказал Элиас Хайдари, кандидат философии в DKFZ и один из авторов исследования. "Затем мы использовали 10-кратный Visium для идентификации раковых клонов в космосе. Это возможно, потому что у нас есть данные для всего транскриптома. Наконец, мы использовали микроскопические изображения, окрашенные H& E, для определения областей, представляющих интерес для гистопатологических аннотаций. Этот анализ успешно продемонстрировал уникальное применение SpatialData для проведения мультимодального анализа наборов данных с пространственным разрешением". В будущем опухоль пациента может быть проанализирована с помощью различных технологий, широко используемых в клинике, а затем данные будут объединены с помощью SpatialData для получения целостного представления об опухоли. Кроме того, интерактивный интерфейс позволит врачу комментировать данные, что позволит проводить детальный анализ конкретных областей опухоли и ее характеристик, что потенциально приведет к разработке индивидуальных подходов к лечению.
|
|
Источник
|