Выявили 200 новых видов CRISPR-систем для биотехнологий
|
Базы данных микробных последовательностей содержат огромное количество информации об ферментах и других молекулах, которые можно адаптировать для биотехнологии. Но за последние годы эти базы данных стали настолько большими, что в них стало сложно эффективно искать интересующие ферменты. Теперь ученые из Института Броуда Массачусетского технологического института и Гарварда, Института исследований мозга Макговерна Массачусетского технологического института и Национального центра биотехнологической информации (NCBI) Национального института здравоохранения разработали новый алгоритм поиска, который выявил 188 видов новых редкие системы CRISPR в бактериальных геномах, охватывающие тысячи отдельных систем. Работа опубликована в журнале Science. Алгоритм, разработанный лабораторией пионера CRISPR Фэн Чжана, использует подходы кластеризации больших данных для быстрого поиска огромных объемов геномных данных. |
Команда использовала свой алгоритм, называемый кластеризацией на основе быстрого локально-чувствительного хэширования (FLSHclust), для анализа трех основных общедоступных баз данных, которые содержат данные о широком спектре необычных бактерий, в том числе обнаруженных в угольных шахтах, пивоварнях, антарктических озерах и слюне собак. Ученые обнаружили удивительное количество и разнообразие систем CRISPR, в том числе те, которые могут вносить изменения в ДНК в клетках человека, другие, которые могут нацеливаться на РНК, и многие с множеством других функций. Новые системы потенциально могут быть использованы для редактирования клеток млекопитающих с меньшим количеством побочных эффектов, чем нынешние системы Cas9. Однажды их также можно будет использовать в качестве диагностики или для молекулярной записи активности внутри клеток. Исследователи говорят, что их поиск подчеркивает беспрецедентный уровень разнообразия и гибкости CRISPR и что, вероятно, еще предстоит открыть еще много редких систем, поскольку базы данных продолжают расти. |
«Биоразнообразие — настоящая сокровищница, и по мере того, как мы продолжаем секвенировать все больше геномов и метагеномных образцов, растет потребность в более совершенных инструментах, таких как FLSHclust, для поиска в этом пространстве последовательностей и поиска молекулярных драгоценностей», — сказал Чжан, соавтор исследования. старший автор исследования и основной член института Broad. Чжан также является исследователем в Институте исследований мозга Макговерна в Массачусетском технологическом институте, профессором нейробиологии имени Джеймса и Патрисии Пойтра в Массачусетском технологическом институте с совместными должностями на кафедрах мозга, когнитивных наук и биологической инженерии, а также исследователем в Медицинском институте Говарда Хьюза. Юджин Кунин, выдающийся исследователь NCBI, также является соавтором исследования. CRISPR, что означает «Кластеризованные регулярно расположенные короткие палиндромные повторы», представляет собой систему защиты бактерий, которая была встроена во многие инструменты для редактирования генома и диагностики. |
Для анализа баз данных последовательностей белков и нуклеиновых кислот для новых систем CRISPR исследователи разработали алгоритм, основанный на подходе, заимствованном у сообщества больших данных. Этот метод, называемый локально-чувствительным хешированием, объединяет объекты, которые похожи, но не совсем идентичны. Использование этого подхода позволило команде исследовать миллиарды последовательностей белков и ДНК — из NCBI, его базы данных Whole Genome Shotgun и Объединенного института генома — за недели, тогда как предыдущие методы поиска идентичных объектов потребовали бы месяцев. Они разработали свой алгоритм для поиска генов, связанных с CRISPR. «Этот новый алгоритм позволяет нам анализировать данные в достаточно короткие сроки, чтобы мы могли фактически восстановить результаты и выдвинуть биологические гипотезы», — сказал Сумья Каннан, один из первых авторов исследования. Каннан был аспирантом в лаборатории Чжана, когда началось исследование, а в настоящее время является научным сотрудником и младшим научным сотрудником в Гарвардском университете. Хан Алтае-Тран, аспирант лаборатории Чжана во время исследования и в настоящее время научный сотрудник Вашингтонского университета, был другим соавтором исследования. |
«Это свидетельство того, чего вы можете добиться, улучшив методы исследования и используя как можно больше данных», — сказал Алтае-Тран. «Очень здорово иметь возможность улучшить масштаб поиска». В своем анализе Алтае-Тран, Каннан и их коллеги заметили, что тысячи обнаруженных ими систем CRISPR попадают в несколько существующих и множество новых категорий. Они более подробно изучили несколько новых систем в лаборатории. Они обнаружили несколько новых вариантов известных систем CRISPR типа I, которые используют направляющую РНК длиной 32 пары оснований, а не 20-нуклеотидную направляющую Cas9. Из-за более длинных направляющих РНК эти системы типа I потенциально могут быть использованы для разработки более точной технологии редактирования генов, менее склонной к нецелевому редактированию. Команда Чжана показала, что две из этих систем могут вносить короткие изменения в ДНК человеческих клеток. А поскольку эти системы типа I по размеру аналогичны CRISPR-Cas9, их, вероятно, можно будет доставлять в клетки животных или людей с использованием тех же технологий доставки генов, которые используются сегодня для CRISPR. |
Одна из систем типа I также продемонстрировала «побочную активность» — широкую деградацию нуклеиновых кислот после того, как белок CRISPR связывает свою мишень. Ученые использовали подобные системы для диагностики инфекционных заболеваний, например SHERLOCK, инструмент, способный быстро распознавать одну молекулу ДНК или РНК. Команда Чжана считает, что новые системы могут быть адаптированы и для диагностических технологий. Исследователи также открыли новые механизмы действия некоторых систем CRISPR типа IV и системы типа VII, которая точно нацелена на РНК, что потенциально может быть использовано при редактировании РНК. Другие системы потенциально могут быть использованы в качестве инструментов записи — молекулярного документа о том, когда экспрессировался ген, — или в качестве датчиков специфической активности в живой клетке. |
Ученые говорят, что их алгоритм может помочь в поиске других биохимических систем. «Этот алгоритм поиска может использоваться любым, кто хочет работать с этими большими базами данных для изучения того, как развиваются белки или открытия новых генов», — сказал Алтае-Тран. Исследователи добавляют, что их результаты иллюстрируют не только разнообразие систем CRISPR, но и то, что большинство из них редки и встречаются только у необычных бактерий. «Некоторые из этих микробных систем были обнаружены исключительно в воде угольных шахт», — сказал Каннан. «Если бы кто-то не интересовался этим, мы, возможно, никогда бы не увидели эти системы. Расширение разнообразия наших выборок действительно важно для дальнейшего расширения разнообразия того, что мы можем обнаружить». |
Источник |
При использовании материалов с сайта активная ссылка на него обязательна
|