В основе наиболее интересных областей технологических инноваций этого года лежат достижения в области искусственного интеллекта.
От белковой инженерии и 3D-печати до обнаружения дипфейков — вот семь областей технологий, за которыми журнал Nature будет следить в следующем году.
Применение технологий глубокого обучения в области белкового дизайна
Два десятилетия назад Дэвид Бейкер (David Baker) из Вашингтонского университета в Сиэтле и его коллеги совершили выдающийся прорыв: они использовали вычислительные инструменты для разработки совершенно нового белка с нуля. Белок Top7 свернулся, как ученые и предполагали, но оказался инертным: он не выполнял никаких значимых биологических функций. Сегодня технология дизайна белков превратилась в практический инструмент для создания ферментов и других белков по индивидуальному заказу. «Это открывает перед нами огромные возможности», — сказал Нил Кинг (Neil King), биохимик из Вашингтонского университета, который сотрудничает с командой Бейкера в разработке белковых вакцин и средств доставки лекарств. «То, что было невозможно еще полтора года назад, — теперь мы просто делаем это».
Значительная часть этого прогресса сводится ко все более массивным наборам данных, которые связывают последовательность белка со структурой. Но сложные методы глубокого обучения — одной из форм искусственного интеллекта (ИИ) — стали играть очень важную роль.
В стратегиях, основанных на последовательностях, применяются большие языковые модели (LLM), которые используются в таких инструментах, как чат-бот ChatGPT. Рассматривая белковые последовательности как документы, содержащие полипептидные «слова», эти алгоритмы могут распознавать закономерности, лежащие в основе структурных «сценариев» реальных белков. «Они действительно осваивают скрытую грамматику», — сказала Ноэлия Феррус (Noelia Ferruz), биохимик из Института молекулярной биологии Барселоны. В 2022 году ее команда разработала алгоритм под названием ProtGPT2, способный создавать синтетические белки, которые успешно сворачиваются в лабораторных условиях. Другой инструмент под названием ZymCTRL, тоже разработанный командой Ферруз, использует данные о последовательностях и функциях для создания членов семейств ферментов природного происхождения.
С помощью стратегий, основанных на последовательностях, можно брать существующие белки и адаптировать их таким образом, чтобы они формировали новые структуры. Но эти стратегии менее эффективны, если требуется индивидуальное проектирование структурных элементов или функций, таких как способность связывать определенные клетки-мишени предсказуемым образом. Для этого лучше подходят стратегии, основанные на структурах, и в 2023 году произошел заметный прогресс в этой области проектирования белков. В некоторых наиболее сложных стратегиях используются «диффузионные» модели, которые также лежат в основе таких инструментов генерации изображений, как DALL-E. Эти алгоритмы сначала учатся удалять сгенерированный компьютером шум из большого количества реальных структур, и, научившись отличать реалистичные структурные элементы от шума, обретают способность формировать биологически вероятные структуры, обладающие нужными пользователю характеристиками.
Программа RF-диффузии, разработанная лабораторией Бейкера, и инструмент Chroma, разработанный компанией Generate Biomedicines в Сомервилле, штат Массачусетс, применяют эту стратегию и достигают поразительных результатов. К примеру, команда Бейкера использует RF-диффузию для создания новых белков, которые могут образовывать прочные соединения с нужными мишенями, создавая конструкции, которые «просто идеально приспосабливаются к поверхности», как сказал Бейкер. Новая «полноатомная» версия RF-диффузии позволяет разработчикам формировать белки вокруг небелковых мишеней, таких как ДНК, небольшие молекулы и даже ионы металлов. Такая «универсальность» открывает новые горизонты для создания новых ферментов, транскрипционных регуляторов, функциональных биоматериалов и многого другого.
Обнаружение дипфейков
Бурное развитие общедоступных генеративных алгоритмов ИИ упростило синтез убедительных, но полностью искусственных изображений, аудио и видео. Результаты могут оказаться довольно забавными, но, учитывая многочисленные геополитические конфликты и предстоящие президентские выборы в США, возникает масса возможностей для манипулирования общественным мнением.
Сивэй Лю (Siwei Lyu), ученый-компьютерщик из Университета Буффало в Нью-Йорке, утверждает, что он видел множество созданных ИИ «дипфейковых» изображений и аудио, связанных, к примеру, с конфликтом между Израилем и ХАМАС. Это лишь очередной раунд игры «кошки-мышки», в которой пользователи ИИ создают вводящий в заблуждение контент, а Лю и другие специалисты работают над его обнаружением и перехватом. И ставки здесь очень высоки.
Одним из решений является встраивание скрытых сигналов в выходные данные моделей — своего рода водяные знаки для контента, сгенерированного ИИ. Другие стратегии сосредоточены на самом контенте. Например, как объяснил Лю, в некоторых обработанных видео черты лица одного общественного деятеля заменяются чертами лица другого, но новые алгоритмы способны распознавать «артефакты» на границах новых черт. Характерные складки наружного уха человека могут выявить несоответствие между лицом и головой, а неровности зубов помогают обнаруживать отредактированные видео, в которых рот человека подвергся цифровым манипуляциям, чтобы сказать что-то, чего реальный человек не говорил. Фотографии, созданные с помощью искусственного интеллекта, тоже представляют собой сложную задачу. В 2019 году Луиза Вердолива (Луиза Вердолива), специалист по медиакриминалистике из Университета Федерико II в Неаполе, помогла разработать FaceForensics++ — инструмент для выявления лиц, «сфабрикованных» несколькими широко используемыми программными пакетами. Но методы анализа изображений зависят от конкретного предмета анализа и примененных программ, поэтому создание универсального инструмента остается проблемой. «Невозможно получить один универсальный детектор, это очень сложно», — сказала она.
Не стоит также забывать и о применении новых инструментов. Программа SemaFor, разработанная Агентством перспективных исследовательских проектов Министерства обороны США, создала весьма полезный набор инструментов для выявления дипфейков, но, как ранее сообщал журнал Nature, крупные соцсети не используют его достаточно регулярно. Расширение доступа к подобным инструментам может способствовать их дальнейшему распространению, и с этой целью команда Лю разработала DeepFake-O-Meter7 — централизованное общедоступное хранилище алгоритмов, которые способны анализировать видеоконтент под разными углами для обнаружения дипфейков. Такие ресурсы будут полезны, но, вполне возможно, борьба с дезинформацией, генерируемой ИИ, будет продолжаться еще долгие годы.
Встройка больших фрагментов ДНК
В конце 2023 года американские и британские регуляторы одобрили первую в истории терапию генного редактирования на основе технологии CRISPR для лечения серповидно-клеточной анемии и трансфузионно-зависимой β-талассемии. Это стало огромной победой в области применения редактирования генома в качестве клинического инструмента.
CRISPR и ее производные используют короткую программируемую РНК для отправки фермента, «разрезающего» ДНК, такого как Cas9, к определенному участку генома. Эти технологии все чаще используются в лабораторных условиях для «отключения» дефектных генов и внесения небольших изменений в последовательности. Точная и программируемая вставка более крупных участков последовательности ДНК, состоящих из нескольких тысяч нуклеотидов, — это сложная задача, но новые решения могут дать ученым возможность заменять важные сегменты дефектных генов или вставлять полностью функциональные последовательности. Ле Конг (Le Cong), молекулярный генетик из Стэнфордского университета в Калифорнии, и его коллеги исследуют белки однонитевого отжига (SSAP) — молекулы вирусного происхождения, которые медиируют рекомбинацию ДНК. В сочетании с системой CRISPR-Cas, где функция разрезания ДНК Cas9 отключена, эти SSAP позволяют точно вставлять в геном человека до двух тысяч килобаз ДНК.
В рамках других стратегий используется основанный на CRISPR метод, называемый прайм-редактированием: сначала вводятся короткие последовательности, своего рода «посадочные площадки», которые избирательно привлекают определенные ферменты, и они, в свою очередь, способны точно вставлять в геном крупные фрагменты ДНК. К примеру, в 2022 году геномные инженеры Омар Абудайех (Omar Abudayyeh) и Джонатан Гутенберг (Jonathan Gootenberg) из Массачусетского технологического университета и их коллеги впервые описали программируемое добавление с помощью элементов сайт-специфического нацеливания (PASTE) — этот метод позволяет точно вставлять до 36 тысяч килобаз ДНК. По словам Конга, PASTE особенно перспективен для ex vivo модификации культивируемых клеток, полученных от пациентов, а лежащая в основе технология первичного редактирования уже находится на стадии клинических исследований. Но для модификации клеток человека in vivo более практичным является инструмент SSAP: более громоздкий механизм PASTE нуждается в трех отдельных вирусных векторах, что может снижать эффективность редактирования по сравнению с двухкомпонентной системой SSAP. Однако даже относительно малоэффективных стратегий замены генов может оказаться достаточно для смягчения течения многих генетических заболеваний.
И такие методы применяются не только в лечении людей. Группа ученых под руководством Кайся Гао (Caixia Gao) из Китайской академии наук в Пекине разработала PrimeRoot — метод, использующий первичное редактирование для введения определенных сайт-мишеней, которые ферменты затем могут использовать для вставки до 20 тысяч килобаз ДНК и в рисе, и в кукурузе. По мнению Гао, этот метод может широко использоваться для выработки у сельскохозяйственных культур устойчивости к болезням и патогенам, продолжив волну инноваций в геномной инженерии растений на основе CRISPR. «Я считаю, что эту технологию можно применить к любым видам растений», — сказала она.
Нейрокомпьютерный интерфейс
Пэт Беннет говорит медленнее, чем среднестатистический человек, и иногда она использует неправильные слова. Но учитывая, что заболевание двигательных нейронов, называемое боковым амиотрофическим склерозом, прежде вообще не позволяло ей выражать свои мысли вербально, это выдающееся достижение.
Восстановление Беннетт стало возможным благодаря сложному нейрокомпьютерному интерфейсу (BCI), разработанному нейробиологом Стэнфордского университета Фрэнсисом Уиллеттом (Francis Willett) и его коллегами из американского консорциума BrainGate. Уиллетт и его коллеги имплантировали в мозг Беннет электроды для отслеживания активности нейронов, а затем научили алгоритмы глубокого обучения переводить эти сигналы в речь. После нескольких недель тренировок Беннетт уже могла произносить до 62 слов в минуту из словарного запаса в 125 тысяч слов — это в два раза больше словарного запаса среднестатисического носителя английского языка. «Скорость, с которой они общаются, действительно впечатляет», — сказала биоинженер Дженнифер Коллинджер (Jennifer Collinger), которая разрабатывает технологии BCI в Питтсбургском университете в Пенсильвании.
Испытание BrainGate — это только одно из исследований за последние несколько лет, демонстрирующих, как технология BCI может помочь людям с тяжелыми неврологическими нарушениями восстановить утраченные навыки и обрести больше независимости. Отчасти этот прогресс обусловлен неустанным накоплением знаний о функциональной нейроанатомии мозга людей с различными неврологическими заболеваниями, как сказал Ли Хохберг (Leigh Hochberg), невролог из Университета Брауна на Род-Айленде и директор консорциума BrainGate. Но, по его словам, эти знания удалось в значительной мере расширить благодаря аналитическим методам, основанным на машинном обучении, которые помогают понять, как лучше размещать электроды и расшифровывать сигналы, которые те фиксируют.
Исследователи также применяют языковые модели на основе ИИ, чтобы ускорить интерпретацию того, что пациенты пытаются сообщить, — по сути, это своего рода «автозаполнение» для мозга. Это стало основным компонентом исследования Уиллетта, а также еще одного исследования, проведенного командой под руководством нейрохирурга Эдварда Чанга (Edward Chang) из Калифорнийского университета в Сан-Франциско. В рамках последнего нейропротез BCI позволил женщине, которая утратила способность говорить вследствие инсульта, общаться со скоростью 78 слов в минуту — примерно вдвое ниже средней скорости для носителей английского языка, но более чем в пять раз быстрее, чем предыдущий речевой аппарат этой женщины. В этой области наблюдается прогресс и по другим направлениям. В 2021 году Коллинджер и биомедицинский инженер Роберт Гонт (Robert Gaunt) из Питтсбургского университета имплантировали электроды в моторную и соматосенсорную кору человека, у которого были парализованы руки и ноги, чтобы тот мог быстро и точно управлять роботизированной рукой и получать тактильную сенсорную обратную связь. В настоящее время также проводятся независимые клинические исследования — учеными в BrainGate, исследователями из UMC Utrecht в Нидерландах, а также фирмой BCI Synchron в Бруклине, — по тестированию системы, которая позволяет парализованным людям управлять компьютером. Это первоеспонсируемое отраслью испытание аппарата BCI.
Будучи специалистом по интенсивной терапии, Хохберг стремится обеспечить этими технологиями своих пациентов с наиболее тяжелыми формами инвалидности. Но по мере развития возможностей BCI их можно будет применять для лечения более умеренных когнитивных нарушений, а также некоторых психических расстройств, таких как расстройства настроения. «Системы нейромодуляции с замкнутым контуром, управляемые нейрокомпьютерными интерфейсами, могут стать огромным подспорьем для многих людей», — сказал он.
Суперразрешение
В 2014 году Штефан Хелл (Stefan Hell), Эрик Бетциг (Eric Betzig) и Уильям Мёрнер (William Moerner) были удостоены Нобелевской премии по химии за преодоление «дифракционного предела», ограничивающего пространственное разрешение световой микроскопии. Полученный в результате уровень детализации — порядка нескольких десятков нанометров — дал возможность проводить широкий спектр экспериментов по визуализации на молекулярном уровне. Но некоторые исследователи не хотят на этом останавливаться – и они добиваются быстрого прогресса. «Мы пытаемся сократить разрыв от микроскопии сверхвысокого разрешения до методов структурной биологии, таких как криоэлектронная микроскопия», — объяснил Ральф Юнгманн (Ralf Jungmann), исследователь нанотехнологий в Институте биохимии Макса Планка в немецком Планеге, упомянув метод, который помогает реконструировать белковые структуры с разрешением на уровне атомов.
Группа ученых во главе с Хеллом и его командой из Института междисциплинарных наук Макса Планка в Геттингене сделали первый шаг в эту сторону в конце 2022 года с помощью метода под названием MINSTED. Он позволяет распознавать отдельные флуоресцентные метки с точностью 2,3 ангстрема — примерно четверть нанометра — с помощью специализированного оптического микроскопа.
Новые методы обеспечивают сопоставимое разрешение в процессе использования обычных микроскопов. К примеру, в 2023 году Юнгманн и его команда описали стратегию, в рамках которой отдельные молекулы помечаются особыми цепочками ДНК. Затем эти молекулы обнаруживаются благодаря помеченным красителем комплементарным цепям ДНК, которые на время, но постоянно связываются с соответствующими мишенями, что позволяет различать отдельные флуоресцентные «мигающие» точки, которые при одновременном отображении сливаются. Такое улучшение разрешения за счет последовательной визуализации (RESI) позволяет увидеть отдельные пары баз на цепи ДНК, демонстрируя разрешение в масштабе ангстрема при использовании стандартного флуоресцентного микроскопа.
Метод одноэтапной наномасштабной микроскопии (ONE), разработанный группой нейробиологов, возглавляемой Али Шаиба (Ali Shaib) и Сильвио Риццоли (Silvio Rizzoli) из Университетского медицинского центра Геттингена, не позволяет достичь такого уровня разрешения. Однако микроскопия ONE дает беспрецедентную возможность напрямую отображать мелкие структурные детали отдельных белков и мультибелковых соединений, как изолированно, так и внутри клеток.
ONE — это метод, основанный на технологии расширяющей микроскопии: белки в образце химическим образом соединяются с матрицей гидрогеля, затем их разделяют, а потом гидрогелю дают возможность увеличиться в объеме в 1000 раз. Фрагменты расширяются равномерно во всех направлениях, сохраняя структуру белка и позволяя пользователям различать детали, разделенные несколькими нанометрами, с помощью стандартного конфокального микроскопа. «Мы взяли антитела, поместили их в гель, пометили их после расширения и вот оно — мы видим Y-образные формы», — сказал Риццоли, имея в виду характерную форму белков.
По его словам, микроскопия ONE может дать представление о конформационно-динамических биомолекулах и позволить визуально диагностировать нарушения свертывания белков, такие как болезнь Паркинсона, по образцам крови. Юнгманн с таким же энтузиазмом относится к потенциалу RESI в документировании реорганизации отдельных белков при различных заболеваниях или в ответ на медикаментозное лечение. «Возможно, такое пространственное разрешение — это еще не предел, — сказал Юнгманн. — Оно может стать еще лучше».
Клеточные атласы
Если вы ищете удобное кафе, Google-карты найдут ближайшие варианты и подскажут, как туда добраться. Но аналога для навигации по гораздо более сложному ландшафту человеческого тела пока не существует. Тем не менее, продолжающийся прогресс в рамках различных проектов по созданию клеточного атласа — в основе которых лежат достижения в анализе отдельных клеток и методах так называемой «пространственной омики», — может вскоре позволить составить клеточные карты всех тканей организма, которых биологи так ждут.
Самая крупная — и, возможно, самая амбициозная — из этих инициатив называется «Атлас клеток человека» (HCA). Этот консорциум был основан в 2016 году клеточным биологом Сарой Тейхманн (Sarah Teichmann) из Института Сэннгера в британском Хинкстоне и Авивом Регевом (Aviv Regev), который сейчас возглавляет отдел исследований и первоначальных разработок в биотехнологической фирме Genentech в Сан-Франциско. В проекте принимают участие около трех тысяч ученых почти из 100 стран, которые работают с тканями 10 тысяч доноров. Однако HCA — это часть более широкой экосистемы пересекающихся проектов по разработке клеточных и молекулярных атласов. Туда входит Программа биомолекулярного атласа человека (HuBMAP) и Инициатива по исследованию мозга посредством инновационных нейротехнологий (BRAIN), инициатива «Клеточная перепись» (BICCN), финансируемая Национальными институтами здравоохранения США, а также «Атлас клеток мозга», финансируемый Институтом Аллена в Сиэтле.
По словам Майкла Снайдера (Michael Snyder), специалиста по геномике из Стэнфордского университета и бывшего сопредседателя руководящего комитета HuBMAP, эти усилия отчасти обусловлены разработкой и быстрой коммерциализацией аналитических инструментов, которые помогают расшифровывать молекулярное содержимое на уровне отдельных клеток. К примеру, команда Снайдера регулярно использует платформу Xenium от компании 10X Genomics для молекулярного профилирования методом пространственной транскриптомики. Платформа позволяет еженедельно исследовать экспрессию примерно 400 генов одновременно в четырех образцах тканей. Методы мультиплексного анализа, такие как платформа PhenoCycler от Akoya Biosciences, позволяют команде отслеживать большое количество белков с разрешением до одной клетки в формате, который дает возможность осуществлять трехмерную реконструкцию тканей. Другие методы «мультиомики» позволяют ученым одновременно составлять профили нескольких молекулярных классов в одной и той же клетке, включая экспрессию РНК, структуру хроматина и распределение белка.
В прошлом году результаты десятков исследований продемонстрировали прогресс в создании атласов конкретных органов с использованием этих методов. Например, в июне HCA опубликовало комплексный анализ 49 наборов данных, полученных из легких человека. «Наличие этой чрезвычайно четкой карты легких помогает понять изменения, которые происходят при таких заболеваниях, как фиброз легких, различные опухоли и даже COVID-19», — пояснила Тейхманн.
Ученым предстоит проделать огромную работу. По оценкам Тейхманн, пройдет не менее пяти лет, прежде чем процесс составления клеточного атласа HCA завершится. Но полученные карты будут просто бесценными, когда они наконец появятся. Тейхманн, к примеру, прогнозирует, что данные из атласа будут использоваться для разработки таргетной терапии, а Снайдеру хотелось бы узнать, как клеточное микроокружение влияет на риски и этиологию сложных заболеваний, таких как рак и синдром раздраженного кишечника. «Сможем ли мы решить эту проблему в 2024 году? Я так не думаю. Это задача на много лет, — сказал Снайдер. — Но это мощный двигатель для всей области».
3D-печать наноматериалов
В нанометровом масштабе могут происходить странные и интересные вещи. Это может затруднять прогнозы в области материаловедения, но это также означает, что работающие в наномасштабах «архитекторы» могут создавать легкие материалы с такими отличительными характеристиками, как повышенная прочность, нужный характер взаимодействия со светом и звуком, а также повышенная способность к катализу или хранению энергии.
Существует несколько стратегий создания подобных наноматериалов, большинство из которых предусматривают использование лазеров для индукции структурной «фотополимеризации» светочувствительных материалов, и за последние несколько лет ученые добились значительных успехов в преодолении тех проблем, которые препятствовали более широкому внедрению этих методов.
Одна из проблем — скорость. Сурабх Саха (Sourabh Saha), инженер Технологического института Джорджии, рассказал, что сборка наноструктур с помощью фотополимеризации происходит примерно на три порядка быстрее, чем другие методы наномасштабной 3D-печати. Этого может быть вполне достаточно для применения в условиях лаборатории, но это слишком медленно для крупномасштабного производства и промышленных процессов. В 2019 году Саха и инженер-механик Ши-Чи Чень (Shih-Chi Chen) из Китайского университета Гонконга вместе с их коллегами показали, что они могут ускорить полимеризацию, используя шаблонный 2D-световой лист, а не традиционный импульсный лазер. «Это увеличивает скорость в тысячу раз, и вы по-прежнему сохраняете нужные вам характеристики», — сказал Саха. Дальнейшие работы исследователей, в том числе Ченя, позволили найти и другие способы более быстрой наномасштабной печати.
Другая проблема заключается в том, что не все материалы можно печатать напрямую посредством фотополимеризации. Но Джулия Грир (Julia Greer) из Калифорнийского технологического института в Пасадене разработала обходной путь. В 2022 году она и ее коллеги описали метод, в рамках которого фотополимеризованные гидрогели служат своего рода микрошаблоном: их пропитывают солями металлов и обрабатывают таким образом, что металл принимает структуру шаблона, одновременно сжимаясь. Хотя метод изначально был разработан для микроструктур, команда Грир использовала эту стратегию и для наноразмерной печати, и исследователи с энтузиазмом относятся к возможности создания функциональных наноструктур из прочных, тугоплавких металлов и сплавов.
Преодолеть последний барьер — экономический — может оказаться труднее всего. По словам Саха, системы на основе импульсного лазера, применяемые во многих методах фотополимеризации, стоят более 500 тысяч долларов. Но сейчас появляются более дешевые альтернативы. Например, физик Мартин Вегенер (Martin Wegener) и его коллеги из Технологического института Карлсруэ испытали непрерывные лазеры, которые дешевле, компактнее и потребляют меньше энергии, чем стандартные импульсные лазеры. А Грир основала стартап для коммерциализации процесса изготовления наноразмерных металлических листов, которые в дальнейшем можно будет использовать в производстве бронежилетов нового поколения или сверхпрочной и ударопрочной внешней обшивки самолетов и других транспортных средств.
Автор — Майкл Эйзенштейн (Michael Eisenstein)