Представьте, что ваша иммунная система ведёт личный дневник всех «врагов», с которыми ей приходилось сталкиваться. Вирусы, бактерии, вакцины и даже собственные ткани организма, случайно попавшие под «дружественный огонь» — всё это фиксируется в биологической памяти нашего тела. Учёные из Стэнфордского университета придумали, как прочитать этот дневник. Они разработали систему под названием Mal-ID, которая использует машинное обучение для анализа B- и T-клеточных рецепторов иммунной системы. Эта технология способна диагностировать разные заболевания — от диабета и COVID-19 до сложных аутоиммунных болезней вроде волчанки.
В исследовании участвовало почти 600 человек. Кто-то был полностью здоров, у других были инфекции или аутоиммунные заболевания. Алгоритм смог определить, кто чем болен, просто «прочитав» последовательности и структуры иммунных рецепторов. «Современные диагностические инструменты практически не используют внутренний архив иммунной системы. А ведь наш иммунитет постоянно патрулирует организм с помощью B- и T-клеток, которые работают как молекулярные детекторы угроз,» — объясняет Максим Заславский, постдокторант и ведущий автор исследования. И не подумайте, что это просто очередная научная новинка! Такой подход может изменить медицину, как мы её знаем.
Особенно ценным Mal-ID может оказаться для диагностики тех заболеваний, которые врачам трудно определить. Например, пациенты с волчанкой могут годами ходить от специалиста к специалисту, прежде чем получат правильный диагноз. Как это работает? Учёные применили технологии машинного обучения, похожие на те, что используются в ChatGPT. Но вместо человеческого языка, алгоритм учился понимать язык белков иммунной системы.
T-клетки и B-клетки представляют два разных «отряда» иммунной системы, но принцип их работы похож. Их ДНК перемешивается случайным образом, создавая триллионы уникальных антител или рецепторов. Эта случайность обеспечивает разнообразие, необходимое для распознавания практически любой угрозы. Когда иммунные клетки сталкиваются с чем-то подозрительным и связываются с этим «нечто», они начинают размножаться. Это создаёт своеобразный «биологический отпечаток пальца» того, с чем боролась иммунная система.
Исследователи собрали более 16 миллионов последовательностей B-клеточных рецепторов и более 25 миллионов последовательностей T-клеточных рецепторов от участников исследования. Затем они использовали машинное обучение для поиска общих черт между людьми с одинаковыми заболеваниями.
Любопытно, что T-клеточные рецепторы оказались более информативными для диагностики волчанки и диабета 1 типа, а B-клеточные — для выявления ВИЧ, SARS-CoV-2 или недавней вакцинации против гриппа. Но наилучшие результаты получались при совместном анализе данных обоих типов клеток. «Традиционные подходы иногда не могут найти группы рецепторов, которые выглядят по-разному, но распознают одни и те же цели,» — говорит Заславский. «А вот языковые модели в этом преуспевают. Они учатся грамматике и контекстным подсказкам иммунной системы так же, как освоили грамматику и контекст английского языка». Ученые планируют адаптировать Mal-ID для выявления иммунологических признаков многих других заболеваний. И кто знает — возможно, в недалеком будущем для диагностики болезни потребуется всего лишь небольшой анализ крови и несколько минут работы искусственного интеллекта!
«Красота этого подхода в том, что он работает, даже если мы изначально не знаем, на что именно нацелена иммунная система,» — отмечает профессор Скотт Бойд, один из руководителей исследования. «Мы всё равно можем получить информацию, просто наблюдая схожие модели иммунного ответа у разных людей».