Капля крови и ИИ: как машинные алгоритмы научились предсказывать болезни

Опубликовано
колумнист Kursiv
Последние открытия в области анализов крови появились благодаря исследованиями в протеомике и использованию искусственного интеллекта. Фото: shutterstock

За последние полгода в СМИ появились информация о нескольких прорывных исследованиях в области анализов крови: ученые обнаружили, что с их помощью можно найти предрасположенность к болезни Паркинсона за семь лет до ее начала, диагностировать или предсказывать более 67 заболеваний по анализу белков в крови, обнаружить рецидив рака, выявить болезнь Альцгеймера на ранней стадии. Есть даже диагностика биполярного расстройства по анализу крови! Почти все эти открытия произошли благодаря полувековым исследованиям в науке о белках протеомике и увеличившимся мощностям искусственного интеллекта. 

Омики

Протеомика — одна из трех «омик» (есть еще геномика, изучающая ДНК, и транскриптомика, изучающая РНК). Протеом клетки – это все белки, которые она в себе содержит и вырабатывает в тот или иной момент, протеом человека — это карта всех белков, которые можно найти в теле человека. В целом все три ветви науки занимаются изучением генома, всего генетического материала, а также процессов в нем. 

Прикладные исследования в области протеомики подтолкнула вперед работа по составлению огромной базы данных белков человека. Составлением протеомного атласа человека занимается сразу несколько институций, в том числе Human Proteome Atlas, Human Proteom Map, Human Proteom Organisation (HPO). В 2010 году был создан Проект протеома человека (The Human Proteome Project, HPP), его цель — идентифицировать все белки человека. Для этого ученые собирают данные из лабораторий, фармкомпаний, банков биоданных от государственных медицинских организаций. Судя по десятилетнему отчету HPP за 2020 год, ученые нашли и определили уже 90% белков. Последние 10% оказались самые сложные. На август 2024 года они смогли идентифицировать около 93% белков. 

Как это работает

А вот заставить эту базу работать на благо медицины уже помогает искусственный интеллект. Ученые собирают образцы крови у заболевших людей, например, одним типом рака молочной железы. Их результаты анализируются с помощью ИИ в попытке найти так называемые сигнатуры белков, фирменного набора элементов, которые выделяются при той или иной болезни или перед ее началом. Это могут быть остатки работы раковой клетки или белки, которые синтезирует сам организм, чтобы справиться с болезнью. Это уникальный для каждого вида заболевания сигнальный набор молекул, который может точно указать на конкретный диагноз, иногда на самой ранней стадии заболевания. Поиск соответствий, закономерностей и предсказание этих сигнатур отдают на откуп ИИ, который обучен на больших объемах данных из открытых источников или национальных биобанков. 

В конце июля 2024 группа ученых из Англии и Германии опубликовала результаты исследования протеомного способа анализа плазмы крови. Они использовали данные крупнейшего в Великобритании протеомного банка Biobank Pharma Proteomics Project о 42 000 пациентах с подтвержденным диагнозом, и обрабатывали их с помощью ИИ. Оказалось, для некоторых заболеваний, которые с трудом диагностируются клинически, достаточно наличия всего одного белка, чтобы найти болезнь. По словам ученых, их модели могут диагностировать или определять предрасположенность к 67 заболеваниям по наличию в плазме всего по 5-20 белков и подвердить это клинически. Исследования могут более точно, чем при обычном скрининге, определять предрасположенность к множественной миеломе, неходжкинским лимфомам и болезни двигательных нейронов, говорится в статье. Они могут быть использованы для диагностики этих заболеваний уже в ближайшее время. 

В июне Guardian опубликовал статью о прорывном способе ранней диагностики болезни Паркинсона. Ученые из Калифорнийского и Геттингенского университетов использовали алгоритм машинного обучения, чтобы обнаружить характерный паттерн восьми белков крови у пациентов с болезнью Паркинсона. Алгоритм смог предсказать предрасположенность к этой болезни у других пациентов, сдавших образцы крови. У одного из пациентов врачи правильно предсказали заболевание за семь лет до появления реальных симптомов. Сейчас в мире от этой болезни страдает около 10 млн человек, лекарства пока не существует, его ищут. Но на данный момент все экспериментальные препараты тестируют на поздних стадиях развития болезни, возможность ранней диагностики дает шанс опробовать их на ранних стадиях и заниматься профилактикой, а не лечением. По мнению разработчиков, такой анализ крови может попасть на массовый рынок уже через два года. 

Еще один метод, ставший доступным после секвенирования генома и появления мощных машинных алгоритмов – сверхчувствительная жидкостная биопсия. Этот метод обнаружения опухолевой ДНК в крови, основанный на искусственном интеллекте, показал супер-результат в прогнозировании рецидивов рака. В ходе исследования, результаты которого опубликованы 14 июня в Nature Medicine, ученые Медицинского колледжа Вайля Корнелла, Нью-Йоркской пресвитерианской больницы, New York Genome Center и Мемориального онкологического центра Слоуна – Кеттеринга, доказали, что способны обучить нейросеть для обнаружения опухолевой ДНК (ctDNA), которая может циркулировать в крови пациента после прохождения терапии. Новая технология может сильно увеличить эффективность лечения рака, потому что способна выявить его возвращение очень рано. 

В июле FDA одобрила скрининговый тест Shield на колоректальный рак от компании Guardant Health. Научным обоснованием для одобрения послужила работа, подтверждающая, что биомаркер бесклеточной ДНК (cell-free DNA, cfDNA) является эффективным в диагностике таких видов рака. Shield – это набор для анализа крови из пальца, который пациент делает на дому и отсылает в лабораторию. По словам разработчиков он может дополнить предыдущие, не самые комфортные способы выявления таких видов рака. Он тоже основан на анализе крови на мутагенные ДНК. Но есть одна проблема, он не так эффективен для ранних стадий заболевания.

Что принесла революция ИИ 

Медицинские технологии, которые оперируют нашими белками, ДНК и РНК, — это будущее, которое нам предсказывали после расшифровки генома человека, и оно уже наступило. После начала революции ИИ в 2022 году и создания крупнейшей базы протеомного атласа человека ученые получили идеальные условия для работы. C одной стороны они получили базу для исследований на основе машинного обучения, с другой – набор новейших технологий протеомики и других омик по анализу белков, РНК и ДНК, циркулирующих в крови.

Судя по прогнозам Стивена МакБрайда, редактора журнала RiskHedge Report, в будущем количество инвестиций в протеомику будет только расти, как и количество самих исследований. Объем мирового рынка в сфере протеомики в 2023 году превысил $36 млрд, к 2028 году он может увеличиться до $79 млрд. 

Крупнейшие игроки на рынке протеомики, американские компании Thermo Fisher Scientific, Danaher, Agilent Technologies и Bruker Corporation, а также Merck KGaA в Германии, активно вкладывают в стартапы и поглощают самые успешные из них. Среди заметных сделок прошлого года — покупка шведской Olink компанией Thermo Fisher за $3,1 млрд, инвестиции $84,6 млн от Bruker в немецкую компанию Biognosys и слияние американских компаний SomaLogic и Standard BioTools. 

Biognosys уже сейчас продает профессиональные наборы для забора крови на протеомный анализ, SomaLogic по запросу может выслать набор для исследований и предоставить для лаборатории собственные ИИ-мощности и разработки. Но это продукты не для обычного пользователя, а для исследователей, их стоимость составляет от $300 до $10 000. 

Новейшие открытия в области диагностики болезней на основе протеомного анализа крови еще не вышли на рынок, соответственно пока нет понимания, сколько они могут стоить. К тому же, сама маркетинговая формула «анализ тысяч белков по одной капли крови» все еще вызывает оторопь у некоторых инвесторов после краха компании Theranos и заключения в тюрьму Элизабет Холмс. 

Технологии подвергаются критике и со стороны части научного сообщества. После выхода статьи в журнале Nature об очередных успехах протеомных анализов по капли крови, доктор Элефтериос Ф.Диамандис, греко-кипрско-канадский биохимик, специализирующийся на клинической химии в Университете Торонто, опубликовал материал под названием «Не называйте это Theranos, который работает». В ней он указывает, что решена только часть проблем, с которыми столкнулись разработчики Theranos. Да, сейчас эти технологии способны анализировать тысячи белков и находить нужные биомаркеры, но еще не факт, что на данном этапе развития они подходят для диагностики заболеваний у человека. Для этого технологии они должны обладать высокой чувствительностью (способностью выявлять заболевание), высокой специфичностью (они должны быть отрицательными у пациентов без заболевания) и, что важно, с высокой точностью указывать на заболевание, если тест положительный. Сейчас биомаркеры часто дают ложноположительный результат. Без решения этих проблем новые виды анализов вряд ли смогут пройти одобрение национальных регуляторов в сфере здоровья и выйти на массовый рынок. 

Увязнет ли прорывной подход к анализам в привычных для технологических продуктов проблемах – дороговизне технологии, нехватке инвестиций и проблемами с регуляцией, или мы и правда находимся в точке времени, где происходит революция наших привычных способов диагностики, станет понятно в течении ближайших пары лет. 

Читайте также