Клетки, как известно, существа с характером: сегодня они «почти эритроцит», завтра — «ну ладно, буду нейтрофилом», и попробуй угадай. Именно эту смесь железной биологической логики и чистой случайности авторы работы Learning cell dynamics with neural differential equations (Vinyard и соавт., Nature Machine Intelligence, 2025) предлагают описывать более честно — через модель scDiffEq, которая учится динамике клеток на языке нейронных дифференциальных уравнений.
Почему «снимков» одной клетки недостаточно, но они всё равно полезны
Одноклеточное секвенирование часто даёт нам не фильм, а фотоальбом: каждый кадр — молекулярный профиль отдельной клетки. Из таких «снимков» исследователи пытаются восстановить траектории развития: как клетка переходит из многопотентного состояния к конкретной судьбе в развитии или болезни.
Проблема в том, что клеточные решения — это баланс детерминизма и стохастики. Есть направляющие силы регуляции (условный «ветер», толкающий клетку к определённой линии), а есть биологический шум (условные «порывы», которые могут ускорить, замедлить или даже слегка отклонить курс).
Дрейф и диффузия: что улучшает scDiffEq
Классический и удобный язык для этого — уравнения дрейфа–диффузии. Во многих подходах дрейф (детерминированная часть) моделируют достаточно гибко, но диффузию упрощают: шум считают постоянным, одинаковым «везде на карте состояний». А биология так не играет: в одних состояниях клетка стабильна, в других — «дрожит от неопределённости».
scDiffEq — генеративная рамка, которая учится нейронным стохастическим дифференциальным уравнениям (neural SDE) и, тем самым, приближает одновременно:
- дрейф (куда «в среднем» течёт клеточное состояние),
- диффузию (насколько и где именно «штормит»).
Проверка на кроветворении и CRISPR: не просто красиво, но и похоже на правду
Авторы показывают, что на данных lineage tracing в гематопоэзе scDiffEq лучше:
- реконструирует клеточные траектории,
- предсказывает судьбы клеток из мультипотентных предшественников.
Отдельно интересна часть про in silico пертурбации: модель «виртуально» вмешивается в состояние предшественников и затем проверяется на том, воспроизводит ли она динамику CRISPR-пертурбированного кроветворения. По описанию результатов — воспроизводит достаточно точно, чтобы считать это полезным инструментом для гипотез.
А если у нас только одна временная точка?
Практический бонус: подход обобщают и на датасеты без трекинга линий и без нескольких timepoint’ов — вплоть до одного среза. С помощью scDiffEq можно симулировать высокоразрешённые траектории развития, отдельно наблюдая вклад дрейфа и диффузии, и изучать временную динамику на уровне генов.
В итоге scDiffEq выглядит как попытка перестать притворяться, что клетка — поезд по расписанию, и признать очевидное: иногда это поезд, иногда — ветер, а иногда — кот, который просто скинул все уравнения со стола.
