Представьте, что ваши клетки — это жильцы большого многоэтажного дома, которые круглосуточно обсуждают жизнь через балкон. Учёные честно пытались всё это «прослушать», но без хорошей аналитики получается только биологический подъездный шум.

В новой статье в Nature Machine Intelligence представлена модель GITIII (Graph Inductive bias Transformer for Intercellular Interaction Investigation), которая относится к ткани так же, как трансформеры относятся к тексту. Каждая клетка — «слово», её соседи — «контекст», а итоговый «смысл» — это состояние клетки, отражённое в профиле экспрессии генов.

В чём проблема со старыми подходами

Пространственная транскриптомика уже умеет измерять РНК в отдельных клетках прямо «на карте» ткани. Но:

  • часто известен лишь ограниченный набор лиганд–рецепторных пар;
  • пространственная информация используется слабо или формально;
  • интерпретация моделей похожа на гадание по тепловым картам.

GITIII пытается решить эти три проблемы разом: он лёгкий, интерпретируемый и учится в self-supervised-режиме, без ручной аннотации взаимодействий.

Как работает GITIII

  1. Строим граф ткани.
    Клетки — вершины, близость в пространстве — рёбра. Получается граф, где структура коры мозга или опухоли превращается в сеть.

  2. Клетка как слово, ниша как предложение.
    Модель учится сопоставлять внутреннее состояние клетки (её транскриптом) и её нишу — состав и свойства соседей.

  3. Self-supervised-обучение.
    Вместо «правильных ответов» GITIII оптимизирует согласованность между клеткой и её окружением, извлекая скрытые закономерности связей «отправитель–получатель».

  4. Интерпретация.
    На выходе можно:

    • оценить, как конкретный тип клеток влияет на экспрессию отдельных генов у соседей;
    • строить карты CCI (cell–cell interactions) по ткани;
    • делать кластеризацию, учитывая не только «кто я», но и «кто вокруг».

Где это проверили

Авторы прогнали GITIII через четыре разных датасета пространственной транскриптомики:

  • Мышиный моторный кортекс (MERFISH):
    модель показала, как разные подтипы астроцитов «подстраиваются» под слои коры и соседние нейроны.

  • Человеческий мозг при болезни Альцгеймера (SEA-AD):
    выявлены паттерны общения микроглии и нейронов, отличающие пациентов с деменцией.

  • Опухоль лёгкого (NSCLC, CosMx) и рак молочной железы (Xenium):
    GITIII помог разобрать сложную микросреду опухоли, выделить субтипы макрофагов и опухолевых клеток и их сигнальные оси, связанные с иммунным уходом и инвазией.

Во всех случаях модель не только находит значимые взаимодействия, но и позволяет статистически их обосновать и визуально показать.

Зачем это нужно практикам

GITIII открывает путь к:

  • картам микросреды опухоли для персонализированной терапии;
  • более тонкой типизации клеток мозга при нейродегенеративных заболеваниях;
  • интеграции новых пространственных платформ без ручной разметки.

Код и данные доступны на GitHub и Zenodo:
https://github.com/lugia-xiao/GITIII и репозиторий для воспроизводимости https://github.com/lugia-xiao/GITIII_reproducible.

Так что любой биоинформатик — хоть в Йеле, хоть в Москве или Новосибирске — может взять свои пространственные данные и попробовать подслушать, о чём на самом деле спорят клетки в его образцах.