Представьте, что ваши клетки — это жильцы большого многоэтажного дома, которые круглосуточно обсуждают жизнь через балкон. Учёные честно пытались всё это «прослушать», но без хорошей аналитики получается только биологический подъездный шум.
В новой статье в Nature Machine Intelligence представлена модель GITIII (Graph Inductive bias Transformer for Intercellular Interaction Investigation), которая относится к ткани так же, как трансформеры относятся к тексту. Каждая клетка — «слово», её соседи — «контекст», а итоговый «смысл» — это состояние клетки, отражённое в профиле экспрессии генов.
В чём проблема со старыми подходами
Пространственная транскриптомика уже умеет измерять РНК в отдельных клетках прямо «на карте» ткани. Но:
- часто известен лишь ограниченный набор лиганд–рецепторных пар;
- пространственная информация используется слабо или формально;
- интерпретация моделей похожа на гадание по тепловым картам.
GITIII пытается решить эти три проблемы разом: он лёгкий, интерпретируемый и учится в self-supervised-режиме, без ручной аннотации взаимодействий.
Как работает GITIII
Строим граф ткани.
Клетки — вершины, близость в пространстве — рёбра. Получается граф, где структура коры мозга или опухоли превращается в сеть.Клетка как слово, ниша как предложение.
Модель учится сопоставлять внутреннее состояние клетки (её транскриптом) и её нишу — состав и свойства соседей.Self-supervised-обучение.
Вместо «правильных ответов» GITIII оптимизирует согласованность между клеткой и её окружением, извлекая скрытые закономерности связей «отправитель–получатель».Интерпретация.
На выходе можно:- оценить, как конкретный тип клеток влияет на экспрессию отдельных генов у соседей;
- строить карты CCI (cell–cell interactions) по ткани;
- делать кластеризацию, учитывая не только «кто я», но и «кто вокруг».
Где это проверили
Авторы прогнали GITIII через четыре разных датасета пространственной транскриптомики:
Мышиный моторный кортекс (MERFISH):
модель показала, как разные подтипы астроцитов «подстраиваются» под слои коры и соседние нейроны.Человеческий мозг при болезни Альцгеймера (SEA-AD):
выявлены паттерны общения микроглии и нейронов, отличающие пациентов с деменцией.Опухоль лёгкого (NSCLC, CosMx) и рак молочной железы (Xenium):
GITIII помог разобрать сложную микросреду опухоли, выделить субтипы макрофагов и опухолевых клеток и их сигнальные оси, связанные с иммунным уходом и инвазией.
Во всех случаях модель не только находит значимые взаимодействия, но и позволяет статистически их обосновать и визуально показать.
Зачем это нужно практикам
GITIII открывает путь к:
- картам микросреды опухоли для персонализированной терапии;
- более тонкой типизации клеток мозга при нейродегенеративных заболеваниях;
- интеграции новых пространственных платформ без ручной разметки.
Код и данные доступны на GitHub и Zenodo:
https://github.com/lugia-xiao/GITIII и репозиторий для воспроизводимости https://github.com/lugia-xiao/GITIII_reproducible.
Так что любой биоинформатик — хоть в Йеле, хоть в Москве или Новосибирске — может взять свои пространственные данные и попробовать подслушать, о чём на самом деле спорят клетки в его образцах.
