본문 바로가기

Contact English

【생물정보학】 COMMOT의 이해

 

COMMOT의 이해

 

추천글 : 【생물정보학】 생물정보학 분석 목차 


1. 개요 [본문]

2. 이론 [본문]

3. 결과 [본문]

4. 논의 [본문]


Cang, Z. et al. (2023). Nature methods, 20(2), 218-228. (ref)


 

1. 개요 [목차]

CCC(cell-cell communication)

① 생물학적 이질성의 이해에 중요 : 세포 운명 결정, 세포 분화 패턴, 병리 기전 연구 

② 다양한 형태 : 리간드-수용체 상호작용, 세포-세포 상호작용, 기관 수준의 상호작용 (예 : 인슐린), 개체 수준의 상호작용 (예 : 페로몬)

③ 임상적 바이오마커 : ICI(immune-checkpoint inhibitor), 조직 재생 연구 

○ 예시 : APAP로 유발된 AKI(acute liver injury) 조직에서 유의하게 necroptosis 관련 간 세포와 대식세포 간 상호작용이 증가

 

출처: 이미지 클릭

Figure. 1. 조직 재생 연구 예시

 

기존 CCC 분석 알고리즘 

bulk RNA-seq 기반 : BulkSignalR, squidpy, IPA, Omnipath

scRNA-seq 기반 : CellTalkDB, CellPhoneDB, CellChat, ICELLNET, NicheNet, SoptSC, CytoTalk, scTensor, CCCExplorer, Connectome, Ramilowski, FlowSig, scSeqComm

공간전사체(ST) 기반 : Giotto, spata2, CellPhoneDB v3, stLearn, SVCA, MISTy, NCEM, COMMOT, SCOTIA, STopover, cytosignal, SpatialDM, SpaTalk, stMLnet, HoloNet, DeepLinc

 

Figure. 2. ST를 활용한 CCC 분석 알고리즘 예시

 

Giotto : 막 결합 리간드-수용체 쌍을 통한 상호작용을 식별하기 위해 공간 근접 그래프를 구축

CellPhoneDB v3 : 공간 정보를 기반으로 정의된 동일한 미세환경 내의 세포 클러스터에 대해서만 상호작용을 제한

stLearn : 리간드 및 수용체 유전자의 공동 발현을 세포 유형의 공간적 다양성과 연관시킴

⑶ COMMOT

① 필요성 : 기존 방법은 multiple-species interaction을 다루지 못함

여러 리간드 종류가 여러 수용체 종류에 결합할 수 있어 경쟁이 발생할 수 있음

○ 리간드의 72%와 수용체의 60%가 여러 종류와 결합

 

Figure. 3. multi-species interaction에 따른 경쟁 시뮬레이션

 

OT(optimal transport)의 필요성

○ OT란, 자원을 출발지(공급)에서 도착지(수요)로 최적으로 분배하는 방법으로 정의됨

○ 이 개념은 경제학, 물리학, 천문학, 컴퓨터 과학 등에서 연구되어 옴

multi-species interaction은 수치해석이 필수이며, 유전자 발현을 리간드에서 수용체로 분배하는 과정과 유사해 OT가 필요

 

Figure. 4. OT를 모래성을 옮기는 과정으로 비유한 것

 

 

2. 이론 [목차]

⑴ OT의 문제 정의

 

Figure. 5. OT의 문제 정의

 

① 1개의 리간드와 1개의 수용체의 상호작용에 사용할 수 있음

② multiple-species interaction에 적용하려면 COT로 문제를 수정해야 함

⑵ COT(collective OT)의 문제 정의

 

Figure. 6. COT의 문제 정의

 

 

 transport plan P ∈ ℝ+nl×nr×ns×ns

 nl : 리간드의 개수

○ nr : 수용체의 개수

○ ns : 스팟 혹은 세포(single cell ST의 경우)의 개수)

② 이상적으로는 ∑jl P(i,j)(k,l) = αi(k), ∑ik P(i,j)(k,l) = βj(l)이 성립

다만, 노이즈가 있는 데이터에서 이 전제가 반드시 성립하진 않음

○ 대신 설명되지 않는 리간드, 수용체 양인 μ, ν를 정의하고, 이를 panelize하는 식으로 최적화 문제를 풂

⑶ COT 문제 풀이 요약

 

 

단계 1. 비용함수 C에 spatial cutoff를 적용하여 공간적으로 근접한 상호작용만 유효한 상호작용으로 간주

 

Figure. 7. 공간 정보를 이용한 비용함수

 

단계 2. F(·) 항을  Shannon entropy 항과 L2 regularizer 항으로 표현

 

 

단계 3. 라그랑주 승수법(Lagrange multiplier) 적용 

① 라그랑주 승수법 원리 

 

Figure. 8. 라그랑주 승수법 원리

 

② 라그랑주 승수법 예제

 

Figure. 9. 라그랑주 승수법 예제

 

단계 3-1. 라그랑주 승수법 표현 및 선형성을 위한 추가 변수 도입

 

 

단계 3-2. 라그랑주 승수법 1차 적용 : 변수 9개를 한꺼번에 적용하기 쉽지 않아 먼저 5개만 적용

 

 

단계 3-3. 라그랑주 승수법 2차 적용 : 나머지 변수 4개에 대해 라그랑주 승수법 적용

 

 

단계 3-4. 복잡한 등식을 풀기 위해 update 식으로 표현

 

 

단계 3-5. 최종 결론

 

 

⑧ 복잡한 등식의 해를 수치해석으로 찾는 과정 : 해의 유일성이나 수렴성이 반드시 성립하지는 않음

 

Figure. 10. 복잡한 등식의 해를 수치해석으로 찾는 과정

 

 

3. 결과 [목차]

⑴ Visium 데이터는 전형적인 피부 구조를 나타냄 

① epidermis, dermis, smooth muscle로 구성되는 피부 구조 중 epidermis 하부, dermis 부분을 주로 보여줌

② dermis 중 피부 안쪽 부분이 basal cell인 점은 예상과 부합함

③ pseudotime 결과로 알 수 있듯이 basal cell이 분열하여 다른 세포들을 만들어내고 있음

 

Figure. 11. Visium 피부 데이터

 

주목할 만한 상호작용

GAS6-TYRO3이 COMMOT에 의해 도출됨

② 리간드 i, 수용체 j, 스팟 l에 대한 상호작용 강도는 다음과 같이 계산 : 그 결과 

 

Figure. 12. GAS-TYRO3 상호작용 강도 시각화

 

③ 클러스터 간 상호작용 강도는 다음과 같이 계산됨 

 

Figure. 13. 클러스터 간 GAS-TYRO3 상호작용 강도

 

 GAS6-TYRO3 상호작용은 실험적으로 검증됨  

 

Figure. 14. GAS6-TYRO3의 실험적 검증

 

⑤ GAS-TYRO3 상호작용은 선천 면역 억제 인자로 알려져 있으며, γδ T 세포나 MAIT 세포와 같은 unconventional T 세포들이 피부에서 조직 항상성과 국소 면역 반응에 중요한 역할을 한다는 사실과 관련이 있을 수 있음

주목할 만한 pathway

① 상호작용 방향 : 주요 pathway에 대한 상호작용 방향은 그 pathway에 대한 리간드-수용체 쌍에 한정하여 관련된 transport plan entry의 벡터합으로 정의. WNT와 TGF-β는 각각 basal cell 증식을 길항적으로 활성/억제하기 때문에 비슷한 상호작용 방향을 가짐 

 

Figure. 15. 주요 pathway에 따른 상호작용 방향

 

② basal cell 증식과 관련된 basal cell marker (KRT15, KRT5), granular cell marker (LOR, FLG)도 WNT, TGF-β 등의 신호전달 경로에서 주요하게 관찰됨

 

Figure. 16. 주요 pathway의 상호작용 강도와 각 유전자 간 연관 분석

 

주목할 만한 시각화

 

Figure. 17. 기타 주목할 만한 시각화

 

Figure. 18. 기타 주목할 만한 시각화

(스팟 임베딩을 통한 스팟 클러스터링)

 

 

4. 논의 [목차]

⑴ 장점 

① multi-species interaction 분석을 가능하게 함

② downstream 분석을 다양하게 제공함 

③ 5개의 ST 플랫폼과 다양한 조직에서 검증 

④ 파이썬에서 작동하며 상당히 쉽게 사용할 수 있음

⑵ 한계

① 비용함수를 구성할 때 spatial cutoff로 사용하는 1000 um는 생물학적으로 납득하기 여러운 값

② COT 해에 대한 수렴성 및 유일성 부분이 충분히 검증되지 않음

③ 리간드-수용체 상호작용에 있어서 단백질 풍부도 및 단백질 변형 등이 포함되지 않음

④ 삼중 상호작용에 대해서는 분석할 수 없음 

 

Figure. 19. AlphaFold3로 구성한 FCER2A, ITGAX, ITGB2 삼중 상호작용

 

입력: 2025.04.05 08:33