美國麻省理工學院、密歇根大學和東北大學聯合團隊在最新《自然·方法》雜誌上發表論文,介紹了一種名為“MultiCell”的幾何深度學習模型。
該模型首次實現了在單細胞分辨率下,預測果蠅胚胎髮育過程中,每個細胞在每分鐘的行為變化。未來可在此基礎上設計出通用的多細胞發育預測模型,構建“數字胚胎”,用於藥物篩選甚至指導人工組織設計。
一個胚胎如何從一團細胞變成有頭有尾、有器官的完整生命體,是發育生物學領域持續百年的核心謎題。雖然科學家早已知道細胞會分裂、移動、摺疊,但具體到某一個細胞在下一分鐘會有什麼動態行為,卻一直難以預測。
模型採用四維全胚胎數據進行訓練和測試,這些數據具有亞微米級分辨率和較高的幀率,每個胚胎包含約5000個被標註邊界和細胞核的細胞。在測試中,模型不僅能判斷細胞是否會發生特定行為,還能精確預測行為發生的時間是幾分鐘後。
團隊將這一方法與“阿爾法摺疊”預測的蛋白質結構相類比:阿爾法摺疊是從氨基酸序列推斷蛋白質三維結構,“MultiCell”則是從細胞羣落的幾何特徵,預測多細胞系統的自組織過程。不過,由於胚胎髮育是持續演變的動態過程,後者遠比前者複雜。
團隊將該方法應用於果蠅早期胚胎髮育的關鍵階段——原腸胚形成。模型在3個胚胎視頻上訓練後,被用於預測第4個新胚胎的演化過程。結果顯示,模型在預測細胞連接丟失方面的準確率約90%;在預測細胞內陷、分裂或重排行為時,也表現了較高的準確率。
團隊表示,“MultiCell”是首個能在多細胞自組裝過程中,實現各類細胞行為單細胞精度預測的算法。鑑於其可捕捉細胞動力學上存在的微妙差異,未來將助力早期診斷或藥物篩選。
不過,該方法仍面臨一些問題,包括數據稀缺,以及當前模型僅基於幾何信息,未整合基因表達、蛋白質定位等。之後加入這些維度,有望更全面揭示物理與生物信息的互動。(科技日報)