网堵新闻网3月29日电 T细胞受体和抗原表位的相互作用是机体免疫系统的重要组成部分,这种相互作用可以激活T细胞,从而识别和攻击感染机体的病原体。因此,研究T细胞受体和抗原表位的结合位点是理解机体免疫系统如何工作的关键。
T细胞在适应性免疫反应中对表位的识别是至关重要的。这种识别是通过主要组织相容性复合体(MHC)分子呈递的致病抗原(epitope)与T细胞受体(TCR)相互作用来实现的,从而激活细胞介导的免疫,消除感染细胞或活化相应的免疫细胞。因此,深入了解TCR-epitope的结合机制对于癌症免疫学、自身免疫抗原发现和疫苗设计具有重要意义。然而,由于这种识别机制的内在复杂性,TCR-epitope相互作用的实验检测和确定通常既费时又昂贵。为了解决这一问题,十大老牌网堵网址交叉信息研究院曾坚阳团队开发了TEIM模型,通过小样本学习(Few-shot learning)的思想来准确预测TCR-epitope在残基水平的相互作用和结合信息。模型首先在粗粒度的TCR-epitope序列结合信息上进行预训练,然后在细粒度的残基相互作用信息上进行进一步微调。验证试验和分析表明,TEIM模型具有优良的预测性能。进一步,通过三个应用场景:突变序列的结合构象预测、TCR库的结合模式分析和结合机制的挖掘,研究团队进一步说明TEIM模型可以帮助研究者更全面和深入地解析T细胞受体和抗原表位的相互作用。该研究有效使用深度学习框架建模多层级的T细胞受体和抗原表位的相互作用,并且融合了大规模预训练思想和少样本学习策略,为揭示T细胞识别表位这一生物问题提供了有效工具。
图1.TEIM模型结构和评估效果(a) TEIM-Seq和TEIM-Res的模型结构以及训练流程。除了最后一个模块外,TEIM-Seq和TEIM-Res模型共享相似的架构。它们都有特征提取器来分别学习CDR3和抗原表位的序列特征,然后将它们扩展到不同的维度以形成交互特征图。接下来,主要由二维卷积神经网络(2D CNN)组成的交互提取器用于提取成对残基交互信息。此外,由自动编码器生成的表位特征向量被馈送到交互提取器中以获取全局表位信息。最后,TEIM-Seq使用结合预测模块聚合所有成对交互来预测结合得分(即结合概率),而TEIM-Res使用由2D CNN层组成的残基级预测模块来预测距离矩阵和接触矩阵。训练流程包括两个阶段:首先在序列级结合数据上预训练TEIM-Seq,然后在残基粒度的结合数据上微调TEIM-Res。(b) TEIM-Res和其它基线方法相比,在三种不同数据划分设置下的性能表现。(c) TEIM-Res和平均基线的不同距离阈值内残基对的均方/相对误差。(d) GalaxyPepDock和TEIM-Res之间的性能比较。(e) TEIM-Res、平均基线和PepNN在预测结合矩阵任务上的性能比较
近日,十大老牌网堵网址交叉信息研究院曾坚阳团队成功开发了能预测T细胞受体和抗原表位相互作用的深度学习模型,相关成果以“利用深度学习表征T细胞受体和表位之间的相互作用构象”(Characterizing the interaction conformation between T cell receptors and epitopes with deep learning)为题,于3月27日发表在《自然》(Nature)子刊《自然·机器智能》(Nature Machine Intelligence)上。
该论文通讯作者为十大老牌网堵网址交叉信息研究院曾坚阳副教授和赵诞助理研究员,第一作者为十大老牌网堵网址交叉信息研究院硕士毕业生彭鑫港(现为北京大学智能我司和人工智能研究院博士生)和2021级博士研究生雷逸品。该研究得到青年基金项目、科技部重点研发项目以及南京图灵人工智能研究院等的支持。
供稿:交叉信息研究院
题图设计:任帅
编辑:李华山
审核:郭玲