新浪财经

上交团队提出TFvelo数学模型,可用于预测细胞命运和鉴定致病基因

资讯精选

关注

RNA 速度,是近年来针对细胞进行时序分析的流行方法。

RNA 速度可以在不依赖于用户输入初始状态标注的情况下预测细胞命运,同时其所建立的动态模型具有良好的可解释性。

自从 2018 年 RNA 速度的概念被提出至今,它一直是国际前沿的研究热点之一。

一般来说,物体运动速度是指在三维空间内位移随时间的变化率。

RNA 速度,指的是 RNA 的表达量随时间的变化率,可以理解为是细胞在基因表达空间内的位移随时间的变化率。

据了解,此前的 RNA 模型大多基于单基因的剪切信号。而单基因剪切信号主要存在两个方面的问题:

一是单个基因所能提供的信息太少。

单细胞转录组本身就存在噪声高、稀疏性高等缺点,因此仅仅依赖于单一基因的表达数据建模,效果会严重受到数据质量的制约。

二是剪切信号的时间尺度可能过短。

RNA 速度模型的核心,在于针对两个信号之间的滞后关系进行建模。

对于剪切过程而言,其时间尺度可能仅仅只有几十秒,远小于整个单细胞转录组数据集中所刻画的分化过程。

因此,从剪切到剪切 RNA 的时间滞后关系,很有可能无法从相位图中观测到,自然也就无法建模。

2020 年,上海交通大学袁野团队开始关注 RNA 速度这一领域。

RNA 速度最主要的特色在于:可以在相位图上,针对存在时间滞后关系的两个变量进行拟合。

通过提出数学方程,可以针对剪切过程进行刻画。从而在相位图上,假定未剪切 RNA 和剪切 RNA 的联合分布,将形成一个逆时针旋转的曲线。

但是,在实际数据中该团队发现剪切 RNA 和未剪切 RNA 表达量的分布,往往无法满足这些模型假设,因此无法实现准确的拟合。

此前,课题组已经注意到转录因子和靶基因之间会形成圆环状的联合分布,因此产生了使用基因间转录调控关系,取代剪切信号建模 RNA 速度的想法。

一开始,他们尝试建立单转录因子到靶基因的动态模型,但是效果不够理想,因为转录过程之中大概率存在多个转录因子的共同作用。

而将多个转录因子纳入建模,却会在数学上面临一定困难。

当时,领域内的学者普遍采用 bottom-up 的建模策略。即先提出一个微分方程,然后求出解析解,再基于解析解来优化模型。

这样一来,一旦把模型建得比较复杂,比如同时考虑多个转录因子,就会出现微分方程无解析解的情况,从而导致项目无法推进。

随后,该团队注意到了香港大学团队提出的 UniTVelo。

在港大课题组的方法中,研究人员提供了 top-down 的建模思路,即直接将基因表达建模为时间的函数,从而无需求解任何微分方程。

通过参考上述思路之后,课题组成功建立了 TFvelo 的数学模型。

由于 TFvelo 额外引入了一组参数,因此需要对其进行优化。

于是,他们想到 了广义最大期望值(EM,Expectation Maximization)算法。通过生成一 个仿真数据集,他们针对所开发的广义 EM 算法加以初步验证。

确认有效之后,针对真实单细胞转录组数据,该团队开始进行算法开发和实验。最终,他们在多个数据集上均取得不错的效果。

如前所述,以前的模型大多基于单基因的剪切信号,而 TFvelo 方法则基于多基因之间的转录调控关系,因此后者能够提升模型的准确度。

此外,TFvelo 使用多基因的转录调控关系来建模。

这样做的好处在于:

一方面,建模过程可以利用多个转录因子的信息,从而克服单基因建模时所面临的数据质量差、信号不足的问题。

另一方面,基因调控过程的时间尺度可以达到数个小时,因此转录因子和靶基因之间的滞后更容易被捕获。

所以,TFvelo 能够利用更好的数据基础,针对基因表达的动态变化进行建模。

另据悉,TFvelo 的输入是每个基因细胞中的表达量,TFvelo 的输出则是每个基因在细胞中表达量的变化率。同时,TFvelo 方法基于多基因间的转录调控关系。

所以,TFvelo 可以更好地拟合各个基因表达量的变化,针对细胞命运进行预测。

同时,基于 TFvelo 的结果,还能提供一些转录调控上的分析,以用于鉴定关键的转录因子。

TFvelo 主要的应用前景在于,其能和具体的疾病分析相结合。

此外,TFvelo 可被用于预测细胞命运、以及分析其中起到关键作用的转录因子。在肿瘤组织中,TFvelo 可以预测病理分析和发展,以及鉴定关键的致病基因。

日前,相关论文以《基因调控激发的 RNA 速度估计》(TFvelo: gene regulation inspired RNA velocity estimation)为题发在 Nature Communications[1]。

下一步,课题组计划分两步走:

一是和具体应用相结合,分析疾病的发生和发展过程中的细胞命运和关键转录调控关系。

二是进一步拓展该模型的功能和适用场景,比如针对多分支过程开展建模等。

参考资料:

1.Li, J., Pan, X., Yuan, Y.et al. TFvelo: gene regulation inspired RNA velocity estimation. Nat Commun 15, 1387 (2024). https://doi.org/10.1038/s41467-024-45661-w

运营/排版:何晨龙

01/ 科学家开发新型荧光聚合物,可写入亚微米级像素的隐形文字与图像,助力信息安全与商标防伪

02/ 西交大团队将AI用于电池建模和健康管理,成功打造物理信息神经网络,在三十万余个样本上验证的平均绝对百分比误差低于1%

03/ 连续工作11天吸附性能仍为100%,科学家成功研发带电吸附剂,已着手开发空气直接碳捕集系统

04/ 科学家制备仿钻石超结构,兼具光物理性能和光催化性能,可用于构建纳米尺度的电子器件

05/ 科学家发现氢气制备新机制,并重新评估水氧化催化剂设计原理,为研究铱基材料带来新见解

加载中...