En 内网

检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的极速模式浏览,或者使用谷歌、火狐等浏览器。

下载Firefox

Nature Communications | 高歌课题组提出人类转录调控元件建模与相关非编码变异功能解析方法

日期: 2025-01-04

细胞是生物体生命活动的基本单元,生命活动的正常进行依赖于精确的基因表达调控过程,而基因转录调控过程则是基因表达调控中的重要环节。人类基因组中约98%的区域为非编码区,其中约80%的区域可能涉及基因转录调控过程。基因的时空特异性表达依赖于复杂的基因调控网络,涉及多种顺式调控元件,并且往往以组合的方式共同发挥调控作用。针对高等真核生物多层次、跨尺度的复杂基因调控模式,如何有效鉴定基因组中的调控元件并挖掘转录调控规律是亟待解决的重要挑战。

针对上述挑战,2024年12月30日,js33333金沙线路检测/昌平实验室高歌课题组于Nature Communications在线发表题为Quantifying the regulatory potential of genetic variants via a hybrid sequence-oriented model with SVEN的研究论文,通过引入多尺度混合模型,逐层学习序列中的调控信息,进而量化建模特定调控元件及其组合对下游基因表达的影响。在此基础上,构建了人类转录调控相关非编码变异功能解析方法SVEN,能够针对不同类型的变异(包括大尺度的结构变异和小尺度的SNV/indel等),在超过350个组织和细胞系中实现复杂非编码基因组变异的功能预测与机制解析,为从序列水平深入理解细胞调控图谱提供了有价值的方法学基础与数据储备。

为充分利用现有数据并提升模型的准确性,SVEN采用了一种不同于传统“单一大模型”的构建方式,创新性地引入了基于序列的多尺度混合模型架构:基于来自ENCODE的超过400种组织和细胞系的组学数据,通过结合针对特征的个体模型(feature-oriented separate models)和针对类的整体模型(class-oriented holistic models),以一组“小模型”分别学习基因组调控序列的特征(如转录因子结合、DNA开放性和组蛋白修饰),而后再通过隐空间投影去除冗余的特征信息,实现了对多个组织和细胞系中基因转录水平的量化建模(图1)。

图3 SVEN可准确预测结构变异对基因转录水平影响

SVEN全部实现代码已经开源发布:https://github.com/gao-lab/SVEN

js33333金沙线路检测博士生王宇(已毕业,现为昌平实验室博士后)为该论文第一作者,梁楠在实验验证方面提供大力支持。该研究得到了国家重点研发计划、蛋白质与植物基因研究国家重点实验室、北京未来基因诊断高精尖创新中心和昌平实验室的资助。计算分析工作于昌平实验室高性能计算平台、js33333金沙线路检测太平洋高性能计算平台与js33333金沙线路检测高性能计算校级公共平台完成。

论文链接:https://doi.org/10.1038/s41467-024-55392-7