5 12 月, 2025

西交利物浦大学团队推出全球首个m6A修饰数据库

m6a-

在生命科学研究领域,”RNA修饰”被视为基因表达的”隐形开关”,它控制着细胞何时、以何种方式制造蛋白质。其中,最常见的一种修饰是m6A (N6-甲基腺苷),它影响RNA的稳定性和蛋白质合成效率,被认为与细胞功能及疾病发生密切相关。然而,长久以来,不同实验室的研究结果常常不一致,这让科研人员难以判断哪些修饰是真实且可重复验证的。

近日,这一混乱状况有望得到改善。西交利物浦大学理学院生物科学与生物信息学系魏震博士团队,联合利物浦大学研究者,在国际权威期刊《核酸研究》上发表了最新成果,推出了全球首个整合多种m6A检测技术并通过交叉验证的数据库——m6AConquer。

统一标准:让全球数据“对齐”

魏震博士形象地将m6AConquer比作一个能“对齐”所有数据的共同坐标系。该数据库整合了来自十种实验技术和数百个公开数据集的m6A测序结果,并通过引入“正交验证”的算法,筛选出了能够在多种采用不同生化原理的m6A检测技术中重复验证的修饰位点。这意味着研究者终于有了一个可靠、统一、可验证的数据基准。

m6AConquer:在十种m6A修饰检测技术上实现一致量化和正交验证的数据分享平台。

一台“RNA修饰真伪检测仪”

在生动的比喻下,m6AConquer可以被看作一台“RNA修饰真伪检测仪”。它帮助科研人员区分哪些信号是可重复的生物学标记,哪些只是偶然的实验噪音。研究团队借鉴了国际著名的ENCODE人类基因组计划的统计框架,采用IDR模型来衡量不同检测方法之间的结果一致性。最终,他们识别出了超过13.5万个高置信度的m6A修饰位点,这些位点在不同的正交实验技术之间表现出统计显著的可重复性。

“这项分析首次在该领域中建立了严谨的真实标准(ground truth)数据集,让不同m6A检测方法的性能评估成为可能。”——魏震博士

从“能信”到“能用”:科研的基础设施

除了确保数据的可靠性,魏博士团队还关注“可用性”——如何让这些数据更容易被科学家使用。m6AConquer建立了一个标准化的数据共享框架,将原本分散、复杂的多组学原始数据重新整理为“分析就绪”的矩阵化格式。这就像把散落在不同国家的字典整合成同一种语言版本,大幅提升科研效率与可复现性。

m6AConquer构建的多组学数据分享框架(Multi-Omics Data-Sharing Framework)

连接基因变异与疾病机制的新窗口

更令人兴奋的是,m6AConquer不仅整合了修饰数据,还将RNA修饰与基因变异、基因表达和疾病风险相结合。研究团队发现了6000多个与高置信度m6A位点修饰水平显著相关的基因变异(m6A-QTL),揭示了遗传差异如何影响RNA修饰,从而改变基因的调控方式。

其中一些变异位于精神疾病、抑郁症等复杂疾病的风险区域,为科学家理解这些疾病的分子机制提供了新的切入点。魏震博士表示,m6AConquer不仅是一个数据资源,更是连接遗传变异、RNA修饰与疾病发生的桥梁。它为未来利用高置信度数据开展人工智能建模、RNA修饰预测和药物靶点研究奠定了坚实基础。

“我们希望这一开放资源能够成为推动表观转录组学从‘数据整合’走向‘机制理解’的重要一步。”——魏震博士

目前,m6AConquer数据库和所有分析工具已在网站rnamd.org/m6aconquer免费向全球科研人员开放。

推荐阅读  贵州新条例破解科研痛点 助力科技强省建设