Genome Res:西奈山伊坎医学院张斌团队发现超4700个基因簇对32种癌症的预后至关重要

时间:2023-12-08 11:36:40   热度:37.1℃   作者:网络

癌症是一个多面和复杂的调控过程。目前,人们开发了各种网络方法来描述基因相互作用并解剖肿瘤发生通路的调控关系。其中,基因共表达网络是一种数学模型,它假设功能相关的基因作为一个系统被共同调节,并且可以嵌入在一个共表达网络。剖析基因共表达网络对癌症研究至关重要,可以提供基因如何在生物体中共同发挥功能的综合信息,有助于识别新的基因相互作用和途径。

预测患者生存的基因对癌症生物标志物的开发、风险评估和临床决策至关重要。已有研究表明,癌症预后基因倾向于在转录组水平上进行共调控,并在共表达网络模块中富集。共表达基因模块(基因簇)反映了通路相关基因的整体特征,因此它们对癌症预后和功能解释具有强大的意义。但对跨多种癌症类型的共表达网络和预后基因模块的综合了解仍然缺乏。

近日,美国西奈山伊坎医学院张斌教授团队在Genome Research发表了题为“Multiscale network modeling reveals the gene regulatory landscape driving cancer prognosis in 32 cancer types”的文章。通过结合基因组、转录组学和表观基因组学数据,研究团队分析了癌症基因组图谱(TCGA)队列中的所有32种主要癌症类型,全面表征了癌症中的共表达网络,确定了在调控癌症进展中起重要作用的4749个关键预后模块。简而言之,该研究确定了关键基因及其复杂的关系,这些基因或阻止或促进了癌症的发展,这一发现为未来癌症治疗和诊断方法的改进打开了大门。

图片

文章发表在Genome Research

泛癌共表达网络和预后模块的构建

TCGA是最全面的公共癌症数据库之一,研究人员使用多尺度嵌入式基因共表达网络分析 (MEGENA)系统地识别了该数据库中的预后模块,构建了32个实体瘤的基因共表达网络。研究团队主要进行了四项分析:基因网络构建、基因模块注释、模块预后检测和模块保存分析。MEGENA从32个共表达网络中识别了27,448个分级模块,对应32种不同的癌症类型。平均而言,每个网络包含17,831个基因,51,677个基因相关性,以及858个层次网络模块。

结果显示,泛癌网络分析识别出4749个预后模块,其模块特征基因与癌症患者生存结果相关。基于分子特征数据库(MSigDB)标记通路注释,发现预后模块最丰富的是肿瘤发展的关键通路,包括E2F靶点、G2M检查点、上皮-间充质转化(EMTs)、MYC靶点和炎症反应。在239个富集了E2F靶标通路的预后模块中,205个(86%)模块与较差的生存率或较高的危险比相关(图1B,C)。同样,EMT通路的209个预后模块中有184个(88%)显示生存率较低。鉴于E2F靶点和EMT通路在多种癌症类型中是保守的,因此,这两种与低生存率相关的通路富集了更多的预后模块。

图片

图1. 构建泛癌共表达网络和预后模块

研究团队还比较了预后模块与预后基因的预测性能。考虑到预后模块的特征基因是通过PC分析计算的,研究人员提取了所有预后基因的PC与预后模块进行比较。结果显示,基于模块的方法在识别生存相关特征方面比单个基因分析更有效。由于网络模块代表了模块中的所有单个基因,因此能够揭示肿瘤调控因子的相互作用。

网络模块的表观遗传调控

DNA甲基化的表观遗传调控在癌症发展中发挥着关键作用。因此,研究团队分析了DNA甲基化模块水平的调控及其对患者预后的影响。16种癌症类型的样本与正常样本比较发现,1517和1626个网络模块分别显著富集上调和下调差异表达基因(DEG),849和597个网络模块分别富集上调和下调差异甲基化CpG(DMC)

分析显示,DEG和DMC整体呈负相关。例如,408个模块富集了下调的DEG和上调的DMC(dDEG-uDMC),173个模块富集了上调的DEG和下调的DMC(uDEG-dDMC)(图2A)。uDEG-dDMC富集的网络模块主要参与细胞因子和趋化因子通路,表明基因表达和甲基化的共调控可能在不同模块功能中发挥重要作用。此外,在富含uDEG-dDMC的模块中,13个和34个模块分别与良好和较差的患者生存相关;在富含dDEG-uDMC的模块中,34个和65个模块分别表明患者生存良好和生存较差(图2C、2D)。

图片

图2. DNA甲基化对模块基因表达的调控

共表达模块在32种癌症中的保守性

研究团队分析了32种癌症类型网络模块的保守性,以揭示癌症转录组分子调控机制的相似性。为了评估模块的保守情况,研究人员计算了所有癌症类型模块两两比较的相似度,共鉴定出829167对模块具有显著相似性,其中8020对模块高度保守,这些保守模块来自32种癌症类型的1941个模块。此外,研究还确定了1063个癌症类型特异性模块,并对1941个保守模块和1063个特定模块进行详细的下游分析。

其中,保守和特异模块数量的比值在肺鳞癌中最高,在胸腺瘤中最低,这反映了所有癌症类型中共享转录组特征的趋势。基于保守模块的相似性,研究团队对32种癌症类型进行了聚类分析,将癌症类型分为模块相似度不同的4组。

图片

图3. 泛癌网络模块的保守性分析

保守和特异模块的预测特征

已有分析发现,保守模块往往位于肿瘤中经常失调的染色体热点。在确定的1063个癌症类型特异性模块中,252个与患者生存显著相关。此外,这些预后模块中有63个在MSigDB标记通路显著富集,表明这些模块可能在不同癌症类型的特定生物学过程中发挥重要作用(图4B)。此外,癌症类型特异性模块可能在癌症的发生和进展中具有独特的功能,突出了它们作为癌症类型特异性调控机制和治疗靶点的潜力。

图片

图4. 泛癌特异性预后模块分析

综上所述,研究团队对32种癌症类型的共表达网络进行了系统分析,确定了4749个在癌症调控通路中发挥重要作用的预后模块,包括细胞分裂、转移和免疫微环境过程。这些网络模块受到多维机制的调控,包括基因表达、甲基化和染色质可及性的相互作用。癌症类型特异性预后模块参与不同癌症类型中独特的生物学过程。总之,该泛癌分析提供了预后模块在肿瘤发生发展中的全面理解,并揭示了癌症发生和进展的潜在生物标志物。目前,研究团队在开源网站上分享了所有的网络、模块、预测特性和功能注释。

虽然癌症研究取得了重大进展,但理解其遗传复杂性仍具有挑战性。该文章通讯作者、伊坎西奈山医学院张斌教授表示:“我们的目标是通过提供各种类型癌症的基因相互作用的全面分析来填补这一知识空白。我们已经确定了4749种不同的共调控基因模块,它们在癌症进展中起着关键作用,这一发现为未来癌症研究和治疗策略分析奠定了重要基础。”

论文原文:

Peng Xu et al, Multiscale network modeling reveals the gene regulatory landscape driving cancer prognosis in 32 cancer types, Genome Research (2023). DOI: 10.1101/gr.278063.123.https://genome.cshlp.org/content/33/10/1806.full

上一篇: 【甲状腺癌】了解甲状腺癌分期、治疗及预后...

下一篇: AMERICAN JOURNAL OF ...


 本站广告