AJHG:哈医大邵婷婷/徐娟团队构建人类癌症单细胞变异图谱数据库:CanCellVar

时间:2024-07-12 19:00:33   热度:37.1℃   作者:网络

变异,包括DNA中的单核苷酸变异(SNV)和mRNA中的A>G RNA编辑,作为细胞增殖和肿瘤发生的重要驱动因素,通常与癌症进展和生长有关。在不同癌症之间,甚至在同一癌症的不同肿瘤之间分布模式、变异频率和光谱都有显著差异。目前,数千种癌症已经进行DNA和RNA测序,并建立了数据库。但大多数关于变异的研究和数据库分析的是全肿瘤(bulk tumor),它是癌细胞、免疫细胞和基质细胞的混合物,反映了不同亚克隆的平均特征。然而,在单细胞分辨率下,癌细胞的异质性以及浸润和驻留宿主细胞的变异异质性在很大程度上仍然未知。因此,挖掘和总结单细胞变异将提供更精细、更高分辨率的癌症视图,并进一步促进精准医疗。同时,我们需要一个用户友好的数据库,包括丰富的单细胞变异数据和有效的工具来研究人类癌症的遗传异质性。

为此,哈尔滨医科大学生物信息科学与技术学院的邵婷婷、徐娟团队AJHG发表了题为“CanCellVar: A database for single-cell variants map in human cancer”的研究文章,报道了CanCellVar数据库,旨在提供和可视化肿瘤微环境中单细胞变异的综合图谱。目前,CanCellVar收集了来自多个公共数据库的53个10× scRNA-seq数据集,涉及37种癌症类型,鉴定了多种细胞类型的约300万个变异(约140万个SNV,约140万个A>G RNA编辑),并构建了泛癌变异图谱。此外,CanCellVar提供了基本的注释信息以及变体的细胞和分子功能属性和临床相关性,如肿瘤分级、治疗、转移等,并开发了一些灵活的工具来帮助检索和分析细胞-细胞相互作用、基因表达、细胞发育轨迹、调控和受变异影响的分子结构。总之,CanCellVar将成为研究单细胞变异的功能和特征及其在人类肿瘤进化和治疗中的作用的重要资源。

图片

CanCellVar概述

01 数据库内容和统计信息

CanCellVar收集了37种癌症类型461个样本的53个肿瘤10×scRNA-seq数据集,包括2,754,531个细胞的scRNA-seq原始数据(图1B)。CanCellVar重新注释了5种主要细胞类别的所有细胞,包括恶性细胞、免疫细胞、内皮细胞、上皮细胞和基质细胞(图1B)。基于这些数据集,CanCellVar在单细胞水平鉴定了2,896,201个变异,包括1,429,113个SNV和1,436,356个A>G RNA编辑(图1C)。大多数变异位于内含子和基因间区域,其次是UTR(图1D)。在>30个数据集中,恶性细胞积累了更多的突变位点,表明了肿瘤微环境中变异的一般突变模式和优势细胞亚群(图1E)。此外,每个数据集中临床特征组之间的变异数量是一致的(图1F)。

为了表征泛癌变异特征并在单细胞水平上识别驱动突变,CanCellVar确定了不同的细胞群,并为每个数据集构建了变异图谱(图1A)。此外,CanCellVar还整合了基因表达、调控和临床数据,以研究目标变异的细胞和分子功能。用户可以使用CanCellVar探索致病变异及其在细胞和分子功能以及突变状态中的相互作用。

图片

图1.CancelVar的数据内容和接口概述

02 CanCellVar的功能和实用程序

CanCellVar提供了一个友好的界面,用于查询、浏览、可视化和下载癌症单细胞变异数据(图2A-D)。用户可以通过输入基因名称或选择癌症和细胞类型来查询变异(图2C)。CanCellVar提供了7种交互工具(变异组分、细胞轨迹、细胞间通讯、表达扰动、药物敏感性、调节扰动和结构扰动),从不同方面检索有关细胞变异的详细信息(图2D)。在结果页面上,用户可以查看变异的位置、检测到SNV或编辑位点的细胞数量以及等位基因分数(图2E)。在数据表中,用户可以单击详细信息按钮以进一步获取有关变异的细胞和分子功能的广泛信息。

首先,CanCellVar在表中提供有关变异的基本信息(图2F)。为了进一步探索变异与肿瘤分期、治疗等的关联,用户可以观察不同临床组中变异的分布和宿主基因表达(图2G)。CanCellVar构建了从细胞假时间推断的发育轨迹,并结合临床特征说明了不同谱系中变异的特征分布(图2H)。在携带变异的细胞亚群和其他细胞类型之间鉴定了细胞间通讯,这有助于确定变异在肿瘤微环境中的作用(图2I)。细胞相互作用强度和受体-配体对以图形式提供。CanCellVar允许用户评估突变组和野生组细胞之间基因表达和药物敏感性的差异,并分别进行变异与基因表达和药物敏感性的相关性分析(图2J-K)。用户可以在CanCellVar中分析调节和结构变异的分子功能(图2L)。此外,CanCellVar还提供了多种可视化结果,以促进对其在癌症中作用的理解,并允许用户从“下载”页面下载每个数据集的基因表达谱、突变谱和细胞注释信息。

图片

图2.CancelVar的功能和实用程序

03 CanCellVar的应用示例

通用CanCellVar,研究团队从变异角度探讨了SNCG在膀胱癌(BLCA)中的致癌机制。研究发现,SNCG是BLCA细胞中含SNV的顶级基因,且变异主要富集在大量上皮细胞和恶性细胞中。在2000多个上皮细胞和恶性细胞中检测到的SNV中,有3个变异在BLCA低级别肿瘤中富集,且具有更高的等位基因分数。这些变异可能促进低级别BLCA中恶性细胞的侵袭,并导致癌细胞产生耐药性。此外,SNVs与SNCG在低级别肿瘤细胞中异常表达之间存在关系,且SNV通过调节扰动模块介导miRNA和RBP结合的丢失。以上结果揭示了变异驱动BLCA中SNCG的异常表达并导致恶性肿瘤进展,证明了CanCellVar作为癌症单细胞水平功能变异表征、了解肿瘤中恶性细胞侵袭和迁移以及辅助临床诊断和治疗的重要资源的潜力

图片

图3.CanCellVar在解决致癌变体中的应用

综上所述,CanCellvar提供了一个全面的数据集和强大的可视化工具,填补了癌症基因组中的单细胞变异空白。对单细胞变异进行更深入的研究将有助于剖析肿瘤内的异质性,并促进预测性生物标志物的识别和新药或治疗策略的开发,提供新的机制见解。

论文原文:

Yang C, Liu Y, Lv C, et al. CanCellVar: A database for single-cell variants map in human cancer. Am J Hum Genet. Published online May 29, 2024. doi:10.1016/j.ajhg.2024.05.014

https://www.cell.com/ajhg/fulltext/S0002-9297(24)00177-0

上一篇: Adv Sci:山东大学杨其峰团队揭示了...

下一篇: 中山大学,最新Nature系列综述:RO...


 本站广告