Nat Commun:核酸捕获成本降低2-3个数量级!林兰/邢毅团队发表一种通用、低成本的靶向长读长RNA测序技术
时间:2023-08-13 17:34:57 热度:37.1℃ 作者:网络
导读
转录本异构体变异在真核生物细胞中普遍存在,并极大地丰富了真核基因产物的多样性。各种RNA水平的调控过程,如选择性剪接(AS)和选择性聚腺苷酸化,可以从单个基因产生多个转录本异构体。所产生的转录本异构体在RNA定位、稳定性和翻译效率方面可有所不同,并可编码具有不同结构和功能的蛋白质异构体。
在过去的十多年中,短读长RNA测序(RNA-seq)已被广泛用于转录组分析。但由于其读长较短,因此短读长RNA测序在解析全长转录本异构体和复杂RNA加工事件的能力上受到很大限制。相比之下,长读长测序技术可以生成长度超过10kb的序列,从而直接对全长转录本进行测序。但长读长测序的通量相对较低,这也成为限制其在转录组分析领域广泛应用的一大瓶颈。
为了克服这些局限性,推动长读长RNA测序在生物、医学、临床的广泛应用,近日,美国费城儿童医院/宾夕法尼亚大学林兰教授与邢毅教授团队合作,在Nature Communications发表了题为“TEQUILA-seq: a versatile and low-cost method for targeted long-read RNA sequencing”的研究文章,报道了新开发的靶向长读长RNA测序技术TEQUILA-seq(Transcript Enrichment and Quantification Utilizing Isothermally Linear-Amplified probes in conjunction with long-read sequencing)。TEQUILA-seq的一个关键创新是巧妙设计了一个核酸内切酶触发的等温链置换扩增(SDA)反应,从阵列合成的非生物素化的寡核苷酸模板库中大量合成生物素化的寡核苷酸,用作核酸捕获探针,这种合成策略使得TEQUILA-seq具有很高的成本效益和可扩展性。与标准的商业解决方案相比,TEQUILA-seq可将目标捕获的单样本成本降低2-3个数量级,可广泛用于各种生物、医学、临床环境中全长转录本的靶向测序。
文章发表在Nature Communications
主要研究内容
TEQUILA-seq概述
TEQUILA-seq是一种通用、易于实现、低成本的靶向长读长RNA测序技术。首先,研究人员设计单链DNA(ssDNA)寡核苷酸以覆盖目标基因的所有注释外显子序列,并使用基于阵列的DNA合成技术进行合成。接下来,基于通用引物和生物素标记的dUTPs底物,以ssDNA寡核苷酸为模板,使用单链核酸内切酶触发的SDA反应进行扩增。SDA反应借助链置换DNA聚合酶和预先设计的切割位点,通过重复循环的延伸和切割反应,实现生物素化的寡核苷酸的等温扩增。由此产生的TEQUILA探针库可用于捕获目标基因的全长cDNA分子。由于使用了低成本的ssDNA寡核苷酸和大量的探针合成输出,与现有商业方法相比,TEQUILA方法大大降低了核酸捕获的初始和单样本捕获成本。
例如,对于一个6,000条序列的探针库,TEQUILA探针合成的初始成本大约为3,086美元(其中1,820美元用于非生物素化的寡核苷酸模板库)。考虑到试剂和耗材成本,该模板库可能用于合成6,250至25,000次反应的TEQUILA探针,相对每个样本捕获反应的成本为0.31 - 0.53美元。
当与长读长RNA测序结合时,TEQUILA-seq可提供目标基因全长转录本的高覆盖率,以促进全面发现和准确定量转录本异构体。研究团队使用自主开发的ESPRESSO软件进行数据分析,该软件可对长读长RNA测序数据进行准确的转录本分析。
图1. TEQUILA-seq流程图,来源:Nature Communications
TEQUILA-seq高效富集目标基因的转录本
研究团队使用多个RNA样本和目标基因panel,系统评估了TEQUILA-seq对目标基因转录本的富集以及在转录本检测和定量方面的性能。与未经靶向捕获的长读长cDNA全转录组测序相比,TEQUILA-seq可以几十至几百倍的富集目标基因的转录本,极大提升低丰度转录本的检测灵敏度,同时保存转录本异构体的定量。
图2. TEQUILA-seq对目标基因转录本的检测和定量,来源:Nature Communications
TEQUILA-seq的生物医学应用
为了演示TEQUILA-seq在生物医学上的用途,研究团队设计合成了一个针对468个癌症基因的的TEQUILA探针库,对40个乳腺癌细胞系的癌症基因全长转录本进行了TEQUILA-seq分析。这40个细胞系包含四种不同的乳腺癌亚型。
在TEQUILA-seq数据中,468个癌症基因的靶向率(on-target rates)为62.8% - 71.4%,在非捕获对照RNA测序数据中为2.9 %- 3.6%,平均富集度约20倍。综合40个乳腺癌细胞系的TEQUILA-seq数据,研究团队一共发现了目标癌症基因的3,122个注释转录本异构体和25,519个新转录本异构体。接下来,研究团队使用TEQUILA-seq数据在40个乳腺癌细胞系中识别了与乳腺癌亚型相关的转录本异构体。
图3. TEQUILA-seq用于靶向测序癌症基因的全长转录本,来源:Nature Communications
此外,研究人员还使用TEQUILA-seq数据识别了在单个或少量乳腺癌细胞系中特异存在的癌症基因转录本异构体。例如,研究人员在HCC1599细胞株中发现了重要抑癌基因TP53的新转录本异构体。在该细胞株中,由于TP53第6个内含子剪接位点上的一个DNA单核苷酸突变,该内含子被保留在成熟的转录本产物中,从而生成了这个新转录本异构体。由于第6个内含子包含一个提前终止密码子,该TP53新转录本异构体不稳定,会被无义介导的mRNA降解通路(nonsense-mediated mRNA decay,NMD)降解。研究人员通过40个乳腺癌细胞系的TEQUILA-seq数据发现,类似的不稳定、易被降解的乳腺癌细胞系特异性的转录本异构体在抑癌基因上有显著富集。这一发现揭示了癌症生成发展中导致抑癌基因失活的一个普遍的RNA机制。
图4. TEQUILA-seq发现乳腺癌细胞系特异性的癌症基因转录本异构体,来源:Nature Communications
结 语
综上所述,研究团队开发了一种通用、低成本的靶向长读长RNA测序技术TEQUILA-seq。该方法易于实现,可以用少量低成本的原料合成大量生物素化的核酸捕获探针,可用于大量的捕获反应,从而大大降低了单个捕获反应的成本。与标准商业解决方案相比,TEQUILA-seq降低了初始成本,并大幅(达到2-3个数量级)降低了目标捕获的单样本成本,因此TEQUILA-seq可以很容易地扩展到具有大量生物样本的大型队列研究。
研究团队在文章中指出,鉴于其显著的低成本以及简易的操作步骤,TEQUILA-seq将促进靶向长读长RNA测序的广泛应用,在不同的生物、医学和临床环境中提供多种应用场景。此外,TEQUILA探针是通用普适的核酸捕获探针,与靶向RNA或DNA测序兼容,可结合长读长或短读长测序平台,用于靶向长读长RNA测序之外的各种核酸靶向测序应用。据悉,费城儿童医院为此项技术提交了全球专利申请。
参考文献:
1.Wang, F., Xu, Y., Wang, R. et al. TEQUILA-seq: a versatile and low-cost method for targeted long-read RNA sequencing. Nat Commun. 14, 4760 (2023).
https://doi.org/10.1038/s41467-023-40083-6
2.Gao, Y., Wang, F., Wang, R. et al. ESPRESSO: Robust discovery and quantification of transcript isoforms from error-prone long-read RNA-seq data. Sci Adv. 9, 3 (2023).
https://www.science.org/doi/10.1126/sciadv.abq5072