大家好!今天跟大家分享的文献是2021年7月发表在Frontiers in Cell and Developmental Biology(IF=6.684)杂志上的一篇文章。作者对TCGA数据库中BRCA患者的RNA-seq数据集及额外的RNA-seq数据集进行分析鉴定与m6A有关的lncRNA。根据单因素和多因素Cox回归分析构建m6A-LPS。该预后模型可用准确预测BRCA患者的预后。
题目:Comprehensive Analysis of the Immune-Oncology Targets and Immune Infiltrates of N6-Methyladenosine-Related Long Noncoding RNA Regulators in Breast Cancer
乳腺癌N6甲基腺苷相关lncRNA调控因子的免疫肿瘤靶点和免疫浸润分析
摘要
乳腺癌是目前发病率最高的癌症之一。为预测乳腺癌的预后,还需要对乳腺癌标志物进行深入研究。本研究中作者对TCGA数据集和RNA-seq数据集使用Pearson相关性分析,单因素和多因素Cox回归分析鉴定可以作为预后标记物的N6-甲基腺苷相关lncRNA(m6A相关lncRNA)。鉴定基于12个lncRNA构建m6A相关lncRNA预后模型(m6A-LPS)。根据风险打分将患者分为高风险组和低风险组,其低风险组免疫打分较高,免疫靶点表达水平上调表达,而高风险组与基因突变情况,Wnt/β-catenin信号和JAK-STAT信号通路相关性更强。此外,基于风险打分和临床特征构建的列线图可以预测BRCA患者的总生存期(OS)。因此,m6A-LPS可以作为预测BRCA患者预后的标志物,对个体免疫治疗具有积极影响。
流程图
结果
1. 数据的获取和整理
从TCGA下载BRCA患者的mRNA表达数据,lncRNA注释文件和临床数据。从RNA-seq数据集中获取lncRNA的注释文件。从以往的研究中获取21个m6A相关基因的表达矩阵。
2. 鉴定BRCA患者中的m6A相关lncRNA
本研究中作者从TCGA数据集中鉴定到16501个lncRNA,从RNA-seq数据集中鉴定到17573个lncRNA。根据lncRNA表达水平与21个m6A相关基因表达水平的相关性鉴定m6A相关lncRNA。图1A为本研究的流程图。根据Pearson相关性鉴定到1509个m6A相关lncRNA。将TCGA数据集(1089例)随机分为训练集(545例)和验证集(544例)。随后进行单因素和多因素Cox回归分析鉴定到12个m6A相关lncRNA与OS有关(图1B和1C)。图1D为m6A相关基因与这12个m6A相关lncRNA的相关性热图。
3. 构建和验证m6A-LPS
作者根据这12个m6A相关lncRNA构建预后模型(m6A-LPS)。根据lncRNA计算患者的风险打分。图2A和2B为训练集和验证集患者的风险打分和生存状态分布。热图表明保护性lncRNA的表达水平随风险打分降低而升高,而风险性lncRNA的表达水平随风险打分升高而升高。此外,训练集ROC曲线的AUC为0.722,验证集ROC曲线的AUC为0.698。KM生存分析表明高风险组的OS较差(图2A和2B)。
4. m6A-LPS与免疫细胞浸润和免疫肿瘤靶点的相关性
作者研究高风险组和低风险组的28种免疫细胞比例(图2C),其中高风险组中CD56dim自然杀伤细胞和中性粒细胞浸润水平更高,而低风险组中活化B细胞、效应记忆CD4 T细胞、效应记忆CD8 T细胞、记忆B细胞、1型T辅助细胞、2型T辅助细胞、嗜酸性粒细胞、肥大细胞、自然杀伤细胞、自然杀伤T细胞和浆细胞样树突状细胞浸润水平更高。此外,这28种免疫细胞类型与风险打分相关性如图2D所示。两组的免疫打分不同,低风险组的免疫打分更高(图2E)。高风险组的激活B细胞,效应记忆CD4 T细胞和中性粒细胞浸润水平较低(图2F-2H)。为研究免疫肿瘤靶点与m6A-LPS的相关性,作者比较两组中免疫靶点的表达水平差异,CTLA4、PDCD1、CD274和CD19在高风险组中表达水平较低(图3A),这4个靶点与lncRNA的相关性如图3F所示。
5. 风险打分与SNP,TMB,基因集富集分析和化疗的相关性分析
对两个分组进行基因突变分析,高风险组中有420个样本发生SNP,其中TP53、PIK3CA和TTN的比例最高(图3B),低风险组中有387个样本发生SNP其中TP53、PIK3CA和CDH1的比例最高(图3C),高风险组中TMB较高(图3D)。此外,GSEA分析表明高风险组与Wnt/β-catenin信号和JAK-STAT信号通路有关(图3E)。随后,作者研究风险打分对BRCA患者化疗作用的预后价值。对BRCA化疗患者分组并进行生存分析,高风险组OS较差(图3G),AUC为0.819(图3H)。
6. m6A-LPS的分层分析和独立性预后分析
热图表明TGFB2-AS1, LINC01725, AP002478, AL352979, AL033543, ZNF197-AS1, AL592546, AC092653和AP005131的表达水平随风险打分升高而降低,而OTUD6B-AS1, LINC02296和 AC022150的表达水平随风险打分升高而升高,其表达水平也与临床特征有关(图4A)。此外,单因素和多因素Cox回归分析表明m6A-LPS是BRCA患者的独立预后因子(图4B和4C)。ROC曲线表明m6A-LPS的AUC值最高(图4D)。
7. 构建列线图
作者基于风险打分和临床特征构建列线图来评估患者的3.5年、5年和7.5年的生存情况(图4E)。校准曲线表明列线图预测OS的效果较好(图4F)。
8. m6A-LPS的外部验证和蛋白编码基因分析
作者使用RNA-seq数据作为验证数据集验证m6A-LPS的预后价值。该数据集的低风险组OS优于高风险组,ROC曲线的AUC为0.744(图5A和5B)。此外,图5C为患者的风险打分和生存状态的分布情况以及12个lncRNA的表达水平。此外,作者将蛋白编码基因添加到该预后模型中,其ROC曲线的AUC为0.677,较m6A-LPS的AUC低。总的来说,作者构建的m6A-LPS可以预测BRCA患者预后。
结论
作者对TCGA数据集进行分析构建了一个m6A相关lncRNA的预后模型(m6A-LPS)。根据m6A-LPS可以将BRCA患者分为高风险组和低风险组,两组的生存情况,免疫细胞浸润比例,TMB及基因突变情况均不同。作者使用RNA-seq数据集作为验证集验证m6A-LPS的预后性能。但是本研究还存在一定局限性,例如GEO数据库缺乏可用的lncRNA数据集,无法进一步验证。此外,对m6A相关lncRNA在BRCA患者肿瘤微环境中的调控机制尚不清楚还需要进一步研究。
版权声明:本文转自“生信发文助手”,文章转载只为学术传播,不代表本号观点,无商业用途,版权归原作者所有,如涉及侵权问题,请联系我们,我们将及时修改或删除。
SCIER星科编辑-SCI论文润色等。
添加微信获取最新优惠、出版政策、课程直播信息,随时咨询客服/编辑,了解更多实时资讯