尔云间 一个专门做科研的团队
关注我们
不蹭热点如何轻松发纯生信?
双疾病绝对是不二之选~
还可以分析现成的两种疾病合并数据!
小云之前给大家分享过多篇双疾病的研究思路,小哥内容都是相对简单且常规,但影响因子丝毫不差。
但之前的双疾病思路都是分别分析单个疾病的DEGs,再取交集得到双疾病相关的基因。
如果数据库直接有现成的两种疾病合并的数据,直接分析岂不是得来全不费工夫嘛~
(想知道你关注的疾病是否可以做双疾病思路?数据库是否有现成诗句?分析内容如何升级?快来评估吧!)
展开全文
今天小云要分享的这篇纯生信小哥,就是直接利用数据库中两种疾病合并的数据进行分析。亮点是利用WGCNA+机器学习分析了两种疾病合并的诊断基因,评估其诊断价值,增加临床意义。另外还利用单基因GSEA分析出了关键的信号通路。快和小云一起来看看吧!
题目:WGCNA和机器学习的综合分析确定了扩张型心肌病合并心力衰竭的诊断生物标志物
杂志:Frontiers in cell and developmental biology
影响因子:6.081
发表时间:2023年3月
数据信息
研究思路
从GEO数据库中下载扩张型心肌病(DCM)合并心力衰竭(HF)的数据集,采用加权基因共表达网络分析(WGCNA),在模块中鉴定出15个与DCM和HF高度相关的基因。对关键基因进行LASSO和机器学习,筛选出3个关基因用于诊断DCM合并HF。单细胞RNA-seq分析进一步证实了关键基因在DCM患者心肌细胞中稳定的上调表达。此外,通过GSEA发现TGF-β信号通路与关键基因相关,是DCM合并HF的潜在机制。
主要研究结果
1
分析扩张型心肌病(DCM)合并心力衰竭(HF)中的
差异表达基因(DEGs)
分析正常心肌样本(对照组)和DCM合并HF患者心肌样本(DCM合并HF组)间的差异表达基因。
图1 分析DEGs
2
上调DEGs的生物学功能、途径和相关疾病
分别进行了GO、KEGG和DO富集分析,以注释135个上调的DEGs的潜在功能、途径和疾病。其中NPPA作为核心基因,表达量高,边数多,表明其在肌肉收缩中具有新的作用。
图2表达上调的DEGs的潜在生物学功能、途径及相关疾病
3
加权基因共表达网络的构建
利用WGCNA构建基因共表达网络,识别临床特征相关模块。其中ME蓝模块与DCM与HF呈强正相关,获得模块中的15个关键基因。
图3 DCM伴HF相关模块关键基因的鉴定
4
基于13个特征基因构建BP神经网络(BPNN)与验证
选取ME蓝模块中的15个关键基因与135个上调的DEGs取交集作为DCM伴HF的特征基因,共得到13个基因。基于这13个基因构建一个BPNN,BPNN具有较高的预测精度,训练组AUC评分为0.988。
图4基于13特征基因的BPNN构建与验证
5
筛选DCM合并HF的关键基因
为了缩小特征基因的范围,进行Lasso,从13个特征基因中保留了5个基因。基于这5个基因建立5个机器学习模型(RF、GBM、NN、XGBoost和SVM),并验证其分类性能。其中3个基因(OMD、PRELP、NPPA)作为诊断DCM伴HF的关键基因。
图5获得DCM合并HF诊断的关键基因
6
验证关键基因对DCM伴HF具有诊断能力
分析关键基因mRNA表达水平,并通过AUC评估它们的诊断能力。
图6训练组和试验组关键基因的差异表达及诊断准确率
7
单细胞RNA-seq分析关键基因在DCM患者中表达上调
分析对照组和DCM组的细胞群,在对照组和DCM组分别标注了三种不同的心肌细胞类型。然后,我们分析关键基因在对照组和DCM组心肌细胞中的表达。发现与对照组相比,DCM大多数心肌细胞中关键基因的表达水平较高。
图7 单细胞RNA-seq分析关键基因在DCM患者中表达上调
8
NPPA、OMD和PRELP可能参与TGF-β信号通路在DCM合并HF中的作用
为了深入了解NPPA、OMD和PRELP的潜在通路,对每个基因进行了GSEA。其中TGF-β信号通路是NPPA、OMD和PRELP最可能参与的机制。然后,分别分析了NPPA、OMD和PRELP与TGF-β信号通路基因集的Pearson相关性,取交集得到关键的TGF-β信号通路相关基因,将关键基因在在TGF-β信号通路中进行可视化。推测与NPPA、OMD、PRELP呈正相关的TGF-β信号通路可能在HF合并DCM的过程中起关键作用。
图8 DCM伴HF中关键基因调控的潜在通路
总结
这篇小哥基于WGCNA和机器学习确定了诊断DCM伴HF的3个关键基因,还发现了关键的TGF-β信号通路可能是参与DCM合并HF的关键机制。另外还利用单细胞数据验证了关键基因在心肌细胞中的表达上调。
双疾病的效果是1+1>2,简单的生信分析就能让影响因子翻倍。你还不来试试吗?而且目前已发表的双疾病生信小哥并没有什么高难度分析手段,简简单单常规分析也可以发文,非肿瘤疾病之间可以用,非肿瘤和肿瘤间可以用,原发疾病和并发症之间可以用,用途相当广泛。
另外,如果数据库直接有现成的两种疾病合并的数据,直接分析岂不是更加轻松嘛~如果你也对双疾病感兴趣或者想要对思路创新升级可以来找小云聊聊哦!
往期推荐
干嘛伤磕一种疾病,交叉融合才是王道!8+ Frontiers系列的双疾病纯分析小哥,让您跳出内卷,run出来!(私信获取)
经验分享!你想知道的双疾病纯生信分析的相关问题都在这里了,建议收藏!
别只盯着铁伤亡、铜伤亡了,快来看看这个经典又热门的方向,你的下一篇生信小哥可能就是它了!
一篇Science引出一个潜在生信热点— —动作淋巴结构(TLS),创新性高、生信发文空间巨大
,看到就是赚到!
如何从Nature小哥思考并形成我们自己的生信分析思路?这套独家秘笈轻易不外传!
震惊!5张图就能搞定一篇8分+Frontiers生信分析小哥!基于免疫细胞的分析又添新成员
,这个思路千万不要错过!
双疾病纯生信分析6分+WGCNA和机器学习鉴定诊断基因+关键信号通路
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权【久伴学 9banxue.com】发表,未经许可,不得转载。