系统性硬化症(systemic sclerosis,SSc)是一种原因不明,以局限性或弥漫性皮肤变硬和增厚为特征的结缔组织疾病,受累组织广泛,包括皮肤、肺脏、胃肠道、心脏、肾脏、骨关节等多个器官,其中累及肺部常常表现肺间质纤维化及肺动脉高压。研究表明,系统性硬化症合并肺动脉高压(SScPAH)预后差,其1、3、5、8年生存率分别为95%、75%、63%、49%,因此,SScPAH患者的早期诊断和早期治疗对于降低其死亡率至关重要。2024年1月,武汉大学学报(医学版)刊登了朱太文等人的一篇文章,他们用生物信息学方法筛选系统性硬化症合并肺动脉高压的关键基因与信号通路,有望成为系统性硬化症合并肺动脉高压早期诊断和精准治疗的潜在靶点。下面将对他们的文章作简单分享。
研究基于NCBIGene Expression Omnibus(GEO)、NCBIGene、GeneCards、OMIM四个公共数据库,应用生物信息学方法探究SScPAH的差异上调基因及与此疾病相关的可能信号通路,构建蛋白蛋白互作(PPI)网络,并筛选关键基因,为SScPAH提供潜在生物标记物。
研究方法如下:
根据设置的筛选条件,在火山图中将有意义的差异基因用红色及蓝色进行展示,在GSE33463中得到表达上调及下调基因各有416个和336个(图2A),在GSE19617中得到表达上调及下调基因各有320个和286个(图2B)。使用Venn Diagram将两个数据集的共上调基因取交集,得到59个与SSc相关的共同表达的差异基因(图2C)。
A. 基因芯片 GSE33463 的火山图;B. 基因芯片 GSE19617 的火山图;C. 基因芯片 GSE33463 和 GSE19617 中表达上调的差异基因韦恩图。
红色的点代表表达上调基因;蓝色的点代表表达下调基因
后经过GO及KEGG信号通路富集分析,在生物过程方面,SScPAH的共上调基因主要富集于I型干扰素信号通路、对病毒的防御响应等(图3A);在分子功能方面,差异基因主要参与蛋白、钙离子等物质的结合(图3B);在细胞组成方面,差异基因主要富集于细胞质基质等区域(图3C);如KEGG富集分析提示,差异上调基因主要与感染性疾病(如丙型肝炎、甲型流感)的传导通路(图3D)。
蛋白互助网络构建及模块分析,用STRING在线数据库分析上述差异基因之间的互作关系,根据设置的阈值,筛选出35个关键蛋白,并运用Cytoscape构建出PPI网络图(图4A)。使用CytoHubba插件将MCC评分前15名的蛋白分子(STAT1、IFIT1、IFIT2、IFI6、IFI44、MX2、IFI27、PLSCR1、TNFSF10、ALAS2、TLR4、HBG1、HBD、HBA2、NFE2)鉴定为关键蛋白(图4B)。
系统性硬化症相关的核心基因筛选,搜索文献中已报道的与SSc相关的基因,在NCBI中获得487个与SSc相关的基因,在GeneCards获得964个基因,OMIM中获得553个基因。将上述基因与CytoHubba插件筛选的15个关键蛋白取交集,得到2个文献中报道的候选基因,分别为TLR4(Toll like receptor 4),TNFSF10(TNF superfamily member 10)。
应用GSEA筛选差异基因(图5)
A. 基 因 芯 片 GSE33463 的 KEGG 通 路 富 集 结 果 ;B. 基 因 芯 片 GSE19617 的 KEGG 通 路 富 集 结 果 ;C. 基 因 芯 片 GSE19617 和GSE33463 的核心基因与数据库(NCBI、GeneCards、OMIM)中报道的系统性硬化相关基因的韦恩图;D~F. 基因芯片 GSE33463 中共同基因所在的 KEGG 通路的 GSEA 富集结果;G~J. 基因芯片GSE19617 中共同基因所在的 KEGG 通路的 GSEA 富集结果
研究基于GEO数据库,选择了基因芯片GSE33463和GSE19617,以SScPAH患者外周血单核细胞为实验组,以健康人群的外周血单核细胞为对照组,通过R语言分别筛选出两芯片的上调基因,通过Venn图取交集,得到59个表达上调的差异基因作为候选基因。对候选基因的GO和KEGG分析主要集中在I型干扰素信号通路、对病毒的防御反应,细胞质基质及蛋白、钙离子等物质的结合,并主要参与病毒感染性疾病如麻疹、丙型肝炎、甲型流感。尽管目前对于SSc相关致病病毒的报道多数为人巨细胞病毒、EB病毒和细小病毒B19等,对于我们发现的上述病毒无明确阐述,但在遗传因素基础上感染病毒,病毒抗原与自身抗原存在交叉反应,可致结缔组织代谢及血管异常。目前针对系统性硬化症合并肺动脉高压方面,主要为对症治疗,包括氧疗、利尿剂和强心剂、肺动脉血管扩张剂,我们的研究提示预防感染或可减少SScPAH致病因素,阻止疾病的进一步进展。
PLAUR可能通过造成SSc患者肺部血管重塑导致其肺动脉高压,同时造成过度合成细胞外基质如胶原纤维等,随之皮下组织与皮肤紧密粘连,使皮肤增厚和纤维化。CTSG编码组织蛋白酶G,导致肺基质的破坏和急性炎症的持续传播,过表达可能造成细胞外基质的失调,随之纤维化。SSc血管受损导致组织缺氧和毛细血管稀疏,并激活凝血级联和凝血酶的产生,触发肌成纤维细胞分化。FCGR2A与合并肺动脉高压的系统性硬化症的关系暂未见报道,但基因功能与生物信息学分析结果提示FCGR2A与SSc-PAH可能存在一定关联,未来可进一步研究其相关性。
总结:
筛选出的TLR4、TNFSF10、CTSG、PLAUR、FCG2R可能在系统硬化症合并肺动脉高压的进展过程中扮演重要角色,成为潜在防治靶点,对SScPAH患者PBMC差异基因的分析和整合为进一步研究其发病机制、临床诊断及寻求治疗的新靶点提供了新可能。但本研究也存在一定的局限性,本文所选取的数据集原始数据主要来自于西方国家,可能存在种族差异,研究结果也有待后续更全面的基因数据及更深入分子的基础实验进一步佐证,以探讨所筛选目的基因实际应用于筛查与防治SScPAH的可能性。
参考文献
[1] 基于生物信息学分析的系统性硬化症合并肺动脉高压靶基因预测[J]. 武汉大学学报(医学版), 2024.01,45(1):60-67.Prediction of target genes for systemic sclerosis-related pulmonary arterial hypertension based on bioinformatical analysis[J]. Medical Journal of Wuhan University, 2024.01,45(1):60-67.