基于生物信息学对乳腺癌脑转移生物标志物的筛选与鉴定
邵明涛 王 兴 李伟文
广东省江门市中心医院甲状腺乳腺外科,广东江门 529000
[摘要]目的 寻找与乳腺癌脑转移预后相关的关键生物标志物。方法 从GEO 数据库检索获得的微阵列数据集GSE125989,并采用GEO2R 工具来筛选相关差异表达基因。使用STRING 数据库分析差异基因的蛋白质-蛋白质相互作用,使用Cytoscape 软件进行可视化处理并筛选出关键的生物标志物。使用Kaplan-Meier 生存分析数据库确定所筛选出的关键生物标志物的预后潜力。结果 本研究筛选出311 个上调差异基因和104 个下调差异基因,并筛选出了10 个关键基因,包括纤维连接蛋白1(FN1)、血管内皮生长因子A(VEGFA)、Ⅰ型胶原蛋白α1 链(COL1A1)、基质金属蛋白酶2(MMP2)、Ⅲ型胶原蛋白α1 链(COL3A1)、Ⅰ型胶原蛋白α2 链(COL1A2)、骨膜蛋白(POSTN)、核心蛋白聚糖(DCN)、双糖链蛋白聚糖(BGN)和赖氨酰氧化酶(LOX)。通过Kaplan-Meier 生存分析发现,FN1 和VEGFA 高表达,均与不良的总生存期(OS)相关(FN1:HR=1.28,95%CI=1.03~1.59,P=0.023 00;VEGFA:HR=1.35,95%CI=1.09~1.68,P=0.005 50),而低表达DCN 与不良OS 相关(HR=0.69,95%CI=0.56~0.86,P=0.000 71)。FN1、VEGFA、COL1A1、POSTN、BGN 和LOX 高表达,均与不良的无远处转移生存(DMFS)相关(FN1:HR=1.22,95%CI=1.01~1.48,P=0.041 00;VEGFA:HR=1.39,95%CI=1.14~1.68,P=0.000 95;COL1A1:HR=1.53,95%CI=1.09~2.14,P=0.012 00;POSTN:HR=1.61,95%CI=1.16~2.24,P=0.004 20;BGN:HR=1.29,95%CI=1.07~1.57,P=0.009 20;LOX:HR=1.28,95%CI=1.06~1.55,P=0.012 00),而DCN 低表达与不良的DMFS 相关(HR=0.82,95%CI=0.67~0.99,P=0.042 00)。结论 FN1、VEGFA 和DCN 可作为乳腺癌脑转移预后相关的关键生物标志物。
[关键词]乳腺癌;脑转移;生物标志物;生物信息学
乳腺癌是全球女性中最常见的肿瘤之一,也是导致高死亡率的癌症之一。2018年的新发病例约210万,超过62 万例死亡[1]。当发生脑转移时,乳腺癌的预后不良,治疗效果有限[2]。先前的研究表明,超过一半的脑转移患者死于中枢神经系统的进展[3]。考虑到乳腺癌脑转移患者的高发病率、高死亡率和有效治疗的局限性,对高危患者进行及时筛查和干预并制定个体化治疗尤为重要。高通量微阵列是用于识别以诊断和检测具有远处转移的乳腺癌生物标志物的实用工具之一。有研究表明,基因检测能够指导乳腺癌的靶向治疗[4]。因此,本研究通过分析患有脑转移的乳腺癌患者的微阵列基因表达谱,寻找可用于乳腺癌脑转移临床预后的生物标志物,旨在为将来的临床干预提供潜在的诊疗靶标。
1 资料与方法
1.1 资料检索
本研究从GEO 数据库(http://www.ncbi.nlm.nih.gov/geo/)下载了微阵列数据集GSE125989(Affymetrix人类基因组U133A 2.0 阵列)的基因表达谱。GSE125989包含16 对配对样品,分别为非转移性原发性乳腺癌(16 份)和伴脑转移的乳腺癌(16 份)。
1.2 鉴定差异基因
本研究使用GEO2R 进行差异基因的鉴定,采用独立样本t 检验的方法比较所筛选差异基因在以上配对样本之间的表达。本研究根据以下标准选择差异基因:P<0.05 和倍数变化值(fold change,FC)的绝对值(|logFC|)>1。
1.3 PPI 网络评估和关键基因鉴定
本研究使用STRING V.11 数据库[5]来检查差异基因的PPI,并使用Cytoscape V3.7.2 软件将其可视化。利用基于Cytoscape 的Cytohubba 插件进行关键基因分析[6-7],并且在所有模块中度>50 的前10 位基因被认为是关键基因。
1.4 关键基因的预后潜力
Kaplan-Meier 数据库(http://kmplot.com/analysis/)可用于评估多达54 000 个基因对21 种癌症预后的影响。该工具基于荟萃分析发现和验证预后指标。本文中,笔者使用该数据库来确定所筛选的关键基因[8]与乳腺癌预后之间的相关性,并计算对数秩P 值和95%置信区间的危险比(hazard ratio,HR)。 HR=1 意味着基因低表达与高表达的等效性;若低表达处理优于高表达,则HR<1;若低表达处理劣于高表达,则HR>1。
2 结果
2.1 脑转移乳腺癌中差异基因的筛选
本研究确定了415 个差异基因,其中,包括311个上调基因和104 个下调基因。纵坐标以t 检验显著性水平P 值的负对数-log10(P-value)表示,横坐标以log2(FC)表示,作火山图,见图1(封三)。

 
图1 415 个差异基因的表达情况
红色表示上调,绿色表示下调
2.2 PPI 网络的构建和关键基因分析
在差异基因中总共识别出390 个节点和2197 个边缘。使用Cytoscape V3.7.2 软件对PPI 网络进行可视化操作,结果见图2(封三)。

 
图2 差异基因的PPI 网络可视化图
红色表示上调,蓝色表示下调
通过插件CytoHubba 筛选出10 个关键基因,分别为:纤维连接蛋白1(fibronectin 1,FN1)、血管内皮生长因子A(vascular endothelial growth factor A,VEGFA)、Ⅰ型胶原蛋白α1 链(type Ⅰcollagen α1chain,COL1A1)、基质金属蛋白酶2(matrix metalloproteinase 2,MMP2)、Ⅲ型胶原蛋白α1 链(type Ⅲcollagen α1chain,COL3A1)、Ⅰ型胶原蛋白α2 链(type Ⅰcollagen α2chain,COL1A2)、骨膜蛋白(periosteal protein,POSTN)、核心蛋白聚糖(decorin,DCN)、双糖链蛋白聚糖(biglycan,BGN)和赖氨酰氧化酶(lysyl oxidase,LOX)(图3)。

 
图3 筛选的关键基因
2.3 所筛选关键基因的生存分析
所筛选关键基因与乳腺癌总生存期(overall survival,OS)的关系,见图4(封三)。结果显示,FN1、VEGFA 和DCN 与OS 相关。其中,FN1 和VEGFA 高表达均与不良的OS 相关(FN1:HR=1.28,95%CI=1.03~1.59,P=0.023 00;VEGFA:HR=1.35,95%CI=1.09~1.68,P=0.005 50);DCN 低表达与不良的OS 相关(HR=0.69,95%CI=0.56~0.86,P=0.000 71)。

 
图4 所筛选关键基因与乳腺癌OS 的关系
所筛选关键基因与乳腺癌无远处转移生存(distance metastasis free survival,DMFS)的关系,见图5(封四)。结果显示,FN1、VEGFA、COL1A1、POSTN、DCN、BGN和LOX 与DMFS 相关。其中,FN1、VEGFA、COL1A1、POSTN、BGN 和LOX 高表达与不良的DMFS 相关(FN1:HR=1.22,95%CI=1.01~1.48,P=0.041 00;VEGFA:HR=1.3,95%CI=1.14~1.68,P=0.000 95;COL1A1:HR=1.53,95%CI=1.09~2.14,P=0.012 00;POSTN:HR=1.61,95%CI=1.16~2.24,P=0.004 20;BGN:HR=1.29,95%CI=1.07~1.57,P=0.009 20;LOX:HR=1.28,95%CI=1.06~1.55,P=0.012 00);DCN 低表达与不良的DMFS 相关(HR=0.82,95%CI=0.67~0.99,P=0.042 00)。

 
图5 所筛选关键基因与乳腺癌DMFS的关系
综上所述,结果显示,FN1、VEGFA 和DCN 基因影响乳腺癌的预后。
3 讨论
有证据表明,脑转移的乳腺癌患者的预后很差,并且在发生脑转移后生存时间变短[9]。虽然,在病情诊断方面已取得很大进展[10],但是,有效治疗手段的研究进展仍然缓慢,这主要是因为脑转移的标准治疗选择有限[11]。因此,需要鉴定敏感的生物标志物作为新的治疗靶点以改善脑转移乳腺癌患者的预后。
在本研究中,笔者首先筛选了可能与乳腺癌脑转移相关的差异表达基因。随后,通过筛选的差异基因构建了PPI 网络以探索差异基因的相互作用关系。笔者筛选出了10 个关键基因(FN1、VEGFA、COL1A1、MMP2、COL3A1、COL1A2、POSTN、DCN、BGN 和LOX),发现FN1 和VEGFA 是模块中连接最紧密的节点。最后,笔者对所筛选的10 个关键基因进行生存分析,发现FN1 和VEGFA 高表达与不良的OS 相关,DCN 低表达与不良的OS 相关,并且,关键基因FN1、VEGFA、COL1A1、POSTN、BGN 和LOX 高表达与不良的DMFS相关,DCN 低表达与不良的DMFS 相关。回顾文献发现,FN1 具有调节细胞迁移和黏附的能力,FN1 的上调与乳腺癌发生转移有关[12]。VEGFA 在血管生成和肿瘤转移中起着至关重要的双重作用,并与乳腺癌的发病机制有关[12]。COL1A1 的高表达增加了胃癌细胞的侵袭和转移能力[14]。POSTN 可促进肝癌细胞的迁移和侵袭,有望成为肝癌患者术后预后和复发的重要生物学标志物和抑制转移发生的治疗靶标[15]。BGN的高表达也已在许多恶性肿瘤中得到证实[16]。LOX 在许多癌症中上调,例如食道癌、胰腺癌、大肠癌等,并且与肿瘤的不良预后有关[17-19]。此外,有研究发现,DCN在乳腺癌组织中的表达低于癌旁组织,并且与肿瘤大小及淋巴结转移相关[20]。这些均与本文的研究结果基本一致。
本研究的发现可能为了解乳腺癌发生脑转移提供新的见解。但是,这项研究有一些局限性。首先,GEO 数据库中的临床数据不完整,这将影响笔者进行全面的生存分析。其次,本研究仅研究了1 个数据集,可能导致本研究的结果存在偏差。第三,本研究的结果需进一步的实验验证,例如,采用Western blot 和实时聚合酶链式反应的方法来检验所选关键基因的表达情况;构建裸鼠乳腺癌脑转移模型,观察所选关键基因对乳腺癌脑转移表型的影响,这也是笔者下一步的研究目标。
综上所述,本研究筛选了7 个可能与乳腺癌转移相关的关键基因,分别为FN1、VEGFA、COL1A1、POSTN、DCN、BGN 和LOX。其中,FN1、VEGFA 和DCN与乳腺癌患者的预后相关,可能会成为临床干预的潜在诊疗靶标,为乳腺癌脑转移患者的治疗提供新手段。
[参考文献]
[1]Bray F,Ferlay J,Soerjomataram I,et al.Global cancer statistics 2018:GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J].CA Cancer J Clin,2018,68(6):394-424.
[2]Aizer AA,Lee EQ.Brain Metastases[J].Neurol Clin,2018,36(3):557-577.
[3]Bendell JC,Domchek SM,Burstein HJ,et al.Central nervous system metastases in women who receive trastuzumab-based therapy for metastatic breast carcinoma[J].Cancer,2003,97(12):2972-2977.
[4]潘锋.基因检测能够指导乳腺癌的靶向治疗——访福建省肿瘤医院乳腺内科主任刘健教授[J].中国当代医药,2019,26(16):1-3.
[5]Szklarczyk D,Gable AL,Lyon D,et al.STRING v11:protein-protein association networks with increased coverage,supporting functional discovery in genome-wide experimental datasets[J].Nucleic Acids Res,2019,47(D1):D607-D613.
[6]Chin CH,Chen SH,Wu HH,et al.cytoHubba:identifying hub objects and sub-networks from complex interactome[J].BMC Syst Biol,2014,8(Suppl 4):S11.
[7]Wang H,Liu J,Li J,et al.Identification of gene modules and hub genes in colon adenocarcinoma associated with pathological stage based on WGCNA analysis[J].Cancer Genet,2020,242:1-7.
[8]Lanczky A,Nagy A,Bottai G,et al.miRpower:a web-tool to validate survival-associated miRNAs utilizing expression data from 2178 breast cancer patients[J].Breast Cancer Res Treat,2016,160(3):439-446.
[9]Yamamura J,Masuda N,Yasojima H,et al.Clinicopathological Factors Related to the Prognosis of Metastatic Breast Cancer Patients after Development of Brain Metastasis[J].Breast Care (Basel),2015,10(6):387-392.
[10]Gaedcke J,Traub F,Milde S,et al.Predominance of the basal type and HER-2/neu type in brain metastasis from breast cancer[J].Mod Pathol,2007,20(8):864-870.
[11]Niwinska A,Murawska M,Pogoda K.Breast cancer subtypes and response to systemic treatment after whole-brain radiotherapy in patients with brain metastases[J].Cancer,2010,116(18):4238-4247.
[12]Loganathan J,Jiang J,Smith A,et al.The mushroom Ganoderma lucidum suppresses breast-to-lung cancer metastasis through the inhibition of pro-invasive genes[J].Int J Oncol,2014,44(6):2009-2015.
[13]Razak NA,Abu N,Ho WY,et al.Cytotoxicity of eupatorin in MCF-7 and MDA-MB-231 human breast cancer cells via cell cycle arrest,anti-angiogenesis and induction of apoptosis[J].Sci Rep,2019,9(1):1514.
[14]Sun H.Identification of key genes associated with gastric cancer based on DNA microarray data[J].Oncol Lett,2016,11(1):525-530.
[15]温钦,尚进,米色日黎,等.骨膜蛋白对肝癌细胞侵袭转移和肝癌预后的影响[J].中华肝脏病杂志,2019,(10):766-771.
[16]Tang Z,Yang Y,Zhang J,et al.Quantitative Proteomic Analysis and Evaluation of the Potential Prognostic Biomarkers in Cholangiocarcinoma[J].J Cancer,2019,10(17):3985-3999.
[17]Kalikawe R,Baba Y,Nomoto D,et al.Lysyl oxidase impacts disease outcomes and correlates with global DNA hypomethylation in esophageal cancer[J].Cancer Sci,2019,110(12):3727-3737.
[18]Miller BW,Morton JP,Pinese M,et al.Targeting the LOX/hypoxia axis reverses many of the features that make pancreatic cancer deadly:inhibition of LOX abrogates metastasis and enhances drug efficacy[J].EMBO Mol Med,2015,7(8):1063-1076.
[19]Liu Y,Wang G,Liang Z,et al.Lysyl oxidase:A colorectal cancer biomarker of lung and hepatic metastasis[J].Thorac Cancer,2018,9(7):785-793.
[20]张君攀.核心蛋白聚糖在乳腺癌中的表达及临床意义[D].青岛:青岛大学,2020.
Screening and identification of biomarkers for breast cancer brain metastasis based on bioinformatics
SHAO Ming-tao WANG Xing LI Wei-wen
Department of Thyroid and Breast Surgery,Jiangmen Central Hospital,Guangdong Province,Jiangmen 529000,China
[Abstract]Objective To find the key biomarkers related to the prognosis of breast cancer brain metastasis.Methods The microarray data set GSE125989 was retrieved from the GEO database,and the GEO2R tool was used to screen the relevant differentially expressed genes.The STRING database was used to analyze the protein-protein interactions of the differential genes,and the Cytoscape software was used for visualization and screening of key biomarkers.The Kaplan-Meier survival analysis database was used to determine the prognostic potential of the key biomarkers screened.Results In this study,311 differentially up-regulated genes and 104 differentially down-regulated genes were screened,and 10 key genes were screened,including fibronectin 1(FN1),vascular endothelial growth factor A(VEGFA),type Ⅰcollagen α1 chain(COL1A1),matrix metalloproteinase 2(MMP2),type Ⅲcollagen α1 chain(COL3A1),type Ⅰcollagen α2 chain(COL1A2),periosteal protein(POSTN),decorin(DCN),biglycan(BGN)and lysyl oxidase(LOX).Kaplan-Meier survival analysis showed that high expressions of FN1 and VEGFA were associated with poor overall survival(OS)(FN1: HR=1.28,95%CI=1.03-1.59, P=0.023 00; VEGFA: HR=1.35,95%CI =1.09-1.68, P=0.005 50),and low expression of DCN was associated with poor OS(HR=0.69,95%CI=0.56-0.86, P=0.000 71).High expressions of FN1,VEGFA,COL1A1,POSTN,BGN,and LOX were associated with poor distant metastasis-free survival(DMFS)(FN1: HR=1.22,95%CI=1.01-1.48, P=0.041 00; VEGFA: HR=1.39,95%CI=1.14-1.68, P=0.000 95; COL1A1: HR=1.53,95%CI=1.09-2.14, P=0.012 00; POSTN: HR=1.61,95%CI=1.16-2.24, P=0.004 20; BGN: HR=1.29,95%CI=1.07-1.57, P=0.009 20; LOX: HR=1.28,95%CI=1.06-1.55, P=0.012 00),and low expression of DCN was associated with poor DMFS(HR=0.82,95%CI=0.67-0.99, P=0.042 00).Conclusion FN1,VEGFA and DCN can be used as key biomarkers related to the prognosis of breast cancer brain metastasis.
[Key words]Breast cancer; Brain metastasis; Biomarker;Bioinformatics
[中图分类号]R735.2
[文献标识码]A
[文章编号]1674-4721(2021)8(a)-0008-04
[基金项目]广东省江门市医疗卫生领域科技计划项目(2019 A088)
[作者简介]邵明涛(1987-),男,硕士,主要从事肿瘤防治研究
通讯作者:李伟文(1967-),男,主任医师,主要从事肿瘤防治研究
(收稿日期:2020-11-12)