Page 45 - 中国全科医学2022-08
P. 45
·938· http://www.chinagp.net E-mail:zgqkyx@chinagp.net.cn
15 potential key genes,among which CDC20,MAD2L1 and NUSAP1 expressed differentially in CRPC patients:those with
highly expressed CDC20,MAD2L1 and NUSAP1 had statistically lower overall survival rate and disease-free survival rate than
did those with low expressed CDC20,MAD2L1 and NUSAP1(P<0.05). The area under the ROC curve of CDC20,MAD2L1
and NUSAP1 to predict the occurrence of CRPC were 0.933,0.762,and 0.950,respectively,indicating that each of them may
have a high diagnostic value for CRPC. Conclusion CDC20,MAD2L1 and NUSAP1 may be key candidate genes associated
with the development of CRPC.
【Key words】 Prostatic neoplasms;Castration-resistant prostate cancer;Key genes;Bioinformatics
前列腺癌(prostate cancer,PCa)是癌症相关死亡 本研究价值:
率第二高的恶性疾病 [1] ,目前主要采取雄激素剥夺疗 本研究从基因、通路到预后的角度深入挖掘了与
法(androgen-deprivation therapy,ADT)进行治疗 [2] 。
去势抵抗性前列腺癌相关的基因,并发现 CDC20、
据报道,10%~20% 的 PCa 患者对 ADT 产生抵抗,最终
MAD2L1 和 NUSAP1 与去势抵抗性前列腺癌的发生、
演变为去势抵抗性前列腺癌(castration-resistant prostate 发展密切相关,为去势抵抗性前列腺癌的预防和治疗
cancer,CRPC),且中位生存期仅为 14 个月 [3] ,预后 提供了新的研究方向。
不良,死亡率极高 [4] 。已有研究发现在去势状态下雄
激素受体(androgen receptor,AR)信号的传导与 CRPC GSE32269 芯片由 Affymetrix 公司 GPL96 平台检测,包
潜在分子机制有关 [5] ,但具体机制仍不十分清楚,且 括 29 例 CRPC 样本和 22 例原发性 PCa 样本。
目前临床上尚无有效治疗 CRPC 的方法。因此亟须寻找 1.2 筛选 DEGs 使用 R 语言 4.0.3 中的 Affy 包 [10] ,
新的关键基因,为临床诊疗提供新思路。 将 normalize.method 设 置 为“quantiles”,bgcorrect.
生物信息学是一门分析理解生物数据的学科,其可 method 设置为“rma”,pmcorrect.method 设置为“pmonly”,
以在生物体表达的不同位置、不同通路中进行富集,从 summary.method 设置为“liwong”,提取基因的表达量。
而发现与疾病相关联的生物信息,还可根据基因本体论 然后采用 t 检验得到两组样本基因表达量的 P 值,利
(GO)、京都基因和基因组百科全书(KEGG)和蛋白质 - 用 Benjamini-Hochberg 错误发现率方法,调整 P 值来降
蛋白质相互作用(PPI)综合分析,获取在癌症相关疾 低假阳性率 [11] 。采用校正后 P<0.05,差异倍数(fold
病中较为稳定的差异表达基因(differentially expressed change,FC)>1.5 作为截断值的标准,筛选 CRPC 和原
genes,DEGs),是一种能有效发掘癌症相关疾病基因 发性 PCa 样本之间的 DEGs。
表达谱的重要工具 [6] 。已有研究应用生物信息学方法 1.3 功能富集分析 利用 DAVID 在线工具(https://
找到与 PCa 相关的关键基因。SUN 等 [7] 通过生物信息 david.ncifcrf.gov)对 DEGs 进行 GO 富集和 KEGG 信号
学分析鉴定出 ARHGEF38 等关键基因和 PCa 进展相关; 通路分析 [12] 。GO 是一种生物信息学工具,可以提供
SHEN 等 [8] 运用基因表达分析揭示了与 PCa 预后相关 关于分子功能(MF)、细胞成分(CC)和生物过程(BP)
的关键基因并提出靶向细胞周期通路可能与 PCa 的预 等生物领域的信息 [13] 。KEGG 是与系统集成基因功能
后和治疗相关;GU 等 [9] 采用生物信息学方法确定了 信息相关的数据库 [14] 。富集显著性阈值设为 P<0.05。
TOP2A、CCNB2 等关键基因可促进 PCa 的发展和转移。 利用 R 软件中的 GOplot 包使 GO 富集结果可视化。为
为进一步找到和 CRPC 发展密切的候选基因,本研究通 了确定 CRPC 中通路的变化趋势,使用以下公式计算
过生物信息学方法挖掘与 CRPC 进展相关的关键基因。 每项的 Z 分数:Z-score=(N up -N down )/ √count,N up 和
本研究结合 CRPC 和 PCa 样本的基因表达谱,首先 N down 分别代表 CRPC 和原发性 PCa 对照之间上调和下
对数据集进行处理,筛选 DEGs,分析 DEGs 的功能和 调的基因数量,count 是该术语 DEGs 的数量 [15] 。
途径以及疾病的信号通路。然后构建 PPI 网络,对重要 1.4 PPI 网络和模块分析 为预测蛋白质之间物理和功
模块进行分析并筛选出具有生存意义的关键基因,本研 能的相互作用,本研究使用 STRING(https://string-db.
究结果可为 CRPC 发病机制、治疗和预后的相关研究提 org/)构建 DEGs 的 PPI 网络(互作评分 >0.4) [16] 。采
供新思路。 用 Cytoscape 3.7.2 版(http://cytoscape.org/download_old_
1 资料与方法 versions.html)软件进行可视化处理 [17] 。利用 MCODE
1.1 数据收集 从国家生物技术信息中心(National 插件 [18] 对网络进行模块分析,较高分数的模块在疾病
Center for Biotechnology Information,NCBI)(http:// 的发展过程中具有重要意义。
www.ncbi.nlm.nih.gov/) 的 GEO(http://www.ncbi.nlm. 1.5 鉴定关键基因 选择满足以下 2 个约束条件的
nih.gov/geo/)数据库中下载微阵列数据集 GSE32269。 DEGs 作为关键基因:(1)该基因位于关键模块中(模