Page 45 - 中国全科医学2022-08
P. 45

·938· http://www.chinagp.net   E-mail:zgqkyx@chinagp.net.cn


           15 potential key genes,among which CDC20,MAD2L1 and NUSAP1 expressed differentially in CRPC patients:those with
           highly expressed CDC20,MAD2L1 and NUSAP1 had statistically lower overall survival rate and disease-free survival rate than
           did those with low expressed CDC20,MAD2L1 and NUSAP1(P<0.05). The area under the ROC curve of CDC20,MAD2L1
           and NUSAP1 to predict the occurrence of CRPC were 0.933,0.762,and 0.950,respectively,indicating that each of them may
           have a high diagnostic value for CRPC. Conclusion CDC20,MAD2L1 and NUSAP1 may be key candidate genes associated
           with the development of CRPC.
               【Key words】 Prostatic neoplasms;Castration-resistant prostate cancer;Key genes;Bioinformatics



               前列腺癌(prostate cancer,PCa)是癌症相关死亡                 本研究价值:
           率第二高的恶性疾病         [1] ,目前主要采取雄激素剥夺疗                      本研究从基因、通路到预后的角度深入挖掘了与
           法(androgen-deprivation therapy,ADT)进行治疗    [2] 。
                                                                去势抵抗性前列腺癌相关的基因,并发现 CDC20、
           据报道,10%~20% 的 PCa 患者对 ADT 产生抵抗,最终
                                                                MAD2L1 和 NUSAP1 与去势抵抗性前列腺癌的发生、
           演变为去势抵抗性前列腺癌(castration-resistant prostate           发展密切相关,为去势抵抗性前列腺癌的预防和治疗
           cancer,CRPC),且中位生存期仅为 14 个月            [3] ,预后       提供了新的研究方向。
           不良,死亡率极高        [4] 。已有研究发现在去势状态下雄
           激素受体(androgen receptor,AR)信号的传导与 CRPC               GSE32269 芯片由 Affymetrix 公司 GPL96 平台检测,包
           潜在分子机制有关        [5] ,但具体机制仍不十分清楚,且                  括 29 例 CRPC 样本和 22 例原发性 PCa 样本。
           目前临床上尚无有效治疗 CRPC 的方法。因此亟须寻找                         1.2 筛选 DEGs 使用 R 语言 4.0.3 中的 Affy 包       [10] ,
           新的关键基因,为临床诊疗提供新思路。                                  将 normalize.method 设 置 为“quantiles”,bgcorrect.
               生物信息学是一门分析理解生物数据的学科,其可                          method 设置为“rma”,pmcorrect.method 设置为“pmonly”,
           以在生物体表达的不同位置、不同通路中进行富集,从                            summary.method 设置为“liwong”,提取基因的表达量。
           而发现与疾病相关联的生物信息,还可根据基因本体论                            然后采用 t 检验得到两组样本基因表达量的 P 值,利
          (GO)、京都基因和基因组百科全书(KEGG)和蛋白质 -                        用 Benjamini-Hochberg 错误发现率方法,调整 P 值来降
           蛋白质相互作用(PPI)综合分析,获取在癌症相关疾                           低假阳性率     [11] 。采用校正后 P<0.05,差异倍数(fold
           病中较为稳定的差异表达基因(differentially expressed              change,FC)>1.5 作为截断值的标准,筛选 CRPC 和原
           genes,DEGs),是一种能有效发掘癌症相关疾病基因                        发性 PCa 样本之间的 DEGs。
           表达谱的重要工具        [6] 。已有研究应用生物信息学方法                  1.3 功能富集分析 利用 DAVID 在线工具(https://
           找到与 PCa 相关的关键基因。SUN 等            [7] 通过生物信息         david.ncifcrf.gov)对 DEGs 进行 GO 富集和 KEGG 信号
           学分析鉴定出 ARHGEF38 等关键基因和 PCa 进展相关;                    通路分析    [12] 。GO 是一种生物信息学工具,可以提供
           SHEN 等 [8] 运用基因表达分析揭示了与 PCa 预后相关                    关于分子功能(MF)、细胞成分(CC)和生物过程(BP)
           的关键基因并提出靶向细胞周期通路可能与 PCa 的预                          等生物领域的信息        [13] 。KEGG 是与系统集成基因功能
           后和治疗相关;GU 等        [9] 采用生物信息学方法确定了                 信息相关的数据库        [14] 。富集显著性阈值设为 P<0.05。
           TOP2A、CCNB2 等关键基因可促进 PCa 的发展和转移。                    利用 R 软件中的 GOplot 包使 GO 富集结果可视化。为
           为进一步找到和 CRPC 发展密切的候选基因,本研究通                         了确定 CRPC 中通路的变化趋势,使用以下公式计算
           过生物信息学方法挖掘与 CRPC 进展相关的关键基因。                         每项的 Z 分数:Z-score=(N up -N down )/ √count,N up 和
               本研究结合 CRPC 和 PCa 样本的基因表达谱,首先                    N down 分别代表 CRPC 和原发性 PCa 对照之间上调和下
           对数据集进行处理,筛选 DEGs,分析 DEGs 的功能和                       调的基因数量,count 是该术语 DEGs 的数量            [15] 。
           途径以及疾病的信号通路。然后构建 PPI 网络,对重要                         1.4 PPI 网络和模块分析 为预测蛋白质之间物理和功
           模块进行分析并筛选出具有生存意义的关键基因,本研                            能的相互作用,本研究使用 STRING(https://string-db.
           究结果可为 CRPC 发病机制、治疗和预后的相关研究提                         org/)构建 DEGs 的 PPI 网络(互作评分 >0.4)        [16] 。采
           供新思路。                                               用 Cytoscape 3.7.2 版(http://cytoscape.org/download_old_
           1 资料与方法                                             versions.html)软件进行可视化处理        [17] 。利用 MCODE
           1.1 数据收集 从国家生物技术信息中心(National                       插件  [18] 对网络进行模块分析,较高分数的模块在疾病
           Center for Biotechnology Information,NCBI)(http://  的发展过程中具有重要意义。
           www.ncbi.nlm.nih.gov/)  的 GEO(http://www.ncbi.nlm.  1.5 鉴定关键基因 选择满足以下 2 个约束条件的
           nih.gov/geo/)数据库中下载微阵列数据集 GSE32269。                 DEGs 作为关键基因:(1)该基因位于关键模块中(模
   40   41   42   43   44   45   46   47   48   49   50