Page 61 - 中国全科医学2022-11
P. 61

·1338· http://www.chinagp.net   E-mail:zgqkyx@chinagp.net.cn


                 100                                             100


                  80
                                                                  80

                 灵敏度(%)  60                                      灵敏度(%)  60


                  40                                              40

                                                                                            BP 神经网络模型
                                           BP 神经网络模型
                  20                       随机森林模型                 20                        随机森林模型
                                           支持向量机模型                                          支持向量机模型

                   0                                               0
                     0     20      40     60     80     100          0     20      40     60     80    100
                                100- 特异度(%)                                     100- 特异度(%)
                                          图 1 3 种模型训练集(A)和测试集(B)ROC 曲线图
           Figure 1 ROC analysis of SVM-,BPNN- and RF-based models in predicting the risk of carotid atherosclerosis in steelworkers in the training set (left)
           and the test set (right)

           增加。而高血压和其他上述疾病与 CAS 的发生密切相                              在本研究中,输入的变量中部分差异无统计学意义,
           关 [19] 。利用 CAS 的危险因素来预测 CAS 危险度,对                   这可能影响了模型的预测效果。因此,以后的研究应着
           于 CAS 的预防和早期筛查具有重要意义。                               重探讨影响 CAS 和非 CAS 差异较大的因素,使本研究
               在选择输入变量时,不仅要考虑在非条件多因素                           提出的 SVM 模型能够提供更好的预测效果。另外,还
           Logistic 回归分析中有意义的变量,还要考虑已有研究                       应进一步完善现有算法,并考虑多种算法结合运用,以
           发现的有意义的变量,以方便找出 CAS 的预测因素。                          提高预测钢铁工人 CAS 准确率,为实现钢铁工人 CAS
           对于传统分类算法,在建立预测模型之前,通过统计处                            的早期预防提供依据,进而提升其生活质量。
           理将不平衡数据转化为平衡数据,最大限度地提升了所                                综上所述,噪声作业、高温作业、高胆固醇、CAS
           使用模型的预测能力,避免了模型的分类准确性降低,                            家族史可能对钢铁工 CAS 的发病有一定的预测价值;
           以及分类结果不理想。                                          SVM 模型预测钢铁工人发生 CAS 的效果最佳。
               本研究结果显示,SVM、BPNN 和 RF 3 种模型训                        作者贡献:王娇娇进行研究的设计与实施、数据的
           练集对比测试集的准确率为 83.81 vs 85.70、79.27 vs                收集、撰写论文并对文章整体负责;陈圆煜、郑子薇、
           75.46、86.60 vs 73.37,可以发现 RF 模型的训练能力最               杨永忠、陈哲、李超、王海东进行研究的实施、评估、
           强,但是其测试能力弱于 SVM 模型。出现这种情况原                          资料收集;武建辉、王国立进行质量控制、稿件的初步
           因可能为:模型自身具有一定的随机性,并且受训练次                            修改与校对,对文章整体负责。
           数、学习率大小、参数设置及网络规模等影响                    [23] ;RF        本文无利益冲突。
           模型的泛化误差比较大;另外在机器学习中,如果学习                            参考文献
           机在训练样本上的学习能力过强将会产生一些消极影                             [1]秦璐,赵颖,佟隽瑶,等 .  颈动脉粥样硬化伴 OSAHS 患者的
           响 [24] ,比如本研究中 RF 模型的训练能力过强,会产                          颈动脉超声研究[J].  中国医刊,2018,53(7):756-760.
           生过拟合问题。近年来,SVM 模型在疾病预测方面的                               DOI:10.3969/j.issn.1008-1070.2018.07.017.
                                                                   QIN L,ZHAO Y,TONG J Y,et al. Study of carotid atherosclerosis
           应用越来越多,在解决小样本、非线性问题上具有较好
                                                                   combined with OSAHS patients by carotid artery ultrasound[J].
           的推广和泛化能力。例如田占霄等                [25] 提出 SVM 模型
                                                                   Journal of China Medical University,2018,53(7):756-760.
           对精神分裂症识别具有一定的判别作用;杨志燕等                      [26]
                                                                   DOI:10.3969/j.issn.1008-1070.2018.07.017.
           表明 SVM 模型为预测急性百草枯中毒患者的预后提供                          [2]陈显荣,张晓 . 超微血管成像与超声造影对颈动脉粥样硬化斑
           了一种新方法。AUC 是分类器好坏的性能指标,本研                               块稳定性的诊断价值[J]. 中国临床神经外科杂志,2019,24(5):
           究结果显示 SVM 模型在训练集中的 AUC 与 RF 模型没                         289-291. DOI:10.137984,issn.1009-153X.2019.05.010.
           有太大的差异(0.84 vs 0.86),表明 SVM 模型在训练                   [3]陈伟伟,高润霖,刘力生,等 . 《中国心血管病报告 2017》概要[J].
           集和测试集中均表现出了较强的预测效果,进一步推断                                中国循环杂志,2018,33(1):1-8. DOI:10.3969/j.issn.1000-
           出 SVM 模型综合实力最强,是预测钢铁工人 CAS 发生                           3614.2018.01.001.
           风险最好的模型。                                                CHEN W W,GAO R L,LIU L S,et al. Summary of the 2017
   56   57   58   59   60   61   62   63   64   65   66