Page 61 - 中国全科医学2022-11
P. 61
·1338· http://www.chinagp.net E-mail:zgqkyx@chinagp.net.cn
100 100
80
80
灵敏度(%) 60 灵敏度(%) 60
40 40
BP 神经网络模型
BP 神经网络模型
20 随机森林模型 20 随机森林模型
支持向量机模型 支持向量机模型
0 0
0 20 40 60 80 100 0 20 40 60 80 100
100- 特异度(%) 100- 特异度(%)
图 1 3 种模型训练集(A)和测试集(B)ROC 曲线图
Figure 1 ROC analysis of SVM-,BPNN- and RF-based models in predicting the risk of carotid atherosclerosis in steelworkers in the training set (left)
and the test set (right)
增加。而高血压和其他上述疾病与 CAS 的发生密切相 在本研究中,输入的变量中部分差异无统计学意义,
关 [19] 。利用 CAS 的危险因素来预测 CAS 危险度,对 这可能影响了模型的预测效果。因此,以后的研究应着
于 CAS 的预防和早期筛查具有重要意义。 重探讨影响 CAS 和非 CAS 差异较大的因素,使本研究
在选择输入变量时,不仅要考虑在非条件多因素 提出的 SVM 模型能够提供更好的预测效果。另外,还
Logistic 回归分析中有意义的变量,还要考虑已有研究 应进一步完善现有算法,并考虑多种算法结合运用,以
发现的有意义的变量,以方便找出 CAS 的预测因素。 提高预测钢铁工人 CAS 准确率,为实现钢铁工人 CAS
对于传统分类算法,在建立预测模型之前,通过统计处 的早期预防提供依据,进而提升其生活质量。
理将不平衡数据转化为平衡数据,最大限度地提升了所 综上所述,噪声作业、高温作业、高胆固醇、CAS
使用模型的预测能力,避免了模型的分类准确性降低, 家族史可能对钢铁工 CAS 的发病有一定的预测价值;
以及分类结果不理想。 SVM 模型预测钢铁工人发生 CAS 的效果最佳。
本研究结果显示,SVM、BPNN 和 RF 3 种模型训 作者贡献:王娇娇进行研究的设计与实施、数据的
练集对比测试集的准确率为 83.81 vs 85.70、79.27 vs 收集、撰写论文并对文章整体负责;陈圆煜、郑子薇、
75.46、86.60 vs 73.37,可以发现 RF 模型的训练能力最 杨永忠、陈哲、李超、王海东进行研究的实施、评估、
强,但是其测试能力弱于 SVM 模型。出现这种情况原 资料收集;武建辉、王国立进行质量控制、稿件的初步
因可能为:模型自身具有一定的随机性,并且受训练次 修改与校对,对文章整体负责。
数、学习率大小、参数设置及网络规模等影响 [23] ;RF 本文无利益冲突。
模型的泛化误差比较大;另外在机器学习中,如果学习 参考文献
机在训练样本上的学习能力过强将会产生一些消极影 [1]秦璐,赵颖,佟隽瑶,等 . 颈动脉粥样硬化伴 OSAHS 患者的
响 [24] ,比如本研究中 RF 模型的训练能力过强,会产 颈动脉超声研究[J]. 中国医刊,2018,53(7):756-760.
生过拟合问题。近年来,SVM 模型在疾病预测方面的 DOI:10.3969/j.issn.1008-1070.2018.07.017.
QIN L,ZHAO Y,TONG J Y,et al. Study of carotid atherosclerosis
应用越来越多,在解决小样本、非线性问题上具有较好
combined with OSAHS patients by carotid artery ultrasound[J].
的推广和泛化能力。例如田占霄等 [25] 提出 SVM 模型
Journal of China Medical University,2018,53(7):756-760.
对精神分裂症识别具有一定的判别作用;杨志燕等 [26]
DOI:10.3969/j.issn.1008-1070.2018.07.017.
表明 SVM 模型为预测急性百草枯中毒患者的预后提供 [2]陈显荣,张晓 . 超微血管成像与超声造影对颈动脉粥样硬化斑
了一种新方法。AUC 是分类器好坏的性能指标,本研 块稳定性的诊断价值[J]. 中国临床神经外科杂志,2019,24(5):
究结果显示 SVM 模型在训练集中的 AUC 与 RF 模型没 289-291. DOI:10.137984,issn.1009-153X.2019.05.010.
有太大的差异(0.84 vs 0.86),表明 SVM 模型在训练 [3]陈伟伟,高润霖,刘力生,等 . 《中国心血管病报告 2017》概要[J].
集和测试集中均表现出了较强的预测效果,进一步推断 中国循环杂志,2018,33(1):1-8. DOI:10.3969/j.issn.1000-
出 SVM 模型综合实力最强,是预测钢铁工人 CAS 发生 3614.2018.01.001.
风险最好的模型。 CHEN W W,GAO R L,LIU L S,et al. Summary of the 2017