Page 60 - 中国全科医学2022-11
P. 60
http://www.chinagp.net E-mail:zgqkyx@chinagp.net.cn ·1337·
表 2 CAS 影响因素的非条件多因素 Logistic 回归分析 表 3 3 种模型的预测效能比较
Table 2 Unconditioned multivariate Logistic regression analysis of factors Table 3 Comparison of performance of SVM-,BPNN- and RF-based
associated with carotid atherosclerosis in steelworkers models in predicting the risk of carotid atherosclerosis in steelworkers
2
变量 β SE Wald χ 值 P 值 OR(95%CI) 训练集 测试集
CAS 家族史 评价指标 SVM BPNN RF 模型 SVM BPNN RF 模型
模型 模型 模型 模型
否 1.00
准确率(%) 83.81 79.27 86.60 85.70 75.46 73.37
是 1.22 0.15 67.80 <0.001 3.39(2.53,4.53)
灵敏度(%) 80.10 66.19 73.62 81.63 64.65 60.00
高温作业
特异度(%) 87.32 91.62 98.90 90.29 87.66 88.45
否 1.00
约登指数 0.67 0.58 0.72 0.72 0.52 0.48
是 0.14 0.07 4.34 0.037 1.15(1.01,1.31)
Kappa 值 0.68 0.58 0.73 0.71 0.52 0.48
噪声作业
阳性似然比 6.31 7.90 66.93 8.41 5.24 5.20
否 1.00
阴性似然比 0.23 0.37 0.27 0.20 0.40 0.45
是 0.19 0.07 7.71 0.005 1.21(1.06,1.38)
阳性预测值(%) 85.64 88.18 98.40 90.46 85.54 85.43
高胆固醇
阴性预测值(%) 86.92 74.15 79.87 81.32 68.72 66.21
否 1.00
0.84 0.79 0.86 0.86 0.76 0.74
是 0.36 0.09 15.57 <0.001 1.43(1.20,1.71)
AUC(95%CI) (0.82, (0.77, (0.85, (0.83, (0.73, (0.71,
0.85) 0.81) 0.88) 0.88) 0.79) 0.77)
低密度脂蛋白胆固醇(LDL-C)和睡眠障碍 18 个变量
注:SVM= 支持向量机,BPNN=BP 神经网络,RF= 随机森林,
为输入变量。 AUC= 受试者工作特征曲线下面积
2.5 3 种 CAS 风险预测模型的预测效能比较 采用欠
采样的方法,CAS 和非 CAS 的例数由原先的 1 264、 表 4 3 种模型预测效能在训练集和测试集的比较
Table 4 Comparison of the performance of SVM-,BPNN- and RF-based
3 304 例(平衡前)采样为 1 264、1 264 例(平衡后)。
models in predicting the risk of carotid atherosclerosis in steelworkers in the
训练集显示:在真实性上,RF 模型的特异度、约 training set and the test set
登指数、阳性似然比高于 SVM 和 BPNN 模型;在可靠 评价 训练集 测试集
2
2
性上,RF模型的准确率和Kappa值均高于其余两种模型; 指标 模型 χ (Z)值 P 值 χ (Z)值 P 值
RF 模型的阳性预测值最高,而 SVM 模型的阴性预测值 灵敏度 RF vs BPNN 24.025 <0.001 7.410 0.009
在 3 种模型中最高,见表 3。3 种模型灵敏度、特异度、 BPNN vs SVM 75.596 <0.001 56.100 <0.001
准确率和 AUC 两两比较,差异有统计学意义(P<0.05), RF vs SVM 21.130 <0.001 80.830 <0.001
见表 4、图 1。 特异度 RF vs BPNN 53.900 <0.001 0.120 0.815
BPNN vs SVM 10.460 <0.001 1.520 0.268
测试集显示:在真实性上,SVM 模型的特异度、
RF vs SVM 98.150 <0.001 0.830 0.435
约登指数、灵敏度、AUC 高于其余两种模型,阴性似
准确率 RF vs BPNN 67.270 <0.001 2.280 0.155
然比最低;从可靠性和预测值来看,SVM 模型准确率、
BPNN vs SVM 19.250 <0.001 42.790 <0.001
Kappa 值、阳性预测值和阴性预测值高于其余两种模型,
RF vs SVM 9.440 0.003 60.240 <0.001
见表 3。SVM 模型灵敏度、准确率和 AUC 与其余两种 a a
AUC RF vs BPNN 8.270 <0.001 1.370 0.170
模型比较,差异有统计学意义(P<0.05),见表 4、图 1。 a a
BPNN vs SVM 4.760 <0.001 6.530 <0.001
3 讨论 RF vs SVM 2.860 a 0.004 7.920 a <0.001
本研究对 4 568 例钢铁工人进行调查,共检出 1 264 注: 为 Z 值
a
例 CAS 患者,CAS 检出率是 27.67%,高于一般人群
(22.06%~25.57%) [9-10] ,但是与重庆中老年钢铁工人 业和噪声作业为 CAS 的影响因素。张童等 [20] 研究表明
(37.6%) [11] 相比偏低,与其他报道相比也较低,如 钢铁工人在高温环境中维生素 C 的情况较差导致血尿酸
辽宁省农村地区人群 CAS 检出率 42.1% [12] ,东北 40 升高,进而导致心血管疾病;CUI 等 [21] 提出随着累积
岁以上的成年人为 42.1% [13] 。原因可能为:一方面年 高温暴露的增加,钢铁工人患高血压的风险增加。王海
龄构成不同,姚利和 [14] 、SONG 等 [15] 研究表明年龄 东 [19] 研究表明钢铁工人在工作中面临的累积噪声暴露
增大是 CAS 的危险因素;另一方面健康工人效应也是 量会作用于钢铁工人的近端病因,从而间接增加颈动脉
造成 CAS 检出率较低的一个重要原因 [16] 。 内膜中膜厚度。已有研究显示,高温环境和噪声水平之
通过非条件多因素 Logistic 回归分析发现,噪声作 间存在交互作用,当钢铁工人同时暴露于高温和噪声时
业、高温作业、高胆固醇、CAS 家族史为 CAS 的有效 其高血压的发病风险会上升 [22] 。倒班作业产生的时差、
预测因素,既往研究表明总胆固醇水平和 CAS 家族史 睡眠中断、食物消耗的变化会导致人体的昼夜节律失调
均为 CAS 的影响因素 [17-19] 。本研究结果显示,高温作 和紊乱,进而导致患高血压、糖尿病等疾病的发生风险