Page 60 - 中国全科医学2022-11
P. 60

http://www.chinagp.net   E-mail:zgqkyx@chinagp.net.cn  ·1337·


                表 2 CAS 影响因素的非条件多因素 Logistic 回归分析                           表 3 3 种模型的预测效能比较
           Table 2 Unconditioned multivariate Logistic regression analysis of factors   Table 3  Comparison of performance of SVM-,BPNN- and RF-based
           associated with carotid atherosclerosis in steelworkers  models in predicting the risk of carotid atherosclerosis in steelworkers
                                    2
              变量     β    SE   Wald χ 值  P 值   OR(95%CI)                        训练集                 测试集
           CAS 家族史                                               评价指标      SVM   BPNN  RF 模型  SVM   BPNN  RF 模型
                                                                           模型    模型           模型    模型
             否                                     1.00
                                                                准确率(%)    83.81  79.27  86.60  85.70  75.46  73.37
             是       1.22  0.15  67.80  <0.001 3.39(2.53,4.53)
                                                                灵敏度(%)    80.10  66.19  73.62  81.63  64.65  60.00
           高温作业
                                                                特异度(%)    87.32  91.62  98.90  90.29  87.66  88.45
             否                                     1.00
                                                                 约登指数      0.67  0.58   0.72  0.72   0.52  0.48
             是       0.14  0.07  4.34    0.037  1.15(1.01,1.31)
                                                                 Kappa 值   0.68  0.58   0.73  0.71   0.52  0.48
           噪声作业
                                                                 阳性似然比     6.31  7.90  66.93  8.41   5.24  5.20
             否                                     1.00
                                                                 阴性似然比     0.23  0.37   0.27  0.20   0.40  0.45
             是       0.19  0.07  7.71    0.005  1.21(1.06,1.38)
                                                               阳性预测值(%)   85.64  88.18  98.40  90.46  85.54  85.43
           高胆固醇
                                                               阴性预测值(%)   86.92  74.15  79.87  81.32  68.72  66.21
             否                                     1.00
                                                                           0.84  0.79   0.86  0.86   0.76  0.74
             是       0.36  0.09  15.57  <0.001 1.43(1.20,1.71)
                                                               AUC(95%CI) (0.82, (0.77, (0.85,  (0.83, (0.73, (0.71,
                                                                          0.85)  0.81)  0.88)  0.88)  0.79)  0.77)
           低密度脂蛋白胆固醇(LDL-C)和睡眠障碍 18 个变量
                                                                  注:SVM= 支持向量机,BPNN=BP 神经网络,RF= 随机森林,
           为输入变量。                                              AUC= 受试者工作特征曲线下面积
           2.5 3 种 CAS 风险预测模型的预测效能比较 采用欠
           采样的方法,CAS 和非 CAS 的例数由原先的 1 264、                            表 4 3 种模型预测效能在训练集和测试集的比较
                                                               Table 4 Comparison of the performance of SVM-,BPNN- and RF-based
           3 304 例(平衡前)采样为 1 264、1 264 例(平衡后)。
                                                               models in predicting the risk of carotid atherosclerosis in steelworkers in the
               训练集显示:在真实性上,RF 模型的特异度、约                         training set and the test set
           登指数、阳性似然比高于 SVM 和 BPNN 模型;在可靠                         评价                   训练集             测试集
                                                                                   2
                                                                                                   2
           性上,RF模型的准确率和Kappa值均高于其余两种模型;                          指标       模型      χ (Z)值   P 值   χ (Z)值    P 值
           RF 模型的阳性预测值最高,而 SVM 模型的阴性预测值                         灵敏度     RF vs BPNN  24.025  <0.001  7.410  0.009
           在 3 种模型中最高,见表 3。3 种模型灵敏度、特异度、                               BPNN vs SVM  75.596  <0.001  56.100  <0.001
           准确率和 AUC 两两比较,差异有统计学意义(P<0.05),                              RF vs SVM  21.130  <0.001  80.830  <0.001
           见表 4、图 1。                                            特异度     RF vs BPNN  53.900  <0.001  0.120  0.815
                                                                       BPNN vs SVM  10.460  <0.001  1.520  0.268
               测试集显示:在真实性上,SVM 模型的特异度、
                                                                        RF vs SVM  98.150  <0.001  0.830  0.435
           约登指数、灵敏度、AUC 高于其余两种模型,阴性似
                                                                准确率     RF vs BPNN  67.270  <0.001  2.280  0.155
           然比最低;从可靠性和预测值来看,SVM 模型准确率、
                                                                       BPNN vs SVM  19.250  <0.001  42.790  <0.001
           Kappa 值、阳性预测值和阴性预测值高于其余两种模型,
                                                                        RF vs SVM   9.440  0.003   60.240  <0.001
           见表 3。SVM 模型灵敏度、准确率和 AUC 与其余两种                                               a              a
                                                                 AUC    RF vs BPNN  8.270  <0.001  1.370  0.170
           模型比较,差异有统计学意义(P<0.05),见表 4、图 1。                                             a              a
                                                                       BPNN vs SVM  4.760  <0.001  6.530  <0.001
           3 讨论                                                         RF vs SVM  2.860 a  0.004  7.920 a  <0.001
               本研究对 4 568 例钢铁工人进行调查,共检出 1 264                     注: 为 Z 值
                                                                     a
           例 CAS 患者,CAS 检出率是 27.67%,高于一般人群
           (22.06%~25.57%)  [9-10] ,但是与重庆中老年钢铁工人               业和噪声作业为 CAS 的影响因素。张童等               [20] 研究表明
           (37.6%)  [11] 相比偏低,与其他报道相比也较低,如                     钢铁工人在高温环境中维生素 C 的情况较差导致血尿酸
           辽宁省农村地区人群 CAS 检出率 42.1%            [12] ,东北 40      升高,进而导致心血管疾病;CUI 等              [21] 提出随着累积
           岁以上的成年人为 42.1%        [13] 。原因可能为:一方面年              高温暴露的增加,钢铁工人患高血压的风险增加。王海
           龄构成不同,姚利和          [14] 、SONG 等 [15] 研究表明年龄         东 [19] 研究表明钢铁工人在工作中面临的累积噪声暴露
           增大是 CAS 的危险因素;另一方面健康工人效应也是                          量会作用于钢铁工人的近端病因,从而间接增加颈动脉
           造成 CAS 检出率较低的一个重要原因             [16] 。              内膜中膜厚度。已有研究显示,高温环境和噪声水平之
               通过非条件多因素 Logistic 回归分析发现,噪声作                    间存在交互作用,当钢铁工人同时暴露于高温和噪声时
           业、高温作业、高胆固醇、CAS 家族史为 CAS 的有效                        其高血压的发病风险会上升            [22] 。倒班作业产生的时差、
           预测因素,既往研究表明总胆固醇水平和 CAS 家族史                          睡眠中断、食物消耗的变化会导致人体的昼夜节律失调
           均为 CAS 的影响因素      [17-19] 。本研究结果显示,高温作              和紊乱,进而导致患高血压、糖尿病等疾病的发生风险
   55   56   57   58   59   60   61   62   63   64   65