Page 57 - 中国全科医学2022-11
P. 57
·1334· http://www.chinagp.net E-mail:zgqkyx@chinagp.net.cn
·论著·
三种风险预测模型预测钢铁工人颈动脉粥样硬化的
效能比较
扫描二维码
王娇娇,陈圆煜,郑子薇,杨永忠,陈哲,李超,王海东,武建辉,王国立 * 查看原文
【摘要】 背景 颈动脉粥样硬化(CAS)不仅影响钢铁工人的工作效率,而且是引发缺血性脑血管疾病最重要
的危险因素。近年来,越来越多的学者利用机器学习并通过易获得的因素对疾病进行风险预测,但目前,关于 CAS 风
险预测模型的研究依然缺乏。目的 运用支持向量机(SVM)、BP 神经网络(BPNN)与随机森林(RF)模型构建钢
铁工人 CAS 发生风险预测模型,并比较其预测效能。方法 选取 2017 年 3—6 月在唐山市弘慈医院进行体检和健康监
测的 4 568 例钢铁工人为研究对象,按照本团队编写的《健康评估检查表》进行调查,调查内容:人口学特征(性别、
年龄、体质指数、文化程度、婚姻状况)、个人的行为生活习惯与方式(吸烟、饮酒 )、个人病史(高血压、糖尿病、
CAS 家族史)、职业史(倒班、高温作业、噪声作业)。收集研究对象的实验室检查指标,如胆固醇、三酰甘油、同
型半胱氨酸、尿酸。结合非条件多因素 Logistic 回归分析结果以及查阅相关文献,确定变量构建 SVM、BPNN 和 RF 模
型并进行比较。结果 训练集显示 SVM、BPNN 和 RF 模型预测钢铁工人发生 CAS 的准确率分别为 83.81%、79.27%、
86.60%,灵敏度分别为 80.10%、66.19%、73.62%,特异度分别为 87.32%、91.62%、98.90%,受试者工作特征曲线下
面积(AUC)分别为 0.84、0.79、0.86。SVM 模型的灵敏度最高,RF 模型在准确率、特异度和 AUC 方面高于其余两
种模型,差异有统计学意义(P<0.05)。测试集显示 SVM、BPNN 和 RF 模型预测钢铁工人发生 CAS 的准确率分别为
85.70%、75.46%、73.37%,灵敏度分别为 81.63%、64.65%、60.00%,特异度分别为 90.29%、87.66%、88.45%,AUC
分别为 0.86、0.76、0.74。SVM 模型在灵敏度、准确率和 AUC 方面高于其余两种模型比较,差异有统计学意义(P<0.05)。
结论 运用 SVM 模型预测钢铁工人 CAS 发生风险的效果优于 BPNN 和 RF 模型。
【关键词】 颈动脉疾病;动脉粥样硬化;金属工人;支持向量机;BP 神经网络;随机森林;预测
【中图分类号】 R 543.4 【文献标识码】 A DOI:10.12114/j.issn.1007-9572.2022.0125
王娇娇,陈圆煜,郑子薇,等 . 三种风险预测模型预测钢铁工人颈动脉粥样硬化的效能比较[J]. 中国全科医学,
2022,25(11):1334-1339. [www.chinagp.net]
WANG J J,CHEN Y Y,ZHENG Z W,et al. Comparison of three risk prediction models for carotid atherosclerosis in
steelworkers[J]. Chinese General Practice,2022,25(11):1334-1339.
Comparison of Three Risk Prediction Models for Carotid Atherosclerosis in Steelworkers WANG Jiaojiao,CHEN
Yuanyu,ZHENG Ziwei,YANG Yongzhong,CHEN Zhe,LI Chao,WANG Haidong,WU Jianhui,WANG Guoli *
Department of Epidemiology and Health Statistics,School of Public Health,North China University of Science and Technology/
Hebei Provincial Key Laboratory of Coal Mine Health and Safety,Tangshan 063210,China
*
Corresponding author:WANG Guoli,Professor;E-mail:15383055966@163.com
【Abstract】 Background As a leading cause of ischemic cerebrovascular disease,carotid atherosclerosis(CAS)
lowers the productivity of steelworkers. An increasing number of scholars have used machine learning to identify readily available
factors to predict the risk of diseases. But there is still a lack of research on risk prediction models for CAS. Objective To
compare the performance of support vector machine(SVM)-,BP neural network(BPNN)- and random forest(RF)-based
models in predicting the risk of CAS in steelworkers. Methods 4 568 steelworkers who underwent physical examination and
health monitoring in Tangshan Hongci Hospital from March to June 2017 were selected for a survey using the Health Assessment
Checklist developed by us for understanding their information about demographic characteristics(sex,age,BMI,education
level,marital status),personal behavior and lifestyle(smoking and drinking),medical history(hypertension,diabetes,
family history of CAS),occupation history(current work in shifts,working under high temperature or in noisy environments).
基金项目:国家科技部重点研发项目(2016YFC0900605);河北省高等学校基本科研业务费项目(JYG2019002)
063210 河北省唐山市,华北理工大学公共卫生学院流行病与卫生统计学学科 河北省煤矿卫生与安全重点实验室
*
通信作者:王国立,教授;E-mail:15383055966@163.com
本文数字出版日期:2022-03-03