Page 27 - 中国全科医学2022-16期

P. 27

·1944· http://www.chinagp.net E-mail:zgqkyx@chinagp.net.cn

而自回归移动平均（ARIMA）模型和神经网络自回归成的顶层，以及包含“隐藏神经元”的中间层。把时间
（NNAR）模型均是用于拟合呈现长期趋势、非平稳数序列的滞后值作为输入构建的神经网络，称为 NNAR（p，
据的常用预测模型［9-11］。本研究通过收集 1990—2019 k）。其中 p 表示滞后输入数，k 表示隐藏层中的节点数。
年中国 COPD 患病率、死亡率和 DALYs 率数据，分析 NNAR 模型的构建可通过“forecast”包中的“nnetar”
我国 COPD 疾病负担变化趋势，并分别采用 ARIMA 和等函数实现。
NNAR 模型进行建模，择优选择模型预测 2020—2024 1.2.2.3 模型比较采用预测值与实际值的相对误差、
年中国 COPD 的疾病负担。平均绝对百分误差（MAPE）、平均绝对误差（MAE）
1 资料与方法及均方根误差（RMSE）对模型的拟合和预测效果进行
1.1 数据来源 1990—2019 年中国 COPD 患病率、死评价。MAPE、MAE、RMSE 值越小，模型拟合精度越
亡率和 DALYs 率等数据来源于 2019 年全球疾病负担高，MAPE<15% 时提示预测精度较好［14］。最后，利
（GBD 2019）。GBD 2019 采用标准的、可复制的方法用最佳模型拟合 1990—2019 年中国 COPD 疾病负担，
估算了全球 204 个国家和地区的 369 种疾病和伤害所造预测得到 2020—2024 年中国 COPD 患病率、死亡率和
成的疾病负担情况，并按国家和地区、年份、性别和年 DALYs 率。
龄组分别报告。疾病负担的详细数据可从全球健康数据 2 结果
交换数据库网站（http://ghdx.healthdata.org/gbd-2019） 2.1 1990—2019 年中国 COPD 疾病负担变化趋势
下载，GBD 数据是一套具有内部一致性和可比性的高 1990—2019 年：（1）中国全人群 COPD 患病率从
5
5
质量数据，GBD 2019 的详细介绍和使用方法参见文 2 344.40/10 增至 3 175.37/10 ，增长了 35.45%，年均增
献［12-13］。长 1.04%（P<0.001）；男性和女性 COPD 的患病率均呈
1.2 统计学方法上升趋势，平均每年分别增长0.92%和1.13%（P<0.001）。
5
1.2.1 疾病负担趋势分析利用 Excel 2016 建立 1990— （2）中国全人群 COPD 死亡率由 105.09/10 下降至
5
2019 年中国 COPD 患病率、死亡率和 DALYs 率数据库， 72.94/10 ，年均降幅为 1.29%（P<0.001）；男性和女
对 COPD 疾病负担在全人群及不同性别人群中的变化趋性的 COPD 死亡率均呈下降趋势，平均每年分别下降
势进行分析，相关指标均采用 GBD 2019 全球标准人口 0.83% 和 1.83%（P<0.001）。（3）中国全人群 DALYs
5
5
进行年龄标准化。变化率 =（2019 年指标值 -1990 年指率从 2 206.55/10 下降至 1 400.71/10 ，年均下降 1.56%
标值）/1990 年指标值 ×100%。采用对数线性回归模（P<0.001）；男性和女性的 COPD DALYs 率均呈下降
型计算平均年度变化百分比（AAPC），使用 Joinpoint 趋势，平均每年分别下降 1.37% 和 1.86%（P<0.001），
Regression Program 4.9.0.0 软件分析率的变化趋势，AAPC 见表 1。
的检验采用 t 检验，以 P<0.05 为差异有统计学意义。 2.2 COPD 患病率预测模型构建由“auto.arima”
1.2.2 ARIMA、NNAR 模型的建立与比较利用 1990— 函数得到 AIC 与 BIC 最小的 COPD 患病率预测模型为
2016 年中国 COPD 患病率、死亡率和 DALYs 率作为训 ARIMA（1，2，0）（AIC=222.97，BIC=228.00）。对
2
练集建立 ARIMA 和 NNAR 模型，利用 2017—2019 年残差序列进行 Ljung-Box 检验，延迟 6 阶 χ 值为 1.020
2
数据作为测试集进行模型评价。ARIMA、NNAR 模型的（P=0.985），延迟 12 阶 χ 值为 1.975（P=0.999），
建立与比较基于 R 4.1.0 软件实现。差异无统计学意义，提示为白噪声。在训练集上：
1.2.2.1 ARIMA 模型建立 ARIMA（p，d，q）是常用 ARIMA（1，2，0）MAPE、MAE、RMSE 分别为
的时间序列模型，其中 p、d、q 分别为自回归（AR）、 0.284%、8.048、13.399，提示模型预测性能良好；由
为使数据平稳所需差分和偏自回归（MA）的阶数。利 “nnetar”函数得到的 COPD 患病率模型 NNAR（1，1）
用“forecast”“tseries”包中的“auto.arima”等函数实的 MAPE、MAE 和 RMSE 分别为 0.506%、14.621、
现对 ARIMA 模型的构建。根据赤池信息准则（AIC）和 19.841。ARIMA（1，2，0）和 NNAR（1，1）预测值的
贝叶斯准则（BIC）筛选最优模型类型及参数。对模型动态趋势与实际情况基本一致（图 1~2）。无论是在训
的残差序列进行Ljung-Box检验，若P>0.05，则通过检验，练集还是在测试集上，ARIMA（1，2，0）的 MAPE、
提示为白噪声，ARIMA 模型拟合度较好，否则重新建模。 MAE 和 RMSE 值均小于 NNAR（1，1），即 ARIMA 模
1.2.2.2 NNAR 模型建立人工神经网络是模拟生物神型更优，见表 2。
经网络的数学模型，允许响应变量和预测变量之间存在 2.3 COPD 死亡率预测模型构建 ARIMA（0，1，1）
复杂非线性关系，其结构主要包括 3 个层次，即由输入（AIC=79.74，BIC=83.51）为 AIC 与 BIC 最小的 COPD
层（预测变量）形成的底层，由输出层（响应变量）形死亡率预测模型。对模型进行Ljung-Box 检验，延迟6阶、

22 23 24 25 26 27 28 29 30 31 32