Page 99 - 2022-24-中国全科医学
P. 99
·3040· http://www.chinagp.net E-mail:zgqkyx@chinagp.net.cn
的整合功能有较强优势,诊断的准确性及分类的准确度 会环境、心理及相关生物学预测因素,设置更多获取孕
较高,具有高速运算的能力,可以快速寻找一个复杂问 产妇资料的测量时间点,深入探讨预测变量之间的作用
题的优化解。此外,ANN 还可以通过影像学资料筛选 机制,以期纳入最佳的预测变量。
出有诊断和鉴别意义的特征,因此未来的研究可以通过 其次,样本量的准确估计是 PPD 预测模型可靠性
ANN 联合影像学特征对 PPD 进行预测。 和可重复性的重要保证。无论使用哪种模型,样本量
对于 PPD 预测模型的建立,关键是对于数据的处 不足时均容易出现过度拟合的情况,即基于小样本量构
理、特征分析以及模型的选择和算法的应用。由于研究 建的 PPD 预测模型难以到更大的人群中进行验证。对
方法、评估标准有所不同,不同机器学习算法预测模型 于 PPD 预测模型的开发,选取大样本、多中心的数据
的预测效果有所差别,因此评估每个模型的效果并选择 有利于提高 PPD 预测模型的预测效果及泛化能力,但
最佳预测模型显得至关重要。未来的研究应基于研究队 也应考虑到研究效率与成本等现实问题,因此样本量的
列对最终模型进行外部验证,并对模型的临床有效性进 确定应同时兼顾有效性及可行性。在样本量计算方面,
行分析。值得注意的是,将机器学习算法应用于 PPD RILEY 等 [47] 为如何计算临床预测模型所需的样本量提
预测的多数研究纳入的预测因子涉及社会人口学及心理 供了方法学指导,且不建议进行数据拆分,而应采用重
社会因素,但很少有研究联合生物遗传学因素进行预测。 采样的方法进行内部验证。除了计算样本量,研究纳入
因此,结合 PPD 生物 - 心理 - 社会三个维度的因素进 的孕产妇的代表性也需引起重视,而孕产妇群体特征偏
行模型构建至关重要。同时应注意,使用大数据集可降 差对 PPD 预测模型的影响有待进一步研究。
低估计方差,从而提供更好的预测性能,而应用预测因 最后,模型验证是实施预测的必要环节,即对模型
素数量少且不改变预测性能的预测模型意味着可以减轻 的区分度、校准度进行评价。完整的预测模型应包含对
收集信息的负担,因而此类预测模型更容易实施和推广。 模型的内部验证与外部验证,而目前的大多数 PPD 预
总之,随着信息科学技术不断发展,数据不断完善,在 测模型研究仅通过随机拆分数据进行内部验证,这种方
未来的研究中可以联合生物 - 心理 - 社会三个维度的预 法减少了开发队列的样本量,可能降低模型的性能,
测因素,使用机器学习算法开发 PPD 的综合预测模型 显示较高的变异度 [48] 。更好的内部验证方法为 k- 倍
作为产后抑郁的精准预测工具。 折叠交叉验证以及 Bootstrap 法,但这两种方法在很多
5 研究展望 PPD 预测模型中常被忽略。同时,内部验证本身并不能
现阶段 PPD 预测模型的研究如火如荼,“二胎” 保证结果的可推广性,因此还需要大样本量的外部验证,
及“三胎”政策背景下,高危孕产妇数量将不断增多, 以更好地验证模型的性能 [49] 。
对参数化、非参数化 PPD 预测模型进行分类与比较对 综上所述,选择合适的模型构建方法至关重要。参
选择合适的模型构建方法至关重要。值得注意的是,笔 数化模型易于解释,侧重于对线性变量的预测,而非参
者在比较参数化与非参数化模型的过程中发现,无论哪 数化模型在非线性变量预测方面具有更好的优势,对于
种模型,均有其相应的适用范围,在选择合适的模型时 文本及图像数据,应用深度学习算法进行分析可能是更
也应考虑到模型的实用性。因此,建议在未来研究中构 好的选择。因此,模型的选择应结合各种算法的功能及
建 PPD 预测模型时注意以下事项。 特性,考虑研究目的、变量类型、维度、样本量、预测
首先,预测变量的维度影响着 PPD 预测模型的稳 因素与结局指标之间关系的复杂程度等。在 PPD 预测
定性与准确性。一方面,由于 PPD 影响因素复杂多样, 方面,研究者更应关注孕产妇 PPD 发生风险预测模型,
纳入模型的预测因素参差不齐,模型拟合及筛选最优模 注重模型的泛化能力,在考虑模型准确度的同时,也应
型存在差异,可能遗漏某些重要影响因素,因此全面、 根据临床的适用性、实际应用的方便性选择合适的模型,
多维度确定纳入的预测因子至关重要。另一方面,采取 避免一味追求统计学的优化,采用了没有必要的复杂
高维度预测变量会导致模型过于复杂、预测变量缺乏代 模型。
表性、实际应用中难以获取,将不利于相关预测模型在 作者贡献:王永剑提出研究方向,进行论文的构思
孕产妇中的推广使用。因此,进行多维预测变量的选择 与设计,负责撰写论文;王翼鹏负责检索文献,收集及
时应考虑变量是否存在严重的信息重叠,采取合适的方 汇总资料;黄莎、李丛及魏娜负责审查矫正,对论文进
法(如正则化技术)进行降维。考虑到妊娠期至产后的 行修改;齐伟静、胡洁负责论文的总体质量控制,对文
时间跨度较长,还应动态监测孕产妇妊娠期至产后的社 章整体负责;所有作者共同确认了论文的最终稿。