Page 99 - 2022-24-中国全科医学
P. 99

·3040· http://www.chinagp.net   E-mail:zgqkyx@chinagp.net.cn


           的整合功能有较强优势,诊断的准确性及分类的准确度                            会环境、心理及相关生物学预测因素,设置更多获取孕
           较高,具有高速运算的能力,可以快速寻找一个复杂问                            产妇资料的测量时间点,深入探讨预测变量之间的作用
           题的优化解。此外,ANN 还可以通过影像学资料筛选                           机制,以期纳入最佳的预测变量。
           出有诊断和鉴别意义的特征,因此未来的研究可以通过                                其次,样本量的准确估计是 PPD 预测模型可靠性
           ANN 联合影像学特征对 PPD 进行预测。                              和可重复性的重要保证。无论使用哪种模型,样本量
               对于 PPD 预测模型的建立,关键是对于数据的处                        不足时均容易出现过度拟合的情况,即基于小样本量构
           理、特征分析以及模型的选择和算法的应用。由于研究                            建的 PPD 预测模型难以到更大的人群中进行验证。对
           方法、评估标准有所不同,不同机器学习算法预测模型                            于 PPD 预测模型的开发,选取大样本、多中心的数据
           的预测效果有所差别,因此评估每个模型的效果并选择                            有利于提高 PPD 预测模型的预测效果及泛化能力,但
           最佳预测模型显得至关重要。未来的研究应基于研究队                            也应考虑到研究效率与成本等现实问题,因此样本量的
           列对最终模型进行外部验证,并对模型的临床有效性进                            确定应同时兼顾有效性及可行性。在样本量计算方面,
           行分析。值得注意的是,将机器学习算法应用于 PPD                           RILEY 等 [47] 为如何计算临床预测模型所需的样本量提
           预测的多数研究纳入的预测因子涉及社会人口学及心理                            供了方法学指导,且不建议进行数据拆分,而应采用重
           社会因素,但很少有研究联合生物遗传学因素进行预测。                           采样的方法进行内部验证。除了计算样本量,研究纳入
           因此,结合 PPD 生物 - 心理 - 社会三个维度的因素进                      的孕产妇的代表性也需引起重视,而孕产妇群体特征偏
           行模型构建至关重要。同时应注意,使用大数据集可降                            差对 PPD 预测模型的影响有待进一步研究。
           低估计方差,从而提供更好的预测性能,而应用预测因                                最后,模型验证是实施预测的必要环节,即对模型
           素数量少且不改变预测性能的预测模型意味着可以减轻                            的区分度、校准度进行评价。完整的预测模型应包含对
           收集信息的负担,因而此类预测模型更容易实施和推广。                           模型的内部验证与外部验证,而目前的大多数 PPD 预
           总之,随着信息科学技术不断发展,数据不断完善,在                            测模型研究仅通过随机拆分数据进行内部验证,这种方
           未来的研究中可以联合生物 - 心理 - 社会三个维度的预                        法减少了开发队列的样本量,可能降低模型的性能,
           测因素,使用机器学习算法开发 PPD 的综合预测模型                          显示较高的变异度        [48] 。更好的内部验证方法为 k- 倍
           作为产后抑郁的精准预测工具。                                      折叠交叉验证以及 Bootstrap 法,但这两种方法在很多
           5 研究展望                                              PPD 预测模型中常被忽略。同时,内部验证本身并不能
               现阶段 PPD 预测模型的研究如火如荼,“二胎”                        保证结果的可推广性,因此还需要大样本量的外部验证,
           及“三胎”政策背景下,高危孕产妇数量将不断增多,                            以更好地验证模型的性能           [49] 。
           对参数化、非参数化 PPD 预测模型进行分类与比较对                              综上所述,选择合适的模型构建方法至关重要。参
           选择合适的模型构建方法至关重要。值得注意的是,笔                            数化模型易于解释,侧重于对线性变量的预测,而非参
           者在比较参数化与非参数化模型的过程中发现,无论哪                            数化模型在非线性变量预测方面具有更好的优势,对于
           种模型,均有其相应的适用范围,在选择合适的模型时                            文本及图像数据,应用深度学习算法进行分析可能是更
           也应考虑到模型的实用性。因此,建议在未来研究中构                            好的选择。因此,模型的选择应结合各种算法的功能及
           建 PPD 预测模型时注意以下事项。                                  特性,考虑研究目的、变量类型、维度、样本量、预测
               首先,预测变量的维度影响着 PPD 预测模型的稳                        因素与结局指标之间关系的复杂程度等。在 PPD 预测
           定性与准确性。一方面,由于 PPD 影响因素复杂多样,                         方面,研究者更应关注孕产妇 PPD 发生风险预测模型,
           纳入模型的预测因素参差不齐,模型拟合及筛选最优模                            注重模型的泛化能力,在考虑模型准确度的同时,也应
           型存在差异,可能遗漏某些重要影响因素,因此全面、                            根据临床的适用性、实际应用的方便性选择合适的模型,
           多维度确定纳入的预测因子至关重要。另一方面,采取                            避免一味追求统计学的优化,采用了没有必要的复杂
           高维度预测变量会导致模型过于复杂、预测变量缺乏代                            模型。
           表性、实际应用中难以获取,将不利于相关预测模型在                                作者贡献:王永剑提出研究方向,进行论文的构思
           孕产妇中的推广使用。因此,进行多维预测变量的选择                            与设计,负责撰写论文;王翼鹏负责检索文献,收集及
           时应考虑变量是否存在严重的信息重叠,采取合适的方                            汇总资料;黄莎、李丛及魏娜负责审查矫正,对论文进
           法(如正则化技术)进行降维。考虑到妊娠期至产后的                            行修改;齐伟静、胡洁负责论文的总体质量控制,对文
           时间跨度较长,还应动态监测孕产妇妊娠期至产后的社                            章整体负责;所有作者共同确认了论文的最终稿。
   94   95   96   97   98   99   100   101   102   103   104