Page 22 - 2022-31-中国全科医学
P. 22

http://www.chinagp.net   E-mail:zgqkyx@chinagp.net.cn  ·3859·


           分 =0.5 分 [10] 。                                     并开始进行从 100 倒计数(如 100、99、98......)。3 个
               AD 患者的纳入标准:(1)均符合美国国立神经病                        步态测验采集的步态参数一致,包括步幅、步速、步频、
           语言障碍卒中研究所和阿尔茨海默病及相关疾病学会的                            支撑相、摆动相、跨步时间、支撑时间、摆动时间、足
           AD 诊断标准    [11] 。(2)简易精神状态检查(Mini-Mental            趾离地角度和足跟着地角度。
           State Examination,MMSE)量表提示痴呆:评分≤17分(文              1.3 统计学方法 使用 SPSS 26.0 软件进行统计分析。
                                                                                                    2
           盲)或评分≤ 20 分(小学毕业)或评分≤ 24 分(初中                       计数资料以相对数表示,组间比较采用 χ 检验。计量
           毕业及以上)      [12] 。(3)蒙特利尔认知评估(Montreal              资料首先使用 Shapiro-Wilk 检验每组数据的正态性,然
           Cognitive Assessment,MoCA)量表提示认知受损:最佳               后使用 Levene's 检验每组数据的方差齐性。符合正态
           划界分值为 19 分(受教育年限≤ 6 年)或 22 分(受教                     分布且方差齐的数据,以( ±s)表示,多组间比较采
           育年限 7~<12 年)或 24 分(受教育年限≥ 12 年)            [13] 。   用单因素方差分析,然后使用 LSD 事后检验进行组间
           (4)CDR 量表评分 =1 分。(5)具有以下特征的早期、                      两两比较;非正态分布或方差不齐的数据,以中位数
           显著性的情景记忆损害:①患者本人或知情者报告的持                            (四分位数间距)〔M(QR)〕表示,多组间比较采用
           续6个月以上的缓慢进展的记忆功能变化;②显著情景                            Kruskal-Wallis H 检验,然后使用事后多重比较进行组
           记忆损害的客观证据,包括不能被线索提示、再认测试                            间两两比较。以 P<0.05 为差异有统计学意义。
           改善或纠正的回忆困难;③情景记忆损害在起病或疾病                            1.4 分类建模 使用随机森林算法(RF)和梯度提升
           进展过程中可以单独存在,或与其他认知功能改变共存。                           决策树算法(GBDT)建立模型,10 个步态参数作为预
           (6)颅脑计算机 X 线断层扫描(CT)显示无明显异常                         测变量,疾病状态(HC、aMCI、AD)作为响应变量。
           或仅为脑萎缩。                                             每种机器学习算法建立了 3 个模型,分别是 HC/aMCI、
               HC 的纳入标准:(1)MMSE 量表评分≥ 25 分;(2)                 HC/AD 和 aMCI/AD。使用 10 倍交叉验证评估每个模型
           认知正常,由知情人确认;(3)CDR 量表评分 =0 分。                       的性能。
               所有参与者的排除标准:(1)文盲;(2)存在任                             RF 是 bagging 的一种扩展,是由 BREIMAN         [20] 提
           何可能导致认知和运动障碍的神经系统疾病和其他系统                            出的一种分类算法。其计算效率高,可以在大型数据集
           性疾病(卒中病史、帕金森病、癫痫、脑创伤等)、影                            上快速运行,已被应用于不同领域                [21] 。RF 由一组决
           响下肢的活动性风湿病和骨科疾病、膝关节病史 / 髋关                          策树组成,其中每个树都包含拆分节点和叶节点                     [22] ,
           节置换术等。                                              然而 RF 使用每个节点上随机选择的变量中的最佳节点
           1.2 研究方法 在“面对面”访谈时收集参与者的基                           将每个节点拆分为分支,而不是在所有变量中使用最佳
           本情况,包括年龄、身高、体质量和鞋码。采用 MMSE                          分支  [23] 。实际上 RF 中的每棵决策树都是一个分类器
           量表和 MoCA 量表评估整体认知功能,使用 CDR 量表                       (假设现在针对的是分类问题),对于一个输入样本,
           评估认知受损程度。认知域的评估包括记忆力、执行能                            N 棵树会有 N 个分类结果,而随机森林集成了所有的分
           力、注意力和语言评估,评估方法分别为听觉词语学习                            类投票结果,将投票次数最多的类别指定为最终的输出。
           测验(AVLT)    [14] 、Stroop 色词测验(SCWT)     [15] 、符     该算法具有多个必须由用户设置的超参数,例如节点必
                               [16]
                                                       [17]
           号数字模式测验(SDMT) 、波士顿命名测验(BNT) 。                       须包含的最小样本数和树的数量等              [24] 。RF 的优点包括:
           使用日常生活活动评估量表(Activities Of Daily Living,            在决策树中随机选择样本可以在一定程度上避免过度拟
           ADL)评估患者在日常生活中的自我护理能力                   [18] 。步     合 ; 随机选择样品可以增强抗噪性 ; 可以处理高尺寸样
           态测试:所有步态测试均是在佛山市第一人民医院宽敞                            品,无须因素筛选        [25] 。
           走廊内使用可穿戴步态采集设备完成。可穿戴步态采集                                GBDT 是 FRIEDMAN   [26] 在 1999 年提出的一种迭代
           设备常以鞋或鞋垫的形式嵌入传感器模块采集受试者步                            决策树算法,该算法由多棵决策树组成,所有树的结论
           态信息,配合穿戴于肢体和躯干的整合角度计模块与足                            累加起来为最终结果,被认为是泛化能力较强的一种算
           部信息可以得出下肢与躯干的运动动态角度信息                     [19] 。    法。GBDT 是一种用于回归和分类问题的机器学习技术,
           所有参与者需要穿戴步态采集设备完成 3 个步态测验(1                         基本思想是将一系列弱基分类器组合成一个强基分类
           个单任务测验,2 个双任务测验),行走长度 >10 m。                        器 [27] ,学习过程是基于特征和响应数据集构建梯度提
           单任务测验,即自由行走,参与者以舒适的速度行走,                            升树分类或回归模型,然后使用分类和回归模型对新的
           无任何额外的行为。双任务测验包括倍数 7 和倒数 100                        传入样本进行分类 / 预测         [28] 。GBDT 模型采用梯度下
           测试。倍数 7 测试:在平整的地面进行测试,参与者开                          降法,将决策树法与 bagging 和 boosting 算法相结合,
           始行走,同时计数 7 的倍数(如 7、14、21......)。倒                   解决传统决策树的过拟合问题              [25] 。GBDT 和随机森林
           数 100 测试:在平整的地面进行测试,参与者开始行走,                        最本质的区别是 GBDT 中的每一棵树学习的是之前所有
   17   18   19   20   21   22   23   24   25   26   27