Page 124 - 中国全科医学2022-08
P. 124
http://www.chinagp.net E-mail:zgqkyx@chinagp.net.cn ·1017·
表 2 肠道代谢物及其在哮喘发展中的作用机制 有监督学习和无监督学习。在有监督学习中,机器学习算法
Table 2 Roles of intestinal metabolites involved in the pathogenesis of 的目标是从已知分组的训练数据集推算得出疾病的类别,属
childhood asthma
于分类算法,其功能是预测;相反,在无监督学习中,目标
代谢物 机制
是从“未标记”的样本推断可能的集合,属于聚类算法,其
短链脂肪酸: 直接激活 G 蛋白偶联受体(如 GPR41、GPR43、
乙酸盐、丙酸 GRP109A),抑制组蛋白脱乙酰基酶,作为能量 功能是降维,对样本间差异较小的特征不敏感。
盐、丁酸盐 底物 [62] ;换行诱导 T 调节细胞分化,减少嗜酸粒 此外,哮喘是一种复杂而异质的疾病,可分为不同的表
细胞运输和存活 [55] ,以及促进黏膜抗体产生 [63]
型及内型,相同表型的患者,对同一药物的反应不尽相同。
多不饱和脂肪 增加短链脂肪酸的产生,被人体肠道微生物代谢
酸:o me g a -3 产生共轭亚油酸(CLA)和 12,13- 二羟基 -9- 精确的内型是通过特定的生物标志物将病理生物学机制和可
脂肪酸(二十 十八烯酸(12,13-diHOME)。换行免疫失衡情 见特性联系起来,其有望将哮喘细分为不同亚型并为个性化
碳五烯酸和 况下,补充 CLA 能减少肿瘤坏死因子(TNF)-α、 治疗方案开辟道路。多组学数据为超越临床表型的内分型提
二十二碳六烯 干 扰 素(IFN)-γ 和 白 介 素(IL)-5 的 产 生 以
酸 )、omega-6 及嗜酸粒细胞来源神经毒素的释放 [64] ;12, 供了机会,特别是与上述机器学习聚类算法结合使用时。将
脂肪酸(亚油 13-diHOME 可激活树突状细胞中的 PPARγ 调控 多组学数据与聚类算法结合使用,可以识别同质的哮喘内型,
酸及其代谢物 基因的表达,并减少体外的抗炎细胞因子分泌和
花生四烯酸) Treg 细胞数量,从而增加肺部炎症 [65] 这些内型可能对特定的、个性化的治疗方案做出相似反应。
胆汁酸:胆酸、 熊去氧胆酸通过连接树突状细胞的法尼醇 X 受体 随着代谢组学技术的发展,不再将代谢物视为下游产物,
鹅脱氧胆酸、 (FXR),促进 IL-12 的产生,促进树突状细胞的 代谢物除了是饮食、环境、遗传、微生物共同作用的结果,
脱氧胆酸、石 迁移,减少肺部嗜酸性气道炎症 [66] ;鹅去氧胆酸
胆酸、熊去氧 通过阻断炎性细胞浸润,从而抑制 Th2 细胞因子 其还能调控基因表达、RNA代谢和蛋白质活性,在哮喘的发生、
胆酸 IL-4、IL-5、IL-13 的分泌 [67] 发展中发挥作用。通过对血液、呼出气、粪便、尿液等样本
色氨酸:犬尿 吲哚胺 2,3- 双加氧酶 -1 代谢色氨酸产生犬尿氨 的检测,代谢组学可提供生物标志物的筛选、发病机制的阐释、
氨 酸、5- 羟 色 酸衍生物,通过降低色氨酸的利用率 [68] 和促进 T
胺、褪黑激素、 调节细胞来减轻 T 细胞炎症 [69] ;色氨酸衍生物可 疾病的预测与分度、呼吸道炎症的监测。此外,随着系统生
吲哚、吲哚酸、 以激活芳香烃受体 [70] ,刺激 ILC3 细胞产生 IL-22 物学的发展,运用多组学融合手段对疾病进行更加全面地研
粪臭素、色胺 并抑制 ILC2 功能,促进耐受性树突状细胞 [71] 、
Th17 和 T 调节细胞分化 [72] 究也逐渐成为趋势。未来,将基因组学、转录组学、蛋白质
鞘 脂:1- 磷 酸 1- 磷酸鞘氨醇与 T 细胞表面 S1P 受体结合,控制 组学、代谢组学、微生物组学和生物信息学结合,有利于为
鞘 氨 醇、1- 磷 T 细胞从淋巴结进入血液 [73] ;从头合成鞘脂的减 儿童哮喘的研究提供可信度更高的数据,并有望借此区分不
酸神经酰胺 少会降低细胞内镁含量并影响平滑肌收缩力 [74]
同哮喘亚型,实现精准医疗和个体化治疗。
影响,例如性别 [11] 、年龄 [12] 、BMI [13] 、饮食 [14] 、吸烟、 作者贡献:黄宇戈、罗连响进行文章的构思与设计,文
药物 [15] 、体力活动、并发症等;其次,代谢组学研究过程相 章的可行性分析;吴锐剑进行文献的收集、整理,以及撰写
关操作,例如样品收集时间 [85] 、收集程序、前处理 [86] 、存储 [34] 、 论文;黄宇戈进行文章的质量控制及最终文章的修改,对文
冻融 [87] 、提取程序 [88] 、稀释、分析方法等,也会对结果造 章整体负责,监督管理。
成影响,所以,规范的操作可以减少偏差,增加结果的可靠性; 本文无利益冲突。
最后,在数据处理过程中,由于变量数常大于样本数量,所 本文文献检索策略:
以数据会过度拟合,从而导致错误。为解决过度拟合的问题, 检索 Pubmed 数据库,检索时间为建库至 2020 年 12 月。
就需要足够的样本量,使用内部交叉验证或 Bootstrapping 算 纳入标准:(1)以检索式metabolomics AND asthma AND (child
法对模型进行校准,并在独立的外部样本中对结果进行验证。 OR children)检索相关文献;(2)尽量以近 10 年文献作
4 代谢组学的发展方向 为参考文献。排除标准:(1)重复文献;(2)与“代谢
遗传、调控和环境刺激在生物系统中触发了广泛的输 组学”“儿童”无关文献;(3)存在研究设计缺陷,质量
入 - 输出级联,疾病的发病机制需要在这种广泛的生物学系 差的文献。
统背景下进行验证。代谢组学是整合来自各种组学研究(基
参考文献
因组、转录组、蛋白质组、代谢组和微生物组)的数据,可
[1]BATEMAN E D,HURD S S,BARNES P J,et al. Global
能会为在复杂的生物系统背景下理解疾病的发展过程提供更
strategy for asthma management and prevention:GINA executive
大的机会 [89] 。尽管单个组学研究得到了大量可访问的数据,
summary[J]. Eur Respir J,2008,31(1):143-178. DOI:
但是通过组学整合来识别新的生物机制尚未达到预期,原因
10.1183/09031936.00138707.
是高度异构数据整合困难,以及目前所谓的大数据集与使用 [2]ASHER I,PEARCE N. Global burden of asthma among
无监督学习方法有效工作所需的数据集相比仍然很小,并且 children[J]. Int J Tuberc Lung Dis,2014,18(11):1269-
难以达到所需的精度 [90] 。为了在多组学数据中实现高信息含 1278. DOI:10.5588/ijtld.14.0170.
量,仍需要遵守相关标准,并以高度系统化的方式进行实验。 [3]BEASLEY R,SEMPRINI A,MITCHELL E A. Risk factors for
其次,通过基于人工智能的机器学习方法,从数据中学 asthma:is prevention possible?[J]. Lancet,2015,386(9998):
习复杂的功能关系,而无需先验证假设。机器学习模型的原 1075-1085. DOI:10.1016/s0140-6736(15)00156-7.
理是在一个生物数据集上训练,然后使用检测到的模式来预 [4]全国儿科哮喘协作组,中国疾病预防控制中心环境与健康相关
测另一个。机器学习在典型的生物学应用中分为两大类,即 产品安全所 . 第三次中国城市儿童哮喘流行病学调查[J]. 中