编辑
萝卜皮
不知不觉,已经渐渐延伸到了各个领域,医药领域也不例外。
来自印度BVRaju理工学院的研究人员发表综述,讨论了中的,归纳总结了应用于制药领域的各类技术,并指出当前该领域发展的难点,以及未来发展方向。
该综述以「MachineLearninginDrugDiscovery:AReview」为题,于年8月11日发布在《ArtificialIntelligenceReview》杂志。
概念与许多领域密切相关,如、概率论、统计学、以及模糊模型、等众多程序,统称为「计算智能」。对于制药行业而言,方法的使用将彻底改变传统的过程。
图示:使用进行的各个领域。(来源:论文)
已应用于药物设计的各种方面,如药物-蛋白质相互作用预测、药物疗效的发现、确保安全性生物标志物。
药物设计应用
药物设计技术依赖于基于不同ML算法开发的。算法在过程中的精确训练、验证和应用,简化复杂的协议,已经取得了不少成果。大多数药物设计过程中都引入了ML技术,以减少时间成本和人工干预。
图示:蛋白质的初级、二级、第三和第四级结构突出与活性位点残留物。(来源:论文)
蛋白质与蛋白质相互作用的预测
蛋白质-蛋白质相互作用(PPI)是主要的生物学现象之一,身体(细胞)的基本单位通过它传输信号、离子、底物和能量产生成分。这些信号、离子、底物和能量产生成分可以改善身体所需的药理反应。另外,PPI在疾病的发病机制中起着至关重要的作用。
近年来,基于PPI的计划在实验上产生了一种有希望的药理物质。然而,PPI实验预测的时间和成本被认为是限速障碍。在这方面,不同的托管了以PPI为框架的Web服务器,以加速药物化学研究。
图示:使用AI模型说明设计技术和主题。(来源:论文)
Hit发现
药物再利用的特点是「为目前处于存在阶段的药物」寻找新的适应症,它减少了的时间和危险情况。DeepDTnet算法被认为比NetLapRLS和KBMF2K方法以及、SVM、KNN和算法更具优势。
虚拟筛选是在过程中使用的一种AI策略,用于定位小分子以区分药物靶标的结合结构。
分子对接技术的高吞吐量虚拟筛选和评分
目标识别之后,通常使用虚拟筛选(HTVS)和分子对接技术,以了解蛋白质/受体的活性位点。另一种基本方法,是基于配体的虚拟筛选(LBVS),该方法依赖于化学的物理化学特性。
图示:分子对接取样和评分fowchart的基本概述。(来源:论文)
命中领先
QSAR分析用于先导优化过程,通过预测生物活性类似物从命中类似物中寻找潜在的先导化合物。主要用于数学概念,研究物理化学或结构对象和生物活动的定量。
图示:从与ML算法相关联的Hit-to-lead优化协议中获得的Abl激酶抑制剂。(来源:论文)
Denovo药物架构通过调整或平衡目标利益来推进独特的化学结构。使用Denovo模型从头开始引入新分子。模型可以利用强大的知识和生成能力,引入具有适当属性的新结构。
图示:抗病毒化合物的Smiles/SLN符号。(来源:论文)
先导优化
先导优化的主要目的是通过最小的结构修改来消除现有活性类似物的副作用影响。可用于研究先导优化,如化学和物理特性、吸收、分布、代谢和排泄、毒性以及ADME/T。
用于电子资源中的ML
图示:平台电子资源中的。(来源:论文)
泛检测干扰筛查中的ML(PAINS)可以根据要求从PAINS访问泛检测信息。从Pubchem库和筛选分析中编译出来的HitDexter2.0,可用于了解新设计化合物的生物学特性。
药物代谢物和代谢位点预测中的ML在进入临床实验之前,确定药物或新化学实体的代谢部位是非常必要的。药物代谢的预测可以通过动物模型(临床前研究)来完成,这是一个限制效率的步骤,而且成本高昂。利用模型可以解决这一问题,已经可以用于预测新陈代谢的工具有ADMET预测器、FAME3、GLORY/GLORYx等。
皮肤敏感预测中的ML皮肤敏感性的预测是评估新药/化合物安全性的基本标准之一。在这方面,基于的MACCS(RF_MACCS)和基于(SVM)的PaDEL(SVM_PaDEL)算法等AI模型已经训练了大约个与局部淋巴结检测(LLNA)信息相关的配体。
天然产品标识中的ML用,个天然产物分离物和经MCC验证的合成文库训练的ML,被用作基本预测模型NPScout在线服务器,将揭示新发现的药物类似物的可能身份。NPScout在分子来源预测中的应用,可以提供有关其天然产物来源的信息,并可能成为基于天然产物的过程的重要组成。
问题
目标验证
由于数据驱动的目标识别实验的数量倍增,因此将ML方法用于目标识别是绝佳选择。在目标识别方面,确认疾病和目标之间的因果关系是第一步。通过使用ML方法,可以对目标的已知属性、因果关系、驱动目标进行预测。ML技术可以从不同角度应用于目标识别领域。
预测生物标志物
使用ML方法,通过区分药物以及了解合理患者的药物机制,从而发现生物标志物,进而提高临床试验性能。在临床试验的最后阶段,往往要消耗大量的时间和成本。为了战胜这一问题,有必要在临床试验的早期阶段应用、构建和验证预测模型。使用ML算法可预测临床前数据分类中的转化生物标志物。
数字病理学
数字病理学基础理论的快速改进,可以更合理、更精确、高通量的发现新的生物标志物,从而缩短药物开发时间,患者也可以更快获得治疗。在应用模型之前,许多与图像分析相关的算法促使计算机学者与病理学家合作。为了对组织层进行分类,许多计算机科学家需要在计算机中手工制作图形特征。多尺度CNN模型则非常适用于数字病理学工作。
挑战
中存在许多挑战,大多数挑战可以通过使用技术来解决。
在训练期间有几个和结构会导致ML策略产生问题。特别是在训练期间数据不足的情况下,特定的算法不能满足精度和局部最优。
透明度问题是的另一个挑战。在不同分类模型中的决策规则是不清楚的。在药物开发中,模型需要理解多种机制来解释结果,并且需要多个组合特征来提高对可解释性的信任度。
可以从许多参考文献中访问集成数据,尤其是「组学」区域。
同质数据会产生集成挑战。
在制药公司,研究从巨大的分子延伸到个体,并且通常依赖于异构数据的整合;这些数据需要在不同的背景和规模下维持其自身,这本书就是一项挑战。
结论和未来方向
结论
技术正广泛应用于医药行业。在医学科学中,技术使计算机辅助药物开发领域向前迈进了一步。尽管如此,一些问题仍然存在,即
方法的性能可以直接影响的创新,因为多个深度在大量数据上得到有效训练。主要目的是解决的自动问题。
「黑盒」模型在概念中变得混乱。LocalInterpretableModel-Explanations(LIME)是反事实调查的一个例子。LIME被用来解锁黑盒模型。在这里,必须通过模型来解释受限数据。然而,通过技术揭示数据仅在初始阶段发挥作用。
许多在的训练期间进行了调整,但一些理论和实践框架无法优化这些模型。
未来方向
网络创新与医学科学相结合,以提高决策和算法的预测能力,包括生物标志物、疗法的副作用、治疗效果。需要协调化学信息、组学数据和医学数据等理论结果,从而实现创新。未来,期待AI技术覆盖医药科学的方方面面。
论文链接: