近日,云南大学教育部自然资源药物化学重点实验室肖伟烈课题组在天然产物权威评述期刊Natural Product Reports上发表文章,对基于机器学习的天然产物活性研究的进展进行了综述(IF = 11.876, https://doi.org/10.1039/D0NP00043D)。该文章结合本团队的研究经验,在总结理论方法和分析文献案例的基础上,提出了一系列研究建议,拟在数据科学家和药物研究者之间架设一道有效沟通的桥梁。
天然产物是药物分子的重要来源,但其结构发现具有“偶然性”,生物活性探索具有“随机性”,限制了天然产物的活性发现和深入研究。机器学习算法通过对现有天然产物的分子结构、理化性质和生物活性数据进行分析,建立天然产物活性的预测模型。与传统方法相比,机器学习方法并不根据已有知识对结构-活性关系进行预设,而是从数千个描述符中筛选出高度相关的参数,可以发现非线性的规律。在天然药物活性研究中引入机器学习方法的文献数量逐年递增,但仍然受到一些因素的制约,例如缺乏高整合度和标准化的数据库等。该团队于2018年开始首次针对抗炎活性的天然产物开展了系统性的化学信息学研究(J. Chem. Inf. Model. 2019, https://doi.org/10.1021/acs.jcim.8b00560),并在此基础上开展基于机器学习和网络分析的天然产物活性-靶标预测方法及应用研究。
教育部自然资源药物化学重点实验室张芮菡副研究员为论文的第一作者,肖伟烈研究员为通讯作者。该项目得到教育部重点实验室、化学科学与工程学院、云南大学双一流建设“分子与生命学科群”、云南省天然产物转化与应用重点实验室、中缅联合实验室平台及部门的支持;以及得到国家自然科学基金、云南大学-云南省科技厅“双一流”联合项目、省创新团队、省应用基础研究计划等项目经费的支持。
教育部自然资源药物化学重点实验室 供稿
(编辑:李哲)