人工智能的又一次胜利——AI与合成生物学的结合

21世纪是多元化的世纪,被称为生命科学及信息化的时代,其间诞生的合成生物学、人工智能等学科引起了各国政府和国内外学者的广泛关注。人工智能与合成生物学的结合,一方面是为了促进智能、全自动一体化的生物合成流程的形成;另一方面是为了推动人工智能向更深层次的方向发展,即将人工智能从日常生活的运用发展成科学研究的应用。人工智能与合成生物学的结合将在健康医疗、生物医药、复杂信号感知与识别、高性能仿真与计算等领域实现颠覆式的产业应用。





何为AI?何为合成生物学?


人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,是一个总括术语,包含了计算机科学的几个不同应用,大体上可以分为三类应用程序:
(ⅰ) 机器学习(Machine Learning),主要表现为通过程序员设置的算法来分析已知特定结果的数据的监督学习、通过算法分析未知结果的数据的分析以及测评算法本身的准确性的强化学习的三种形式;
(ⅱ) 深度学习(Deep Learning),是一种“人工神经网络”,主要表现为模仿人脑处理信息和做出决策,识别已知或未知的信息;
(ⅲ) 认知计算(Cognitive Computing),代表一种全新的计算模式,包含信息分析、自然语言处理和机器学习领域的技术创新,能够以更加自然的方式与人们进行交互。
以一部智能手机为例,它是一款AI产品,能通过算法分析你平时浏览的信息数据,并在你下一次使用时向你推荐相关类似的信息,这是一种机器学习的表现;平时使用的指纹解锁、脸部识别是智能手机的多种功能之一,而这种功能就是利用深度学习所表达出来的一种结果;除了识别外,语音助手也是智能手机的一类特色,如Siri、小爱同学等,都可以让使用者可以更自然地与手机进行互动,这就是认知计算的一种结果。与智能手机同理,将AI与合成生物学结合,能够创造出更多具有价值的产品。
合成生物学(Synthetic Biology)就是以人工手段制造生物系统——人工生物系统,从最基本的要素开始一步步建立零部件,最后让它们像电路一样运行。合成生物学的主要研究内容分为三个层次:
(ⅰ) 是利用现有的天然生物模块构建新的调控网络并表现出新功能;
(ⅱ) 是采用从头合成方法人工合成基因组DNA;
(ⅲ) 是人工创建全新的生物系统乃至生命体。
基因测序、基因合成以及基因编辑技术的加速发展为合成生物学领域的研究奠定了坚实的基础;而计算机、大数据、先进制造及自动化等AI技术为合成生物学的应用插上了腾飞的翅膀。



AI与合成生物学结合的趋势越发明显

随着AI和大数据时代的到来,深度学习技术在复杂对象的特征表征、多模态融合、样本自动生成等问题中表现出独特的优势,为生物分子的设计提供了新的可能。
今年2月,澳大利亚研究人员在《EMBO Reports》期刊发文指出生命科学与信息科学融合产生的未来场景,可被看作生物信息的未来,提出了结合合成生物学及AI领域的生物铸造厂(Biofoundries)的概念,其中包含了五项内容:
(ⅰ) 弹性社会(Resilient Societies),即加强伦理、公正和包容的社会创新组成;
(ⅱ) 健康人群(Healthy People),即关注健康结果、综合保健与健康的研究;
(ⅲ) 安全星球(Secure Planet),即维持人们相互依存的世界,并探索人们在宇宙中的位置;
(ⅳ) 繁荣经济(Prosperous Economies),即以可持续方式提高经济生产力并促进繁荣的能力;
(ⅴ) 创新技术(Innovative Technologies),即合成生物学和人工智能进一步发展的技术、系统、设计和实践等。
今年5月,国际学术期刊《Nucleic acids research》在线发表了清华大学汪小我副教授课题组的研究论文《基于深度生成式模型的大肠杆菌合成启动子设计》。该研究首次采用人工智能方法设计产生全新的基因启动子,为生物调控元件的设计和优化提供了崭新的手段。
世界上将AI与合成生物学结合的应用还有很多,根据Simon Smith于BenchSci博客上发表的帖子可知,目前至少有230家在药物研发中使用AI的初创企业,他们利用AI在合成生物学领域进行不断地尝试:有些企业通过AI收集相关合成生物学数据、提取文献资料中的因果联系,以此来分析、评估研究的发展方向、重点产品等,如Elucidata Corporation、Causaly、Biorelate等;还有些企业通过AI对疾病模型进行化合物测试,并以此来筛选有效的药物,如Recursion Pharmaceuticals、Pharnext、Lantern Pharma等;但更多的企业是将AI用于基因组的创新创造,以此来开发更多全新的化合物,如Atomwise,这是第一家将机器学习应用于药物设计和发现的企业,其首席执行官AbrahamHeifets博士提到Atomwise的算法可以虚拟筛选的小分子化合物的数量几乎没有限制,他们已经筛选了120亿个分子,大多是自然界中不曾存在过的,Heifets博士断言,这些理论化合物的可用性正在迅速增加,在将来一定能够发挥出较好的效用。



将AI与合成生物学结合存在的难点


不论是AI还是合成生物学都还处于发展阶段,并不是两个非常成熟的领域,因此这可能会导致二者之间的深度联系较难被发掘,甚至还可能影响到本身的发展。

将AI与合成生物学结合需要大量的数据支持,包括各类研究信息、文献资料等,单从数据结合这一方面考虑,就可以感受到工程量的巨大,更何况很多的数据信息属于商业机密亦或是专利保护的范围,很难通过合理的途径将数据信息结合。

AI本身的算法严谨与否也影响着AI与合成生物学的结合成果,若是不够严谨,就会导致AI导出结果的可信度降低,那么利用其去促进合成生物学发展的构思也就失去了意义。

因此,在重视AI及合成生物学本身发展的同时,还要注意二者结合中存在的不足之处,努力将其改进,才能更好地利用两者的结合成果。


结语

虽然AI与合成生物学的结合仍然存在较为棘手的难点,但是从目前对它的研究可以看出在将来这样的系统也许可以在细胞内工作,帮助回答生物问题或是诊断疾病。如果一个生化过程能够对其它分子的存在做出智能响应,它将会允许研究人员制造出日益复杂的化学物质,或者搭建出新的分子结构。同时脱离科技应用的理念,这些系统的设计也可以让我们间接认识到思维的进化过程。



参考资料:

1.https://blog.benchsci.com/startups-using-artificial-intelligence-in-drug-discovery
2.Jd R E W , Jd G H J , Jd A B S . Artificial Intelligence in Biotechnology: A Framework for Commercialization 1[J]. Biotechnology Entrepreneurship (Second Edition), 2020:419-427.
3.Oliveira A L . Biotechnology, Big Data and Artificial Intelligence[J]. Biotechnology Journal, 2019.

封面:源自网络图片的裁剪组合

(文章内容译自上述参考资料,同时对其内容进行了一定的简化、补充,若有不足之处,欢迎指正


唯铂莱 唯铂莱官方网站