发现新药-暗知识：机器认知如何颠覆商业和社会在线阅读

语速1.0: 2.0

进度0:

发现新药

AI在医疗健康领域的第二个重要应用是制药。小分子化合物新药发现的简单原理是找到一种化合物的分子结构能够和要“对付”的生化目标（例如癌症细胞中的某种蛋白质或被病毒攻击的人体正常蛋白质）发生反应，激活或抑制目标蛋白质的某些功能。传统的发现新药的方法是试错，像爱迪生发明钨丝灯泡一样试验成千上万种不同的化合物。但是这种试错法成本极高，因为筛选出一个新药的备选化合物要做大量的实验，还要逐一比较该化合物的有效性和毒副作用等。如图5.10所示，世界大药厂研发一款新药的费用在2010年已经达到26亿美元，今天早已大大超过这个数额。其中临床前阶段超过10亿美元，这10亿美元主要是用于初期的筛选和试错。从大量的化合物中筛选出备选化合物直到最后优化出新药不仅耗资巨大，而且过程长达数年。

不同年代新药的研发成本数据来源

图5.10不同年代新药的研发成本

数据来源：Tufts Center for the Study of Drug Development，CSDD。

在基于深度学习的人工智能成熟之前，新药研发已经广泛使用计算机辅助制药。根据人类已有的生化知识，例如备选化合物以及目标分子结构和特性，计算机可以通过建立模型来模拟化合物和目标蛋白质的生化反应，从而减少实验和缩短时间。传统的计算式新药发现可以说是建立在对分子结构理解基础上的“白箱操作”模式。而基于深度学习的新药发现则是一种“黑箱操作”模式。在“黑箱操作”模式下，计算机并不需要建立化合物的分子结构模型，甚至不需要了解备选化合物及生化目标的特性，而只需要有大量的已有化合物和已研究过的生化目标之间的生化反应数据。用这些已有数据来训练神经网络模型，训练好的深度学习算法可以在很短的时间里从大量不同化合物中筛选出可能有用的备选化合物。这里被筛选的大量化合物也不是随机产生的，完全可以根据人类已有的知识用计算机模型产生那些可能性比较大的化合物。同样的原理，在备选化合物进一步被筛选时，例如进行化合物的生物可利用性、代谢半衰期和毒副作用的实验时，仍然可以用已有的数据进行识别和筛选。

这个原理类似一个有经验的媒婆，当媒婆拿到一个要找对象的小伙子的资料时，媒婆根据小伙子的长相、身高、脾气、职业、收入等在自己的记忆中寻找类似的小伙子成功配对的案例，就能八九不离十地给他介绍一个有希望成功的姑娘。目前硅谷和欧洲已经有几家用深度学习发现新药的公司，如位于旧金山的Atomwise。