诊断与监测
AI在医疗健康领域的第三个重要的应用是基于医疗大数据的诊断、预测和健康监测。医疗诊断的挑战在于:第一,人体是一个复杂的系统;第二,所谓“同一种疾病”其实在每个个体身上都有很大的不同,例如当一个患者血糖高时,可能影响到心、肝、脾、肺、肾、胰腺等多个器官,不同的患者影响不同。即使是很有经验的医生也很难考虑得很周全,特别是优质医疗资源紧张的地方,例如中国的北京、上海等地,门诊医生能花在每个患者身上的诊断时间只有几分钟,医生只能根据经验和患者的情况做一个大致的疾病分类判断,而基于人工智能的诊断可以做精细化的诊断。第一步是收集整理患者的数据,包括各类化验和检查结果、患者主诉和医生判断。将这些数据整理和清洗(剔除明显错误或无关数据)后,将各类病症的相关性整理出来。图5.11是硅谷AI医疗诊断公司CloudMedx关于各种疾病症状之间的相关图。图中的每一个节点都是某类特定患者(特定性别、年龄、种族等)的某种症状。节点之间的连线是两种症状之间的相关性,收集的患者数据量越大,节点就越多,相关性就越准确。这种超级相关图就可以是深度学习里面的用于训练机器模型的已标注数据。一旦一个新的病例数据输入机器中,机器就可以马上根据已有的数据做出一个比有经验的医生还准确的判断。
图片来源:CloudMedx Inc.。
同样的原理也适用于疾病的预测和预防。医生有很多工具预测患者的健康状况,但他们也经常被人体复杂性所难倒,尤其是心脏病发作是很难预料的。现在,科学家已经证明能够运用人工智能实现比标准的医疗指南更有效的预测,能大大提高预测的准确率。目前,各国的科学家已经在大脑疾病、心脏疾病、慢性病、心脏病、骨关节疾病、流行病等的预测研究上取得较好的成果。随着这些方法的进一步成熟和落地,每年可以挽救数百万人的生命。
每年有将近2 000万人死于心血管疾病,包括心脏病、中风、动脉阻塞和其他循环系统功能障碍。许多医生使用类似美国心脏病学会/美国心脏协会(ACC / AHA)的指南预测这些病例。这些指南基于年龄、胆固醇水平和血压等八个风险因素,经过医生有效叠加进行预测。但这种方式太简单了,不能涵盖患者可能使用的许多药物,或者其他疾病和生活方式等因素。并且一些因素的影响是违反人类直觉的。英国诺丁汉大学的流行病学家斯蒂芬·翁(Stephen Weng)说:“生物系统中有很多因素相互影响。在某些情况下,大量的脂肪实际上可以预防心脏病。”翁和他的团队使用了四种机器学习算法,以便发现病历记录和心血管疾病之间的关联,他们基于英国378 256名患者的电子病历训练了人工智能模型。与ACC / AHA指南不同,机器学习方法考虑了22个影响因素,包括种族、关节炎和肾脏疾病等。利用2005年的记录数据,他们预测在未来十年内哪些患者会有第一次心血管发病事件,并对2015年的记录进行预测。四种机器学习方法的表现明显好于ACC/AHA指南,通过AUC的统计方法(得分为1意味着100% 的准确率),ACC/AHA指南得分是0.728。这四种机器学习方法的得分介于0.745~0.764。最好的一个神经网络比ACC/AHA方法准确率高7.6%,并且它减少了1.6% 的误报,在大约83 000条记录的测试样本中相当于可以多挽救355名患者的生命。翁说这是因为预测结果可以通过降低胆固醇的药物或改变饮食来预防。这个研究发现,机器学习算法认定的最强预测因素没有被ACC /AHA指南囊括,例如严重的精神疾病和口服皮质类固醇。同时,ACC/AHA列表中没有一种算法将糖尿病列入前10名预测指标。翁希望在后续的研究中算法能包含其他生活方式和遗传因素,以便进一步提高其准确性。
另一个通过人工智能预测心脏疾病的研究机构也取得了很好的效果。英国医学研究委员会下的MRC伦敦医学科学研究所称,人工智能软件通过分析血液检测结果和心脏扫描结果,可以发现心脏即将衰竭的迹象。研究人员发现肺内血压的增高会损害部分心脏,大约1/3的患者会在确诊之后的五年内死亡。目前的治疗方法主要是直接将药物注射到血管以及肺移植,但是,医生需要知道患者还能活多久,以便选择正确的治疗方案。研究人员在人工智能软件中录入了256名心脏病患者的心脏核磁共振扫描结果和血液测试结果。软件测量了每一次心跳中,心脏结构上标记的3万个点的运动状况,把这个数据与患者八年来的健康记录相结合,人工智能软件就可以预测哪些异常状况会导致患者的死亡。
人工智能软件能够预测未来五年的生存情况,预测患者存活期只有一年的准确率大约为80%,而医生对于这个项目的预测准确率为60%。
目前世界上超过5亿人患有不同的肾脏疾病,但是全社会对于慢性肾病的知晓率不足10%,因为慢性肾病早期没有明显的症状,很容易被忽视,很多患者等到肾功能恶化时才去就医,因此肾病分级预警是一件很急迫的事情。华南农业大学食品学院的研究员曾经基于人工智能对肾小球过滤进行预测,通过神经网络构造了预测模型,从而最终构建出一个实用性良好的慢性肾病分型预警模型。
医疗健康诊断和预测是一个典型的暗知识案例。一个疾病的原因非常复杂,每个病人的身体情况和病史又都不同。人生活在一个超级复杂的环境中,环境中的所有因素都对人的健康有影响。过去的医疗教育是把这些非常复杂的情况大大简化,编写成各种教科书和指南,但这些明知识根本无法覆盖所有的情况,所以一个好的医生主要是通过多年实践掌握了大量的默知识。但由于人体的复杂性,每个医生掌握的默知识只是一点皮毛,无论是广度和深度都远远不够。只有机器学习才能系统地通过数据挖掘出大量复杂的,医生通过自己经验和理解都无法触及的暗知识。这些数据不仅包括病人的数据,也包括生物、药理、生理、气候、环境等数据,机器能在这些复杂的数据中找出隐蔽的相关性。机器将发现越来越多的医疗健康方面的暗知识,这不仅将从根本上改变未来的医疗诊断,也将深刻影响未来的医学教育和医生培养。
本书评论