医学影像-暗知识：机器认知如何颠覆商业和社会在线阅读

语速55: 80

进度0:

医学影像

AI在医疗健康领域的第一个重要的应用是医学影像诊断。2016年11月，美国FDA（食品药品监督管理局）颁发了第一个医疗AI软件平台的许可。这个软件平台是斯坦福大学校友创办的Arterys心脏核磁共振成像诊断平台。这个平台用1 000个已知图像对模型进行了训练。心脏可以分为17个部分，通过这些部分的影像可以判断心脏是否有问题。要通过FDA批准，这个平台的判断至少要和专业医生一样准确，这个平台可以在15秒内做出判断，而有经验的医生通常需要半小时到一小时，比医生快了200倍左右。

我们知道癌症早期发现的治愈率远远高于中晚期。如果发现得早，那么五年存活率可以达到97%，但如果在最晚期发现，那么五年存活率只有14%。如何让那些不方便看皮肤科医生的人能够最早发现病情就成为关键。美国每年有540万例皮肤癌，2017年初，斯坦福大学AI实验室的Thrun（特伦）教授的博士生开发出了一个可以诊断皮肤癌的AI算法。他们用已经认证过的370张含有恶性皮肤癌和恶性黑色素瘤的图片让算法和21位皮肤科医生的判断相比较，算法在各方面都达到了和医生相同的判断准确度。

中国是全球肺癌死亡率和发病率最高的国家。据测算仅2015年中国就有429.2万新发肿瘤病例和281.4万死亡病例，肺癌是发病率最高的肿瘤，也是癌症死因之首。2015年中国新发47.7万例食管癌，占全球的50%。新增肺癌病例73.33万，占全球的35.8%，中晚期占70%。目前最有效的手段就是筛查，早期诊断和早期治疗能将患者的五年生存率提高到80%以上。

表5.1中国、美国、英国的癌症发病率与死亡率

中国、美国、英国的癌症发病率与死亡率

资料来源：IARC《五大洲癌症发病率》。

肺癌早筛的难点主要是：早期肺癌多表现为肺部结节。它们尺寸小，对比度低，非常容易跟其他的组织部位混淆，患者的CT扫描数量通常超过200层，人工阅片耗时耗力。腾讯公司推出的“腾讯觅影”技术，利用多尺度三维卷积神经网络实现肺部图像的三维分割与重建，结合金标准（指当前临床医学界公认的诊断疾病的最可靠、最准确、最好的诊断方法）病理诊断数据和大量医生标注的结节位置信息，3~10毫米肺结节检测准确率达到95%，肺癌识别率已经达到80%，并且还能通过增强图像与放大片子辅助医生查看。目前，该技术已经与数家三甲医院进行合作。该类技术的逐步商用有望大幅降低癌症患者的发现率和死亡率。

人工智能在早期肺癌筛查中的应用

图5.9人工智能在早期肺癌筛查中的应用

图片来源：腾讯觅影。

表5.2 50例早期肺癌筛查人机对比实验结果

50例早期肺癌筛查人机对比实验结果

资料来源：https://miying.qq.com/official/product/lung。

医疗图像识别比人脸图像识别要困难。例如早期肿瘤的诊断，人体组织是否有病变常常表现为该组织影像的大小、形状、灰度上细微的差别。与人脸图像识别相比较，医疗图像识别的挑战在于病变组织的形状和样态变化非常大。这些变化由下列因素造成。

（1）成像噪音。由于在使用医疗成像仪器时照射剂量和显影剂浓度不同，所以组织的清晰度差别很大。

（2）患者个体差别。患者的身高、体重、器官大小、脂肪厚薄都会影响成像。

（3）患者在成像过程中的姿势、动作和器官活动也会影响成像。

（4）内脏器官的位置，例如器官之间的接触和遮挡会影响成像。

（5）医疗判断的准确性和可靠性要求。与大部分人脸识别不同，医疗图像的判断关乎人命，不可出错。

为了使医疗图像识别更准确，通常借助下列两个办法。

第一，大数据库。美国每年有9 000万张CT片子，训练数据集越大，各种情形就包含得越多。

第二，解剖学和病理学背景知识。所有的医疗图像都来自人体的某一个部分，解剖学和病理学的知识可以帮助识别和判断。但解剖学和病理学知识通常用于基于规则的判断或者是基于病理模型的判断。但这两种方法无法融入神经网络模型，所以只能和神经网络并行使用。当两者判断一致时可以增加神经网络判断的可信度，但当两者判断不一致时，该相信哪一个的判断呢？最后还是需要有经验的医生。

目前的人工智能医疗影像识别判断的主要作用是辅助判断，还不能不经过医生审核签字就直接做判断。但即使是辅助判断，也可以提高读片质量或加快速度。中国的三甲医院每天可能产生上千张各种影像，目前的程序是先由初级医生读片，包括在影像上寻找异常位置、测量和记录，初步判断后把报告交给资深医生审阅再做最后判断。即使医生在每张医疗图片上只花10分钟时间，一名医生8小时不间断读片也只能读48张片子，一天如果有480张片子，则需要10位医生读片。况且在一些国家与地区，为了保证准确度，医生的阅片数量被限定在一定范围内。在三甲医院，有经验的医疗影像（例如放射科）医生远远供不应求。如果人工智能读片能够把时间从原来的10分钟缩短到5分钟，就可以多读一倍的图片。由于医疗成像设备成本快速下降，超声、X光、CT、核磁共振以及PET（正电子发射计算机断层显像）等设备正在广泛普及，医学影像数据大幅度增长。美国的数据年增长率达到了60%，但专业图像医生的增长率只有2%。中国的医学影像增长也达到了30%，而医生的增长只有4%。这意味着医生的工作量大增，判断准确性下降。从影像方面的误诊人数来看，美国的误诊人数达到了1 200万/年，而中国因为人口基数庞大，达到了惊人的5 700万/年，这些误诊主要发生在基层医疗机构。

目前中国优质医疗资源高度集中在大城市。许多县级以下医院虽然都有能力添置更多的医疗影像设备，但严重缺乏有经验的读片医生。如果AI医疗影像诊断能达到有经验医生的水平，那么通过网络上传读片将大大提高中国基层医疗机构对疾病的诊断水平。可以预见，未来基于云服务的医疗影像识别判断将在基层医院的影像识别和判断上发挥主要作用。一旦这样的实验成功，将适用于全世界所有的发展中国家，甚至很多发达国家。

从目前来看，人工智能医疗影像的技术都是从医院体系外部开始的，主要由高科技新创公司提供技术和医院合作。这些公司的后台算法模型和计算能力都大同小异。关键看谁能从医院得到更多以往被验证过的独家数据（即用于训练神经网络模型的“干净”的已标注数据）。这些公司竞争的第二个能力就是业务拓展能力和市场策略（例如专攻三甲医院还是面向基层）。在这个领域未来可能出现一些新的商业模式，例如当技术成熟时设立一家专门的医疗影像识别判断机构，专门为大量的基层医院提供外包服务。这样的趋势也将影响医学院的课程设置和培养学生的方向。