AI医疗应用重要突破登Nature，自我监督学习解决数据难题

时间：2023-10-05 23:51:14编辑：科技君

智东西9月14日消息，研究人员开发了一种AI模型RETFound，它能够根据人们的视网膜图像来诊断和预测多种健康状况的患病风险，并且较以往的模型更节约成本、更快速也更精准。相关研究论文已登载Nature。

RETFound的特殊之处在于，它是使用一种类似于训练大语言模型的自我监督学习的方法开发的。RETFound可以使用未标记的数据进行初步训练，从而减少训练所需的数据标记数量，节约成本、提高疾病检测速度，这或许可以解决医疗AI领域中标签效率不佳一大关键问题。

RETFound在检测眼部疾病、全身性疾病等方面得到了应用，并且检测结果准确度较高。现在，更多的研究人员在探索，将RETFound中的技术应用于更多、更复杂的医学成像。不过，公开RETFound算法也可能带来一些例如道德性、安全性的风险，需要RETFound的研发者注意。

视网膜是人体中唯一可以直接观察到毛细血管网络的部位，并且它也是中枢神经系统的一部分，因此，视网膜可以反应人体的健康情况。伦敦Moorfields眼科医院NHS基金会信托基金的眼科医生Pearse Keane就说：“如果你患有某种会影响身体每根血管的全身性心血管疾病，比如高血压，我们可以通过视网膜图像直接观察到这一点。”

在得到视网膜图像后，人们面临的问题是，有能力解读扫描结果的专家很少，很多时候人们储备的专业知识不足以支撑他们完全解读扫描结果。Keane认为，这种情况就是AI的用武之地。因为AI有着很强的学习能力。

Keane说过，RETFound可以轻松的通过数百万张视网膜图像，掌握视网膜的样子以及视网膜的所有特征。

RETFound基础模型的开发和评估示意图（图源：Nature）

这也意味着研究人员不用再对用于训练的160万张视网膜图像一张张进行分析和标记。研究人员可以用所有的未标记图像对RETFound进行预训练，在RETFound从未标记的图像中了解到视网膜应该是什么样子后，再引入少量的标记图像，例如100张患有帕金森病的人的视网膜图像和100张没有帕金森病的人的视网膜图像，来训练RETFound认识特定的疾病。

今年4月，国际顶级学术期刊Nature Machine Learning上的一篇名为《Improving image labelling quality》的论文中提到，数据标签对于医疗AI领域十分重要，尤其是标签质量直接影响模型性能。缺乏标记数据为智慧医疗领域造成了瓶颈。

现在，英国伯明翰大学研究AI负责任创新的临床研究员刘晓璇（Xiaoxuan Liu）认为，RETFound可以使用未标记的数据来初步训练模型，就在一定程度上解决了这一瓶颈。加州斯坦福大学的医学和成像AI中心（AIMI）的主任、放射科医生Curtis Langlotz也同意这种观点，他说：“高质量的一辆数据标签非常昂贵，因此使用更少的标签做更多的事，提高标签效率，已经成为医疗AI领域发展的关键。”

RETFound在检测眼部疾病，特别是糖尿病造成的视网膜病变方面表现出色。按照评分标准：0.5分表示模型的预测结果不必随机预测好，1分表示模型是每次都能做出准确预测的完美模型，RETFound在检测糖尿病性视网膜病变方面的得分在0.822-0.943之间，具体得分则取决于训练时使用的数据集。

在预测如心脏病、心力衰竭、中风和帕金森等全身性疾病的风险时，RETFound的表现不算惊艳，但仍然比其它AI模型的预测结果要好。刘晓璇称，到目前为止，RETFound是将基础模型应用于医学成像的少数几个成功案例之一。

眼部疾病诊断分类的表现（图源：Nature）

现在，研究人员正在探索开发RETFound所使用的技术还能够应用于哪些类型的医学成像。Langlotz对此认为，例如磁共振图像或计算机断层扫描，如果可以把RETFound的技术应用到这些复杂的三维甚至四维的图像中，将是一件有趣且意义重大的事。

同时，RETFound的开发人员已经公开了这个模型，希望世界各地的人才能够对RETFound进行优化调整和训练，使其适用于不同的患者群体和医疗环境。Keane说：“其他人有可能使用RETFound的算法，并利用他们所在国家的数据对RETFound的算法进行微调，以此获得更适合他们使用的模型。”刘晓璇认为这是一件非常令人兴奋的事。

但刘晓璇也提出了自己的担忧。她觉得，把RETFound作为检测其它疾病的模型的基础是有风险的，因为这样做的话，RETFound中存在的所有缺陷和局限都可能会渗入未来以RETFound为基础构建的模型中。这就需要RETFound的开发者来确保使用RETFound的道德性和安全性，包括透明地公开RETFound的局限性，以实现RETFound成为真正的公共财富。

AI模型RETFound拥有较高的标签效率和较高的疾病检测精度。RETFound可以在使用未标记图像进行预训练后，再导入少量标记图像来掌握与疾病相关的视网膜特征，提高了标签效率。同时，RETFound在检测糖尿病性视网膜病变、全身性疾病等方面的准确度较其它模型更高，有利于医疗AI领域突破瓶颈、提高效率。

RETFound还被研究人员不断探索，试图在更复杂的医学成像中得到应用，如果可行，将更大程度的发展智慧医疗。

未来，RETFound作为基础模型会被如何使用，我们将持续关注。

来源：Nature

上一篇：似乎一夜之间，AI就攻陷了数学

下一篇：《2023AI大模型应用中美比较研究》报告发布：大模型成中美科技竞