Lien de l’article source : https://erictopol.substack.com/p/the-amazing-power-of-machine-eyes
Le rapport d’aujourd’hui sur l’IA des images des vaisseaux rétiniens pour aider à prédire le risque de crise cardiaque et d’accident vasculaire cérébral, provenant de plus de 65 000 participants de la UK Biobank, renforce un ensemble croissant de preuves que les réseaux neuronaux profonds peuvent être entraînés à “interpréter” des images médicales bien au-delà de ce qui était prévu. Cette découverte s’ajoute à l’étude multinationale de la semaine dernière sur l’apprentissage profond des photos rétiniennes pour détecter la maladie d’Alzheimer avec une bonne précision.
Dans ce billet, je vais passer brièvement en revue ce qui a déjà été glané à partir de deux images médicales classiques - la rétine et l’électrocardiogramme (ECG) - pour illustrer la capacité passionnante de la vision artificielle à “voir” bien au-delà des limites humaines. Bien sûr, les machines ne voient ou n’interprètent pas vraiment et n’ont pas d’yeux au sens humain du terme, mais elles peuvent être entraînées à partir de centaines de milliers (ou de millions) d’images pour produire des résultats extraordinaires. J’espère qu’après avoir lu ces lignes, vous conviendrez qu’il s’agit d’une avancée particulièrement frappante, qui n’a pas encore été mise en pratique dans le domaine médical, mais dont le potentiel est énorme.
Tout d’abord, un point sur l’apprentissage profond à partir de la rétine. Nous aurions dû savoir, il y a quelques années, que la rétine recelait quelque chose de riche (j’ose dire de révélateur) que les humains, y compris les spécialistes de la rétine, ne pouvaient pas voir. Alors qu’il existe des moyens bien plus simples de déterminer le sexe d’une personne, les ophtalmologistes sont partagés entre les deux, ce qui signifie qu’il n’existe aucun indice visible pour les yeux humains. Mais aujourd’hui, deux modèles ont montré une précision de 97 % dans la détermination du sexe à partir de l’entraînement du réseau neuronal. Ce n’était qu’un début.
Bien sûr, les modèles d’IA se sont avérés très utiles pour détecter les maladies oculaires, comme la rétinopathie diabétique. Mais il s’agit ici d’indirects, de choses pas si évidentes. Ces travaux se sont étendus à la détection des maladies rénales, au contrôle de la glycémie et de la pression artérielle, aux maladies hépatobiliaires, à une étude antérieure sur la prévision des crises cardiaques, à une corrélation étroite entre les vaisseaux rétiniens et le score calcique des artères cardiaques (coronaires) et, avant le nouveau rapport ci-dessus, à l’évaluation prospective et au suivi de la maladie d’Alzheimer (“AlzEye”, Moorfields Eye Institute, Royaume-Uni, dirigé par le professeur Pearse Keane).
La quasi-totalité de ces travaux ont été publiés au cours des deux dernières années, et on ne sait pas ce que les machines peuvent encore voir qui serait invisible pour les yeux humains. C’est là que réside le potentiel futur de la prise d’une photo de votre rétine via votre smartphone (idéalement sans avoir à dilater vos pupilles) pour obtenir une lecture précise de nombreux systèmes et fonctions organiques de votre corps.
Passons maintenant à l’ECG. En tant que cardiologue, je les lis depuis plus de 35 ans et j’aime ça, reconnaître rapidement des schémas comme des anomalies du rythme, une hypertrophie du cœur, une tension basse ou une péricardite. Mais je ne suis pas de taille face aux yeux de la machine. Voici la première récolte de rapports d’ECG par apprentissage profond qui m’a surpris. Je ne pourrais jamais estimer l’âge ou le sexe d’une personne, ni son taux d’hémoglobine, en regardant un ECG, et il serait difficile de parvenir à une évaluation précise de la fraction d’éjection d’une personne, la principale mesure utilisée pour le fonctionnement de la pompe cardiaque.
Mais ce n’est pas tout. Récemment, des réseaux neuronaux profonds d’ECG ont été entraînés à détecter les maladies valvulaires, le diabète, à prédire la fibrillation auriculaire qui présente un risque d’accident vasculaire cérébral, et à prédire assez précisément la pression de remplissage (coin capillaire pulmonaire) du ventricule gauche (la principale chambre de pompage du cœur).
Pour la rétine et l’ECG, aucune de ces capacités de vision artificielle n’a été mise en pratique, à une exception près : la fraction d’éjection. La Mayo Clinic a réalisé un essai aléatoire avec des médecins de soins primaires, en donnant à la moitié d’entre eux la lecture automatique améliorée et à l’autre groupe, la lecture automatique standard, qui servait de contrôle. La précision de la détection des patients ayant une faible fraction d’éjection a été améliorée et ce système de santé fournit désormais ces sorties d’apprentissage profond de manière routinière. La sensibilisation aux diagnostics difficiles, tels que la cardiomyopathie amyloïde ou hypertrophique, est également intégrée aux interprétations d’ECG de pointe de Mayo.
J’utilise la rétine et l’ECG comme exemples, mais le pouvoir des yeux de la machine s’étend à pratiquement toutes les formes d’images médicales qui ont été évaluées à ce jour. Pour les gastro-entérologues, de multiples essais randomisés ont montré que la vision artificielle en temps réel permettait de mieux détecter les polypes que les yeux humains experts. Pour les pathologistes, il y a la capacité d’extraire des caractéristiques cachées sur des lames numérisées (imagerie de lames entières), comme dans le cas du cancer, pour déterminer les mutations motrices, les variations génomiques structurelles, l’origine primaire de la tumeur, la réponse probable à la thérapie et le pronostic, autant d’éléments qui ne peuvent être vus par les pathologistes, et qui sont joliment examinés ici. Je pourrais continuer à donner d’autres exemples, mais je vous en épargne la lecture !
Maintenant, avec de telles avancées, il faut reconnaître les mises en garde et les limites. À l’exception des quelques essais randomisés mentionnés (ECG et coloscopie améliorés), tous ces rapports sont basés sur des analyses rétrospectives. Bien que celles-ci soient utiles, l’analyse in silico d’ensembles de données complets et “nettoyés” est très différente de l’évaluation prospective dans le monde réel de la médecine clinique. En conséquence, les résultats des rapports rétrospectifs doivent être considérés comme générateurs d’hypothèses et doivent être confirmés par des essais cliniques prospectifs et/ou randomisés.
L’autre préoccupation est la focalisation sur l’homme contre la machine, qui est une excroissance du monde de l’IA remontant bien avant que Garry Kasparov n’affronte Deep Blue aux échecs en 1997. S’il est convaincant que les machines “voient” des choses que les cliniciens experts ne peuvent pas voir d’après de multiples études, il n’y a pas eu d’évaluation de ce qui est manqué par les machines, mais détecté par les humains. Dans la pratique médicale, le contexte de la consultation du patient, l’examen des dossiers et bien d’autres contextes constituent un avantage important qui n’est pas actuellement intégré dans la vision artificielle des images médicales. C’est une partie de l’application de l’IA multimodale, que mes collègues et moi-même avons récemment examinée dans Nature Medicine, la prochaine frontière de l’IA intégrant de multiples couches de données provenant de sources disparates.
N’oubliez pas que les images sont le point fort de l’apprentissage profond, et que nous sommes encore plus en retard, notamment en médecine, pour ce qui est de disposer de capacités similaires pour la parole et le texte. Mais les progrès récents et rapides des modèles de base en dehors des soins de santé, qui traitent plus d’un trillion de paramètres, et qui apparaissent maintenant dans les sciences de la vie, vont sans aucun doute accélérer ces perspectives.
En résumé, je pense qu’il s’agit là d’un domaine très intéressant de la médecine, qui laisse libre cours à l’imagination quant à ce que les machines peuvent voir et finiront par apprendre à voir - penser grand. Ce bref résumé me permet également de revenir au domaine qui m’intéresse au premier chef plutôt que de m’attarder sur la covidologie, alors qu’il y a, pour l’instant, une accalmie dans le niveau de menace des virus en circulation. En fait, je me réjouis de ne plus avoir à couvrir la covidologie à l’avenir et d’écrire beaucoup plus sur les aspects passionnants de la biomédecine.
Commentaires récents