RaReTIA : transformer le diagnostic des rétinopathies pigmentaires grâce à l’IA et aux données de santé

Pourriez-vous vous présenter brièvement, votre parcours, votre carrière, et ce qui vous a amenée à travailler sur ce groupe de pathologies ?

Hélène Dollfus : A l’origine, je suis ophtalmologiste, puis je suis devenue généticienne. Je suis cheffe du Service de Génétique médicale des hôpitaux universitaires de Strasbourg et dirige aussi une unité mixte de recherche Inserm-Université Strasbourg à laquelle le projet est affilié. Je pilote également un centre de référence Maladies rares consacré aux maladies génétiques rares de l’œil, et pilote le réseau français des centres de référence dédiés aux maladies sensorielles (la filière de santé maladies rares SENSGENE), qui inclut ces maladies rares en connexion avec tous les centres Maladies Rares sur le territoire. Et enfin, je coordonne un réseau européen de référence qui s’appelle ERN-EYE.

Pourquoi s’intéresser aux rétinopathies pigmentaires ? Parce que ce groupe de maladies génétiques dégénératives est la cause la plus fréquente des maladies rares de l’œil. Dans notre activité, au moins 60 % des patients ont ce qu’on appelle une « dégénérescence héréditaire de la rétine ». Ce sont des maladies qui se définissent par une dégénérescence progressive de certaines cellules de la rétine :  les cônes, les bâtonnets et leurs cellules de soutien. Et ces pathologies sont très hétérogènes au niveau génétique, on dénombre plus de 300 gènes connus pouvant être responsables de ces maladies, qui peuvent se manifester par des signes cliniques très variés.

Fond de l’œil d’un patient non atteint

Fond de l’œil d’un patient atteint de rétinopathie pigmentaire

Pouvez-vous nous décrire sommairement les rétinopathies pigmentaires, leurs signes cliniques, leurs évolutions ? Quelle est la prévalence de cette maladie en France ?

H. D. : Cela commence souvent par des difficultés en vision nocturne, puis un rétrécissement du champ visuel, des difficultés pour la vision des détails et les couleurs. Le stade ultime atteint par un certain nombre de patients est la cécité. Ce qu’il est important de savoir, c’est que non seulement les formes génétiques, c’est-à-dire les modes de transmission, sont nombreuses, mais aussi les formes cliniques, les différentes catégories de dystrophie héréditaire de la rétine, c’est-à-dire ce qu’on observe au niveau du fond d’œil. Il s’agît de la cause la plus fréquente de consultation dans des centres de référence maladies rares dédiés aux maladies rares de l’œil, à Strasbourg, dans tous les centres français, mais aussi dans les centres européens. Pour autant, ce sont des affections qui connaissent pour le moment très peu d’options thérapeutiques. Il existe une thérapie génique de remplacement sur le marché, le voretigène néparvovec (Luxturna) qui adresse le gène RPE65. Ensuite, il y a beaucoup d’essais cliniques, mais pour le moment il n’existe pas de thérapie systématique.  Nous avons identifié là un vrai besoin à la fois d’identifier les patients, de poser un diagnostic, à la fois clinique et génétique, et de mieux connaître l’histoire naturelle de ces maladies.

En France, on estime que 30 000 personnes seraient atteintes de RP, soit une prévalence d’environ 1/4000 naissances. L’errance diagnostique de cette pathologie est due à sa chronicité et à sa progressivité. Ce qui fait que l’on tend parfois à diagnostiquer les patients à des stades assez avancés, un enfant peut mettre du temps réaliser que son champ visuel se réduit par exemple.

Votre projet est lauréat de l’appel à manifestation d’intérêt des programmes d’investissements d’avenir, désormais intégrés à France 2030, « Accélérer la recherche et l’innovation sur les maladies rares grâce aux bases de données scientifiques » et a reçu un financement d’1,335 M€. Pourquoi avoir déposé à cet appel en particulier pour adresser ces pathologies ?

H. D. : En fait, plusieurs facteurs nous y ont conduits dans un contexte de développement des entrepôts de données de santé et de développement des outils d’intelligence artificielle, notamment appliquée à l’imagerie médicale. Le diagnostic en ophtalmologie se base beaucoup sur les images, celles du fond d’œil, mais aussi l’OCT (Tomographie à Cohérence Optique), un examen permettant de voir en coupe les couches de la rétine ou l’autofluorescence, qui donnent des indications sur les types et les sous-types de dystrophie rétinienne.

En parallèle, on dispose d’un grand nombre de données concernant tous les gènes impliqués et toutes les différentes mutations connues. On a donc une accumulation de données sur lesquelles il va falloir travailler dans les années à venir, non seulement pour générer de la connaissance, mais aussi pour avoir une meilleure classification de ces affections, un meilleur suivi des malades et une meilleure distinction des patients qui peuvent bénéficier de telle ou telle thérapie, une meilleure connaissance de l’histoire naturelle, etc. Notre objectif à terme serait de pouvoir identifier le plus tôt possible les patients.

Cet appel à manifestation d’intérêt sur les bases de données est tombé à point nommé. Cela faisait des années qu’on ressentait le besoin d’outils pour collecter dans des entrepôts de données, au niveau de tous nos centres et de manière structurée, les images et les informations concernant les malades, afin de pouvoir ensuite faire de la recherche.

Pouvez-vous décrire le projet RaReTia ? 

H. D. : RaReTia a pour objectif la création ex-nihilo, au sein de France Cohortes, d’un entrepôt de données de santé (en prospectif et rétrospectif) de patients atteints de rétinopathie pigmentaire (RP). L’ambition est de collecter des données de 2000 patients sur 2 ans avec des données génétiques et cliniques, des images, et d’intégrer les différentes données pour développer des outils d’aide au diagnostic, d’aide à la détection précoce d’une RP, d’aide à la classification, gradation et de prédiction notamment avec l’aide de l’intelligence artificielle. Ce projet est divisé en deux phases : la phase I, initiée en septembre 2022, constitue la mise en place de l’entrepôt de données de santé FREDD (French Rare Eye Diseases Database), la phase II permettra de débuter son exploitation. Durant la phase II, deux projets de recherche vont avoir accès aux données afin d’alimenter plusieurs algorithmes d’intelligence artificielle.

Où en sont vos travaux en cours à mi-parcours du projet ?

H. D. : Parmi les travaux en cours, nous élaborons un très vaste et ambitieux travail de classification des images et d’harmonisation de leur sémiologie. Il y a en effet une grande variabilité du vocabulaire qui entoure historiquement la description des images. C’est un effort que l’on fait au niveau européen au travers d’un travail de structuration de l’annotation des images qui recourt à différentes technologies comme des numéros qu’on appelle Human Phenotype Ontology (HPO) par exemple. Cette phase d’harmonisation et de standardisation est cruciale et se stratifie à l’échelle nationale et internationale avec le réseau ERN-EYE.

Un second travail concerne le pilote d’intelligence artificielle pour l’aide au diagnostic des rétinopathies pigmentaires que nous allons développer. Les questions sont encore nombreuses. Qu’est-ce que la machine va parvenir à reconnaître, à discriminer à partir des images ? Par exemple, un des challenges serait de pouvoir demander à la machine de déduire le gène impliqué lorsqu’elle observe une image de fond d’œil. Est-ce que la machine arrivera à poser le diagnostic et est-ce qu’elle parviendra à identifier le sous-type diagnostique ?

Bien sûr, il n’est nullement question ici de remplacer les médecins par les machines, nous visons surtout une aide au diagnostic – par exemple dans des pays sous-dotés en médecins ou sous-dotés en spécialistes – une aide à la classification des maladies, une aide pour faire de la recherche. Il va de même falloir entraîner les outils et récolter des images. On est actuellement en passe d’entrer dans cette phase de récolte. On sait que l’intelligence artificielle demande beaucoup de statistiques. Un des gros enjeux de ce projet est d’avoir une base propre, interopérable, que l’on puisse connecter aux différents entrepôts qui contiennent des informations sur les maladies rares de l’œil. Et pour cela, il faut que l’on parle tous le même langage. Il y a donc un énorme travail en amont pour créer cet entrepôt, pour le rendre ensuite opérationnel et le rendre efficace pour en exploiter toute la puissance. A son lancement, sur des bases robustes et solides au niveau national, nous aurons une phase de communication notamment à travers le site internet, obligatoire au niveau réglementaire, qui sera lancé conjointement. Il faut que les patients puissent être au courant de l’utilisation de leurs données et qu’ils puissent éventuellement s’opposer à leur utilisation.

Il s’agit donc d’un projet à la croisée de l’informatique et de la médecine, comment avez-vous construit son consortium ?

H. D. : Nous avons la chance d’avoir des collaborateurs et des laboratoires exceptionnels au sein d’un consortium multidisciplinaire qui va de la médecine à l’intelligence artificielle en passant par le traitement de l’image. Tout d’abord, sur Strasbourg, une équipe de ICube  travaille sur le traitement global des images avec la plateforme IRIS sous la responsabilité de Vincent Noblet. Nous travaillons également avec un deuxième laboratoire situé à Brest, celui du docteur Lamard, qui avait l’avantage d’avoir déjà travaillé sur la rétinopathie diabétique, une maladie commune, et d’avoir développé des outils d’intelligence artificielle. Nous avons intégré une équipe de bio-informatique, des systèmes informatiques, de l’étude des systèmes complexes qui est celle d’Olivier Poch de ICube du CNRS. Bien sûr, à cela s’ajoutent toutes les équipes cliniques, les centres cliniques du territoire et notre unité Inserm qui héberge le projet. Enfin, nous avons une cheffe de projet pour coordonner tout cela, Camille Marin.

Par ailleurs, le projet nécessite un important travail réglementaire. Les entrepôts de données de santé sont des objets assez nouveaux dans l’écosystème. Habituellement, le suivi de cohortes se fait avec des bases de données qui sont vraiment spécifiques à la cohorte. La base existe le temps du projet de recherche pour une durée de plus ou moins quatre ou cinq ans. Tandis qu’un entrepôt de données est censé être pérenne dans le temps. En cela, ce sont vraiment des objets très spécifiques puisque les patients peuvent potentiellement y voir leurs données conservées pendant 20 ans. En termes de sécurité, ils sont encadrés par une réglementation très spécifique au niveau de la CNIL et assez nouvelle. Ce sont donc des bastions très complexes à mettre en place au niveau réglementaire, administratif, éthique ; la sécurité des données des patients étant la priorité absolue.

Quels seront, à terme, les impacts possibles de vos travaux pour les malades, le parcours de soins, les traitements ?

H. D. : Quatre ans, c’est très court. Nos travaux ne vont pas impacter tout de suite le parcours de soins. Cependant, ce qui est important pour les malades, c’est la communication autour du projet. On va les informer par exemple dans les salles d’attente que cet effort national collectif est en cours. Je pense que c’est important parce que, souvent, les malades ont besoin de faire partie d’une communauté. Il y a des associations de patients très dynamiques, notamment l’association Retina France, qui fait partie de Retina International. La majorité des patients atteints par les maladies rares veulent participer à la recherche. C’est très important pour eux de savoir que leurs images vont servir collectivement à améliorer la connaissance.

A terme, dans le temps long, ces outils d’aide au diagnostic pourront peut-être aider les ophtalmologues libéraux pour la prévention et le dépistage, à mieux reconnaitre les signes cliniques et adresser le cas échéant les patients à un centre de référence. Autre exemple, un outil d’intelligence artificielle pourrait un jour permettre d’identifier et sélectionner des sous-groupes de malades qui pourraient être éligibles pour des essais cliniques.

La partie 2 du projet, axée sur l’exploitation des données récoltées, s’appuie sur des approches de radiomique et de fouille de données pour prédire les corrélations phénotype-génotype. Pouvez-vous expliquer plus précisément en quoi cela consiste dans le cadre du projet ?

H. D. : La radiomique consiste à mettre en corrélation un grand nombre de paramètres quantitatifs extraits d’images radiologiques (des éléments d’intérêt qui servent au diagnostic, générés par l’annotation des médecins), à la réalité clinique et biologique. Il s’agit ensuite de mettre en corrélation ces termes pour comprendre lesquels sont liés entre eux, ou liés à un certain gène. C’est ce qu’on appelle les « graphes de données » où chaque élément va être lié à un autre par un point, la relation entre les points étant représentée par une arrête. Ce sont des outils extrêmement performants pour les usages de l’intelligence artificielle. Ainsi, à partir des connaissances biologiques, le gène, la « voie biologique » et ce qu’on observe en clinique, il est possible d’établir des réseaux de connaissances qui permettent ensuite de tirer des conclusions, des tendances, des relations. La corrélation phénotype-génotype, c’est aussi cela : c’est un gène va s’exprimer et donner ce qu’on appelle un phénotype, c’est-à-dire l’ensemble des traits observables d’un organisme.

Exemple de graphe de concepts

Pouvez-vous nous dire quelques mots sur vos attentes concernant le 4ème plan national Maladies Rares (PNMR), prochainement annoncé par l’État ?

H. D. : D’une manière générale, ce que l’on souhaite, c’est l’interopérabilité maximale pour la saisie et l’utilisation des données. C’est-à-dire, que l’alimentation de l’entrepôt soit la plus efficace possible et qu’il y ait le plus de ressources à cette fin, notamment des ressources humaines, des ressources techniques d’interopérabilité, etc. Car l’un des écueils sur lesquels on risque de buter est une mauvaise ou une absence d’alimentation des entrepôts par carence en alimentation de données. Notre souhait, c’est que des moyens soient alloués aux hôpitaux, pour s’assurer que les données récoltées soient de quantité et de qualité suffisantes afin que la recherche qui en découle soit qualitative. Un soutien fort de l’état français sur ces entrepôts, véritable richesse nationale, sera nécessaire pour que l’on ait le temps de travailler sur ces sources, sur ces données, et continuer à collecter, à élargir les collectes, etc. On appelle donc de nos vœux de futurs appels à projets, de futurs financements, permettant des recrutements afin que des personnes expertes dotées d’outils performants puissent continuer à faire fleurir ce domaine.

En savoir plus :

A new French Rare Eye Diseases Database (FREDD) for Retinitis Pigmentosa phenotype/genotype research: RaReTiA a pilot Artificial Intelligence project

https://francecohortes.org/cohortes-associees/cohortes-projets-maladies-rares-ami

https://www.sensgene.com

Centre de référence pour les affections rares en génétique ophtalmologique – Les Hôpitaux Universitaires de Strasbourg (chru-strasbourg.fr)