Challenge IA-Biodiv : quand l’intelligence artificielle se met au service de la biodiversité marine
Lancé en 2021, le Challenge IA-Biodiv s’est inscrit dans la stratégie nationale pour l’intelligence artificielle initiée en 2018, et dans le prolongement du rapport Villani, publié la même année, qui identifiait l’environnement comme l’un des grands défis d’intérêt général pour l’IA. Porté par l’Agence Nationale de la Recherche (ANR), en partenariat avec l’Agence Française de Développement (AFD), le Challenge IA-Biodiv a permis de soutenir trois consortiums de recherche réunissant informaticiens, écologues, statisticiens et spécialistes des données environnementales autour de la biodiversité marine.
Avec 11 millions de km2 de mers sous juridiction nationale, dont 97 % situés en outre-mer, la France est le deuxième État en matière de zone économique exclusive marine (ZEE). Présente dans cinq océans, elle a une responsabilité importante dans la protection de la biodiversité des milieux aquatiques. Dans cette perspective, le Challenge IA-Biodiv s’est focalisé sur des projets de recherche sur la biodiversité des milieux marins côtiers des zones méditerranéennes et pacifiques.
Les travaux des trois consortiums se sont ainsi organisés autour d’un enjeu central : développer des modèles de prédiction et des indicateurs plus performants pour évaluer l’évolution de la biodiversité marine sous l’effet combiné du changement climatique et des activités humaines. Pour y parvenir, les équipes ont exploré trois grandes directions : l’adaptation de modèles d’IA existants aux spécificités des données de biodiversité, la conception de nouveaux modèles d’IA dédiés et l’hybridation de ces différents modèles pour mieux saisir la complexité des systèmes écologiques.
Smart-Biodiv
Laboratoire de Recherche International Georgia Tech-CNRS, CentraleSupélec Loria, Laboratoire interdisciplinaire des environnements continentaux (LIEC), Laboratoire d’océanographie de Villefranche-sur-mer
Cédric Pradalier, professeur d’informatique à GeorgiaTech Europe, pilote le consortium interdisciplinaire Smart-Biodiv. Ce projet se structure autour de deux objectifs majeurs : d’une part, l’utilisation de techniques avancées d’apprentissage automatique pour enrichir des jeux de données actuels souvent incomplets ou épars, et d’autre part, la construction d’indicateurs robustes destinés à mesurer la santé écologique des milieux naturels. Par exemple, l’abondance, ou simplement la présence de certains organismes vivants reflète l’état d’un environnement. Ces indicateurs peuvent permettre d’évaluer l’état écologique des milieux aquatiques et de guider les décisions de gestion et de conservation de la biodiversité.
Les données utilisées proviennent notamment d’images individuelles de plancton, issues de systèmes d’imagerie quantitative déployés en mer Méditerranée et lors de l’expédition Tara Pacific. Le consortium s’inspire également du cadre réglementaire (Directive Cadre sur l’Eau) mis en œuvre depuis 2000 pour évaluer l’état écologique des eaux douces. Ces jeux de données spécifiques sont largement complétés par des données d’occurrence issues de grandes bases internationales (OBIS, GBIF). Les traiter représente un défi considérable : les données sont souvent éparses, dans le temps comme dans l’espace, et il y a très peu de données d’absence. En effet, dans le cas du recensement d’espèces, on identifie uniquement les individus observés, il n’y a pas, ou très peu, de données négatives. Dans ce contexte, l’intelligence artificielle constitue un outil essentiel pour analyser la distribution des espèces, mais elle doit s’adapter aux spécificités des données écologiques.
L’un des enjeux majeurs du projet Smart-Biodiv consiste à prédire et à quantifier l’impact des actions de conservation pour mieux déterminer quelles espèces protéger en priorité, en mobilisant des modèles de distribution d’espèces. Un objectif est d’identifier des espèces dites « parapluies ». Ce concept d’écologie de la conservation désigne des espèces dont la protection peut bénéficier à un grand nombre d’autres espèces vivant dans le même écosystème. Les espèces parapluies sont souvent des espèces capables de « séduire le plus grand nombre afin d’en sauvegarder d’autres à l’aspect plus repoussant, moins aimées, voire méconnues du grand public, qui ne comprendrait pas l’intérêt de protéger une espèce peu attachante ». Par exemple, le panda géant vit dans la même zone que 70 % des mammifères forestiers, 70 % des oiseaux forestiers et 31 % des amphibiens forestiers. Le projet a permis de développer un outil capable de proposer des espèces potentiellement parapluies à partir de modèles de distribution d’espèces. Ces résultats ont vocation à être comparés à d’autres outils et dispositifs de conservation, comme les aires protégées, afin d’analyser si les habitats que le modèle identifie comme prioritaires sont déjà protégés aujourd’hui, et de repérer d’éventuelles zones importantes encore non protégées. Ces modèles restent toutefois imparfaits : certaines interactions écologiques entre espèces y sont probablement encore sous-représentées.
Les travaux menés se sont également focalisés sur les diatomées benthiques d’eaux douces, à travers des jeux de données robustes disponibles dans le cadre du suivi réglementaire de la qualité de ces écosystèmes, basée sur l’indice biotique normalisé IBD (Indice Biologique Diatomées). Ces données sont utilisées pour évaluer la pertinence de l’utilisation des réseaux de co-occurrences taxonomiques ou fonctionnels (basés sur les espèces ou les traits fonctionnels, respectivement) pour évaluer l’effet des facteurs environnementaux sur les écosystèmes et ainsi prédire la qualité des milieux. Cette approche développée sur des jeux de données robustes ciblant les eaux douces pourra être testée dans le cadre de la surveillance des milieux côtiers.
Ces recherches ont d’ores et déjà donné lieu à 3 publications.
Le consortium Smart-BioDiv a également mobilisé des fonds du programme PAUSE, mis en place par le Collège de France en partenariat avec la National Research Foundation of Ukraine et soutenu par l’ANR, pour accueillir un scientifique réfugié ukrainien.
AIME
Université Cadi Ayyad (Maroc), Université de Yaoundé (Cameroun), Université Gaston Berger de Saint-Louis et Université Cheick Anta Diop (Sénégal), Institut de recherche pour le développement – IRD (France).
Jihad Zahir, professeure d’informatique à l’Université Cadi Ayyad de Marrakech, coordonne le consortium franco-africain AIME (intelligence artificielle pour les écosystèmes marins), fruit d’une forte collaboration internationale. Comptant d’ores et déjà 10 articles publiés et plusieurs autres soumis, ce projet vise à améliorer la justesse et la précision des indicateurs de biodiversité grâce à l’IA ainsi que le développement de nouveaux indicateurs de biodiversité capables de caractériser l’impact des mesures de protection de l’environnement prises par les gouvernements. Ces indicateurs ont pour objectif d’expliquer et prédire l’évolution de la biodiversité marine.
Le projet a permis, entre autres, l’automatisation de l’identification du genre des coraux par l’IA, à partir d’images vidéo sous-marines. Il aura fallu identifier en amont, manuellement, leurs formes et leurs morphotypes. Cette avancée pourrait faciliter le suivi des fonds marins par imagerie vidéo et aider à la mise en place d’un dispositif de monitoring des récifs coralliens. À moyen et long terme, ces outils permettront de mieux observer l’évolution de l’état de santé des récifs ainsi que l’impact des activités anthropiques et également l’impact potentiel de mesures protectrices de la biodiversité.
Les requins forment un autre axe majeur de recherche du projet. L’analyse des données acoustiques des requins bouledogues et des requins-tigres a permis d’affiner les connaissances des dynamiques sociales entres ces deux espèces, mais aussi d’améliorer la prédiction de leurs trajectoires. Ces avancées devraient contribuer à la fois à la protection des populations côtières dépendantes du littoral et à la conservation des espèces de requins étudiées, en limitant les interactions conflictuelles entre humains et requins. In fine, ces travaux seront présentés à des acteurs des communes et des associations locales en Nouvelle-Calédonie afin qu’ils puissent s’en saisir et adapter les mesures de protection déjà mises en place.
Le développement d’un indicateur juridique constitue également l’un des apports novateurs de ce projet, qu’il continue à développer, en partenariat avec d’autres projets. Ces travaux permettent d’analyser la protection juridique de l’environnement marin. L’interdiction de la chasse à la baleine, l’arrêt de l’utilisation de sacs plastiques ou encore l’interdiction de chalutage des fonds marins, sont autant de mesures dont on peut difficilement quantifier l’impact sur la biodiversité marine. L’enjeu est alors de caractériser les interdictions mises en place par plusieurs pays d’Afrique pour protéger les mers et les océans. L’automatisation de cette analyse des textes juridiques aura été une première étape pour mieux comparer l’impact des dispositifs de protection de l’environnement en fonction des pays.
À long terme, le but est de mettre à la disposition des collectivités locales et des décideurs publics un observatoire permettant de les informer sur l’efficacité des stratégies de protection des espèces, et de les accompagner dans leurs choix en matière de gestion des écosystèmes marins côtiers.
Fish-Predict
Marine Biodiversity Exploitations and Conservation, Laboratoire d’informatique, de robotique et de microélectronique de Montpellier, Centre d’écologie fonctionnelle et évolutive, Laboratoire des sciences techniques de l’information, de la communication et de la connaissance, Laboratoire d’écologie alpine
David Mouillot, enseignant-chercheur à l’Université de Montpellier en écologie et membre de MARine Biodiversity Exploitation and Conservation (MARBEC), est le coordinateur du consortium Fish-Predict. Ce consortium développe des méthodes d’IA pour prédire la biodiversité, la distribution et l’abondance des poissons récifaux à partir de sources de données très diverses : vidéos sous-marines, images satellites, bases de données d’ADN environnemental. L’ADN environnemental est de l’ADN prélevé dans l’environnement plutôt que sur un organisme : cette technique permet de détecter la présence d’espèces à partir de traces génétiques laissées dans l’eau. L’objectif consiste également à améliorer l’identification d’espèces rares, sous-représentées dans les bases de données. Un enjeu majeur est en particulier d’améliorer le suivi des écosystèmes côtiers, de mieux anticiper leur devenir, mais également de mieux guider la création et l’extension des aires marines protégées.
11 articles dans des revues scientifiques internationales de premier plan (dont un article dans la revue Science) couvrant les domaines de l’écologie, l’intelligence artificielle et la télédétection ont été publiés. FISH-PREDICT a notamment permis de développer des outils capables de détecter automatiquement jusqu’à 86 % des poissons observables sur des vidéos sous-marines, avec moins de 5 % de fausses détections, y compris pour des espèces absentes des données d’apprentissage. Les méthodes basées sur l’ADN environnemental ont amélioré nettement l’identification des poissons dans des zones où les bases de référence génétiques sont incomplètes.
L’idée de cette étude est partie d’une collaboration avec Alexis Joly, co-créateur de la plateforme Pl@ntNet, application à succès qui identifie une plante à partir d’une photo. Des avancées notables ont été effectuées sur la capacité des algorithmes à reconnaître les différentes espèces de poissons récifaux, grâce, notamment, au plus de 400 plongées réalisées pour identifier les poissons de façon visuelle par l’humain.
Ces travaux s’appuient sur la base de données GBIF (Global Biodiversity Information Facility), issue des sciences participatives qui rassemble des données sur la biodiversité, les espèces, leurs habitats et leurs caractéristiques, nourrie par des scientifiques comme par des amateurs. Bien que cette immense quantité d’informations puisse comporter des erreurs, les résultats montrent que « l’IA parvient malgré tout à produire des analyses pertinentes : la masse de données tend à compenser les imprécisions individuelles. » À partir de ces ressources, les chercheurs ont mis au point de nouveaux modèles d’intelligence artificielle hybrides, combinant connaissances scientifiques et données. L’essor massif des grands modèles de langages permet désormais de transposer du texte sur des images, c’est-à-dire assembler du texte et des images ou de l’ADN. Après les plantes et les poissons, il reste un grand nombre d’espèces et de milieux naturels à répertorier, insiste David Mouillot, comme dans les abysses et les régions polaires. Le chercheur en écologie confie être particulièrement intéressé par les îles Eparses situées dans l’ouest de l’océan Indien autour de Madagascar, mais également les îles Galapagos qui regorgent d’espèces endémiques non encore recensées.
En savoir plus
Projet Fish-Predict, article publié dans Science : Global patterns and drivers of untracked industrial fishing in coastal marine protected areas
