A quoi ça sert les mathématiques ? Sandrine et l'écotoxicologie prédictive

“Mais à quoi ça sert, les mathématiques ?” Cruelle question !

Pour trouver des éléments de réponse à partager avec vos élèves, nous vous proposons un nouveau type d’interview à la rencontre de femmes et d’hommes qui utilisent les mathématiques dans leur quotidien. C’est l’occasion de vous faire découvrir ou redécouvrir des domaines fascinants qui seront peut-être source d’inspiration dans vos cours !

Sandrine Charles est professeure des universités et directrice de l’école doctorale Evolution Ecosystèmes Microbiologie Modélisation (E2M2) à l’université Claude Bernard Lyon I. Spécialiste en écotoxicologie prédictive, elle enseigne les mathématiques appliquées aux sciences de la vie.

Merci à elle d’avoir accepté de répondre à nos questions !

Pouvez-vous nous parler de vos activités de recherche ?

Je travaille principalement sur l’évaluation des risques pour l’environnement, et notamment l’étude des risques liés aux perturbations d’ordre chimique relatives aux activités anthropiques. On parle de xénobiotiques : des espèces chimiques contaminantes, qui ne sont pas supposées être présentes dans un environnement et qui peuvent avoir potentiellement des effets toxiques sur les différentes espèces d’un écosystème. On s’intéresse aux conséquences de la présence de ces xénobiotiques sur la survie des organismes vivants, leur reproduction, leur croissance, etc.

Pour aborder ces questions, je développe des modèles de prédiction de ces effets à partir de données collectées en laboratoire ou sur le terrain afin de proposer des outils d’aide à la décision pour des instances de réglementation, chargées par exemple de délivrer des autorisations de mise sur le marché de substances chimiques, nouvelles ou en renouvellement.

Dans cette optique, je développe et je maintiens depuis 2013 une plate-forme Web, MOSAIC, qui propose plusieurs services à destination des chercheurs pour les aider à analyser leurs données en écotoxicologie. Cette plate-forme joue un rôle de conseil, d’expertise, d’accompagnement, mais aussi de support pédagogique puisqu’elle nous permet aussi de faire de la formation.

Cette plate-forme est librement accessible selon le principe de la science ouverte, qui me tient particulièrement à cœur : les données et le code informatique sont partagés, mis à la disposition de tout un chacun, dans une optique de transparence et de reproductibilité des résultats de la recherche. C’est ce que l’on désigne comme étant les principes FAIR pour les données, pour Facile à trouver, Accessibles, Interopérables et Reproductibles.

Ce qui m’intéresse particulièrement dans mes recherches, c’est la méthodologie et la généricité des modèles développés pour leur trouver un maximum d’applications, quelle que soit l’espèce, quelle que soit la substance chimique à laquelle cette espèce est exposée, et quel que soit son milieu. J’ai travaillé sur des invertébrés, des organismes terrestres, bientôt nous allons travailler sur des oiseaux.
L’autre objectif est de développer des outils opérationnels et accessibles même aux non-spécialistes.

Comment vérifier la pertinence d’un modèle mathématique ?

On procède en trois étapes :

  1. La calibration, qui consiste tout d’abord à recueillir des données expérimentales, dans la littérature scientifique ou en montant des expériences ; elle sert à construire nos modèles qui vont tenter d’expliquer au mieux nos jeux de données.

  2. Dans un second temps, avec ces modèles calibrés, nous réalisons des simulations, des prédictions, mais dans un cadre d’exposition relativement simple au départ. Ce sont des prédictions pour lesquelles nous disposons aussi de données d’observations, afin de pouvoir procéder à des comparaisons.
    C’est ce qu’on appelle l’étape de validation.

  3. Vient enfin la véritable étape de prédiction. Des simulations sont réalisées pour des scénarios d’exposition plus complexes, plus réalistes d’un point de vue environnemental, mais donc plus difficiles, voire impossibles, à mettre en œuvre expérimentalement.
    Par exemple, aucune expérience ne peut être menée sur l’humain et de moins en moins sur les organismes vertébrés. La réglementation animale est de plus en plus stricte et nous incite à réduire voire remplacer les expérimentations in vivo.

Dans tous ces modèles, il est nécessaire de prendre en compte une multitude de facteurs environnementaux susceptibles d’influencer les effets des substances chimiques : je pense aux changements climatiques, aux perturbations d’origine chimique ou biologique, … Dans tous les cas, le modélisateur a un rôle majeur et fédérateur, à l’interface entre les mathématiques et les sciences de la vie. Il est important non seulement d’intégrer un maximum de réalisme environnemental mais il est tout aussi nécessaire aussi de garder un certain contrôle sur la modélisation pour ne pas être uniquement et strictement dépendant d’un code informatique, sans capacité d’un regard critique sur la pertinence des résultats. C’est ce que l’on appelle le principe de parcimonie (ou rasoir d’Ockham) qui consiste à ne pas sur-paramétrer ou complexifier à outrance les modèles.

L’outil informatique est-il indispensable pour améliorer la qualité des modèles ?

La programmation informatique fait aujourd’hui partie intégrante de la modélisation. Le processus de calibration nécessite de faire le lien entre une formulation mathématique, ou statistique, et des données expérimentales : seul l’outil informatique le permet par des procédures d’optimisation. A l’aide des données expérimentales, nous cherchons à renseigner la valeur des paramètres de notre modèle.
On parle de processus d’inférence : depuis les résultats obtenus sur les observations d’un échantillon, on cherche à établir une généralisation vers la population théorique dont sont issues ces données. Ce processus d’inférence, selon les principes de la statistique fréquentiste ou bayésienne, s’appuie le plus souvent sur des algorithmes de résolution numérique car les modèles impliqués sont généralement non linéaires et associés à des lois de distribution spécifiques (souvent non gaussienne) pour décrire la variabilité des données autour de la tendance moyenne.

Cependant, il est parfois possible de faire des résolutions exactes grâce aux mathématiques, que l’on peut ensuite implémenter dans nos codes informatiques et ainsi accélérer les calculs. Je pense à des travaux récents que nous sommes en train de publier sur la résolution de systèmes dynamiques à base d’équations différentielles ordinaires linéaires, qui relient des compartiments (NdA : groupements homogènes correspondant à un type d’individu) entre eux, en prenant en compte toutes les connexions qui peuvent exister entre ces compartiments deux à deux, ainsi qu’entre ces compartiments et le milieu extérieur. Par un jeu très simple de matrices et d’exponentielles de matrices, j’ai réussi à produire une solution générale de ces systèmes, quel que soit le nombre de ces compartiments ou de leurs relations.
Ensuite, en collaboration avec une startup qui fait du développement de code informatique pour l’environnement et l’écotoxicologie, Qonfluens, nous sommes parvenus à réduire le temps de calcul pour l’inférence, qui était de l’ordre de 24h à l’origine, à désormais seulement une dizaine de minutes. Ce gain de temps nous permet maintenant d’envisager l’intégration de ces nouveaux outils au sein de notre plateforme MOSAIC, donc leur mise à disposition simplifiée pour la communauté scientifique.

Réduire le temps de calcul est d’autant plus intéressant qu’il faut être très vigilant quand on se préoccupe de la protection de l’environnement : la ressource numérique a un impact carbone très important ! Nous devons autant que possible limiter l’acquisition des données, le stockage des données, les temps de calcul, … tout ce qui fait appel à de la ressource numérique.

Pouvez-vous nous parler de votre parcours ?

J’étais une bonne élève et je me suis laissée porter tout au long d’un parcours scientifique classique. J’ai fait deux années de classe préparatoire avant d’intégrer l’école des Mines.

Lorsque j’ai dû trouver un stage de fin d’études d’ingénieur, j’ai eu la chance d’être accueillie dans mon laboratoire actuel pour travailler en bactériologie/microbiologie ! J’ai alors découvert la biométrie, c’est-à-dire la mesure de la biologie, et j’ai compris que je pouvais mettre à profit mes connaissances méthodologiques en mathématiques pour répondre à des questionnements concernant la santé. J’ai commencé à travailler sur la bactérie Listeria monocytogenes : j’ai proposé une nouvelle approche de modélisation pour mieux comprendre le développement de cette bactérie, qui a la particularité de pouvoir se développer dans des conditions très froides. J’ai ensuite bifurqué vers l’écotoxicologie.

Enfin, un collègue qui travaillait aussi dans le champ de l’écotoxicologie, mais plutôt spécialisé dans l’acquisition de données, m’a proposé une collaboration pour que j’apporte mes outils de modélisation dans ce domaine.

Ce qui fait notre spécificité et notre renommée aujourd’hui, au niveau national comme international, c’est plus particulièrement l’apport de la statistique bayésienne dans le domaine de l’écotoxicologie. C’est une méthode d’inférence fondée sur une vision spécifique de la notion de probabilité comme étant un degré d’incertitude, comme lorsque l’on se pose la question du temps qu’il fera demain. C’est de mon point de vue une approche probabiliste beaucoup plus intuitive que la statistique fréquentiste, notamment lorsque l’on veut quantifier l’incertitude.
Et c’est particulièrement vrai pour des élèves qui s’engagent dans des études supérieures en biologie et sont réfractaires aux approches quantitatives !

Comment faites-vous, justement, pour enseigner les mathématiques avec ces étudiants réfractaires ?

On ne peut pas se passer de méthodologie en biologie, et cela inclut les mathématiques, en particulier les statistiques. Quel que soit le sujet, il faut quantifier ! Alors je fonctionne beaucoup par l’exemple, l’illustration, l’étude de cas concrets pour capter l’attention des étudiants. Je fais aussi un peu d’apprentissage par problèmes (APP). J’essaye d’avoir une pédagogie adaptée en leur expliquant d’emblée qu’on ne va pas faire des maths pour les maths, qu’il s’agit de questionnements mathématiques au service de la biologie. L’objectif est de leur faire acquérir un peu de théorie, quelques outils, au travers d’exemples simples.

Je me suis formée à l’apprentissage par problèmes en Belgique, puis j’ai formé à mon tour des collègues à l’APP. La pédagogie universitaire est un domaine qui m’intéresse tout particulièrement. J’ai eu la chance par le passé d’accompagner des travaux de recherches dans ce domaine, qui ont donné lieu à des publications. J’ai par exemple beaucoup réfléchi à l’impact de l’utilisation des sites Web pour l’apprentissage, et ce dès le début des années 2000. A l’époque, j’étais responsable de l’unité d’enseignement “ Mathématiques pour les Sciences de la Vie “ en première année. La partie travaux pratiques était assez conséquente et c’est dans ce cadre que nous avons mis en place de l’apprentissage par problème. L’objectif était d’introduire la modélisation par équation différentielle aux étudiants au moyen d’outils en ligne, d’expériences virtuelles, de vidéos. Je formais mon équipe d’intervenants à l’APP par l’APP afin qu’ils accompagnent à leur tour les élèves dans l’APP ! J’avais d’ailleurs fait évaluer ce dispositif par des spécialistes universitaires du monde de la pédagogie universitaire et les retours étaient très positifs.

Aujourd’hui, l’APP fait toujours partie de cet enseignement de L1 mais de manière plus réduite car c’est très chronophage. Cela demande du temps de conception et de réalisation, mais aussi beaucoup de ressources humaines pour l’accompagnement en présentiel, il faut donc beaucoup d’argent ce dont l’université ne dispose pas toujours, face au nombre toujours croissant d’étudiants que nous accueillons chaque année, alors que les recrutements de collègues se raréfient.

Ces enseignements de première année sont extrêmement énergivores : il faut convaincre et encore convaincre ces étudiants en biologie, réfractaires aux mathématiques, du bien-fondé de ces enseignements. Mais le retour sur investissement est là. J’ai en effet souvent des retours d’étudiants, plus tard lorsqu’ils arrivent en Master, qui me disent combien ils regrettent de ne pas avoir davantage travaillé les mathématiques dès le départ.

Vous avez eu une expérience très positive de l’enseignement en distanciel. Pouvez-vous nous en parler ?

Étant très à l’aise avec les outils numériques, j’ai pu m’adapter à l’enseignement à distance, en explorant toute une palette d’outils différents, afin de trouver ceux qui me correspondent le mieux. Je suis aussi très bien équipée, entre tablette, ordinateur, tableau blanc, etc.

Dès le premier confinement, j’ai partagé mon exploration de ces outils avec mes collègues à travers des documents ou l’animation de TD en collaboration, etc.
J’ai aussi filmé des capsules vidéos pour les mettre à disposition des étudiants et elles le sont encore aujourd’hui, pour mes étudiants actuels que j’ai de nouveau en présentiel. C’est une valeur ajoutée à laquelle je n’aurais pas pensé avant la pandémie ! Je fais maintenant de la classe inversée, notamment en master, et la plupart du temps les étudiants jouent le jeu en consultant les ressources en amont. C’est plus interactif et cela permet de gagner quelques heures sur les emplois du temps, tout en rendant les étudiants plus autonomes, et plus investis dans leurs apprentissages.

Je vois aussi aujourd’hui des applications pédagogiques vraiment très intéressantes avec l’enseignement distanciel, notamment dans l’accompagnement des travaux pratiques avec usage du numérique. Par exemple, dans le cas d’un TP d’informatique en présentiel, la mise en place d’une classe virtuelle, tout comme on le ferait à distance, permet de partager les codes des étudiants plus facilement. Plutôt que de projeter uniquement le corrigé, je peux afficher ceux de mes étudiants et nous pouvons en discuter ensemble C’est plus enrichissant pour tout le monde : tant pour l’étudiant qui va expliquer son code que pour les autres étudiants qui sont généralement plus attentifs. Ils ne vont plus copier sans réfléchir une solution toute faite, qui n’est d’ailleurs pas toujours la meilleure.

D’ailleurs j’enseigne encore à distance en L1 pour environ 250 étudiants, par choix pédagogique. L’assiduité est bien meilleure en distanciel : j’ai régulièrement jusqu’à 200 étudiants connectés alors qu’en présentiel je dépassais rarement les 70. Je trouve aussi que l’interactivité est bien meilleure grâce au chat et je m’appuie sur des référents volontaires pour améliorer la communication lorsque j’ai de grands groupes.

J’apprécie aussi la possibilité de pouvoir gérer le temps de cours et en particulier, m’adapter au temps de concentration, connu pour être de 45 minutes. Ainsi, j’adapte mes sessions en conséquence, je réserve des plages horaires plus longues et je planifie des pauses entre les sessions de 45 minutes. En présentiel, les plannings de réservation des salles ne nous permettent pas une telle organisation !

Toutes ces expériences d’enseignement en distanciel m’ont permis non seulement de découvrir de nouveaux outils de communication, de nouvelles pratiques pédagogiques, mais aussi de changer ma manière de coordonner les activités de mon équipe de recherche, le pilotage de mes doctorants, les réunions avec mes collaborateurs ou ma participation aux conférences internationales.
J’ai beaucoup appris, j’ai innové dans mes pratiques pédagogiques ou la gestion de mes recherches, et ce, grâce à une certaine liberté d’action qui nous est offerte en tant qu’enseignants-chercheurs.