Cancer colorectal : l’IA peut-elle prédire le risque à partir du microbiome intestinal ?
Une étude publiée dans Gut Microbes explore l'utilisation de l'IA explicable pour évaluer le risque de cancer colorectal à partir du microbiome intestinal. Prometteur, mais encore loin d'un test clinique de routine
Cet article est un décryptage de l'étude suivante : Novielli P., Baldi S., Romano D., Magarelli M. et al., "Personalized colorectal cancer risk assessment through explainable AI and Gut microbiome profiling", Gut Microbes, 2025. DOI : 10.1080/19490976.2025.2543124
Le cancer colorectal fait partie des cancers les plus fréquents. Il a pourtant une particularité importante : dans de nombreux cas, il se développe progressivement, à partir de lésions précancéreuses appelées adénomes. Cela laisse une fenêtre d'intervention. Plus on repère tôt les personnes à risque, plus la prévention et le dépistage peuvent être efficaces.
Une étude publiée en 2025 dans Gut Microbes explore une piste qui attire de plus en plus l'attention : utiliser le microbiome intestinal, c'est-à-dire l'ensemble des micro-organismes vivant dans notre intestin, comme source d'information pour estimer le risque de cancer colorectal. Les chercheurs ne se contentent pas d'observer quelques bactéries isolées. Ils utilisent des modèles d'intelligence artificielle capables de repérer des signatures complexes dans les données microbiennes.
L'idée est séduisante : un simple échantillon de selles pourrait, un jour, aider à mieux orienter le dépistage. Mais il faut tout de suite poser une limite. Cette étude ne signifie pas qu'un test microbiome est prêt à remplacer la coloscopie ou les stratégies actuelles de dépistage. Elle montre plutôt qu'un signal biologique existe, qu'il peut être exploité par l'IA, et que certains profils microbiens pourraient aider à mieux comprendre la progression vers le cancer colorectal.
En clair : l'étude ne prouve pas encore qu'on peut dépister le cancer colorectal avec le microbiome. Elle montre que le microbiome contient une information prédictive exploitable, au moins dans un cadre de recherche.
Pourquoi le microbiome intéresse autant la recherche sur le cancer colorectal
Le microbiome intestinal n'est pas un simple décor biologique. Il participe à la digestion, dialogue avec le système immunitaire, produit des métabolites et influence l'environnement local de la muqueuse intestinale. Dans le cas du cancer colorectal, cette proximité anatomique rend son rôle particulièrement plausible : les bactéries intestinales vivent au contact direct du tissu où les lésions apparaissent.
Le développement du cancer colorectal suit souvent une progression en plusieurs étapes. Des cellules normales de la muqueuse du côlon peuvent accumuler des anomalies, former un adénome, puis évoluer vers une tumeur maligne. Cette séquence n'est pas automatique : tous les adénomes ne deviennent pas des cancers. Mais elle explique pourquoi la détection des lésions précancéreuses est un enjeu majeur.
Plusieurs travaux ont déjà montré que certaines bactéries sont plus fréquemment retrouvées chez les personnes atteintes de cancer colorectal. Parmi les noms qui reviennent souvent, on trouve notamment Fusobacterium. D'autres groupes bactériens semblent au contraire associés à des profils plus favorables. Le problème est que le microbiome ne se résume jamais à une bactérie isolée. C'est un écosystème dense, variable, influencé par l'alimentation, les médicaments, l'âge, l'inflammation, la géographie et de nombreux autres facteurs.
C'est précisément là que l'intelligence artificielle devient intéressante.
Le problème : trop de données pour une lecture simple
Un profil de microbiome contient énormément d'informations. On peut y trouver des centaines de groupes bactériens, chacun avec une abondance différente. Deux personnes en bonne santé peuvent déjà avoir des microbiomes très différents. À l'inverse, deux personnes ayant une pathologie similaire ne partagent pas forcément exactement les mêmes bactéries dominantes.
Chercher un marqueur unique serait donc trop simpliste. Le risque ne se lit probablement pas comme une ligne rouge sur une analyse biologique classique. Il ressemble plutôt à une combinaison de signaux faibles : certaines bactéries augmentent, d'autres diminuent, certains équilibres se déplacent, et l'ensemble forme un profil plus ou moins proche de celui observé chez des patients porteurs d'adénomes ou de cancers.
Les modèles de machine learning sont utiles dans ce type de situation, car ils peuvent analyser de nombreuses variables en même temps et repérer des combinaisons difficiles à identifier à l'oeil nu. Mais cette puissance pose un problème majeur : si l'algorithme donne un score de risque sans explication, il devient difficile à utiliser en médecine.
Un médecin ne peut pas se contenter d'un verdict opaque du type : "le modèle estime que ce patient est à risque". Il doit comprendre quels éléments ont pesé dans la prédiction, avec quel niveau de fiabilité, et dans quel contexte biologique cette prédiction peut être interprétée.
C'est le rôle de l'IA explicable.
IA explicable : ouvrir la boîte noire
Dans cette étude, les chercheurs utilisent des approches dites d'IA explicable. L'objectif n'est pas seulement de prédire, mais aussi d'expliquer la prédiction. Autrement dit, le modèle ne doit pas seulement dire : "ce profil ressemble à un profil à risque". Il doit aussi indiquer quelles bactéries ont contribué à cette estimation.
La méthode SHAP, utilisée dans l'étude, sert justement à attribuer à chaque variable une contribution positive ou négative dans la décision du modèle. Dans le contexte du microbiome, cela revient à demander : quelles bactéries poussent le score vers un risque plus élevé, et lesquelles le tirent dans l'autre sens ?
Cette approche est importante pour deux raisons.
D'abord, elle rend le modèle plus lisible pour les chercheurs et les cliniciens. Ensuite, elle peut révéler des biomarqueurs biologiquement intéressants. Si une bactérie ressort régulièrement comme contributrice au risque, elle devient une piste à explorer : simple marqueur de la maladie, acteur du processus tumoral, ou reflet d'un environnement intestinal modifié.
Ce que les chercheurs ont fait
L'étude s'appuie sur des profils de microbiome issus de patients porteurs d'adénomes ou de cancers colorectaux, comparés à des sujets sans lésion. Les auteurs ont analysé l'ADN bactérien à partir de la région 16S rRNA, une méthode couramment utilisée pour identifier les grands groupes bactériens présents dans un échantillon.
Ils ont ensuite testé plusieurs modèles de machine learning afin de distinguer les profils associés aux lésions colorectales des profils sans lésion. Parmi les modèles évalués, CatBoost ressort comme l'un des plus performants. Ce type de modèle est adapté aux données complexes et hétérogènes, ce qui en fait un candidat naturel pour les données de microbiome.
Les performances rapportées sont encourageantes, avec une capacité de discrimination supérieure au hasard et une aire sous la courbe ROC dépassant 0,7 dans certaines analyses. Pour un lecteur non spécialiste, on peut résumer ainsi : le modèle ne prédit pas parfaitement, mais il détecte un signal réel.
Il faut toutefois éviter de surinterpréter ce chiffre. Une performance supérieure à 0,7 peut être intéressante en recherche, mais elle ne suffit pas à valider un outil de dépistage clinique. Pour devenir utile en population générale, un test doit être robuste, reproductible, validé sur de larges cohortes indépendantes, et comparé aux outils existants.
Une bonne performance statistique dans une étude ne suffit pas à faire un test médical. C'est une étape prometteuse, pas une validation clinique.
Les bactéries qui ressortent : signal de risque ou simple signature ?
Grâce à l'analyse explicable, les auteurs identifient plusieurs groupes bactériens associés à la prédiction du risque. Certains poussent le modèle vers une classification plus proche des adénomes ou du cancer colorectal. D'autres semblent au contraire associés à un profil plus protecteur.
Parmi les bactéries associées au risque, Fusobacterium et Peptostreptococcus ressortent comme des marqueurs importants. Ce n'est pas complètement surprenant : Fusobacterium est déjà fréquemment discutée dans la littérature sur le cancer colorectal. Sa présence ne signifie pas automatiquement qu'elle cause le cancer, mais elle semble liée à un environnement tumoral ou précancéreux.
À l'inverse, le groupe Eubacterium eligens apparaît dans l'étude comme un prédicteur négatif robuste. Autrement dit, sa présence semble tirer le score dans une direction moins associée aux lésions colorectales. Là encore, prudence : parler de "bactérie protectrice" est tentant, mais le terme peut être trompeur. Une association statistique ne suffit pas à prouver qu'une bactérie protège réellement contre la maladie.
Le point le plus intéressant n'est donc pas seulement la liste des bactéries. C'est la logique d'ensemble : le modèle semble capter une transition du microbiome, depuis des profils sans lésion vers des profils plus proches de ceux observés chez les patients atteints de cancer colorectal.
L'idée d'un état de transition
L'un des aspects les plus utiles de cette étude est l'identification de profils intermédiaires. Certains patients porteurs d'adénomes présentent un microbiome qui ressemble davantage à celui de patients atteints de cancer colorectal qu'à celui de sujets sans lésion.
Cette observation est importante, car elle pourrait aider à mieux comprendre la progression adénome-cancer. Tous les adénomes ne se valent pas. Certains resteront probablement stables, d'autres évolueront plus défavorablement. Si le microbiome aide un jour à distinguer ces trajectoires, il pourrait devenir un outil de stratification du risque.
Dit simplement : il ne s'agirait pas seulement de dire "cancer ou pas cancer". L'enjeu serait plutôt d'identifier des états biologiques intermédiaires, où la prévention et la surveillance pourraient être adaptées.
Ce que cela pourrait changer, si la piste se confirme
La première application possible serait un dépistage plus personnalisé. Aujourd'hui, les stratégies de dépistage reposent principalement sur l'âge, les antécédents, les tests de sang occulte dans les selles et, selon les situations, la coloscopie. Un score microbiome pourrait un jour enrichir cette évaluation, notamment pour repérer des personnes qui mériteraient un suivi plus attentif.
La deuxième application concerne le suivi après découverte ou retrait d'un polype. Si certains profils microbiens se rapprochent d'un état plus à risque, on pourrait imaginer suivre leur évolution dans le temps. Un microbiome qui se normalise après intervention n'aurait pas la même signification qu'un microbiome qui reste fortement associé à un profil à risque.
La troisième piste est plus thérapeutique. Si certaines bactéries ou certains équilibres microbiens participent réellement au processus tumoral, alors modifier le microbiome pourrait devenir une stratégie de prévention. Cela pourrait passer par l'alimentation, des prébiotiques, des probiotiques ciblés, ou d'autres approches plus expérimentales. Mais cette partie reste beaucoup plus spéculative.
Pour l'instant, l'étude soutient surtout une idée : le microbiome pourrait devenir une couche d'information supplémentaire dans l'évaluation du risque. Pas un remplacement immédiat des outils existants.
Tableau des promesses et limites de l'IA appliquée au microbiome dans le cancer colorectal
| Piste | Ce que cela apporterait | Limite actuelle | Maturité |
|---|---|---|---|
| Score de risque microbiome | Repérer des profils plus proches des lésions colorectales à partir d'un échantillon de selles | Performance encore insuffisante pour un usage autonome en dépistage | Exploratoire |
| IA explicable | Comprendre quelles bactéries contribuent au score au lieu d'obtenir une prédiction opaque | Une explication statistique ne prouve pas un mécanisme biologique | Prometteur |
| Suivi des adénomes | Identifier des profils intermédiaires pouvant justifier une surveillance plus personnalisée | Il faut confirmer que ces profils prédisent réellement l'évolution future | À confirmer |
| Modulation du microbiome | Imaginer des stratégies préventives via alimentation, prébiotiques ou interventions ciblées | On ne sait pas encore si les bactéries identifiées sont causes, conséquences ou simples marqueurs | Spéculatif |
Pourquoi il faut rester prudent
Le premier risque, dans ce type de sujet, est de transformer une étude prometteuse en promesse de dépistage immédiat. Ce serait une erreur. Les auteurs travaillent sur des données biologiques complexes, avec des modèles statistiques puissants, mais cela ne règle pas les problèmes de validation.
Le microbiome est très sensible au contexte. L'alimentation, les antibiotiques, les inhibiteurs de la pompe à protons, les anti-inflammatoires, les maladies métaboliques ou encore les habitudes de vie peuvent modifier sa composition. Un modèle entraîné sur une population donnée peut perdre en performance dans une autre population si ces facteurs diffèrent.
Il y a aussi la question de la causalité. Une bactérie associée au cancer colorectal peut être impliquée dans la maladie, mais elle peut aussi simplement profiter d'un environnement déjà modifié par la tumeur. Dans ce cas, elle serait un marqueur utile, mais pas nécessairement une cible thérapeutique.
Enfin, la technologie utilisée dans cette étude, basée sur le séquençage 16S rRNA, donne une vision utile mais partielle du microbiome. Elle renseigne sur la composition bactérienne, mais pas toujours sur les fonctions précises exercées par ces bactéries. Deux microbiomes différents peuvent produire des effets métaboliques proches, et deux profils taxonomiques proches peuvent avoir des fonctions différentes.
Pour aller plus loin, il faudra probablement combiner plusieurs niveaux de données : microbiome, métabolites, inflammation, alimentation, génétique, données cliniques et historique de dépistage. C'est ce qu'on appelle souvent une approche multi-omique.
Ce que cette étude dit vraiment
La conclusion la plus solide n'est pas que l'IA va révolutionner à court terme le dépistage du cancer colorectal. La conclusion solide est plus sobre : le microbiome intestinal contient un signal associé aux lésions colorectales, et l'IA explicable permet de rendre ce signal plus lisible.
C'est déjà important. Dans beaucoup de travaux d'intelligence artificielle appliquée à la santé, le modèle fonctionne plus ou moins, mais on comprend mal ce qu'il utilise pour décider. Ici, l'explicabilité aide à relier la prédiction à des groupes bactériens identifiables. Cela ne suffit pas à prouver un mécanisme, mais cela transforme une boîte noire en outil d'exploration biologique.
L'étude montre aussi que les adénomes ne sont peut-être pas tous identiques du point de vue du microbiome. Certains profils semblent occuper une position intermédiaire entre l'absence de lésion et le cancer colorectal. Si cette observation est confirmée, elle pourrait devenir très utile pour mieux stratifier le risque.
Ce qu'on peut retenir en pratique
Pour le grand public, le message doit rester équilibré. Il ne faut pas commander aujourd'hui un test de microbiome en pensant mesurer précisément son risque de cancer colorectal. Les tests commerciaux actuels ne sont pas validés pour remplacer le dépistage médical.
En revanche, cette étude renforce une tendance de fond : la prévention du cancer colorectal pourrait devenir plus personnalisée. À l'avenir, le risque ne sera peut-être pas évalué seulement à partir de l'âge et des antécédents, mais aussi à partir de signaux biologiques plus fins, dont le microbiome intestinal.
L'IA joue ici un rôle d'interprète. Elle ne rend pas le microbiome magique. Elle aide à extraire une information utile d'un système trop complexe pour être lu directement.
En bref, le microbiome pourrait devenir un indicateur de risque intéressant, et l'IA explicable pourrait aider à le rendre utilisable. Mais entre une signature prometteuse et un outil médical de routine, il reste une étape majeure : la validation clinique.
Référence
Novielli P., Baldi S., Romano D., Magarelli M., Diacono D., Di Bitonto P., Nannini G., Di Gloria L., Bellotti R., Amedei A., Tangaro S. Personalized colorectal cancer risk assessment through explainable AI and Gut microbiome profiling. Gut Microbes. 2025;17(1):2543124. DOI : 10.1080/19490976.2025.2543124