intelligence artificielle en santé

Les scribes IA font-ils vraiment gagner du temps aux médecins ? Ce que montre une grande étude multicentrique

Une étude menée dans 5 centres universitaires américains suggère que les scribes IA réduisent modestement le temps de documentation des cliniciens et augmentent légèrement le nombre de consultations, sans réduire clairement le travail hors horaires.

Cet article est un décryptage de l'étude suivante :

Lisa S. Rotenstein et al., Changes in Clinician Time Expenditure and Visit Quantity With Adoption of Artificial Intelligence–Powered Scribes: A Multisite Study, JAMA, publication en ligne du 1er avril 2026. doi:10.1001/jama.2026.2253

Un espoir très concret : moins de temps devant l'écran

Comme le rappellent les auteurs et les travaux cités dans leur introduction, la documentation médicale est l'un des domaines où la promesse de l'intelligence artificielle paraît immédiatement tangible. Dans de nombreux systèmes de santé, les cliniciens consacrent une part considérable de leur temps au dossier médical électronique : rédiger les notes de consultation, vérifier les antécédents, traiter les résultats, répondre aux messages, coder les actes. Cette charge administrative est devenue un sujet majeur, non seulement parce qu'elle pèse sur le quotidien des soignants, mais aussi parce qu'elle peut réduire le temps disponible pour les patients.

C'est dans ce contexte que se sont diffusés les scribes IA, ces outils qui écoutent la consultation, en extraient les éléments pertinents, puis proposent une note clinique à relire et à corriger. L'idée est séduisante : si une partie du travail de rédaction peut être automatisée, le clinicien pourrait passer moins de temps à documenter et, potentiellement, voir davantage de patients ou terminer sa journée plus tôt.

L'étude publiée dans JAMA début avril 2026 apporte ici un éclairage utile. Elle ne prétend pas trancher à elle seule toutes les questions, mais elle a un mérite important : elle observe l'adoption de ces outils dans cinq grands centres académiques américains, avec un effectif bien plus large que la plupart des travaux antérieurs. Son message principal est clair, et assez mesuré : les gains existent, mais ils restent modestes. Dit autrement, les scribes IA ne semblent pas transformer radicalement le travail clinique, mais ils peuvent alléger une partie précise de la charge documentaire.

Ce que l'étude a fait

Les auteurs ont analysé les données de 8 581 cliniciens ambulatoires issus de cinq institutions universitaires américaines : Mass General Brigham, Emory Healthcare, UCSF, Yale New Haven Health et UC Davis. Parmi eux, 1 809 ont adopté un scribe IA, tandis que 6 772 ne l'ont pas adopté pendant la période étudiée.

La fenêtre d'observation s'étend de juin 2023 à août 2025. Il ne s'agit pas d'un essai randomisé où l'on attribue au hasard un outil à certains cliniciens et pas à d'autres. Les chercheurs ont réalisé une étude observationnelle longitudinale, en comparant l'évolution des utilisateurs et des non-utilisateurs au fil du temps.

Pour estimer l'association entre adoption du scribe IA et changements observés, l'équipe a utilisé une méthode statistique de type difference-in-differences. L'idée, en simplifiant, consiste à comparer non pas seulement les niveaux bruts entre deux groupes, mais la façon dont leurs trajectoires évoluent avant et après l'adoption. Les modèles prennent aussi en compte des effets fixes liés au clinicien et au temps, afin de limiter certains biais évidents.

Les critères principaux étaient très concrets. Les auteurs ont mesuré :

le temps total passé dans le dossier médical électronique, rapporté à 8 heures programmées de soins patients ;
le temps consacré spécifiquement à la documentation ;
le temps passé dans le dossier en dehors des horaires prévus ou lors de jours non programmés ;
le nombre hebdomadaire de consultations.

Ce point méthodologique est important : les résultats ne portent pas sur une impression subjective du type "j'ai l'impression de gagner du temps", mais sur des indicateurs d'usage du dossier médical et d'activité clinique.

Autre intérêt de l'étude : elle ne s'arrête pas à l'effet moyen global. Les auteurs ont aussi examiné si l'association variait selon plusieurs caractéristiques : la spécialité, le sexe, le statut professionnel (médecin sénior, interne, professionnel de pratique avancée) et l'intensité d'utilisation de l'outil. Cette approche est utile pour une lecture de vulgarisation, car elle permet d'éviter une conclusion trop simple du type "ça marche" ou "ça ne marche pas". La question pertinente est plutôt : pour qui, dans quelles conditions, et sur quelle partie du travail clinique observe-t-on un effet ?

Les résultats : un gain réel, mais mesuré

Le résultat central tient en quelques chiffres.

Par rapport aux non-adoptants, l'adoption d'un scribe IA a été associée à 13,4 minutes de moins passées dans le dossier médical électronique pour 8 heures de soins programmés. Pour le temps de documentation au sens strict, la baisse atteignait 16 minutes. En revanche, le travail réalisé en dehors des horaires prévus n'a pas diminué de manière statistiquement significative. Enfin, le volume d'activité augmentait légèrement, avec 0,49 visite supplémentaire par semaine.

En réalité, tout dépend de la question posée. Si l'on attend d'un scribe IA qu'il fasse disparaître la bureaucratie médicale, les résultats paraissent nettement plus limités. Si l'on se demande au contraire s'il peut réduire une fraction identifiable du temps de documentation dans des conditions réelles, la réponse est plutôt oui.

Les auteurs traduisent ces variations en pourcentages relatifs. Le temps total dans le dossier diminuait d'environ 3%, tandis que le temps de documentation baissait d'environ 10%. Cette différence est instructive. Elle suggère que l'outil agit surtout sur la partie rédactionnelle du travail, sans alléger automatiquement tout le reste : lire les résultats, répondre aux messages, vérifier les informations, ou encore revoir la note produite pour en garantir l'exactitude.

C'est probablement l'un des enseignements les plus utiles de l'étude. Un scribe IA n'est pas un bouton "consultation terminée". Il semble plutôt déplacer une partie du travail documentaire, sans effacer la nécessité du contrôle clinique humain. Les auteurs soulignent d'ailleurs que le temps gagné sur la rédaction peut être réalloué à d'autres tâches liées aux soins.

Une autre phrase du papier résume bien ce point : le temps hors horaires "did not change significantly". Autrement dit, même si les cliniciens documentent un peu plus vite, cela ne suffit pas, en moyenne, à réduire clairement le travail effectué en dehors des horaires prévus. C'est un résultat important, parce qu'une partie du discours autour de ces outils laisse entendre qu'ils pourraient régler directement le problème des soirées passées devant l'ordinateur. Cette étude ne permet pas de soutenir une telle conclusion.

Qui semble en bénéficier le plus ?

L'analyse par sous-groupes est l'un des aspects les plus intéressants du travail, même si elle doit être interprétée avec prudence.

Dans les analyses exploratoires par sous-groupes, les bénéfices apparents étaient plus marqués chez plusieurs catégories de cliniciens : les professionnels de pratique avancée, les femmes, ainsi que les cliniciens de soins primaires et de certaines spécialités médicales. Les effets semblaient aussi plus importants dans le sous-groupe d'usage élevé défini par les auteurs, c'est-à-dire chez les cliniciens qui utilisaient le scribe IA pour au moins la moitié des notes documentées lorsque cette intensité était mesurable.

Le constat concernant l'intensité d'usage est également logique : un outil utilisé occasionnellement a peu de chances de modifier profondément l'organisation du travail. Les auteurs notent d'ailleurs qu'environ 32% seulement des adoptants appartenaient à ce groupe d'usage élevé. Cela suggère qu'une part importante de la variabilité observée dépend probablement non seulement de la qualité intrinsèque du logiciel, mais aussi de l'intégration dans les routines, de la formation reçue et du soutien organisationnel.

L'étude ne mesure pas directement le niveau de maîtrise des utilisateurs, mais cette hétérogénéité peut aussi se lire comme un rappel important : les scribes IA étudiés ici restent des outils récents, et tous les cliniciens n'en exploitent probablement pas encore les capacités de la même façon. Autrement dit, les gains observés à court terme reflètent peut-être autant l'état actuel des modèles que la qualité de leur appropriation locale. Cela invite à une lecture un peu plus critique des performances mesurées aujourd'hui, mais aussi un peu plus ouverte à l'idée que ces effets puissent évoluer si les modèles s'améliorent et si les équipes sont mieux accompagnées.

L'étude relève également des effets très marqués chez les internes, mais ici la prudence s'impose encore davantage : ce sous-groupe était petit. Les auteurs eux-mêmes soulignent que l'usage des scribes IA chez les médecins en formation soulève des questions spécifiques, car la documentation participe aussi à l'apprentissage clinique. Gagner du temps n'est pas la seule variable pertinente lorsqu'on parle de formation.

Productivité : un peu plus de consultations, mais pas de miracle

Un autre résultat a retenu l'attention : l'association avec une légère hausse du nombre de visites hebdomadaires. Le chiffre moyen est faible - environ une demi-visite par semaine - mais statistiquement compatible avec un petit gain de capacité.

Là encore, il faut éviter la surinterprétation. Cette augmentation ne signifie pas que les scribes IA dopent massivement la productivité médicale. Elle indique plutôt qu'une fraction du temps économisé peut, dans certains contextes, se traduire par un peu plus d'activité. Les auteurs ont aussi réalisé une analyse exploratoire du revenu lié aux visites d'évaluation et de prise en charge, aboutissant à une estimation conservatrice d'environ 167 dollars supplémentaires par mois et par clinicien. Mais ils précisent eux-mêmes que cette estimation ne permet pas une vraie analyse coût-bénéfice, puisque les prix d'achat, d'implémentation et de support des outils varient fortement.

Autrement dit, l'étude suggère un signal économique modeste, pas une démonstration de rentabilité universelle.

Ce que l'étude ne montre pas

C'est sans doute la partie la plus importante à garder en tête.

D'abord, l'étude ne démontre pas un lien de causalité ferme. Elle observe une association entre adoption des scribes IA et certaines évolutions du temps passé dans le dossier ou du volume de visites. Même avec des méthodes statistiques robustes, il reste possible que des différences non mesurées entre adoptants et non-adoptants expliquent une partie des résultats. Les cliniciens qui choisissent d'adopter tôt un nouvel outil peuvent, par exemple, être différents des autres dans leur organisation, leur charge de travail ou leur appétence technologique.

Ensuite, l'étude ne mesure pas directement la charge cognitive, la satisfaction, la qualité des notes, la qualité des décisions médicales, ni les effets sur la relation médecin-patient. Or ce sont précisément des dimensions souvent mises en avant dans les discours sur l'IA clinique. Réduire un indicateur de temps de documentation est une chose ; améliorer réellement l'expérience du soin en est une autre.

Enfin, l'absence d'effet significatif sur le travail hors horaires rappelle qu'un gain sur la rédaction ne résout pas à lui seul l'ensemble de la surcharge numérique en médecine. Une partie du fardeau administratif vient d'autres tâches que la production de notes cliniques.

Les limites à ne pas oublier

Les auteurs détaillent plusieurs limites importantes, et elles méritent d'être prises au sérieux.

La première est le caractère observationnel de l'étude. Même si les analyses sont soignées, elles n'ont pas la force démonstrative d'un essai randomisé.

La deuxième tient à l'hétérogénéité des implémentations. Les sites n'utilisaient pas tous les mêmes fournisseurs ni les mêmes modalités de déploiement. Cela peut être vu de deux façons : d'un côté, cela réduit l'idée qu'un résultat ne dépendrait que d'un seul contexte local ; de l'autre, cela mélange des expériences potentiellement très différentes, ce qui donne surtout une moyenne du "monde réel".

Troisième point : l'étude porte sur des centres académiques américains, avec un volume moyen d'environ 20 consultations par semaine. Les résultats ne se transposent pas nécessairement tels quels à des cabinets libéraux, à des structures non universitaires, ou à des environnements où les volumes de patients sont plus élevés.

Les auteurs soulignent aussi que les données détaillées d'intensité d'usage manquaient pour une partie des cliniciens, que la période de suivi après adoption restait relativement courte, et que les bénéfices pourraient évoluer avec la familiarisation progressive à l'outil. En clair : on observe ici un début d'histoire, pas son point d'arrivée.

On peut ajouter une limite plus implicite, que l'étude ne met en avant qu'indirectement : elle observe des scribes IA déployés très tôt dans leur cycle de diffusion, entre 2023 et 2025, avec un recul encore court. Les outils évalués ici n'ont donc rien d'une technologie arrivée à maturité. Une partie des résultats mesurés peut refléter non seulement la qualité intrinsèque des modèles, mais aussi le fait que les cliniciens et les organisations apprennent encore à s'en servir. Cela impose de rester prudent face aux promesses actuelles, sans pour autant figer trop vite dans le marbre les performances observées aujourd'hui.

Ce qu'on peut retenir

Cette étude apporte un message utile, justement parce qu'il est sobre. Les scribes IA ne semblent pas abolir la charge administrative des médecins. En revanche, ils sont associés à une réduction modeste mais réelle du temps passé à documenter, et à une légère hausse du nombre de consultations dans certains contextes.

Leur intérêt paraît donc plausible pour des cliniciens très exposés à la charge documentaire. Mais les analyses exploratoires du papier suggèrent surtout que ces outils pourraient être particulièrement utiles en soins primaires et chez les utilisateurs qui les intègrent réellement dans leur pratique. Ces résultats ne justifient ni enthousiasme sans nuance, ni rejet global.

La bonne lecture de ce papier est probablement la suivante : les scribes IA sont des outils qui peuvent réduire certaines frictions administratives, pas des solutions magiques. Ils peuvent alléger une partie de la charge documentaire là où elle pèse le plus, mais ils ne réorganisent pas à eux seuls la complexité du travail clinique.

Si l'on veut savoir s'ils améliorent durablement le quotidien des soignants, il faudra encore des travaux sur plusieurs dimensions : la qualité réelle des notes, l'acceptabilité à long terme, les effets sur le burnout, les coûts, la sécurité, et l'impact selon les spécialités. On peut donc rester prudent sur ce que montrent les versions actuelles de ces outils, tout en gardant à l'esprit que des modèles plus mûrs et une meilleure maîtrise par les équipes pourraient conduire à des gains plus nets à l'avenir. Pour l'instant, cette grande étude multicentrique suggère surtout une chose simple : oui, il y a un gain ; non, ce n'est pas un bouleversement. Et en matière d'évaluation des promesses de l'IA, cette nuance compte beaucoup.