lundi, 18/05/2026
  • Tiếng Việt
  • English
  • French

Bảo tàng lịch sử Quốc gia

Musée National d'Histoire du Vietnam

22/01/2026 15:52 519
Rating: 0/5 (0 votes)


L'IA nous livre les secrets des textes médiévaux / CQFD / 26 min. / le 13 janvier 2026

Un projet international, baptisé CoMMA, utilise l’intelligence artificielle pour retranscrire des manuscrits médiévaux à grande échelle. Cette avancée technologique ouvre l’accès à des trésors historiques longtemps inexplorés et permet de mieux comprendre notre passé.

Les manuscrits médiévaux, souvent volumineux et richement décorés, représentent un défi pour les chercheurs: colonnes de texte, annotations marginales, initiales enluminées, abréviations… Leur analyse exige un travail minutieux et chronophage. Grâce à CoMMA, ces documents peuvent désormais être étudiés à une échelle inédite, offrant un éclairage nouveau sur les dynamiques culturelles et linguistiques du Moyen Âge.

L’IA au service de l’histoire

Face à ces complexités, l’intelligence artificielle propose des outils puissants. Thibault Clérice, chercheur en humanités computationnelles à l’INRA (France), explique que des modèles d’intelligence artificielle comme Kraken, développés à Paris, permettent de lire et transcrire automatiquement les manuscrits ligne par ligne. Là où un humain mettrait des mois pour retranscrire un ouvrage de plusieurs centaines de pages, une machine accomplit cette tâche en 10 à 20 minutes, à condition que les documents soient numérisés.

Ces technologies ne sont toutefois pas infaillibles: avec un taux d’erreur d’environ 10%, les chercheurs doivent corriger et valider les transcriptions. Aux erreurs s’ajoutent les analyses que les IA ne peuvent pas réaliser, la qualité du parchemin, le type d’encre utilisée. Les éléments artistiques comme les enluminures sont des sources d’informations qui sont encore analysées pas l’humain. "La recherche reste un équilibre entre complémentarité homme-machine", souligne dans l'émission CQFD du 13 janvier Simon Gabay, maître-assistant en humanités numériques à l’Université de Genève et spécialiste de philologie romane.

Un accès élargi au patrimoine écrit

L’un des objectifs majeurs du projet CoMMA est de rendre accessibles des manuscrits qui, sans la numérisation et l’IA, seraient restés dans l’oubli faute de moyens humains. Il ouvre encore des perspectives dans le domaine de la lexicologie. Avec l’élargissement du corpus de textes médiévaux numérisés et retranscrits, il est possible d’étudier l’évolution de la langue, et par exemple dater l’apparition de nouveaux mots. Des travaux qui permettent de mieux appréhender les préoccupations de différentes époques et la manière que l’on avait d’en parler.

Une révolution pour les sciences humaines

La standardisation des transcriptions, bien que susceptible d’effacer certaines nuances, est essentielle pour rendre ces textes lisibles et exploitables. Elle recrée une version fidèle des manuscrits tout en respectant leur authenticité.

En combinant les méthodes traditionnelles de la philologie avec les avancées computationnelles, les chercheurs peuvent désormais explorer les langues et cultures médiévales à une échelle inédite. Ce projet illustre comment l’intelligence artificielle contribue à préserver et valoriser notre patrimoine culturel.

Propos recueillis par Arditë Shabani

Adaptation web: Sébastien Foggiato

https://www.rts.ch/

Shares: