Culture

Une IA pour déchiffrer des langues anciennes

Temps de lecture : 2 min

La plupart des langues qui ont existé ne sont à ce jour plus parlées.

Réussir à déchiffrer des langues anciennes permettrait de mieux comprendre les peuples qui les parlaient. | AlexanderPaukner via Pixabay
Réussir à déchiffrer des langues anciennes permettrait de mieux comprendre les peuples qui les parlaient. | AlexanderPaukner via Pixabay

Une équipe de scientifiques du laboratoire de recherche en informatique et intelligence artificielle du MIT a créé une intelligence artificielle (IA) capable de déchiffrer automatiquement des langues éteintes depuis bien longtemps. Pour ce faire, la nouvelle technologie n'a besoin d'aucune connaissance préalable sur la langue étudiée, ni sur les liens qu'elle pourrait avoir avec d'autres langues.

Le but de ce nouveau projet est de découvrir les différentes relations qui existent entre certaines langues mortes, pour lesquelles les historien·nes ont des traces écrites malheureusement difficiles à comprendre, ces langues n'étant plus parlées depuis très longtemps.

La recherche suggère que la plupart des langues qui ont existé ne sont à ce jour plus parlées. Des douzaines de langues mortes sont actuellement considérées comme perdues, les linguistes ayant trop peu d'informations sur leur grammaire, leur vocabulaire ou leur syntaxe pour être capables de comprendre les textes retrouvés. Pour les scientifiques, réussir à déchiffrer ces langues permettrait pourtant de mieux comprendre les peuples qui les parlaient.

Un algorithme qui comprend des langues mortes

L'équipe du MIT a développé un algorithme capable de comprendre comment les langues évoluent avec le temps. Celui-ci parvient ensuite à déterminer certains schémas linguistiques et à mieux appréhender ces langues.

L'algorithme sait classifier les mots d'une langue ancienne et les relier à ceux d'une autre langue. Si cette intelligence artificielle ne peut pas, comme le ferait un service de traduction en ligne, déchiffrer des textes anciens ni les traduire dans une langue moderne, elle peut néanmoins identifier les racines de la langue étudiée.

Par exemple, l'algorithme a notamment été capable d'identifier avec précision la famille linguistique à laquelle appartient l'Ibère, une langue autochtone disparue qui était parlée en Europe de l'Ouest environ du VIIe au Ier siècle avant Jésus Christ. Alors que son lien avec le Basque a souvent été débattu, l'IA a tranché la question. Pour l'algorithme, les deux langues sont indépendantes.

L'équipe de recherche espère que le nouveau système sera bientôt capable de déchiffrer des langues mortes qui échappent aux linguistes depuis des décennies, en utilisant seulement quelques milliers de mots.

Newsletters

«Au vieux pays de mes pères», un podcast qui invite à questionner l'histoire familiale

«Au vieux pays de mes pères», un podcast qui invite à questionner l'histoire familiale

Dans ce documentaire en quatre volets produit par Binge Audio, Thomas Rozec tente de découvrir la vérité sur le supposé passé collaborationniste de son arrière-grand-père breton.

Dans les comics, les gros sont rarement des super-héros

Dans les comics, les gros sont rarement des super-héros

Il s'agit soit de super-héros en crise existentielle, soit de super-vilains, soit de personnages secondaires... Quand leur surpoids n'est pas simplement le super-pouvoir qui les caractérise.

Celui où Anais et Marie font leur (clip) show

Celui où Anais et Marie font leur (clip) show

En attendant le grand retour d'AMIES la semaine prochaine, on vous propose un épisode un peu spécial, dans la grande tradition de Friends. Voici donc un clip show avec les meilleurs moments des onze premiers épisodes d'AMIES entrecoupés de...

Newsletters