Culture

Une IA pour déchiffrer des langues anciennes

Temps de lecture : 2 min

La plupart des langues qui ont existé ne sont à ce jour plus parlées.

Réussir à déchiffrer des langues anciennes permettrait de mieux comprendre les peuples qui les parlaient. | AlexanderPaukner via Pixabay
Réussir à déchiffrer des langues anciennes permettrait de mieux comprendre les peuples qui les parlaient. | AlexanderPaukner via Pixabay

Une équipe de scientifiques du laboratoire de recherche en informatique et intelligence artificielle du MIT a créé une intelligence artificielle (IA) capable de déchiffrer automatiquement des langues éteintes depuis bien longtemps. Pour ce faire, la nouvelle technologie n'a besoin d'aucune connaissance préalable sur la langue étudiée, ni sur les liens qu'elle pourrait avoir avec d'autres langues.

Le but de ce nouveau projet est de découvrir les différentes relations qui existent entre certaines langues mortes, pour lesquelles les historien·nes ont des traces écrites malheureusement difficiles à comprendre, ces langues n'étant plus parlées depuis très longtemps.

La recherche suggère que la plupart des langues qui ont existé ne sont à ce jour plus parlées. Des douzaines de langues mortes sont actuellement considérées comme perdues, les linguistes ayant trop peu d'informations sur leur grammaire, leur vocabulaire ou leur syntaxe pour être capables de comprendre les textes retrouvés. Pour les scientifiques, réussir à déchiffrer ces langues permettrait pourtant de mieux comprendre les peuples qui les parlaient.

Un algorithme qui comprend des langues mortes

L'équipe du MIT a développé un algorithme capable de comprendre comment les langues évoluent avec le temps. Celui-ci parvient ensuite à déterminer certains schémas linguistiques et à mieux appréhender ces langues.

L'algorithme sait classifier les mots d'une langue ancienne et les relier à ceux d'une autre langue. Si cette intelligence artificielle ne peut pas, comme le ferait un service de traduction en ligne, déchiffrer des textes anciens ni les traduire dans une langue moderne, elle peut néanmoins identifier les racines de la langue étudiée.

Par exemple, l'algorithme a notamment été capable d'identifier avec précision la famille linguistique à laquelle appartient l'Ibère, une langue autochtone disparue qui était parlée en Europe de l'Ouest environ du VIIe au Ier siècle avant Jésus Christ. Alors que son lien avec le Basque a souvent été débattu, l'IA a tranché la question. Pour l'algorithme, les deux langues sont indépendantes.

L'équipe de recherche espère que le nouveau système sera bientôt capable de déchiffrer des langues mortes qui échappent aux linguistes depuis des décennies, en utilisant seulement quelques milliers de mots.

Newsletters

«Parks and Recreation» est la série feel good dont nous avons besoin

«Parks and Recreation» est la série feel good dont nous avons besoin

La série culte est enfin disponible en France, et elle n'aurait pas pu tomber à un meilleur moment.

«The Crown», saison 4: ce qui est vrai, ce qui est faux

«The Crown», saison 4: ce qui est vrai, ce qui est faux

La dernière saison des aventures de la famille royale est tirée de faits réels. Mais pas que.

2020 a été si chaotique que l'Oxford Dictionary a choisi plusieurs mots de l'année

2020 a été si chaotique que l'Oxford Dictionary a choisi plusieurs mots de l'année

En temps normal, seul un terme est désigné par le dictionnaire britannique pour résumer l'année écoulée.

Newsletters