Culture

Une IA pour déchiffrer des langues anciennes

Temps de lecture : 2 min

La plupart des langues qui ont existé ne sont à ce jour plus parlées.

Réussir à déchiffrer des langues anciennes permettrait de mieux comprendre les peuples qui les parlaient. | AlexanderPaukner via Pixabay
Réussir à déchiffrer des langues anciennes permettrait de mieux comprendre les peuples qui les parlaient. | AlexanderPaukner via Pixabay

Une équipe de scientifiques du laboratoire de recherche en informatique et intelligence artificielle du MIT a créé une intelligence artificielle (IA) capable de déchiffrer automatiquement des langues éteintes depuis bien longtemps. Pour ce faire, la nouvelle technologie n'a besoin d'aucune connaissance préalable sur la langue étudiée, ni sur les liens qu'elle pourrait avoir avec d'autres langues.

Le but de ce nouveau projet est de découvrir les différentes relations qui existent entre certaines langues mortes, pour lesquelles les historien·nes ont des traces écrites malheureusement difficiles à comprendre, ces langues n'étant plus parlées depuis très longtemps.

La recherche suggère que la plupart des langues qui ont existé ne sont à ce jour plus parlées. Des douzaines de langues mortes sont actuellement considérées comme perdues, les linguistes ayant trop peu d'informations sur leur grammaire, leur vocabulaire ou leur syntaxe pour être capables de comprendre les textes retrouvés. Pour les scientifiques, réussir à déchiffrer ces langues permettrait pourtant de mieux comprendre les peuples qui les parlaient.

Un algorithme qui comprend des langues mortes

L'équipe du MIT a développé un algorithme capable de comprendre comment les langues évoluent avec le temps. Celui-ci parvient ensuite à déterminer certains schémas linguistiques et à mieux appréhender ces langues.

L'algorithme sait classifier les mots d'une langue ancienne et les relier à ceux d'une autre langue. Si cette intelligence artificielle ne peut pas, comme le ferait un service de traduction en ligne, déchiffrer des textes anciens ni les traduire dans une langue moderne, elle peut néanmoins identifier les racines de la langue étudiée.

Par exemple, l'algorithme a notamment été capable d'identifier avec précision la famille linguistique à laquelle appartient l'Ibère, une langue autochtone disparue qui était parlée en Europe de l'Ouest environ du VIIe au Ier siècle avant Jésus Christ. Alors que son lien avec le Basque a souvent été débattu, l'IA a tranché la question. Pour l'algorithme, les deux langues sont indépendantes.

L'équipe de recherche espère que le nouveau système sera bientôt capable de déchiffrer des langues mortes qui échappent aux linguistes depuis des décennies, en utilisant seulement quelques milliers de mots.

Newsletters

Dans les salles de concert, le public manque à l'appel

Dans les salles de concert, le public manque à l'appel

Alors que les annonces de tournée se multiplient, les ventes de billets sont loin de ce que les programmateurs et tourneurs espéraient.

Quand la baguette de pain a-t-elle été inventée?

Quand la baguette de pain a-t-elle été inventée?

La réponse vous surprendra: c'était il y a très peu de temps.

17 octobre 1961: quelles traces reste-t-il du massacre des Algériens à Paris?

17 octobre 1961: quelles traces reste-t-il du massacre des Algériens à Paris?

Dans un documentaire sonore produit par Binge Audio, Tristan Thil exhume des archives poignantes.

Podcasts Grands Formats Séries
Slate Studio