Culture

Une IA pour déchiffrer des langues anciennes

Temps de lecture : 2 min

La plupart des langues qui ont existé ne sont à ce jour plus parlées.

Réussir à déchiffrer des langues anciennes permettrait de mieux comprendre les peuples qui les parlaient. | AlexanderPaukner via Pixabay
Réussir à déchiffrer des langues anciennes permettrait de mieux comprendre les peuples qui les parlaient. | AlexanderPaukner via Pixabay

Une équipe de scientifiques du laboratoire de recherche en informatique et intelligence artificielle du MIT a créé une intelligence artificielle (IA) capable de déchiffrer automatiquement des langues éteintes depuis bien longtemps. Pour ce faire, la nouvelle technologie n'a besoin d'aucune connaissance préalable sur la langue étudiée, ni sur les liens qu'elle pourrait avoir avec d'autres langues.

Le but de ce nouveau projet est de découvrir les différentes relations qui existent entre certaines langues mortes, pour lesquelles les historien·nes ont des traces écrites malheureusement difficiles à comprendre, ces langues n'étant plus parlées depuis très longtemps.

La recherche suggère que la plupart des langues qui ont existé ne sont à ce jour plus parlées. Des douzaines de langues mortes sont actuellement considérées comme perdues, les linguistes ayant trop peu d'informations sur leur grammaire, leur vocabulaire ou leur syntaxe pour être capables de comprendre les textes retrouvés. Pour les scientifiques, réussir à déchiffrer ces langues permettrait pourtant de mieux comprendre les peuples qui les parlaient.

Un algorithme qui comprend des langues mortes

L'équipe du MIT a développé un algorithme capable de comprendre comment les langues évoluent avec le temps. Celui-ci parvient ensuite à déterminer certains schémas linguistiques et à mieux appréhender ces langues.

L'algorithme sait classifier les mots d'une langue ancienne et les relier à ceux d'une autre langue. Si cette intelligence artificielle ne peut pas, comme le ferait un service de traduction en ligne, déchiffrer des textes anciens ni les traduire dans une langue moderne, elle peut néanmoins identifier les racines de la langue étudiée.

Par exemple, l'algorithme a notamment été capable d'identifier avec précision la famille linguistique à laquelle appartient l'Ibère, une langue autochtone disparue qui était parlée en Europe de l'Ouest environ du VIIe au Ier siècle avant Jésus Christ. Alors que son lien avec le Basque a souvent été débattu, l'IA a tranché la question. Pour l'algorithme, les deux langues sont indépendantes.

L'équipe de recherche espère que le nouveau système sera bientôt capable de déchiffrer des langues mortes qui échappent aux linguistes depuis des décennies, en utilisant seulement quelques milliers de mots.

Newsletters

Celui où Anaïs découvre le pilote de «Friends» (et où Marie se moque d'elle)

Celui où Anaïs découvre le pilote de «Friends» (et où Marie se moque d'elle)

L'une n'a jamais regardé Friends. L'autre a vu, revu et re-revu la série culte des dizaines de fois, dans son intégralité. Anaïs Bordages et Marie Telling sont amies et critiques de séries télé: dans AMIES, Marie va faire découvrir à Anaïs sa...

Anne Sylvestre était bien plus qu'une chanteuse pour enfants

Anne Sylvestre était bien plus qu'une chanteuse pour enfants

Ouvertement féministe, engagée malgré elle, Anne Sylvestre a écrit des centaines de chansons plus poétiques, militantes et drôles les unes que les autres. Un répertoire trop complexe pour un public assoiffé de simplisme?

«Petite Fille», l'enfant, les mots et les regards

«Petite Fille», l'enfant, les mots et les regards

Diffusé sur Arte, le nouveau film de Sébastien Lifshitz accompagne pas à pas le combat d'une fillette née dans le corps d'un garçon et de sa mère, pour construire un espace vivable, et même heureux.

Newsletters