Un programme reconstitue automatiquement les langues anciennes

Un Maori de Nouvelle-Zélande. La langue maori fait partie du grand groupe des langues austronésiennes étudié par Alexandre Bouchard-Côté.New Zealand: Maori Culture 009 Babasteve, Flickr sous licence Creative Commons

Comme les êtres vivants, les langues évoluent, se transforment, disparaissent. Le New Scientist rapporte que des chercheurs canadiens et américains ont exploité les changements phonétiques entre les langues pour retrouver automatiquement les caractéristiques de langues anciennes à l'aide d'un programme informatique.

Les balbutiements des changements phonétiques qui mènent à l’apparition d’une nouvelle langue s’observent notamment dans les différences entre français de France et du Québec. Par exemple, là où les Français prononcent «moi», les Québécois disent volontiers «moé».

Alexandre Bouchard-Côté de l’université de Colombie-Britannique, à Vancouver, a créé avec ses collègues un algorithme capable de remplacer le laborieux travail manuel du chercheur en linguistique. En effet, un des grands défis dans la recherche en linguistique consiste à reconstruire les mots apparus dans les protolangues à partir desquelles les langues modernes se sont formées.

Une des méthodes les plus prisées, dite méthode comparative, ressemble à celle qu’utilisent les biologistes de l’évolution pour retrouver l’ancêtre commun de deux espèces: en analysant systématiquement les mots et les sons des deux langues, on peut retrouver ceux qui existaient déjà dans la protolangue commune aux deux langues modernes.

En s’appuyant sur l’intelligence artificielle, l’algorithme a effectué ce travail pour 637 langues austronésiennes. Celles-ci constituent le deuxième plus grand groupe linguistique au monde, avec entre autres le javanais, le malais-indonésien et le malgache. Le programme a retrouvé les mêmes résultats que les spécialistes qui avaient travaillé à la main, à une lettre près dans 85% des cas.

Les chercheurs précisent dans leur article, accepté par le journal scientifique PNAS, que l’analyse offre également de bons arguments pour expliquer la manière dont les langues se modifient. Selon l’hypothèse dite de charge fonctionnelle, introduite en 1955, les sons qui jouent le rôle le plus important dans la reconnaissance d’un mot ont le moins de chances de changer dans le temps. Cette hypothèse semble être largement démontrée grâce à l’approche quantitative permise par l’utilisation de l’algorithme.

En analysant de très nombreuses langues à la fois, une tâche impossible à la main, le programme pourrait permettre de reconstituer avec précision des langues plus anciennes encore.

La connaissance des langues anciennes ouvre des portes sur l’histoire humaine depuis ses débuts. Elle permet d’étudier les migrations, les évolutions technologiques et les écritures des premières sociétés. Le New Scientist donne l’exemple du mot «roue», dont la divergence à partir d’une protolangue en Europe offre des indications à propos des peuplements humains.

Le programme pourrait également permettre d’améliorer les traductions automatiques entre langues proches, telles que le portugais et le français.

A LIRE AUSSI