Tech & internet / Monde

Les langues africaines et asiatiques ignorées des technologies de reconnaissance vocale

Temps de lecture : 2 min

Les pays dont les locuteurs et locutrices sont pauvres n’intéressent pas vraiment la Silicon valley.

Des enfants à l'école à Kampal en Ouganda | Bill Wegener via Unsplash CC License by
Des enfants à l'école à Kampal en Ouganda | Bill Wegener via Unsplash CC License by

L’enceinte connectée est la dernière tendance des gadgets technologiques. Google et Amazon, les deux plus gros vendeurs de ce type de produits, en commercialisent désormais à moins de cinquante euros, ce qui va vraisemblablement faire de l’Amazon Echo et du Google Home des cadeaux vedettes de Noël 2018.

Selon les prédictions d’une association de consommateurs américaine, vingt-deux millions d’enceintes connectées seront offertes sous les sapins cette année aux États-Unis. Les choses seront bien différentes sur d'autres continents: d'après une étude de Caribou Digital et du DFS Lab, les développeurs de technologies de reconnaissance vocale ne s’intéressent pas à certaines langues, notamment africaines et asiatiques.

S'ils ont récemment accompli de grandes avancées dans le domaine, les concepteurs crééent par la même occasion un fossé entre les langues. Car avec le développement des commandes vocales, il est probable que tout un écosystème reposant sur elles se créé. Écosystème auquel les locuteurs et locutrices d’une langue ignorée ne pourront pas prendre part.

Objectif profits

Les langues africaines et asiatiques sont laissées de côté principalement parce qu'elles sont parlées par des populations pauvres –les constructeurs voulant avant tout que leur technologie soit profitable. Les scientifiques auteurs de l’étude soulignent qu’en multipliant le nombre de locuteurs et locutrices par le PIB par tête, les 100 langages les plus usités du monde couvrent 96% du PIB global, alors qu’ils ne représentent que 60% de la population mondiale. Ce qui veut dire que 40% de la population parlent des langues qui ne représentent que des petits marchés.

Un autre obstacle au développement de ces technologies réside dans des bases de données insuffisantes. Même le kiswahili, parlé par plus 100 millions de personnes, n’a apparemment pas assez de données facilement accessibles. Pour créer un service qui permette d’interagir par la voix avec une machine, il faut approximativement 100.000 heures de dialogue enregistrées.

Slate.fr

Newsletters

Les États de l'Union européenne et les géants du web, main dans la main pour faciliter la censure

Les États de l'Union européenne et les géants du web, main dans la main pour faciliter la censure

Le texte européen le plus liberticide de cette décennie est en approche.

La course contre la montre pour sauver le contenu adulte de Tumblr

La course contre la montre pour sauver le contenu adulte de Tumblr

Une petite entreprise d'archivage a décidé de sauvegarder les documents en danger.

En Australie, les médias n'ont pas le droit de couvrir le procès d'un cardinal accusé de pédophilie

En Australie, les médias n'ont pas le droit de couvrir le procès d'un cardinal accusé de pédophilie

La justice australienne a interdit à la presse de publier le verdict du procès afin de ne pas influencer un autre procès en cours.

Newsletters