Tech & internet / Monde

Les langues africaines et asiatiques ignorées des technologies de reconnaissance vocale

Temps de lecture : 2 min

Les pays dont les locuteurs et locutrices sont pauvres n’intéressent pas vraiment la Silicon valley.

Des enfants à l'école à Kampal en Ouganda | Bill Wegener via Unsplash CC License by
Des enfants à l'école à Kampal en Ouganda | Bill Wegener via Unsplash CC License by

L’enceinte connectée est la dernière tendance des gadgets technologiques. Google et Amazon, les deux plus gros vendeurs de ce type de produits, en commercialisent désormais à moins de cinquante euros, ce qui va vraisemblablement faire de l’Amazon Echo et du Google Home des cadeaux vedettes de Noël 2018.

Selon les prédictions d’une association de consommateurs américaine, vingt-deux millions d’enceintes connectées seront offertes sous les sapins cette année aux États-Unis. Les choses seront bien différentes sur d'autres continents: d'après une étude de Caribou Digital et du DFS Lab, les développeurs de technologies de reconnaissance vocale ne s’intéressent pas à certaines langues, notamment africaines et asiatiques.

S'ils ont récemment accompli de grandes avancées dans le domaine, les concepteurs crééent par la même occasion un fossé entre les langues. Car avec le développement des commandes vocales, il est probable que tout un écosystème reposant sur elles se créé. Écosystème auquel les locuteurs et locutrices d’une langue ignorée ne pourront pas prendre part.

Objectif profits

Les langues africaines et asiatiques sont laissées de côté principalement parce qu'elles sont parlées par des populations pauvres –les constructeurs voulant avant tout que leur technologie soit profitable. Les scientifiques auteurs de l’étude soulignent qu’en multipliant le nombre de locuteurs et locutrices par le PIB par tête, les 100 langages les plus usités du monde couvrent 96% du PIB global, alors qu’ils ne représentent que 60% de la population mondiale. Ce qui veut dire que 40% de la population parlent des langues qui ne représentent que des petits marchés.

Un autre obstacle au développement de ces technologies réside dans des bases de données insuffisantes. Même le kiswahili, parlé par plus 100 millions de personnes, n’a apparemment pas assez de données facilement accessibles. Pour créer un service qui permette d’interagir par la voix avec une machine, il faut approximativement 100.000 heures de dialogue enregistrées.

Slate.fr

Newsletters

En Indonésie, le compte Instagram d'un dessinateur de personnages homosexuels mystérieusement supprimé

En Indonésie, le compte Instagram d'un dessinateur de personnages homosexuels mystérieusement supprimé

Le Gouvernement indonésien assume avoir demandé la suppression de ce compte au réseau social, qui dément pour sa part avoir satisfait à sa demande.

Twitter, vecteur de la haine ordinaire

Twitter, vecteur de la haine ordinaire

À la lumière des agissements outranciers de la Ligue du LOL, il est temps de dénoncer ce médium dont on détourne la raison première pour mieux distiller sa petite haine au quotidien.

Se servir de la reconnaissance faciale lors d’un procès, une délicate question éthique

Se servir de la reconnaissance faciale lors d’un procès, une délicate question éthique

Aux États-Unis, le procédé commence à être utilisé dans des affaires mineures.

Newsletters