Google Traduction parlait déjà français, mais avec la dernière mise à jour de son moteur, il double quasiment le nombre de langues prises en charge, avec de nombreux dialectes et langues apparentées. On trouve par exemple plusieurs créoles français, le breton ou encore l'occitan.

Google Traduction propose une mise à jour historique

La dernière version de Google Translate prend en charge 110 nouvelles langues. Jusqu'à présent, Google Translate prenait en charge 133 langues. Cette extension, que l'entreprise qualifie de plus importante de son histoire, représente donc une mise à jour historique.



Les langues varient énormément : variétés régionales, dialectes, normes orthographiques différentes. En fait, de nombreuses langues n'ont pas de forme standard et il est donc impossible de choisir la "bonne" variété. L'approche de Google a consisté à donner la priorité aux variétés les plus couramment utilisées de chaque langue. Par exemple, le romani est une langue qui compte de nombreux dialectes dans toute l'Europe. Les modèles de l'entreprise produisent un texte qui se rapproche le plus du romani Vlax méridional, une variété couramment utilisée en ligne. Mais ils intègrent également des éléments d'autres variétés, comme le vlax du nord et le romani des Balkans.

Pour ce faire, celui que l'on appelle souvent Google Translate s'est appuyé sur le modèle d'intelligence artificielle PaLM 2 de l'entreprise. Il s'est avéré particulièrement efficace pour apprendre les langues apparentées, telles que les langues "proches de l'hindi, comme l'awadhi et le marwadi, et les créoles français comme le créole seychellois et le créole mauricien", explique Isaac Caswell, de Google, dans un article de blog.



La liste des langues nouvellement prises en charge par Translate inclut aussi le cantonais, qui "est depuis longtemps l'une des langues les plus demandées", selon Caswell qui précise que le cantonais se confond souvent avec le mandarin à l'écrit, il est donc difficile de trouver des données et d'entraîner des modèles. Au total, un quart des nouvelles langues proviennent d'Afrique.



La plupart des nouvelles langues sont parlées par au moins un million de personnes, tandis que "plusieurs" sont parlées par des centaines de millions de personnes. Voilà qui devrait permettre à la firme de Mountain View de toucher quasiment toute la planète.



Et vous, vous êtes plutôt Google Traduction, Traduire d'Apple, Deepl ou autre ?

Télécharger l'app gratuite Google Traduction