Preloader
WAXAL : la base de données vocale pour l'IA en langues africaines lancée par Google

WAXAL : la base de données vocale pour l'IA en langues africaines lancée par Google

Feb 18, 2026 9 min de lecture 25 vues

WAXAL répond à un défi majeur : sur plus de 2 000 langues africaines, moins de 5% disposent de ressources suffisantes pour l'IA vocale, excluant des millions de personnes des assistants vocaux, transcriptions et outils d'IA.

Google a récemment dévoilé WAXAL, une vaste base de données vocale ouverte dédiée à 21 langues d'Afrique subsaharienne, marquant une avancée majeure pour l'intelligence artificielle inclusive sur le continent. Ce projet, développé sur trois ans avec un financement de Google, vise à combler le fossé numérique affectant plus de 100 millions de locuteurs.

Contexte du lancement

WAXAL répond à un défi majeur : sur plus de 2 000 langues africaines, moins de 5% disposent de ressources suffisantes pour l'IA vocale, excluant des millions de personnes des assistants vocaux, transcriptions et outils d'IA. Lancé officiellement début février 2026, ce dataset contient plus de 11 000 heures d'enregistrements vocaux issus de près de deux millions d'échantillons individuels, incluant 1 250 heures de parole naturelle transcrite et plus de 20 heures d'enregistrements studio pour des voix synthétiques réalistes. Aisha Walcott-Bryant, responsable de Google Research Africa, souligne que WAXAL permet aux communautés africaines de développer des technologies adaptées à leurs contextes locaux.

Les langues couvertes et les partenaires

La base couvre 21 langues clés comme le haoussa, le yoruba, l'igbo, le luganda, le swahili, l'acholi, le peul et l'ikposo, parlées par des centaines de millions de personnes en Afrique de l'Ouest, de l'Est et du Centre. Des institutions africaines leaders ont piloté la collecte : l'université Makerere (Ouganda), l'université du Ghana, Digital Umuganda (Rwanda) et l'Institut africain des sciences mathématiques (AIMS). Plus de 7 000 volontaires au Ghana seul ont contribué, et les partenaires conservent la propriété des données tout en les rendant accessibles mondialement.

Impacts attendus sur l'IA africaine


WAXAL boostera les applications en éducation, santé, agriculture et commerce, rendant les outils vocaux accessibles aux locuteurs non anglophones. Joyce Nakatumba-Nabende, maître de conférences à Makerere, insiste : « Pour que l'IA impacte l'Afrique, elle doit parler nos langues et comprendre nos contextes ». Isaac Wiafe, professeur associé à l'université du Ghana, prévoit une innovation accélérée dans ces secteurs grâce à ces données de qualité. Open-source, WAXAL favorise startups et chercheurs locaux, comme Lelapa AI en Afrique du Sud avec Vulavula.

Initiatives connexes de Google

Ce lancement s'inscrit dans une stratégie plus large : en octobre 2025, Google a publié un glossaire de 100 termes d'IA en swahili, afrikaans, xhosa et isiZulu pour 266 millions de locuteurs. Google Traduction intègre aussi de nouvelles langues africaines depuis 2024. Au Nigeria, N-ATLAS (modèle open-source pour yoruba, haoussa, igbo) complète ces efforts en septembre 2025.

Perspectives et défis futurs

WAXAL ouvre la voie à une IA africaine souveraine, mais des défis persistent : extension à plus de langues, formation de talents locaux et intégration culturelle. Disponible publiquement, ce dataset pourrait catalyser une vague d'innovations, renforçant la présence africaine dans l'IA mondiale d'ici 2027. Google confirme ainsi son engagement pour une technologie inclusive en Afrique.

La Rédaction

Articles similaires

QUAND L’IA DEVIENT UN CRITERE DE COMPETANCE : LE NOUVEAU CONTRAT IMPLICITE CHEZ LES BIG TECH

Depuis 2026, l’IA générative n’est plus seulement encouragée dans la Big Tech : son usage devient me...

Prism : quand l’IA s’invite dans l’atelier de l’écriture scientifique

Prism se présente comme un espace de travail LaTeX natif, dans le cloud, avec collaboration temps ré...