abusesaffiliationarrow-downarrow-leftarrow-rightarrow-upattack-typeblueskyburgerchevron-downchevron-leftchevron-rightchevron-upClock iconclosedeletedevelopment-povertydiscriminationdollardownloademailenvironmentexternal-linkfacebookfilterflaggenderglobeglobegroupshealthC4067174-3DD9-4B9E-AD64-284FDAAE6338@1xinformation-outlineinformationinstagraminvestment-trade-globalisationissueslabourlanguagesShapeCombined Shapeline, chart, up, arrow, graphLinkedInlocationmap-pinminusnewsorganisationotheroverviewpluspreviewArtboard 185profilerefreshIconnewssearchsecurityPathStock downStock steadyStock uptagticktooltiptriangletwitteruniversalitywebwhatsappxIcons / Social / YouTube

Эта страница недоступна на Русский и отображается на French

Статья

8 Сен 2025

Автор:
Africanews

La fondation Gates soutient un programme d'intégration des langues africaines dans l'intelligence artificielle pour réduire la fracture numérique

"Des IA en langues africaines pour réduire la fracture numérique", 8 septembre 2025

Des initiatives sont en cours en Afrique du Sud, au Kenya et au Nigeria pour créer plus d’outils d’IA en langues africaines. Des chercheurs ont déjà enregistré plus de 9 000 heures de discours local afin d’élargir l’accès à cette technologie révolutionnaire sur le continent.

Alors que l’utilisation des modèles de langage basés sur l’intelligence artificielle (IA) explose, avec de nombreux sites web alimentés par l’IA intégrés dans la vie quotidienne, certains en Afrique craignent que leurs populations soient exclues des logiciels principalement occidentalisés.

Malgré la richesse linguistique de l’Afrique, où plus d’un quart des langues mondiales seraient présentes selon certaines estimations, cette diversité est encore peu représentée dans le développement de l’IA. La principale raison ? un manque d’investissement et de données accessibles. La majorité des outils d’IA, comme ChatGPT, sont entraînés sur des textes en anglais ou dans d’autres langues européennes et chinoises, qui disposent d’immenses bases de données en ligne.

Or, de nombreuses langues africaines, principalement orales, ne disposent pas de suffisamment de textes écrits pour alimenter l’apprentissage automatique, ce qui limite leur intégration dans ces technologies. Résultat : des millions de personnes sont laissées de côté...

Les chercheurs ont récemment publié ce qui serait le plus grand ensemble de données linguistiques pour les langues africaines...

L’initiative « African Next Voices » a rassemblé linguistes et informaticiens pour créer des jeux de données adaptés à l’IA dans 18 langues africaines. Bien que cela ne couvre qu’une fraction des plus de 2 000 langues parlées sur le continent, les participants espèrent étendre cette base dans le futur.

En deux ans, ils ont enregistré 9 000 heures de discours dans des contextes quotidiens liés à l’agriculture, à la santé et à l’éducation, à Kenya, au Nigeria, et en Afrique du Sud. Parmi les langues enregistrées figurent le kikuyu et le dholuo au Kenya, le haoussa et le yoruba au Nigeria, ainsi que l’isiZulu et le tshivenda en Afrique du Sud...