[ad_1]
Telecombedrijf Veon, mobiele operator Beeline Kazachstan, het Barcelona Supercomputing Center en de GSMA-lobbygroep zeiden woensdag dat ze zouden samenwerken om een “AI-taalkloof” voor ondervertegenwoordigde talen te overbruggen.
Grote taalmodellen die 'bots' zoals chatGPT aandrijven, vertrouwen vaak op grote hoeveelheden online gegevens, zoals digitale boeken, websites, artikelen en blogs, om te leren hoe ze mensachtige reacties kunnen genereren. Maar de gegevens en bronnen in sommige talen zijn beperkt.
“Van de bijna 7000 talen die over de hele wereld worden gesproken, worden er slechts zeven beschouwd als talen met veel hulpbronnen in de digitale wereld: Engels, Spaans, Frans, Mandarijn, Arabisch, Duits en Japans”, aldus de groepen in een gezamenlijke verklaring.
Ze zullen samenwerken aan de ontwikkeling van tools en taalmodeldocumentatie in ondervertegenwoordigde talen, waaronder de talen die gesproken worden in de landen waar Veon actief is: Pakistan, Oekraïne, Bangladesh, Kazachstan, Oezbekistan en Kirgizië.
Een andere taal was het Catalaans, dat door ongeveer 10 miljoen mensen wordt gesproken, aldus de verklaring.
“Het gebrek aan middelen in andere talen resulteert in een AI-taalkloof die leidt tot een suboptimale gebruikerservaring in AI-toepassingen, de vooringenomenheid in AI-modellen verdiept en het risico inhoudt dat de digitale kloof in AI-technologieën groter wordt”, voegde ze eraan toe.
[ad_2]
Source link