Nvidia démocratise l’ia vocale pour toutes les langues d’europe

NVIDIA renforce l'intelligence artificielle multilingue en Europe
Alors que l’intelligence artificielle (IA) semble omniprésente, elle reste pourtant limitée à une infime portion des 7 000 langues parlées dans le monde. Ce fossé linguistique exclut une grande partie de la population mondiale des avancées technologiques. NVIDIA entend bien corriger cette lacune, en se concentrant notamment sur les langues européennes sous-représentées dans les outils d’IA actuels.
Une boîte à outils open source pour 25 langues européennes
La société a récemment dévoilé une nouvelle suite d’outils open source conçus pour permettre aux développeurs de créer des solutions d’IA vocale de haute qualité dans 25 langues européennes. Cela inclut bien sûr les langues les plus courantes, mais aussi des idiomes souvent négligés par les grandes entreprises technologiques, tels que le croate, l’estonien ou le maltais.
L’objectif est de fournir les fondations nécessaires pour concevoir des outils vocaux performants, jusqu’ici réservés à quelques langues dominantes :
- Chatbots multilingues réellement capables de comprendre leurs utilisateurs
- Services clients automatisés
- Outils de traduction instantanée
Granary : une immense bibliothèque audio pour entraîner l’IA
Au cœur de cette initiative repose Granary, une base de données colossale regroupant environ un million d’heures d’enregistrements vocaux soigneusement annotés. Ce corpus vise à affiner les capacités de reconnaissance vocale et de traduction automatique des modèles d’IA.
Pour exploiter pleinement ces données, NVIDIA met aussi à disposition deux nouveaux modèles d'intelligence artificielle spécialement conçus pour les tâches linguistiques :
- Canary-1b-v2 : un modèle puissant pensé pour offrir une précision optimale en transcription et traduction, même dans les cas complexes.
- Parakeet-tdt-0.6b-v3 : conçu pour les applications en temps réel, où la rapidité est primordiale.
Une innovation technologique au service de l’inclusivité
Granary sera présenté durant la conférence Interspeech qui se tiendra prochainement aux Pays-Bas. Les développeurs peuvent déjà accéder à la base de données et aux deux modèles via la plateforme Hugging Face.
Mais l’innovation majeure réside surtout dans la façon dont ces données ont été produites. Plutôt que de passer par le processus long et coûteux d’annotation manuelle, l’équipe de NVIDIA, en collaboration avec les chercheurs de Carnegie Mellon University et de la Fondation Bruno Kessler, a automatisé ce processus via leur propre outil NeMo. Résultat : des données structurées de haute qualité issues d’audio brut non étiqueté.
Cette avancée constitue un véritable bond en avant pour l’inclusivité numérique. Grâce à ces outils, un développeur basé à Riga ou Zagreb peut désormais créer des assistants vocaux qui comprennent parfaitement la langue locale — et ce, de façon bien plus efficace. Les chercheurs ont démontré que les données de Granary permettent d’atteindre un certain niveau de précision avec deux fois moins de données qu’avec d’autres corpus populaires.
Des performances qui rivalisent avec les plus grands
Les deux nouveaux modèles d’IA illustrent parfaitement ces avancées :
- Canary-1b-v2 égale ou dépasse même des modèles trois fois plus gros en termes de qualité de transcription et traduction, tout en étant jusqu’à dix fois plus rapide.
- Parakeet analyse en temps réel de longues séquences audio, comme des réunions de 24 minutes, en détectant automatiquement la langue, avec une excellente gestion de la ponctuation, des capitales et des horodatages mot par mot.
Vers une IA vraiment multilingue pour tous
En démocratisant l’accès à ces outils puissants et en partageant leur méthodologie, NVIDIA ne se contente pas de livrer un simple produit technologique. L’entreprise espère insuffler une nouvelle dynamique d’innovation, où chaque développeur, peu importe sa langue ou sa localisation, peut construire des applications vocales intelligentes. Un pas décisif vers une intelligence artificielle qui parle réellement la langue de chacun.
Crédit photo : Aedrian Salazar
À lire aussi : DeepSeek revient chez NVIDIA après l’échec de la puce IA de Huawei
Événements à ne pas manquer
Vous souhaitez approfondir vos connaissances en intelligence artificielle et Big Data avec les leaders du secteur ? Ne manquez pas le AI & Big Data Expo, qui se déroulera à Amsterdam, en Californie et à Londres. Cet événement est coorganisé avec d'autres grands rendez-vous technologiques tels que :
Découvrez toutes les conférences et webinars à venir sur le site de TechForge.
@ReservoirLive
Comments ()