OpenAI prépare un modèle GPT open source aux capacités inédites

OpenAI prépare un modèle GPT open source aux capacités inédites

null

Fuite : OpenAI s'apprête à lancer un puissant modèle d’IA open source

Une fuite récente suggère qu'OpenAI est sur le point de dévoiler un tout nouveau modèle d'intelligence artificielle open source, et cela pourrait se produire dans les prochaines heures.

Des indices numériques pointent vers un lancement imminent

La rumeur repose sur une série d’indices numériques qui ont été minutieusement analysés par la communauté des développeurs. Des captures d’écran ont révélé plusieurs dépôts GitHub comportant des noms évocateurs comme yofo-deepcurrent/gpt-oss-120b et yofo-wildflower/gpt-oss-20b. Bien que ces dépôts aient été supprimés, les comptes associés à ces projets sont liés à des membres de l’équipe OpenAI.

Le tag gpt-oss semble indiquer clairement qu’il s’agit de modèles GPT Open Source Software. Cette initiative marquerait un retour aux sources pour OpenAI, qui avait adopté une approche plus fermée ces dernières années.

Une famille complète de modèles IA open source

La fuite révèle plusieurs versions de ces modèles, portant des noms de code différents et des tailles de paramètres variées. Cela suggère qu’OpenAI a prévu une gamme complète de modèles IA open source, soigneusement planifiée.

Capture d'écran montrant des dépôts potentiellement liés au nouveau modèle Open Source de OpenAI

Un aperçu technique du modèle GPT-OSS 120B

Grâce à un fichier de configuration ayant fuité, on connaît déjà quelques détails techniques sur la version 120 milliards de paramètres du modèle.

Ce modèle repose sur une architecture Mixture of Experts (MoE). Plutôt qu’un seul modèle traitant toutes les requêtes, il fonctionne comme un groupe de 128 spécialistes. Lorsqu’une requête est soumise, le système sélectionne les 4 meilleurs experts pour y répondre. Cela permet de combiner la puissance d’un modèle massif avec la rapidité et l’efficacité d’un système plus léger.

Caractéristiques techniques annoncées :

  • Architecture : Mixture of Experts (MoE) avec activation partielle pour plus d'efficacité
  • Paramètres : jusqu’à 120 milliards
  • Vocabulaire étendu, optimisé pour de multiples langues
  • Utilisation de Sliding Window Attention pour traiter de longs textes efficacement

Un concurrent direct pour Mistral et Meta

Ce modèle place OpenAI en concurrence frontale avec d'autres leaders de l'open source comme Mistral AI et la famille LLaMA de Meta. En lançant un tel modèle, OpenAI ne se contente pas d’entrer dans la course, elle pourrait bien tenter d’en redéfinir les règles.

Pourquoi OpenAI revient aux sources avec l’open source ?

OpenAI a été critiquée ces dernières années pour avoir délaissé ses racines open source. Ce lancement serait une manière de regagner le cœur des développeurs et chercheurs déçus.

C’est aussi un choix stratégique. Meta et Mistral ont démontré l’impact positif d’un écosystème open-source en matière d’innovation. Avec ce modèle GPT-OSS, OpenAI pourrait relancer la dynamique autour de ses outils et créer une nouvelle vague d’adoption.

Une rumeur solide soutenue par des preuves concrètes

Bien qu’aucune confirmation officielle n’ait encore été communiquée, de nombreuses preuves — captures d’écran, dépôts de code, et fichiers de configuration — rendent ce lancement très crédible.

Si cela se confirme, la sortie d’un modèle MoE open source de cette envergure par l’entreprise la plus emblématique de l’IA serait un moment historique pour le secteur.

(Crédit photo : Mariia Shalabaieva via Unsplash)

À lire également :

Mark Zuckerberg présente sa vision de l’IA personnelle chez Meta

Événements à venir autour de l'IA et des données

Vous voulez en savoir plus sur l’intelligence artificielle et les big data ? Ne manquez pas le AI & Big Data Expo qui se tiendra à Amsterdam, en Californie et à Londres.

L’événement est organisé en parallèle de conférences majeures telles que :

Découvrez les autres événements technologiques organisés par TechForge : Agenda complet ici.

null