Openai prépare un modèle gpt open source de 120 milliards de paramètres

Openai prépare un modèle gpt open source de 120 milliards de paramètres

Fuite : OpenAI s'apprête à lancer un puissant modèle d'IA open source

Une fuite révèle le lancement imminent d'un modèle d'IA open source par OpenAI

Selon une fuite récente, OpenAI serait sur le point de dévoiler un tout nouveau modèle d'intelligence artificielle open source, qui pourrait être lancé dans les prochaines heures.

Des indices numériques pointent vers une révélation imminente

Cette fuite est basée sur une série de dépôts GitHub apparus brièvement avant d’être supprimés. Ces dépôts portaient des noms évocateurs tels que yofo-deepcurrent/gpt-oss-120b et yofo-wildflower/gpt-oss-20b. Les comptes associés sur la plateforme Hugging Face sont liés à des membres de l’équipe d’OpenAI.

Le tag “gpt-oss” fait fortement référence à “GPT Open Source Software”, laissant peu de doute sur les intentions d’OpenAI. La diversité des noms et des tailles de modèles suggère le déploiement imminent d’une série complète.

Capture d’écran de dépôts GitHub présumés liés à un modèle open source d’OpenAI.

Un modèle GPT-OSS de 120 milliards de paramètres

Un fichier de configuration ayant fuité donne un aperçu des performances du modèle de 120 milliards de paramètres. Ce modèle repose sur une architecture Mixture of Experts (MoE) incluant 128 experts spécialisés, dont seuls quatre sont activés à chaque requête. Cela améliore à la fois la puissance de calcul et l’efficacité énergétique.

Cette approche combine la richesse des gros modèles avec la rapidité des plus légers, se positionnant comme un concurrent direct des leaders actuels tels que :

  • Mixtral par Mistral AI
  • Llama de Meta

Caractéristiques techniques avancées

Le modèle open source d’OpenAI serait équipé de nombreuses fonctionnalités de pointe :

  • Un vocabulaire étendu pour un meilleur traitement multilingue
  • Le mécanisme Sliding Window Attention pour une gestion fluide des longs textes

Ces caractéristiques rendent ce modèle à la fois puissant et adapté à un déploiement pratique dans différents environnements.

Pourquoi ce retour à l’open source maintenant ?

OpenAI a souvent été critiqué pour s’être éloigné de ses racines open source. Le lancement d’un modèle GPT-OSS serait un geste fort envers la communauté de développeurs et chercheurs déçus par cette évolution.

Ce choix stratégique permettrait aussi de rivaliser avec l’écosystème open source florissant de Meta et Mistral, en définissant potentiellement un nouveau standard du marché.

En attente d’une confirmation officielle

Pour l’instant, tout cela reste au stade de rumeurs fondées, appuyées par des dépôts de code et fichiers de configuration authentiques. Mais si ces informations se confirment, le lancement d’un modèle open source performant de 120 milliards de paramètres par OpenAI représenterait un tournant majeur dans le monde de l’IA.

(Crédit photo : Mariia Shalabaieva)

À lire aussi

Zuckerberg détaille la vision IA de Meta pour l’“intelligence personnelle surhumaine”

Événements à venir autour de l’IA et des big data

Participez à l’AI & Big Data Expo qui se tiendra à Amsterdam, en Californie et à Londres. L’événement est organisé en parallèle de conférences majeures telles que :

Découvrez d'autres salons et webinaires technologiques sur TechForge.

@ReservoirLive