Cogito v2 révolutionne le raisonnement des IA open-source

Deep Cogito v2 : une IA open-source qui affine son raisonnement
Deep Cogito vient de lancer Cogito v2, une nouvelle famille de modèles d’intelligence artificielle open-source capables d’aiguiser leurs compétences en raisonnement de manière autonome.
Une gamme de modèles hybrides puissants
Sous licence open-source, la série Cogito v2 se compose de quatre modèles d’IA hybrides :
- Deux modèles de taille moyenne : 70 milliards et 109 milliards de paramètres
- Deux modèles grande échelle : 405 milliards et un impressionnant 671 milliards de paramètres
Le modèle de 671 milliards de paramètres, basé sur l’architecture Mixture-of-Experts (MoE), figure déjà parmi les IA open-source les plus puissantes du monde. Selon Deep Cogito, il rivalise avec les dernières versions de DeepSeek et se rapproche des performances des systèmes propriétaires comme O3 d’OpenAI ou Claude 4 Opus d’Anthropic.
Un changement fondamental : le raisonnement internalisé
Mais au-delà de la puissance brute, l’innovation majeure de Cogito v2 repose sur sa capacité à internaliser ses processus de raisonnement.
Contrairement aux systèmes traditionnels qui prolongent les calculs pour trouver une réponse, Cogito v2 apprend à prévoir le résultat de son raisonnement grâce à la technique Iterated Distillation and Amplification (IDA). Cette méthode distille les connaissances acquises lors de recherches précédentes et les intègre directement dans les paramètres du modèle pour renforcer son intuition.
Résultat : les chaînes de raisonnement générées par Cogito v2 sont en moyenne 60 % plus courtes que celles de concurrents comme DeepSeek R1, tout en offrant une qualité équivalente, voire supérieure.
Des performances élevées pour un coût réduit
En matière de coût, Deep Cogito réalise un véritable exploit. Le développement complet de tous ses modèles – des phases expérimentales jusqu’à l’entraînement final – a coûté moins de 3,5 millions de dollars. Une goutte d’eau comparée aux budgets colossaux souvent investis dans l’IA générative.
Un entraînement ciblé sur la qualité du raisonnement
Le modèle phare de 671B a fait l’objet d’une attention particulière. L’objectif ? Non seulement améliorer les réponses finales, mais aussi optimiser les chemins de raisonnement menant à ces réponses. Cette stratégie a permis de favoriser les démarches directes et d’éviter les détours inutiles.
Les résultats sont là : le modèle dépasse ou égalise les meilleurs benchmarks des dernières IA de DeepSeek, et se rapproche des performances de systèmes propriétaires.

Capacités émergentes en raisonnement visuel
Une surprise de taille : bien qu’ils n’aient pas été spécifiquement entraînés sur des images, les modèles Cogito v2 savent raisonner à partir d’éléments visuels.
Deep Cogito a partagé un exemple où le modèle compare deux images – un canard et un lion – et analyse leurs habitats, couleurs et composition en utilisant l’apprentissage par transfert. Cette capacité émergente pourrait ouvrir la voie à la création de futurs modèles multimodaux sans données visuelles explicites.
Une vision tournée vers l’intelligence artificielle générale
À l’avenir, l’équipe de Deep Cogito prévoit de poursuivre son approche de l’amélioration itérative autonome pour tendre vers la superintelligence. Elle réaffirme également son engagement pour le logiciel libre : tous ses modèles actuels et futurs resteront open-source.
À lire aussi
Fuite : un modèle open-source d'OpenAI pourrait être lancé prochainement
Participer aux événements Tech sur l'IA
Envie d’en apprendre davantage sur l'IA et le big data ? Participez à l'AI & Big Data Expo à Amsterdam, en Californie ou à Londres. L'événement est organisé conjointement avec d'autres conférences majeures :
@ReservoirLive
Comments ()