Tout le monde parle de ChatGPT. Yann LeCun, lui, veut reconstruire l'intelligence depuis zéro.
Le chercheur le plus influent de l'IA pense que nous faisons tout faux
Pendant que le monde s'extasie devant les dernières versions de GPT-4o, Gemini ou Claude, l'un des pères fondateurs de l'apprentissage profond tire la sonnette d'alarme. Yann LeCun, directeur scientifique de l'IA chez Meta et lauréat du prix Turing, est convaincu d'une chose : les grands modèles de langage (LLM) actuels ne mèneront jamais à une intelligence artificielle générale. Et il l'explique avec une clarté qui dérange.
Sa thèse est simple, mais radicale : une IA qui comprend le monde ne peut pas se construire uniquement sur du texte. Pour LeCun, un enfant de 4 ans qui manipule des cubes en bois comprend la physique mieux que n'importe quel modèle de langage, aussi sophistiqué soit-il. Et cette différence n'est pas un détail technique — c'est un gouffre fondamental.
Le problème que personne ne veut vraiment adresser
Les LLM actuels sont entraînés sur des milliards de tokens de texte. Ils prédisent des mots, reconstituent des phrases, imitent des raisonnements. Ils sont impressionnants. Mais ils n'ont jamais touché un objet, observé une balle tomber, ni ressenti la résistance d'un matériau.
LeCun appelle ce manque le problème de la réalité physique. Selon lui, l'intelligence véritable émerge d'une interaction continue avec un environnement physique, d'une capacité à modéliser ce qui va se passer avant que cela n'arrive. Les humains font ça naturellement. Les LLM, eux, génèrent du texte statistiquement vraisemblable — ce n'est pas la même chose.
Il illustre souvent son propos avec une métaphore directe : si vous demandiez à ChatGPT de vous expliquer comment attraper une balle, il produirait une réponse parfaitement formulée. Mais il serait incapable de simuler mentalement la trajectoire de cette balle une fraction de seconde avant qu'elle n'arrive. Ce modèle interne du monde — ce que LeCun appelle le world model — est précisément ce qui manque.
La voie que LeCun propose : apprendre comme un mammifère
Face à ce constat, LeCun ne se contente pas de critiquer. Il propose une architecture alternative : le modèle JEPA (Joint Embedding Predictive Architecture). L'idée centrale est d'entraîner des systèmes d'IA à prédire des représentations abstraites du monde — pas des pixels ou des mots, mais des structures latentes qui capturent l'essence de ce qui va se passer.
Concrètement, cela signifie :
- Apprendre à partir de vidéos et d'expériences sensorielles, pas seulement de texte
- Construire des modèles prédictifs capables d'anticiper l'évolution d'une scène physique
- Développer une hiérarchie de représentations, du bas niveau (texture, mouvement) au haut niveau (intention, causalité)
- Intégrer un mécanisme de planification qui permette à l'IA de tester des actions virtuellement avant de les exécuter
Cette approche s'inspire directement du fonctionnement du cerveau des mammifères, qui apprennent en grande partie par observation et interaction physique avec leur environnement dans les premières semaines de vie.
Pourquoi ça compte pour vous, maintenant
Vous pourriez vous dire : "C'est de la recherche fondamentale, ça ne me concerne pas." C'est une erreur de perspective.
Les limites que décrit LeCun sont exactement celles que vous rencontrez au quotidien avec les outils IA actuels. ChatGPT ou Gemini peuvent halluciner des faits physiques, se tromper sur des raisonnements spatiaux, ou produire des instructions techniques incorrectes parce qu'ils manquent d'un ancrage dans la réalité. Ce n'est pas un bug à corriger dans la prochaine version — c'est une limite architecturale profonde.
En revanche, si la vision de LeCun se concrétise, les implications sont massives : des robots capables d'apprendre des tâches physiques complexes en quelques heures, des assistants IA qui raisonnent réellement sur des problèmes d'ingénierie, des systèmes de diagnostic médical qui comprennent la physiologie plutôt que de reconnaître des patterns statistiques.
Un dissident influent dans un consensus fragile
Ce qui rend la position de LeCun particulièrement intéressante, c'est son contexte. Il n'est pas un outsider qui critique l'IA de l'extérieur. Il travaille chez Meta, il a codesigné les bases du deep learning moderne, et il dispose de ressources considérables pour tester ses hypothèses. Son scepticisme vis-à-vis des LLM vient de l'intérieur du système.
Face à lui, des figures comme Sam Altman ou Demis Hassabis misent sur la mise à l'échelle continue des modèles actuels. Plus de données, plus de paramètres, plus de puissance de calcul. LeCun, lui, pense que l'échelle ne résoudra pas un problème de conception. C'est un désaccord philosophique autant que technique — et il n'est pas près d'être tranché.
Ce que cela change à notre façon de penser l'IA
La leçon la plus importante que l'on peut tirer de la pensée de LeCun n'est pas technique. C'est une invitation à regarder l'IA avec plus de précision, à ne pas confondre performance linguistique et compréhension, à distinguer ce qu'un modèle fait de ce qu'il comprend vraiment.
Les outils comme ChatGPT, Claude ou Gemini sont des instruments remarquables pour ce qu'ils sont : des moteurs de génération de texte entraînés à être utiles. Mais traiter leur output comme le reflet d'une compréhension du monde réel, c'est une erreur que nous payons déjà — en décisions mal informées, en confiances mal placées, en attentes déçues.
LeCun ne veut pas tuer les LLM. Il veut construire ce qui vient après. Et comprendre ce débat, c'est comprendre où l'IA va réellement — pas où le marketing veut nous faire croire qu'elle est déjà arrivée.
— Reservoir Live