La suisse dévoile apertus, une ia open source multilingue puissante

La suisse dévoile apertus, une ia open source multilingue puissante

La Suisse lance Apertus, un modèle d'IA 100% open source

Apertus : la Suisse dévoile un modèle d’intelligence artificielle 100% open-source

Un consortium d’institutions suisses, composé de l’EPFL, de l’ETH Zurich et du Centre National Suisse de Calcul Scientifique (CSCS), vient de lancer un nouveau modèle d’intelligence artificielle à code ouvert nommé Apertus, signifiant “ouvert” en latin. Fidèle à son nom, le modèle a été conçu pour être accessible à tous, dans une logique de transparence, de recherche et de souveraineté numérique.

Un modèle d’IA pour la recherche, l'éducation et les entreprises

Apertus peut être utilisé par les développeurs et les organisations pour construire des chatbots, outils de traduction ou applications éducatives. Il est disponible en deux versions : un modèle de 8 milliards de paramètres et une version plus puissante de 70 milliards de paramètres. Vous pouvez le :

  • Télécharger directement depuis Hugging Face
  • Accéder au modèle via Swisscom, partenaire stratégique du projet

Les deux versions sont proposées sous une licence open source permissive, permettant leur utilisation dans les milieux académique, éducatif et commercial.

Un projet fondé sur la transparence et l’ouverture

Contrairement à d’autres systèmes d’IA propriétaires, Apertus se distingue par son approche totalement ouverte. L’architecture, les données d'entraînement, ainsi que la documentation sont publiquement accessibles.

Martin Jaggi, professeur à l’EPFL et membre du comité directeur de l’Initiative Suisse pour l’IA, déclare : « Nous fournissons ici un modèle de confiance, souverain et inclusif. Apertus sera mis à jour régulièrement par les équipes du CSCS, de l’ETH Zurich et de l’EPFL. »

Pour Thomas Schulthess, directeur du CSCS, Apertus « représente une infrastructure d’innovation à long terme au service de la recherche, de la société et de l’industrie ».

Un modèle multilingue pour toucher le monde entier

Le modèle Apertus a été entraîné sur 15 000 milliards de tokens provenant de plus de 1 000 langues. Environ 40 % des données sont en langues non-anglophones, incluant le suisse allemand et le romanche, souvent négligés par les autres grands modèles de langage (LLMs).

Selon Imanol Schlag, directeur technique du projet et chercheur à l’ETH Zurich : « Apertus est conçu pour le bien public. Il allie accessibilité, transparence et conformité dès sa conception. »

Swisscom l’utilise déjà dans sa plateforme souveraine d'IA pour renforcer la souveraineté numérique de la Suisse.

Accès et cas d’usage concrets

Bien que le téléchargement d’Apertus soit simple pour les utilisateurs avancés, son intégration requiert des ressources telles que des serveurs, du cloud ou des interfaces spécialisées.

Les développeurs pourront tester Apertus durant les Swiss {ai} Weeks, se déroulant jusqu’au 5 octobre 2025. Les participants aux hackathons auront un accès via l’interface proposée par Swisscom. De plus, les clients professionnels de Swisscom peuvent déjà l’utiliser sur la plateforme d’IA de l’entreprise. Un accès est également prévu à l’international via le Public AI Inference Utility.

Joshua Tan, responsable de cette plateforme, estime qu’« Apertus est aujourd’hui le principal modèle public d’IA. Preuve qu'une IA peut être gérée comme une infrastructure publique, au même titre que l’eau ou l’électricité. »

Respect des normes et éthique des données

L’entraînement du modèle a suivi les règles suisses en matière de protection des données, les lois sur le droit d’auteur, ainsi que les exigences de transparence de l’EU AI Act. La base de données ne contient que des données publiques, filtrées pour éviter les informations personnelles ou sensibles, et respecte les directives éthiques en vigueur.

Perspectives de développement à long terme

Antoine Bosselut, professeur à l’EPFL et co-responsable de l’Initiative IA Suisse, explique : « Le lancement d’Apertus est un point de départ vers une IA générative puissante, ouverte et bénéfique pour tous. »

Les prochaines étapes incluent :

  • L’élargissement de la famille de modèles
  • L’amélioration de l’efficacité
  • Le développement d’outils spécifiques pour les secteurs du droit, de la santé, du climat et de l’éducation
  • Le maintien de standards stricts en matière de transparence et d’éthique

Photo par Cory Johnson

Pour en savoir plus sur l’intelligence artificielle et les mégadonnées avec les leaders du secteur, rendez-vous à l’événement AI & Big Data Expo, organisé à Amsterdam, en Californie et à Londres.

Article rédigé par @ReservoirLive