SprintOSSprintOS

Modèles IA

GPT-5.6 : Sol, Terra et Luna, la nouvelle génération d'OpenAI

Par Yacine Zahidi

Co-fondateur de SprintOS · 2 juillet 2026 · 9 min de lecture

OpenAI vient de dévoiler GPT-5.6, une nouvelle génération de modèles déclinée en trois niveaux : Sol, Terra et Luna. Au-delà des gains de performance, deux choses méritent l'attention des dirigeants : un système de nommage plus clair qui sépare la génération du niveau de capacité, et un lancement inhabituel, en aperçu limité et coordonné avec le gouvernement américain. Voici ce qui change concrètement, ce que ça coûte, et ce que cela dit de la direction que prend l'IA de frontière.

Illustration OpenAI de la famille GPT-5.6 : Sol (le soleil), Terra (la Terre) et Luna (la Lune), trois niveaux de capacité.
GPT-5.6 se décline en trois niveaux : Sol, Terra et Luna. Source : OpenAI.

Une nouvelle famille : Sol, Terra, Luna

Le changement le plus visible est le nommage. Avec GPT-5.6, le chiffre désigne la génération et le nom désigne un niveau de capacité durable :

  • Sol : le modèle phare, le plus puissant. Pensé pour les tâches les plus exigeantes.
  • Terra : le modèle équilibré du quotidien. Des performances comparables à GPT-5.5, pour deux fois moins cher.
  • Luna : le plus rapide et le plus abordable, pour les usages à fort volume où la vitesse et le coût priment.

L'intérêt pour une entreprise : au lieu de deviner ce que cache un numéro de version, on choisit un curseur clair entre intelligence, vitesse et coût. Chaque niveau peut ensuite progresser à son propre rythme d'une génération à l'autre.

Ce qui change vraiment

Au-delà des noms, GPT-5.6 Sol apporte des nouveautés concrètes :

  • Un raisonnement « max » : un nouvel effort de raisonnement qui laisse au modèle le temps de réfléchir en profondeur sur les problèmes difficiles.
  • Un mode « ultra » : il dépasse le cadre d'un agent unique en s'appuyant sur des sous-agents pour accélérer les travaux complexes. C'est un signal fort : l'orchestration multi-agents entre dans le produit standard.
  • Du codage à l'état de l'art : Sol établit un nouveau record sur Terminal-Bench 2.1, qui teste les workflows en ligne de commande (planification, itération, coordination d'outils).
  • Des progrès en biologie et en cybersécurité : de meilleurs résultats en analyse génomique (GeneBench) avec moins de tokens, et les capacités cyber les plus fortes d'OpenAI à ce jour, orientées vers la défense (trouver et corriger des vulnérabilités) plus que vers l'attaque.
Classement Terminal-Bench 2.1 (codage en ligne de commande) : GPT-5.6 Sol Ultra 91,9 %, GPT-5.6 Sol 88,8 %, Claude Mythos 5 88 %, GPT-5.6 Terra 84,3 %, Claude Fable 5 84,3 %, GPT-5.5 83,4 %, GPT-5.6 Luna 82,5 %, Claude Opus 4.8 78,9 %, Gemini 3.1 Pro Preview 70,7 %.
Terminal-Bench 2.1 (codage en ligne de commande) : la famille GPT-5.6 face aux autres modèles du marché. Source : OpenAI.

Côté cybersécurité, OpenAI mesure les capacités des trois modèles sur ExploitGym, un banc d'essai construit avec des chercheurs de l'UC Berkeley. Le constat : plus on donne de budget de raisonnement (et de coût), plus les modèles progressent, Sol nettement devant Terra et Luna.

Résultats ExploitGym : part d'exploits visés en fonction du coût API, pour GPT-5.6 Sol, Terra et Luna comparés à GPT-5.5 et GPT-5.4, sous limites de temps de 2 h et 6 h.
ExploitGym : capacités cyber (part d'exploits visés) rapportées au coût API, pour GPT-5.6 Sol, Terra, Luna vs GPT-5.5/5.4. Source : OpenAI.

Ces capacités expliquent l'encadrement du lancement. Dans sa fiche système (system card), OpenAI classe les trois modèles (Sol, Terra et Luna) en « High » (capacité élevée) sur les domaines cyber et biologique de son cadre de préparation. C'est la première fois qu'un modèle rapide et bon marché comme Luna atteint ce niveau. En clair : les modèles savent trouver des vulnérabilités et des briques d'exploit, mais ne franchissent pas le seuil « Critique » (pas d'attaque autonome de bout en bout contre des cibles durcies). OpenAI ajoute des classificateurs dédiés, un contrôle des sorties en temps réel, plus de 700 000 heures GPU de « red teaming » automatisé, et réserve les capacités les plus sensibles aux acteurs de la défense via des accès de confiance.

Les prix (et une bonne nouvelle sur le cache)

ModèleEntrée / million de tokensSortie / million de tokensPositionnement
GPT-5.6 Sol5 $30 $Le plus puissant
GPT-5.6 Terra2,50 $15 $Équilibré (~GPT-5.5, deux fois moins cher)
GPT-5.6 Luna1 $6 $Rapide et abordable

Pour beaucoup d'entreprises, Terra sera le meilleur rapport qualité-prix : la performance de la génération précédente, à moitié prix. Autre nouveauté utile : GPT-5.6 rend la mise en cache des prompts plus prévisible, avec des points de rupture explicites, une durée de vie minimale de 30 minutes, une écriture facturée 1,25× l'entrée et une lecture remisée de 90 %. Si vous avez des prompts répétitifs (agents, RAG, assistants), c'est un levier de coût direct, que nous détaillons dans notre guide sur le prompt caching. Enfin, OpenAI annonce Sol sur Cerebras en juillet, jusqu'à 750 tokens par seconde.

GPT-5.5 était déjà le champion du rapport performance-prix

Un rappel utile pour situer GPT-5.6. Son prédécesseur, GPT-5.5, s'est imposé comme le modèle de frontière le plus efficient en coût. Sur l'indice Coding Agent d'Artificial Analysis rapporté au coût par tâche, GPT-5.5 (via Codex) se place tout en haut du « quadrant le plus attractif » : le meilleur score de codage pour un coût contenu, sur la frontière de Pareto, devant des modèles bien plus chers.

Artificial Analysis : indice Coding Agent en fonction du coût par tâche. GPT-5.5 (via Codex) occupe le quadrant le plus attractif (score élevé pour un coût faible), sur la frontière de Pareto, devant Claude, Gemini, DeepSeek et les autres.
Indice Coding Agent vs coût par tâche : GPT-5.5 (Codex) domine le « quadrant le plus attractif » (meilleur score pour un coût contenu). Source : Artificial Analysis.

Ce que cela implique pour GPT-5.6 : avec Terra (des performances proches de GPT-5.5 pour deux fois moins cher), OpenAI ne se contente pas de pousser la performance brute avec Sol, il prolonge ce leadership sur le rapport performance-prix. Et en attendant l'ouverture large de GPT-5.6, GPT-5.5 lui-même reste l'un des choix les plus rentables du marché pour les agents de codage.

Un lancement sous contrôle du gouvernement

C'est le point le plus inhabituel, et le plus riche d'enseignements. GPT-5.6 ne sort pas normalement : il démarre en aperçu limité, réservé d'abord à un petit groupe de partenaires de confiance via l'API et Codex, à la demande du gouvernement américain. OpenAI a présenté en amont les capacités du modèle aux autorités, dans le cadre du décret (Executive Order) sur la sécurité de l'IA, et prévoit une ouverture plus large « dans les prochaines semaines ».

OpenAI ne cache pas ses réserves : le laboratoire estime que ce type de processus d'accès gouvernemental ne devrait pas devenir la norme, car il prive développeurs, entreprises et défenseurs des meilleurs outils. Ce n'est pas un cas isolé. Au même moment, Anthropic voyait son modèle Fable 5 retiré du marché par des mesures de contrôle à l'export, avant d'être redéployé. Autrement dit, la disponibilité d'un modèle de frontière devient une variable géopolitique, un sujet que nous reprenons dans les volets suivants de cette série et dans notre article sur l'IA souveraine.

Ce que ça change pour votre PME

Trois réflexes utiles face à cette annonce :

  1. Choisir le bon niveau, pas le plus gros. Sol impressionne, mais Terra (voire Luna) suffit pour la plupart des tâches, à une fraction du coût. Le bon modèle est celui qui passe vos tests, pas celui qui domine un classement.
  2. Mesurer avant de basculer. On ne change de modèle (ou on n'active un raisonnement « max ») que si on peut prouver le gain sur ses propres cas. C'est tout l'objet des évaluations privées.
  3. Ne pas dépendre d'un seul fournisseur. Un lancement peut être retardé ou filtré, un modèle peut disparaître du jour au lendemain. Garder une architecture portable, et une option souveraine, protège votre continuité.

C'est exactement le travail que nous menons chez SprintOS, selon une méthode structurée : choisir et brancher le bon modèle pour chaque cas d'usage, le mesurer, et le déployer dans un cadre maîtrisé. Pour en parler, faites le point avec un expert ou testez vos cas d'usage avec SprintAI.

Questions fréquentes

C'est quoi GPT-5.6 Sol ?

GPT-5.6 Sol est le modèle phare de la nouvelle génération GPT-5.6 d'OpenAI, présentée fin juin 2026. C'est le modèle le plus puissant du laboratoire à ce jour, avec de nouvelles capacités en codage, en biologie et en cybersécurité, un raisonnement approfondi (mode « max ») et un mode agent « ultra » qui s'appuie sur des sous-agents.

Quelle différence entre Sol, Terra et Luna ?

Ce sont trois niveaux d'une même génération. Sol est le modèle le plus puissant (5 $/30 $ par million de tokens entrée/sortie). Terra est équilibré : des performances proches de GPT-5.5 pour deux fois moins cher (2,50 $/15 $). Luna est le plus rapide et le moins cher (1 $/6 $). Le chiffre indique la génération, le nom indique le niveau de capacité.

Combien coûte GPT-5.6 ?

Par million de tokens (entrée/sortie) : Sol à 5 $/30 $, Terra à 2,50 $/15 $, Luna à 1 $/6 $. GPT-5.6 améliore aussi la mise en cache des prompts (points de rupture explicites, durée minimale de 30 minutes, écriture à 1,25× et lecture remisée de 90 %), ce qui réduit fortement le coût des usages répétitifs.

Quand GPT-5.6 sera-t-il disponible ?

Il démarre en aperçu limité, d'abord via l'API et Codex pour un petit groupe de partenaires de confiance, à la demande du gouvernement américain. OpenAI prévoit une disponibilité plus large (ChatGPT, Codex, API) dans les semaines qui suivent.

GPT-5.6 est-il meilleur que GPT-5.5 ?

Oui selon OpenAI : Sol établit un nouvel état de l'art en codage (Terminal-Bench 2.1) et progresse en biologie et en cybersécurité. Terra atteint des performances comparables à GPT-5.5 pour la moitié du prix. Comme toujours, la vraie mesure est de tester sur vos propres cas d'usage.

Pourquoi le lancement de GPT-5.6 est-il limité et « sous contrôle » ?

Parce qu'OpenAI a coordonné le lancement avec le gouvernement américain, dans le cadre d'un décret (Executive Order) sur la sécurité de l'IA. Le modèle est d'abord réservé à des partenaires approuvés avant une diffusion plus large. OpenAI précise ne pas souhaiter que ce type de processus devienne la norme.

En résumé

GPT-5.6 apporte trois choses : une famille lisible (Sol, Terra, Luna) qui clarifie le choix entre puissance, équilibre et coût ; de vraies avancées, notamment le mode agent « ultra » et un codage à l'état de l'art ; et un signal stratégique fort, avec un lancement encadré par le gouvernement américain. Pour une PME, l'annonce se résume à une méthode : choisir le niveau adapté, le mesurer sur ses propres cas, et ne jamais dépendre d'un seul fournisseur. C'est le premier volet d'une série de trois : le deuxième revient sur l'affaire Fable 5 d'Anthropic, bannie puis redéployée, et le troisième relie les deux affaires pour montrer comment l'IA de frontière passe sous contrôle gouvernemental.

Où en est votre PME sur l'IA ?

Un score de maturité en 5 minutes, gratuit et sans engagement.

Lancer le diagnostic →

Prêt à découvrir ce qui fonctionne vraiment ?

30 minutes au téléphone. Vous repartez avec une orientation claire, même si nous ne travaillons pas ensemble.