GPT-5.5 : OpenAI lance une nouvelle classe d’intelligence, le marché retient son souffle

Planète IA

Le rythme est brutal. Le 23 avril 2026, six semaines à peine après la sortie de GPT-5.4, OpenAI a lancé GPT-5.5. Cette accélération n’est pas un simple détail de calendrier ; elle est le symptôme d’une guerre de tranchées technologique où chaque semaine compte. D’autant plus qu’Anthropic avait dévoilé son Claude Opus 4.7 une semaine auparavant, mettant une pression palpable sur le leader du marché. Avec GPT-5.5, le nom de code « Spud » donne presque envie de sourire. Mais le fond, lui, n’est pas drôle du tout pour les concurrents : OpenAI ne comble pas un retard, il déplace le curseur. Autonomie, puissance, multimodalité native… l’écosystème entier doit remettre ses calculs à plat. Et derrière la démonstration musclée, il y a un choix économique très assumé — celui de faire payer l’excellence.

Une refonte architecturale qui change la donne

Les amateurs de mises à jour tranquilles peuvent aller se rhabiller. GPT-5.5 marque une rupture. Il ne s’agit plus d’un simple ajustement des poids du réseau, mais d’un ré-entraînement complet du modèle de base, le premier depuis GPT-4.5, sur une architecture désormais nativement omnimodale.

Concrètement, cela signifie que le modèle ne « traduit » plus une image ou un son en texte pour le comprendre ; il les « pense » directement, au même titre que les mots. Cette fusion des sens lui confère une compréhension du monde bien plus profonde, le tout servi par une fenêtre de contexte d’un million de tokens qui laisse songeur.

Passons aux chiffres, parce qu’ils sont parlants. Sur Terminal-Bench 2.0, GPT-5.5 tourne à 82,7 % — ce qui, en clair, signifie qu’il se débrouille mieux que beaucoup d’humains sur des workflows en ligne de commande. L’administration système, l’automatisation de tâches répétitives : le modèle est déjà là, et il n’a pas besoin qu’on lui tienne la main. OSWorld-Verified confirme la tendance avec 78,7 % : piloter un environnement informatique complexe de façon autonome, c’est désormais dans ses cordes. On n’est plus sur un assistant qui suggère — on est sur un agent qui agit. Et puis il y a le cas Harvey : le cabinet juridique qui a bossé sur BigLaw Bench obtient un score de 91,7 %. Dans un secteur où chaque mot compte et où une erreur peut coûter cher, c’est un résultat qui mérite qu’on s’y attarde.

Cependant, le tableau n’est pas uniformément parfait. Sur le terrain du codage, GPT-5.5 montre une faiblesse relative. Son score de 58,6 % sur SWE-Bench Pro, bien qu’honorable, reste nettement inférieur aux 64,3 % de son rival direct, Claude Opus 4.7. C’est un rappel que la suprématie est rarement absolue. En revanche, sur un critère devenu absolument critique pour les entreprises, le modèle excelle. La Bank of New York, qui a pu le tester en avant-première, salue une résistance aux hallucinations « nettement supérieure ». À mon sens, c’est là que se joue la véritable adoption en entreprise. Pour une institution financière soumise à des régulations drastiques, la fiabilité n’est pas une option, c’est une obligation.

Le coût de l'excellence : un pari sur l'efficacité

La puissance a un prix. Et celui de GPT-5.5 est élevé. OpenAI a fixé le tarif de l’accès API à 5 dollars par million de tokens en entrée et 30 dollars en sortie. C’est le double de GPT-5.4.

La variante Pro, elle, atteint des sommets : 30 dollars en entrée et 180 en sortie. Cette inflation tarifaire n’est pas un détail ; c’est un filtre qui segmente le marché et force les développeurs et les entreprises à repenser leur approche. Fini le temps de l’expérimentation à bas coût sur les modèles de pointe.

Face à cette augmentation, la justification d’OpenAI est purement stratégique : le modèle serait tellement plus efficace qu’il en deviendrait rentable. La promesse est qu’il accomplit des tâches complexes avec beaucoup moins de requêtes intermédiaires. Un workflow qui nécessitait cinq appels API avec GPT-5.4 pourrait n’en demander que deux avec GPT-5.5. Le coût par appel est plus cher, mais le coût total de l’opération pourrait, en théorie, diminuer. C’est un pari audacieux sur l’intelligence du modèle, qui déplace la valeur de la quantité de tokens consommés vers la qualité du résultat obtenu en une seule fois.

Ce que je constate concrètement sur le terrain, c’est que ce modèle économique va obliger les équipes à devenir bien plus rigoureuses dans la conception de leurs prompts et de leurs chaînes de traitement. Chaque appel API devra être justifié par un gain de productivité clair. Cela favorisera les cas d’usage à forte valeur ajoutée et pénalisera les applications plus « gadgets ». En un sens, OpenAI mature son offre : son fleuron technologique n’est plus un jouet pour tous, mais un outil de production pour ceux qui peuvent en mesurer le retour sur investissement.

L'éléphant dans la pièce : la concurrence inaccessible

Malgré cette démonstration de force, un spectre plane sur le lancement de GPT-5.5. Il a un nom : Claude Mythos Preview. Le modèle d’Anthropic, bien que non disponible publiquement, surpasse GPT-5.5 sur la majorité des benchmarks partagés. L’écart est particulièrement cinglant sur le test de codage SWE-Bench Pro, où Mythos atteint un score stratosphérique de 77,8 % contre 58,6 % pour GPT-5.5. C’est un gouffre.

Cette performance, bien que réelle, doit être nuancée par un fait majeur : Claude Mythos est, pour l’instant, une chimère pour le marché grand public. Son accès est réservé à un consortium de défense cyber. Il est donc intouchable. Cette situation crée un paysage concurrentiel étrange. Greg Brockman, le président d’OpenAI, peut qualifier GPT-5.5 de « nouvelle classe d’intelligence » sans mentir : c’est bien la plus puissante accessible au commun des mortels. Mais les initiés savent qu’un prédateur encore plus redoutable évolue dans une réserve privée.

Cette dualité pose une question stratégique fondamentale. Anthropic joue-t-il la carte de l’élitisme technologique, en se concentrant sur des contrats ultra-spécifiques et lucratifs, laissant à OpenAI le soin de gérer le marché de masse ? Ou prépare-t-il une offensive future avec une technologie déjà éprouvée en conditions extrêmes ? Quelle que soit la réponse, l’existence de Mythos relativise la domination de GPT-5.5 et maintient une tension qui pousse l’innovation à son paroxysme.

Plus qu'une mise à jour, un pivot stratégique

GPT-5.5, c’est pas juste un modèle qui monte en puissance. C’est OpenAI qui annonce la couleur : l’IA généraliste capable de prendre en charge des workflows pro complexes, ça existe, ça tourne, et c’est disponible maintenant. L’omnimodalité native, la résistance aux hallucinations… deux points sur lesquels les entreprises buttaient depuis des années, et qui semblent enfin traités sérieusement.

Sauf que la maturité technologique vient avec une facture. En doublant ses tarifs, OpenAI ne fait pas que monétiser un produit — il segmente son marché. D’un côté, les acteurs capables de justifier le coût par un retour sur investissement mesurable. De l’autre, tous ceux qui vont commencer à regarder du côté des alternatives open source ou des modèles moins chers. C’est un pari assumé, et il n’est pas sans risque.

Reste l’ombre au tableau : un concurrent techniquement supérieur qui n’est pas sur le marché. GPT-5.5 est peut-être au sommet — mais c’est le sommet de ce qui est accessible. La course à l’AGI continue, et visiblement, elle coûte de plus en plus cher à tout le monde.

Automatisez vos processus