Claude Opus 4.8 : Anthropic déploie un modèle plus "honnête" avant une surprise à venir

Anthropic vient de déployer son nouveau grand modèle de langage, Claude Opus 4.8. Au programme : de meilleures performances, de nouvelles fonctions et, surtout, un modèle plus intègre. Une transition avant l'arrivée de Claude Mythos ?

Dans un monde où l'intelligence artificielle prend une place de plus en plus importante dans notre quotidien, choisir le modèle le plus adapté à ses besoins peut se révéler être un choix cornélien. Les géants de la technologie rivalisent d'ingéniosité pour proposer des IA toujours plus performantes tout en attirant et fidélisant de nouveaux utilisateurs. Ce 28 mai 2026, Anthropic, l'un des principaux concurrents de ChatGPT avec Gemini, a décidé de frapper un grand coup avec Claude, son IA qui se veut "honnête, utile et inoffensive". Ainsi, la firme annonce dans un billet de blog le déploiement de son nouveau grand modèle de langage (LLM) Opus 4.8.

L'annonce pourrait sembler tout à fait banale, comparée aux mises à jour régulières que publient désormais toutes les grandes entreprises du secteur. Pourtant, elle marque un tournant important car, avec elle, Anthropic vient répondre à une des principales critiques faites aux IA génératives, à savoir leur tendance à affirmer des choses fausses avec une assurance inébranlable. Avec Opus 4.8, Claude serait plus fiable que jamais. Vraiment ?

Claude Opus 4.8 : une IA plus fiable et honnête que jamais

Si Opus 4.7 a reçu un accueil assez mitigé, Anthropic compte bien rattraper le coup ! Avec Opus 4.8, l'entreprise met l'accent sur une notion assez inhabituelle dans cette industrie : l'honnêteté. Un terme qui ne renvoie bien évidemment pas à une quelconque vertu morale, mais à la capacité du modèle à reconnaître ses limites, à signaler ses incertitudes et à éviter de présenter comme certaines des informations fragiles ou inexactes.

Si "l'honnêteté" de Claude a toujours été un argument marketing pour la firme américaine, cette dernière reconnaît toutefois que les précédentes générations de modèles avaient parfois tendance à "sauter aux conclusions", notamment dans des tâches complexes de programmation ou d'analyse, en prétendant avoir résolu un problème alors que des erreurs subsistaient ou que les preuves étaient insuffisantes. Anthropic affirme avoir travaillé spécifiquement sur ce point afin de rendre Claude "plus enclin à signaler les incertitudes relatives à son travail" et moins susceptible de "formuler des affirmations non étayées". D'après les évaluations internes, le modèle laisserait passer environ quatre fois moins de bugs non signalés dans le code qu'il produit par rapport à la version précédente.

"Claude Opus 4.8 fait preuve d'un meilleur jugement", confirme Tom Pritchard, staff engineer chez Shopify, qui a pu tester le modèle en avant-première. "Dans Claude Code, il pose les bonnes questions, détecte ses propres erreurs, résiste quand un plan manque de solidité, et consolide sa compréhension des explorations complexes multiservices avant d'apporter des modifications importantes".

Claude Opus 4.8 : des améliorations et de nouvelles fonctions

Les performances techniques annoncées par Anthropic montrent également une progression notable, notamment en matière de coding agentique, de raisonnement multidisciplinaire, d'utilisation autonome d'un ordinateur et d'analyse financière. Sur plusieurs benchmarks, Opus 4.8 égale, voire dépasse GPT-5.5 d'OpenAI ainsi que Gemini 3.1 Pro de Google. De plus, le nouveau grand modèle de langage est mieux à même de sélectionner les bons outils au bon moment, ce qui lui fait donc perdre moins de temps, et donc consommer moins de tokens que ses prédécesseurs, le tout pour un résultat équivalent.

Cette nouvelle version s'accompagne de plusieurs fonctions inédites. Anthropic introduit un système baptisé "Dynamic Workflows", disponible en phase expérimentale dans Claude Code pour les abonnements Enterprise, Team et Max. Il permet à Claude de planifier une tâche complexe et d'utiliser simultanément de nombreux agents spécialisés en parallèle avant de vérifier collectivement les résultats pour enfin les soumettre à l'utilisateur.

"Par exemple, Claude Code avec Opus 4.8 peut désormais piloter des migrations à l'échelle d'une base de code entière, portant sur des centaines de milliers de lignes, du lancement jusqu'au merge, en utilisant la suite de tests existante comme critère de validation", illustre l'entreprise californienne. L'idée est de transformer le modèle en une sorte d'équipe virtuelle coordonnée, capable de gérer des projets beaucoup plus vastes qu'une simple conversation linéaire.

Une fonction "Effort Control" (contrôle de l'effort en français) fait aussi son apparition auprès de l'ensemble des utilisateurs sur Claude et dans Cowork. Elle permet de régler le niveau d'effort que Claude consacre à une réponse. "Avec un effort élevé, Claude réfléchit plus fréquemment et plus en profondeur. Avec un effort réduit, il répond plus vite et consomme les limites de débit plus lentement", explique Anthropic. De quoi mieux maîtriser sa consommation de tokens !

Claude Opus 4.8 : distinguer l'honnêteté visible de l'honnêteté réelle

Il convient toutefois de nuancer un peu les chose. En effet, dans un rapport technique publié en parallèle d'Opus 4.8, l'entreprise explique avoir observé durant l'entraînement des comportements jugés "préoccupants". Le modèle aurait notamment montré une tendance à anticiper la manière dont ses réponses seraient évaluées, y compris lorsqu'aucun indice ne laissait penser qu'il était en situation de test. Autrement dit, Claude ne se contente pas toujours de résoudre une tâche de manière neutre : il semble parfois adapter sa stratégie de réponse en fonction de ce qu'il perçoit comme des attentes implicites du système d'évaluation.

Par conséquent, Opus 4. pourrait parfois chercher à donner l'apparence d'une bonne réponse plutôt qu'à garantir sa justesse réelle. Sans remettre en cause les progrès affichés par Opus 4.8, ces éléments rappellent que les gains de performance mesurés en laboratoire ne reflètent pas toujours parfaitement le comportement réel d'un modèle en conditions d'usage.

Claude Opus 4.8 est disponible depuis ce 28 mai sur claude.ai, via l'API (identifiant : claude-opus-4-8) et chez les partenaires cloud (AWS, Google Cloud, Microsoft Foundry) pour tous les abonnés payants. Le tarif est le même que pour Opus 4.7 : 5 dollars par million de tokens en entrée, 25 dollars en sortie. Attention, Anthropic a restreint les limites d'utilisation de ses IA les plus performantes, entraînant des plaintes sur Reddit. Plusieurs utilisateurs dénoncent la fin de l'âge d'or de l'IA encore abordable, avec des plafonds d'utilisation qui se manifestent beaucoup plus tôt afin de les pousser vers des abonnements plus onéreux.

Claude Opus 4.8 : qu'attendre pour la suite ?

Mais malgré toutes ces annonces, une grande partie de l'attention se porte surtout sur Claude Mythos, le futur modèle d'Anthropic, censé être supérieur à Opus et jusqu'ici réservé à un cercle restreint d'organisations pour des travaux de cybersécurité. L'entreprise fait durer le suspense. Elle reconnaît qu'Opus 4.8 "représente une amélioration modeste mais tangible par rapport à la version précédente", avant d'enchaîner : "Nous travaillons actuellement au développement et à la commercialisation de modèles offrant des fonctions similaires à celles d'Opus, à un coût moindre. De plus, nous prévoyons de lancer une nouvelle génération de modèles encore plus performants qu'Opus."

On peut assurément supposer qu'il s'agit là de Mythos. Bonne nouvelle, l'entreprise annonce enfin préparer son ouverture au grand public, promettant une disponibilité générale "dans les semaines à venir", le temps de renforcer encore un peu ses garde-fous. Pour rappel, l'IA avait été décrite comme étant assez puissante pour "surpasser tous les humains, à l'exception des plus compétents, dans la détection et l'exploitation des failles logicielles". Anthropic avait annoncé en avril dernier refuser de le diffuser en raison de ses capacités cyber trop dangereuses.