Quand le token ne coûte plus rien : l'IA devient une commodité, la vision devient rare

Note de lecture. Les chiffres cités ici proviennent d'analyses publiées par SemiAnalysis et relayées par Business Insider en juin 2026. Ce sont des mesures de laboratoire, dans des conditions favorables, produites par un acteur proche de l'écosystème NVIDIA. Nous les prenons comme une tendance solide, pas comme une vérité universelle. Hedging assumé tout du long.

En une phrase

Le coût pour produire un million de tokens tomberait, selon SemiAnalysis, de l'ordre de 4,20 $ sur la génération précédente de puces à environ 0,12 $ sur les nouvelles cartes NVIDIA Blackwell — soit près de 35 fois moins cher. Si la tendance se confirme, l'accès à l'IA cesse d'être un avantage : il devient une commodité. Et quand la matière première devient quasi gratuite, la valeur se déplace vers ce qui reste rare — la donnée métier, l'usage, et la vision.

1. Ce que disent les chiffres

NVIDIA déploie à grande échelle, à partir du second semestre 2026, sa génération de puces Blackwell (systèmes GB300 NVL72). SemiAnalysis a comparé leur efficacité à celle de la génération précédente, Hopper (H200). Les écarts rapportés sont d'un ordre de grandeur inhabituel.

Graphique en barres : 4,20 dollars pour produire un million de tokens sur Hopper, contre 0,12 dollar sur Blackwell — soit environ 35 fois moins cher

Trois chiffres ressortent du reporting :

Coût par million de tokens : de l'ordre de 4,20 $ à 0,12 $, soit une réduction d'environ 97 %.
Tokens par mégawatt : à puissance électrique égale, Blackwell produirait jusqu'à 50 fois plus de tokens que Hopper.
Déploiement : la montée en charge est attendue au second semestre 2026, ce qui — si la tendance se confirme — augmenterait régulièrement l'offre de tokens à bas coût.

Le contexte le confirme par ailleurs. Sam Altman a reconnu publiquement que « le coût de l'IA est devenu un vrai problème ». Quand les fournisseurs eux-mêmes parlent du coût comme d'un sujet, c'est que la pression est réelle.

2. Deux pièges de lecture

Avant d'en tirer des conclusions, deux nuances que la couverture médiatique escamote souvent.

Coût de production ≠ prix de marché. Que produire un token coûte 35 fois moins cher ne signifie pas que le prix facturé chutera d'autant. Une partie de l'économie est captée par les marges, l'amortissement des puces (qui coûtent cher à l'achat), et l'énergie. La baisse arrivera — elle a déjà commencé sur certains segments — mais probablement de façon inégale.

Le paradoxe de Jevons. Quand une ressource devient moins chère, on n'en consomme pas moins : on en consomme beaucoup plus. Des tokens bon marché, ce sont des modèles que l'on appelle dix fois, des agents qui raisonnent en boucle, des tâches longues qu'on n'aurait jamais lancées au prix fort. La facture totale d'une entreprise peut très bien augmenter alors même que le prix unitaire s'effondre. L'effondrement du coût unitaire n'est pas la fin de la dépense — c'est le début d'un autre usage.

« Une ressource qui devient abondante cesse d'être un avantage concurrentiel. Mais elle ne cesse pas d'avoir de la valeur — c'est l'usage qu'on en fait qui en a. »

3. La valeur se déplace — où ?

C'est le cœur du sujet. Pendant deux ans, le récit dominant fut : « celui qui a accès aux meilleurs modèles gagne ». Ce récit vieillit. Si le token devient une commodité, avoir accès à l'IA ne distingue plus personne — comme avoir accès à l'électricité ne distingue plus une usine.

La valeur migre alors vers ce qui reste rare et difficile à copier :

La donnée métier — un modèle générique est à tout le monde ; vos données, vos cas d'usage, votre historique terrain, non.
L'interface simple — la capacité à rendre une puissance brute utilisable par un humain qui n'a ni le temps ni l'envie d'apprendre à prompter.
L'intégration terrain — brancher l'IA sur les outils réels, les processus réels, les contraintes réelles d'une organisation.
La vitesse d'exécution — transformer une idée en produit avant les autres, quand tout le monde a accès à la même matière première.
La compréhension du problème — savoir quel problème vaut la peine d'être résolu, ce qu'aucun modèle ne fait à votre place.

Nous l'écrivions déjà à propos du code, dans Le génie logiciel n'est pas mort : quand la production devient abondante, ce n'est pas la fin du métier, c'est la fin du monopole sur la valeur. Le token suit exactement la même courbe que le code. Et la conclusion est la même : les gagnants ne seront pas ceux qui consomment le plus d'IA, mais ceux qui comprennent le mieux le problème à résoudre.

4. Ce que ça change, acteur par acteur

Les vendeurs de « magie » — ceux qui facturent l'accès à l'IA comme une prouesse rare vont se faire rattraper. Quand le coût de revient s'effondre, le discours « c'est cher parce que c'est de l'IA » ne tient plus.
Les éditeurs d'infrastructure — la bataille se déplace vers l'efficacité par watt et par dollar. C'est exactement la logique de la loi de Tau : l'avantage n'est plus la puissance brute, mais l'efficacité.
Les petites structures, les associations, les indépendants — grands gagnants potentiels. Une matière première qui s'effondre démocratise la production. Ce qui était réservé aux géants devient accessible à une équipe de trois personnes — à condition d'avoir la donnée et la vision.
Les organisations sans cap — grandes perdantes. Une IA dix fois moins chère appliquée à une mauvaise idée reste une mauvaise idée, simplement servie plus vite et en plus grand volume.

5. Signaux à surveiller

L'écart production / prix facturé. Les API grand public répercuteront-elles la baisse, et à quelle vitesse ? L'écart entre coût de revient et tarif dira qui capte la valeur.
La consommation totale. Si le paradoxe de Jevons joue, on verra les volumes de tokens exploser plus vite que les prix ne baissent. À surveiller dans les communiqués des grands labs.
Les nouveaux usages rendus viables. Des tâches longues, agentiques, jusqu'ici trop coûteuses, vont devenir économiquement banales. C'est là que naîtront les produits intéressants.
L'indépendance des chiffres. Des mesures venant d'acteurs non liés à NVIDIA confirmeront-elles l'ordre de grandeur ? Tant que la source principale reste proche du vendeur, la prudence s'impose.

6. Un mot situé

Depuis La Réunion, à 9 000 km des centres de calcul qui produisent ces tokens, cette nouvelle a un goût particulier. Pendant des années, l'IA de pointe semblait réservée à ceux qui pouvaient en payer le prix. Si la matière première devient presque gratuite, la barrière financière s'efface — et il ne reste que la barrière qui nous intéresse vraiment : savoir quoi en faire.

C'est une bonne nouvelle pour un laboratoire frugal. Nous n'avons jamais misé sur la quantité d'IA consommée, mais sur la pertinence de l'usage. Un territoire insulaire, une petite association, un artisan : aucun n'a besoin du plus gros modèle du monde. Ils ont besoin du bon problème, bien posé, résolu avec l'outil le plus simple qui marche.

L'IA devient une commodité. C'est précisément pour cela que la vraie rareté, demain, ne sera pas la puissance. Ce sera la vision.

Sources et lectures complémentaires

Business Insider — « AI token prices may crash as Nvidia Blackwell GPUs scale » (juin 2026) — Article à l'origine de cette note ; relaie l'analyse SemiAnalysis et les propos de Sam Altman.
SemiAnalysis — Analyse comparative GB300 NVL72 (Blackwell) contre H200 (Hopper) ; source des chiffres de coût et d'efficacité (acteur proche de l'écosystème NVIDIA — à lire comme tel).
NVIDIA — Données InferenceX / InferenceMAX sur Blackwell Ultra — Jusqu'à 50× de débit par mégawatt et 35× de baisse du coût par token revendiqués (chiffres vendeur).
Ryuzaki Labs — Le génie logiciel n'est pas mort et La loi de Tau — Deux analyses sur la commoditisation et l'efficacité, dont celle-ci prolonge le raisonnement.

Ce document est mis à jour si des éléments nouveaux apparaissent. Dernière révision : 文 13 juin 2026.