Derrière la course à l’IA, des puces très chères et peu écologiques
Jensen Huang, PDG de Nvidia, a présenté le 16 mars 2026 Vera Rubin, la puce pour IA de dernière génération de la firme. - © Josh Edelson / AFP
Jensen Huang, PDG de Nvidia, a présenté le 16 mars 2026 Vera Rubin, la puce pour IA de dernière génération de la firme. - © Josh Edelson / AFP
Durée de lecture : 7 minutes
Pour améliorer ses performances, l’industrie de l’IA s’est lancée dans une course effrénée aux... puces électroniques. Elle peut investir des centaines de milliards de dollars pour acheter les plus récentes, avec un coût environnemental qui explose.
Derrière le mirage immatériel des algorithmes gronde une réalité matérielle implacable : l’intelligence artificielle est une dévoreuse de puces. À coups de centaines de milliards de dollars, les géants du secteur s’arrachent des processeurs graphiques (GPU) toujours plus puissants dont l’espérance de vie atteindrait à peine 3 ans, alertait en novembre 2025 l’ex capital-risqueur Michael Burry, oracle de la crise des subprimes survenue aux États-Unis il y a près de vingt ans.
En cause ? Le rythme de sortie des innovations dans un secteur où les nouveaux produits s’enchaînent à un rythme effréné. En témoigne la promesse faite en 2024 par le leader mondial des microprocesseurs, Nvidia, de commercialiser une nouvelle puce par an, au lieu d’environ tous les deux ans auparavant. Au risque de rendre les générations précédentes de GPU obsolètes bien avant leur expiration prévue.
650 milliards de dollars en 2026
Les GPU, puces indispensables pour faire fonctionner les systèmes d’IA les plus avancés, sont devenus la dépense majeure pour les entreprises du secteur. En 2026, Alphabet — la maison mère de Google —, Amazon, Microsoft et Meta prévoient de dépenser 650 milliards de dollars pour acheter ces bijoux de technologie vendus parfois plus de 40 000 dollars l’unité. Entraînés dans une course au progrès, beaucoup s’endettent massivement pour en acheter le plus possible, le plus vite possible.
S’il n’existe aucun rapport public faisant état du nombre de processeurs graphiques exploités par les centres de données dédiés à l’intelligence artificielle, Jensen Huang, le président de Nvidia, a déclaré dans lors d’une conférence en mars 2025 que quatre des principaux fournisseurs de services en réseau étasuniens (Amazon Web Services, Microsoft Azure, Google Cloud et Oracle Cloud) avaient acheté 3,6 millions de GPU Blackwell — le nom de cette version — depuis leur lancement début 2024, contre 1,3 million de ventes de GPU de la précédente génération, un an plus tôt.
Des cycles de vie limités
Si des entreprises comme Microsoft et Amazon déclarent des cycles de vie de cinq à six ans pour leurs serveurs qui incluent plusieurs GPU, ces chiffres sont remis en question. Mihir Kshirsagar, directeur du Center for Information Technology Policy à l’université de Princeton aux États-Unis, évalue plutôt une durée de vie d’un à trois ans en raison « des contraintes thermiques et électriques trop importantes », écrit-il dans un article de blog.
Fonctionnant au maximum de leurs capacités, les processeurs graphiques peuvent en effet surchauffer et dépasser les 100 °C, de quoi leur causer des dommages immédiats ou réduire considérablement leur durée de vie.
Au coût écologique de cette consommation effrénée de puces, il faut ajouter une demande en électricité qui ne cesse de croître pour les faire fonctionner, et des quantités d’eau pour refroidir les centres de données qui les exploitent, détaillé un rapport de l’Ademe sur la consommation des data centers paru en janvier 2026.
« Nous demandons au système électrique de ne pas changer trop vite en augmentant sa puissance pour servir une industrie dont le matériel devient trop vite obsolète », dit Mike Jacobs, spécialiste des questions énergétiques au sein de l’Union of Concerned Scientists, ONG étasunienne luttant contre le réchauffement climatique.
« La demande en puissance de calcul pour l’IA est si forte qu’on utilise actuellement tout ce qu’on a »
Cependant, pour Stacy Ragson, analyste en semiconducteurs, ces réflexions négatives sur la course aux puces et leur obsolescence accélérée seraient exagérées. « La pression sur les capacités de calcul est telle qu’on exploite tout le matériel disponible, d’autant que ce matériel reste parfaitement opérationnel après trois ans », dit le spécialiste.
Il nuance cependant ses propos : « On pourrait avancer que si la demande était moins forte, nous n’aurions pas besoin d’utiliser les anciens composants, et le risque d’obsolescence deviendrait alors un problème. Mais, pour les anciennes puces, la demande en puissance de calcul pour l’IA est si forte qu’on utilise actuellement tout ce qu’on a », insiste-t-il.
« À chaque nouvelle génération de GPU, la précédente devient mécaniquement moins attractive. Mais cette obsolescence est surtout vraie pour les géants de l’IA, qui ont besoin des meilleures performances possibles à tout moment. Pour des acteurs plus petits, avec moins de moyens, les générations précédentes restent une option crédible et même intéressante », affirme de son côté Frédéric Bordage, expert en sobriété numérique et fondateur du site GreenIT.fr.
Les puces laissées sur le carreau auraient le droit à une seconde chance, à en croire Michaël Reffay, directeur général de l’association France Datacenter : « Dans les centres de données, y a une logique de rotation du matériel parce qu’on y héberge des données stratégiques et qu’on doit disposer d’une puissance de calcul au meilleur standard. C’est ce qui nourrit l’idée que les puces périment rapidement. »
« En réalité, poursuit-il, une puce ne cesse pas d’être utile simplement parce qu’elle n’est plus au sommet de la performance industrielle. Elle peut encore avoir une seconde vie très concrète, par exemple dans la recherche, pour faire tourner des calculs ou pour exécuter des algorithmes dans des environnements moins critiques », affirme le représentant.
« Cette fabrication a un coût immense »
Ce discours ne convainc pas Lorraine de Montenay, coautrice du dernier rapport de l’Ademe sur les data centers. Elle dresse un parallèle avec l’univers de la fast fashion et de la seconde main, invoquant même l’expression « fast tech », qui décrit un cycle d’achats et de remplacements d’appareils à toute vitesse.
« La vraie différence, dit cette consultante indépendante en numérique responsable, c’est qu’on est ici dans un modèle d’entreprise à entreprise. On peut toujours dire que ces puces seront réemployées, mais il ne faut pas oublier qu’elles doivent d’abord être fabriquées, et cette fabrication a un coût immense. »
Et de poursuivre : « Ce sont des composants d’une précision extrême, produits par une industrie très gourmande en eau, en énergie et en métaux critiques. Et tout cela repose sur des ressources limitées, au point qu’on en vient déjà à envisager d’aller les chercher ailleurs, jusque sur les astéroïdes. »
La raréfaction des ressources sur Terre pourrait en effet nous pousser à nous tourner vers l’espace, les aérolithes enfermant du métal et des terres rares, précieuses au développement de nouvelles technologies. En attendant, « dans le domaine de l’IA, seule la sobriété peut encore freiner le tsunami d’impacts environnementaux et de déchets qui s’annonce », dit Frédéric Bordage. En somme, interroger la nécessité même de chaque usage pour freiner une croissance devenue insoutenable.