De AI-uitgavenval: waarom adoptie losstaat van resultaat

Geïnspireerd op The AI Spending Trap: Why Adoption Outpaces Outcomes van Stefan Wolpers (Age of Product, 3 mei 2026). Bronnen verwijzen naar het origineel en de studies die daarin worden geciteerd.

Als je de afgelopen twintig jaar hebt uitgelegd dat velocity geen waarde is, dat adoptie geen resultaat is en dat een Agile-transformatie geen Jira-migratie is, dan lees je de Stanford AI Index 2026 als iemand die dit verhaal al kent. De technologie is nieuw, het faalpatroon is dat niet. Dezelfde organisaties die nu AI omarmen zonder EBIT-effect te kunnen aantonen, hebben eerder Scrum ingevoerd zonder empirisch te leren, DevOps omarmd zonder hun teamfinanciering te veranderen, en productmanagement ingericht zonder iemand productbevoegdheid te geven. De economische data is het bewijs, de interpretatie is wat je al weet.

Geschiedenis herhaalt zichzelf, ook dit keer

De Californische goudkoorts van de jaren 1850 leverde een inzicht op dat sindsdien nooit is verouderd: in een goudkoorts verdien je geld met het verkopen van schoppen, niet met graven. Ruwweg 300.000 mensen trokken naar Californië, de meesten verloren geld. Sam Brannan, San Franciscos eerste miljonair, runde de schoppenwinkel. Wells Fargo vervoerde het goud. De Big Four, Stanford, Huntington, Crocker en Hopkins, waren kooplieden die mijnwerkers bedienden voordat ze het transcontinentale spoorwegnet bouwden.

Vervang houwelen door rekenkracht, frontier model labs door goudzoekers en hyperscalers door schoppenverkopers, en je hebt een werkbare kaart van de AI-markt in 2026. Het patroon is hetzelfde: de winst zit in de infrastructuurlaag, niet bij de bedrijven die de technologie omarmen.

Drie lagen, drie uitkomsten

Het Stanford AI Index Report 2026 maakt drie lagen zichtbaar die zich economisch heel verschillend gedragen.

De infrastructuurlaag wint. NVIDIA boekte $120 miljard nettowinst in fiscaal jaar 2026 volgens SEC-indieningen, wat meer is dan het gecombineerde omzetvolume van alle frontier model labs samen. De hyperscalers Microsoft, Google, Amazon, Meta en Oracle investeren in 2026 naar verwachting $600 tot $750 miljard in AI-infrastructuur, waarvan Google alleen al meer dan $150 miljard aan investeringsuitgaven over 2025 rapporteerde. De laag die zekere inputs verkoopt, rekenkracht, chips en stroom, wint ongeacht of de AI-projecten van klanten slagen.

De consumentenlaag wint ook, al zie je dat nergens terug op een balans. Brynjolfsson en collega’s (Stanford AI Index 2026, hoofdstuk 4) maten via online keuze-experimenten met circa 3.400 Amerikaanse volwassenen hoeveel ze zouden willen ontvangen om een maand lang geen toegang te hebben tot generatieve AI. Het geschatte consumentensurplus bereikte begin 2026 $172 miljard op jaarbasis, tegenover $112 miljard een jaar eerder, en de mediaan waarde per gebruiker verdrievoudigde in twaalf maanden. De meeste hulpmiddelen zijn gratis.

De bedrijvenlaag verliest. Stanford 2026 rapporteert dat 88 procent van de organisaties AI gebruikt in minimaal één bedrijfsfunctie, tegenover 78 procent in 2024, gebaseerd op de McKinsey State of AI 2025-enquête onder 1.993 respondenten. Adoptie is vrijwel universeel, maar slechts 39 procent rapporteert een EBIT-effect van generatieve AI en de meesten melden dat op minder dan 5 procent. Productiviteitswinsten liggen tussen 14 en 26 procent in klantenservice en softwareontwikkeling, met zwakkere of negatieve effecten zodra een taak meer oordeelsvermogen vraagt.

Wie het perceptiedebat daarover nog wil voeren, kan terecht bij de studie van METR. Het Model Evaluation and Threat Research lab voerde begin 2025 een gerandomiseerde gecontroleerde studie uit met 16 ervaren softwareontwikkelaars op grote, volwassen codebases en de uitkomst was dat ze 19 procent langzamer waren mét AI-hulpmiddelen dan zonder. Diezelfde ontwikkelaars verwachtten vooraf 24 procent sneller te zijn, en geloofden achteraf dat ze zo’n 20 procent sneller waren geweest. De kloof tussen perceptie en meting is hardnekkig en niet uniek voor software, want hetzelfde patroon herhaalt zich overal waar mensen zelf rapporteren over hun productiviteit.

Wie de klanteuro vangt

Volg de klanteuro door de keten en het beeld klaart op. De klant betaalt OpenAI voor een API-aanroep, OpenAI betaalt Microsoft voor de rekenkracht, Microsoft betaalt NVIDIA voor de chips en NVIDIA betaalt TSMC voor het silicium. Elke laag omhoog houdt minder over dan de laag eronder, omdat de modellaag de detailhandelspositie bezet en detailhandelaren op dunne marges draaien. Frontier model labs zijn nog geen cashflowbedrijven; ze zitten in een kapitaalintensieve klantenacquisitiefase, gefinancierd door durfkapitaal en afspraken met hyperscalers zoals Microsoft’s $13 miljard in OpenAI.

Dat kapitaal stroomt door naar NVIDIA en TSMC binnen hetzelfde boekjaar, waardoor de labs doorgeefluiken zijn en geen begunstigden. NVIDIA heeft een brutomarge van 71 procent, OpenAI 33 tot 40 procent, en dat verschil zegt minder over de kwaliteit van die bedrijven dan over hun positie in de keten. In mei 2026 wint de laag die zekere inputs verkoopt van de laag die onzekere uitkomsten verkoopt, en daarmee wordt het schoppen-versus-goud-principe een mechanisme dat verder reikt dan de metafoor.

De J-curve verklaart de dip, niet de afwezigheid van investering

Erik Brynjolfsson, Daniel Rock en Chad Syverson publiceerden in 2021 The Productivity J-Curve (American Economic Journal: Macroeconomics), met als kern dat algemene technologieën zoals elektriciteit, de stoommachine en de pc niet vanzelf rendement leveren. Ze vereisen een grote investering in immaterieel kapitaal: procesherontwerp, bijscholing, organisatorische herstructurering en nieuwe manieren van werken. Die investering wordt als kosten geboekt en niet gekapitaliseerd, waardoor gemeten productiviteit eerst daalt en pas later stijgt als die immateriële investering zichtbaar resultaat oplevert.

Het historische ijkpunt is Paul Davids paper The Dynamo and the Computer (1990, American Economic Review). Elektrische motoren waren vanaf de jaren 1890 wijdverspreid in fabrieken, maar de productiviteitswinsten arriveerden pas in de jaren 1920. De vertraging van veertig jaar werd veroorzaakt door iets heel concreets: fabrieken behielden hun stoomasindeling nadat ze elektrische motoren installeerden, en winst ontstond pas toen die fabrieken opnieuw werden ingericht rond het principe van goedkope gedistribueerde energie. ChatGPT lanceerde op 30 november 2022, dus we zitten drieënhalf jaar in de generatieve AI-cyclus en staan volgens elk historisch ijkpunt aan het begin.

Wat er in de dip zit, is geen niets-doen. Het is immaterieel-kapitaalinvestering die de boekhouding niet ziet: procesherontwerp waarbij werkstromen worden herbouwd rond de aanname van goedkope inferentie, bijscholing waarbij mensen leren het gereedschap goed te gebruiken in plaats van vlot, organisatorische herstructurering waarbij review-ketens worden ingekort en oordeelswerk wordt herverdeeld, datakwaliteit en governance als infrastructuur die bepaalt of het instrument signaal of ruis produceert, en verandermanagement om mensen de nieuwe stroom te laten omarmen in plaats van eromheen te werken.

Een organisatie die in 2024 fors in AI investeerde en nul EBIT-effect laat zien, faalt daarmee niet automatisch. De uitrol bevindt zich mogelijk in een normaal gevormde immaterieel-investeringsfase, vergelijkbaar met waar Paul Davids fabrieken in 1900 zaten, en het risico zit dan in de dip zonder die immateriële investering die de stijging veroorzaakt. Wie mensen wegbezuinigt, institutionele kennis verliest en dat een AI-strategie noemt, is van de curve afgestapt.

Er is ook eerlijk tegengeluid. MIT’s Daron Acemoglu publiceerde in 2025 een contra-thesis met de schatting dat AI niet meer dan 0,66 procent toevoegt aan de totale factorproductiviteit over tien jaar, ruwweg een twintigste tot een vijftigste van de prognoses van Goldman Sachs en McKinsey. Acemoglu noemt AI een so-so technology, een matige technologie die aanzienlijke verdringing van werk veroorzaakt maar bescheiden productiviteitswinst oplevert. Brynjolfsson is het er een ordegrootte mee oneens, hoewel beiden het eens zijn over het mechanisme: de opbrengst vereist immateriële investering die betaald moet worden.

Dat verschil is geen academische discussie. Het is een falsifieerbare test die je morgen op je eigen pilots kunt toepassen. Neem aan dat Acemoglu gelijk heeft en AI dus een matige technologie is. Welke van jouw lopende pilots overleven die aanname? De pilots met een verdedigbare waardethese, een te herontwerpen proces, een meetbare uitkomst en een falsifieerbare hypothese over kosten of opbrengst, overleven die test. De pilots die in J-curve-taal zijn verpakt zonder die these niet, en dat zijn de pilots die gokken op een aanname die je je niet kunt permitteren fout te hebben.

Zeven faalpatronen die je al kent

De Stanford 2026-data laat zien waar productiviteitswinsten bestaan, namelijk in smalle en goed meetbare taken, en waar niet, namelijk in alles wat aanhoudend oordeelsvermogen vereist. De faalpatronen hieronder beschrijven hoe organisaties keer op keer in de tweede categorie belanden, en wie Agile praktiseert herkent het oude patroon onder elk ervan.

1. Outputtheater. Tel de AI-functies die zijn opgeleverd in plaats van het effect op de uitkomst te meten en je hebt theater opgevoerd zonder iets te kunnen aantonen. Een team dat een AI-functie uitrolt zonder een nulmeting, een doelstelling en een meetperiode kan niet vaststellen of het iets heeft veranderd. De 88 procent organisatiebrede adoptie in Stanford 2026 is grotendeels dit, want adoptie zegt niets over resultaat. De Scrum-versie van dit antipatroon is velocity-aanbidding: story points tellen en dat productiviteit noemen. Hetzelfde mechanisme, sneller gereedschap.

2. Verkeerde budgetverdeling op basis van zichtbaarheid. De afdelingen die zichtbaar zijn voor de directie krijgen het budget, ook al levert onzichtbaar werk in de backoffice, ondersteuning of kwaliteitsborging vaak een betere ROI op. De keuze is rationeel vanuit een carrièreperspectief, omdat een AI-project in marketing wel op de directiepresentatie verschijnt en een AI-project in de factuurafhandeling niet. Vanuit waardecreatie is diezelfde keuze schadelijk. HiPPO-gestuurde backlog met een nieuw acroniem.

3. De Klarna-val. Klarna verving circa 700 medewerkers van de klantenservice door een OpenAI-chatbot in 2023, claimde $40 miljoen jaarlijkse besparing en draaide dat terug in mei 2025 omdat de kwaliteit van de dienstverlening niet houdbaar bleek. Grootschalige mensvervanging onderschat de kosten van controle, governance en kwaliteitsherstel, en het patroon herhaalde zich bij McDonald’s (IBM drive-through gestopt in juli 2024), bij Air Canada (de aansprakelijkheidsuitspraak Moffatt v. Air Canada over een chatbot, februari 2024) en bij Builder.ai (faillissement mei 2025). Contracten boven samenwerking. Het Manifesto waarschuwde hier al voor in 2001, drieëntwintig jaar later met chatbots.

4. De snelheidsillusie. Mensen voelen zich sneller met AI, ook als metingen het tegendeel aantonen, en de METR-studie is daar één signaal van. De structurele consequentie is zwaarder dan het signaal: als teams sneller lijken maar objectief langzamer zijn, produceren dezelfde uren meer werk met minder reflectie. Bij softwareteams accumuleert technische schuld per uur in plaats van per Sprint, en bij andere teams stapelt zich rommelig denkwerk, slordig onderzoek en ongecontroleerd materiaal op. De houdbaarheid van wat je oplevert daalt op het moment dat je productiever lijkt. Het tegengif is bekend en al twintig jaar hetzelfde: vertrouw de metingen, niet het gevoel. Zelfgerapporteerde productiviteit is al veertig jaar de meest betrouwbaar onjuiste maatstaf in software, en AI heeft dat niet opgelost.

5. De junior-paradox. Stanford 2026 rapporteert dat Amerikaanse softwareontwikkelaars van 22 tot 25 jaar een terugval in werkgelegenheid van bijna 20 procent zagen in 2024, in hetzelfde vakgebied waar AI’s gemeten productiviteitswinsten het duidelijkst zijn. Het patroon zal zich buiten software herhalen, in elk vak waar instaprollen bestaan om mensen het vak te leren. De productiviteitswinst per ervaren medewerker is reëel, de vervanging van instaptalent is dat ook, en organisaties die beide effecten tegelijkertijd draaien en optellen als een productiviteitswinst krijgen over drie tot vijf jaar de rekening voor de personeelsinstroom, wanneer de ontbrekende instapjaargang de volgende generatie vakmensen had moeten zijn. De huidige Sprint optimaliseren ten koste van volgend jaar: elke Agile-coach heeft een directielid deze afweging zien maken, en het kost altijd meer dan het spreadsheet voorspelt.

6. Aansprakelijkheidsblindheid. De Moffatt v. Air Canada-uitspraak in februari 2024 stelde vast dat bedrijven juridisch verantwoordelijk zijn voor wat hun chatbots klanten vertellen, terwijl organisaties juridische blootstelling zelden in kaart brengen op het moment van inkoop. Governance-schuld: Definition of Done met de juridische kolom weg.

7. Ongecontroleerd token gebruik. Deloitte’s enquête AI Token Economics for CFOs (januari 2026, n=550) rapporteert een organisatie waarvan het token gebruik maandelijks 8 tot 10 procent groeide en meer dan $6 miljoen aan ongeplande jaarlijkse kostenstijging opleverde voordat finance zicht had op de oorzaak. Agentic werkstromen verbruiken 5 tot 30 keer meer tokens per taak dan chatbots, en redeneermodellen kunnen meer dan 100 keer zoveel rekenkracht verbruiken per vraag. Onbewaakt werk in uitvoering, met een gemeten API aan de achterkant: elke Kanban-specialist weet wat onbegrensde WIP met een systeem doet.

Dit is bekend terrein

De kern van de AI-uitgavenval is dat infrastructuurleveranciers verdienen omdat ze zekere inputs verkopen ongeacht of hun klanten slagen, dat consumenten echte waarde halen omdat het product wordt weggegeven, en dat bedrijven verliezen omdat ze zekere inputs kopen en hopen dat uitkomsten volgen. Dat schoppen-inzicht is ouder dan goudkoorts: teams die verdienen in elke technologieadoptiecyclus zijn de teams die vóór de hausse al een heldere waardethese hadden. Het Agile-principe is hetzelfde, namelijk dat je het kleinste ding bouwt dat een meetbare uitkomst produceert, dat je het meet en dan beslist of je doorgaat. AI heeft daar niets aan veranderd, behalve dat het de verkeerde weg sneller maakt.

Agile-practitioners betogen dit al twee decennia en verliezen het argument meestal intern. In die lezing toont de Stanford 2026-bedrijvendata helemaal geen AI-probleem. Het is de zoveelste keer dat een generatie directeuren technologie koopt met output-denken en verrast is wanneer uitkomsten uitblijven.

Conclusie: de maandagochtendtest

Een dwaas met een LLM is nog steeds een dwaas, omdat AI versterkt wat je al bent. Bekwame practitioners worden effectiever en onbekwame practitioners produceren zelfverzekerde onzin sneller, want het instrument is neutraal terwijl het vakmanschap dat niet is.

Open daarom je laatste kwartaalpresentatie voor het bestuur, zoek de dia over AI-strategie en tel de werkwoorden. Hoeveel beschrijven outputs (uitgerold, gelanceerd, geïntegreerd, opgeleverd) tegenover uitkomsten (doorlooptijd met X verminderd, Y euro’s aan ongeplande kosten teruggewonnen, klanttevredenheid met Z punten gestegen)? Als de werkwoorden overwegend outputs zijn, sta je helemaal buiten de J-curve. Het immateriële werk is dan nog niet begonnen, terwijl de rekening van je tokenleverancier wel al binnenkomt.

Bronnen: Stanford AI Index 2026, McKinsey State of AI 2025, METR-studie, Brynjolfsson, Rock & Syverson: The Productivity J-Curve (2021), Acemoglu: The Simple Macroeconomics of AI (NBER, 2025), Deloitte: AI Token Economics for CFOs (2026), NVIDIA SEC Q4 FY26, Klarna AI reversal (Entrepreneur, mei 2025), Moffatt v. Air Canada (ABA, februari 2024), OpenAI-Microsoft partnership update (CNBC, april 2026).

Origineel artikel: The AI Spending Trap: Why Adoption Outpaces Outcomes door Stefan Wolpers, Age of Product.