In den letzten Tagen hat die KI-Branche Unternehmen noch dazu ermutigt, „ihr Budget auszugeben“, aber jetzt wendet sie sich schnell einem „Drosselungs“-Modell zu, weil Unternehmen festgestellt haben, dass sie selbst dann, wenn sie KI nur zur Bewältigung einiger kleiner Aufgaben verwenden, leicht eine große Menge an Token-Gebühren verbrennen können, aber möglicherweise nicht die gleiche Rendite erzielen. Immer mehr Unternehmen beginnen, die Nutzung von KI-Tools durch ihre Mitarbeiter einzuschränken, und Unternehmen treten in eine Phase ein, die als „Token-Rationierung“ bezeichnet wird, also die Rationierung von KI-Ressourcen.

Das Beratungsunternehmen Accenture versuchte kürzlich, Mitarbeiter daran zu hindern, KI für grundlegende Aufgaben wie die Konvertierung von PDFs in Präsentationen zu verwenden, um nicht zu viele Token zu verbrauchen. Eine solche Verschärfung ist noch nicht lange her, als Accenture seine Mitarbeiter warnte, dass der Verzicht auf den Einsatz von KI die Aufstiegschancen beeinträchtigen könnte. In einer durchgesickerten internen Besprechungsaufzeichnung, die von 404 Media zitiert wurde, sagte Justice Kwak, Leiter der Agenten-KI-Strategie bei Accenture, das Unternehmen habe einen Wendepunkt erreicht, an dem KI beginnt, die Kostenstruktur erheblich zu beeinflussen, und das Management frage sich immer noch, ob die Investition das Geld wirklich wert sei.

Die Token-Kosten haben begonnen, das KI-Geschäftsmodell ins Wanken zu bringen. In den letzten Monaten gerieten die Aktienkurse und Bewertungen von Unternehmen mit KI-Bezug unter Druck, wobei einige Unternehmen, die stark auf KI angewiesen sind, die Hauptlast tragen, insbesondere Hersteller von Speicherchips. Die Branche beginnt zu erkennen, dass KI nicht durch „Frische“ und „konzeptionelle Begeisterung“ unterstützt werden kann. Letztendlich muss es beweisen, dass es tatsächlich einen finanziellen Mehrwert bringen kann.

Im weiteren Sinne passen Unternehmen gemeinsam ihre internen KI-Strategien an. Viele Unternehmen haben damit begonnen, wöchentliche oder monatliche Nutzungsobergrenzen für Mitarbeiter festzulegen oder verschiedenen Positionen unterschiedliche Token-Budgets zuzuweisen; Einige Unternehmen senden auch Erinnerungen, wenn die Nutzung nahe an der Obergrenze liegt, sodass Mitarbeiter zusätzliche Kontingente beantragen können. Hinter diesem Ansatz steckt die Tatsache, dass Dienstanbieter wie OpenAI, Anthropic und GitHub kürzlich ihre Preismethoden angepasst haben und von einem Modell, das ursprünglich eher einem Modell der „monatlichen unbegrenzten Nutzung“ ähnelte, zu einem Modell übergegangen sind, bei dem die Abrechnung auf der Grundlage des tatsächlichen Token-Verbrauchs im Vordergrund steht.

Der Bericht wies auch darauf hin, dass viele scheinbar einfache Aufgaben auf fortgeschrittenen Modellen tatsächlich nicht billig umzusetzen sind. Beispielsweise kann die Auslagerung komplexer Analysen auf ein großes Modell, das über einen längeren Zeitraum läuft, leicht mehr als 100 US-Dollar kosten; Eine groß angelegte Schwachstellenanalyse der gesamten Codebasis kann sogar 50.000 bis 100.000 US-Dollar kosten. Aus diesem Grund haben einige Unternehmen begonnen, grundlegende Aufgaben auf weniger leistungsstarke und kostengünstigere Modelle zu verlagern und sogar Produkte verschiedener Hersteller zu kombinieren, um die Kosten zu kontrollieren.

Aus betriebswirtschaftlicher Sicht bedeutet dieser Wandel, dass sich die KI von der „Förderung von Mehrfachnutzungen“ hin zu „Feinquoten“ verschiebt. Für Mitarbeiter ist der Zugang zu KI nicht mehr nur eine Frage der Effizienz, sondern auch eine Frage der Budgetverwaltung; Für CFOs, COOs und CIOs muss KI jetzt genauso streng gemessen werden wie andere Kernkosten. Dies ist auch ein Zeichen dafür, dass die erste Phase der Begeisterung für Unternehmens-KI nachlässt und durch eine neue Phase ersetzt wird, die pragmatischer ist und sich mehr um Input und Output kümmert.