Laut einem internen Memo, das der Zeitschrift „Information“ vorliegt, ist Meta Platforms zunehmend optimistisch, was das erste große Kernmodell angeht, das sein neu gebildetes KI-Team bald auf den Markt bringen wird. Das Memo vom 20. Januar wurde von Megan Fu, Produktmanagerin von Meta Superintelligence Labs, veröffentlicht und besagt eindeutig, dass das große Sprachmodell der nächsten Generation, Avocado, das Vortraining abgeschlossen hat und „Metas bisher leistungsstärkstes vorab trainiertes Basismodell“ ist. Das Vortraining ist die Anfangsphase der KI-Modellentwicklung. Das Modell muss riesigen Datenmengen ausgesetzt sein und allgemeines Wissen, Muster und Beziehungen erlernen.

Links sind Alexander Wang und Mark Zuckerberg
In dem Memo heißt es, dass die Leistung von Avocado das derzeit beste Open-Source-Basismodell übertrifft. (Das Grundmodell bezieht sich auf ein großes Sprachmodell, das nur das Vortraining abgeschlossen hat und noch nicht durch die „Post-Training“-Phase optimiert wurde; in der Post-Training-Phase werden Techniken wie Human-Feedback-Verstärkungslernen verwendet, um das Modell für bestimmte Aufgaben zu verfeinern.) Obwohl Avocado das Post-Training noch nicht abgeschlossen hat, sind seine Wissensreserven, seine visuelle Wahrnehmung und seine Mehrsprachigkeitsfunktionen auf Augenhöhe mit den Top-Post-Training-Modellen.
Bevor Avocado offiziell der Öffentlichkeit zugänglich gemacht wird, ist noch unklar, ob Metas interne optimistische Einschätzung des Fortschritts seines KI-Modells einer externen Überprüfung standhalten kann. Aber angesichts der schwierigen Erfahrungen von Meta mit KI im vergangenen Jahr wäre es für das Unternehmen riskant, diesen Fortschritt intern übermäßig zu fördern.
Im Jahr 2025 entsprach die Leistung des großen Sprachmodells Llama 4 der vorherigen Generation von Meta nicht den Erwartungen, was das Unternehmen dazu zwang, seine Veröffentlichung zu verschieben. Meta veröffentlichte schließlich zwei Versionen von Llama 4 – Maverick (Ranger) und Scout (Scout), aber einige Entwickler waren von der tatsächlichen Leistung enttäuscht.
Diese Rückschläge führten direkt zu einer umfassenden Umstrukturierung des gesamten KI-Geschäfts von Meta. Die Umstrukturierung umfasst: Meta hat Scale AI im Juni letzten Jahres für 14,3 Milliarden US-Dollar übernommen. Alexandr Wang, CEO des Startups, wechselte anschließend zu Meta und war für die Leitung der neuen umfassenden KI-Organisation Meta Super Intelligence Laboratory verantwortlich. Seitdem hat Meta eine Rekordsumme in das KI-Geschäft investiert: Das Unternehmen prognostizierte kürzlich, dass die Investitionsausgaben im Jahr 2026, einschließlich der Kosten für KI-Rechenleistung, im Vergleich zu 2025 um etwa 73 % steigen und 115 bis 135 Milliarden US-Dollar erreichen werden.
Der technologische Fortschritt von Meta bei neuen Modellen kann dazu beitragen, die damit verbundenen Kosten zu kontrollieren. Ein weiteres Memo von Mitte Dezember letzten Jahres zeigte, dass die Recheneffizienz von Avocado bei textbezogenen Aufgaben zehnmal höher ist als die von Maverick und mehr als 100-mal höher als die von Behemoth. Behemoth ist Metas verzögerte, noch unangekündigte Version von Llama 4 vom letzten Jahr.
Meta sagte, dass es erfolgreich Effizienzdurchbrüche erzielt habe, indem es qualitativ hochwertigere Daten beschaffte, in die Modellinfrastruktur investierte und deterministisches Training einführte, das sicherstellt, dass das Modell unter derselben Trainingsmethode stabile Ergebnisse liefert. Diese Effizienzsteigerung trägt dazu bei, den Energieverbrauch und die Kosten der KI-Forschung und -Entwicklung zu senken – ein entscheidender Faktor, da Meta bestrebt ist, mit der Konkurrenz mitzuhalten.
Der positive Ton des internen Memos von Meta spiegelt die jüngsten öffentlichen Äußerungen von Führungskräften wider. Letzten Monat deutete Andrew Bosworth, Chief Technology Officer von Meta, auf einer Pressekonferenz beim Weltwirtschaftsforum in Davos, Schweiz, ähnliche Effizienzverbesserungen an und sagte, dass das KI-Modell von Meta „extrem gut funktioniert“ habe. Bosworth sagte auch, dass die Entwicklung eines für Verbraucher nutzbaren Modells viel Arbeit nach der Schulung erfordere.
Gleichzeitig sagte Meta-CEO Mark Zuckerberg letzte Woche in der Telefonkonferenz zu den Ergebnissen über die ersten großen Modelle, die von Metas Super Intelligence Laboratory auf den Markt gebracht werden sollen: „Ich gehe davon aus, dass unsere ersten Modelle eine gute Leistung erbringen werden, aber was noch wichtiger ist, sie werden unseren rasanten Entwicklungskurs demonstrieren. Ich erwarte auch, dass wir in diesem Jahr weiterhin neue Modelle auf den Markt bringen und die technologischen Grenzen stetig vorantreiben werden.“