Am 20. März veröffentlichte das KI-Programmiertool Cursor das selbst entwickelte Modell Composer 2 und behauptete, es sei das erste Ergebnis des Unternehmens aus „fortgesetztem Vortraining kombiniert mit Reinforcement Learning“ auf einem Basismodell. Im Release-Blog wurde der Ursprung des Basismodells nicht erwähnt, aber der Wortlaut schien zu besagen, dass es von Cursor selbst erstellt wurde.

In weniger als zwei Stunden hat ein Entwickler namens Fynn beim Debuggen der Cursor-API die echte Modell-ID von Composer 2, kimi-k2p5-rl-0317-s515-fast, abgefangen. Wenn man es auseinandernimmt, zeigt kimi-k2p5 auf Kimi K2.5, rl steht für Reinforcement Learning, gefolgt vom Datum und der Versionsnummer.


Du Yulun, die Person, die für das Vortraining für Dark Side of the Moon verantwortlich ist, twitterte sofort und sagte, das Team habe den Tokenizer von Composer 2 getestet und festgestellt, dass er „völlig konsistent“ mit Kimis Tokenizer sei, was fast bestätigte, dass „dies eine weitere Feinabstimmung unseres Modells ist.“ Er wandte sich direkt an @Cursor-Mitbegründer Michael Truell und fragte, warum die Lizenz nicht eingehalten und keine Gebühren gezahlt wurden. Der Tweet wurde später gelöscht.


Aber das Feuer brannte bereits. Musk antwortete auf Fynns Tweet mit „Ja, es ist Kimi 2.5“, was die Angelegenheit direkt zu einer heißen Suche machte.


Von „Schutz“ zu „Kooperieren“ dauerte die Umkehr nur wenige Stunden

Kimi K2.5 übernimmt eine modifizierte Version der MIT-Lizenz, die eindeutig vorschreibt, dass kommerzielle Produkte mit einem monatlichen Umsatz von mehr als 20 Millionen US-Dollar oder monatlich aktiven Nutzern von mehr als 100 Millionen „Kimi K2.5“ deutlich sichtbar auf der Benutzeroberfläche gekennzeichnet sein müssen. Der Jahresumsatz von Cursor beträgt etwa 2 Milliarden US-Dollar und übersteigt diesen Schwellenwert um mehr als das Achtfache.

Doch am selben Tag, als die öffentliche Meinung gärte, kehrte sich die Verschwörung um. Der offizielle Account von Dark Side of the Moon @Kimi_Moonshot veröffentlichte eine Nachricht, in der er seinen Ton von Fragen zu Glückwünschen änderte und sagte: „Wir sind stolz, dass Kimi K2.5 die Grundlage für Composer 2 liefert“ und klarstellte, dass Cursor für die Verwendung durch den Inferenzdienstleister Fireworks AI autorisiert wurde.


Aman Sanger, Mitbegründer von Cursor, erklärte später, dass das Team mehrere Basismodelle evaluiert habe und Kimi K2.5 das „stärkste“ gewesen sei, und dann auf dieser Grundlage zusätzliches Vortraining und Verstärkungslernen im Vierfachen der Skala durchgeführt habe. Er gab zu, dass es ein Fehler war, den Kimi K2.5 im Launch-Blog nicht zu erwähnen.


Vom Streit um die Open-Source-Vereinbarung bis zur offiziellen Ankündigung der Zusammenarbeit dauerte der gesamte Prozess weniger als 24 Stunden.

Warum Cursor „Fehler“ machen

Dies ist nicht das erste Mal, dass festgestellt wurde, dass Cursor eine „Basis aus China“ hat. Als Composer 1 im November 2025 veröffentlicht wurde, spekulierte die Community durch Tokenizer-Analyse, dass es in hohem Maße mit DeepSeek übereinstimmte und während der Inferenz gelegentlich Chinesisch ausgab. Auch der Cursor reagierte zu diesem Zeitpunkt nicht.

Von DeepSeek bis Kimi hat sich die Basis des selbst entwickelten Modells von Cursor stark verändert, was alle auf die gleiche Tatsache hindeutet. Das Basismodell mit den stärksten Programmierfähigkeiten der Welt stammt von Chinas Open-Source-Community.

Die Zurückhaltung von Cursor, die Quelle der Basis preiszugeben, hat ein tiefer liegendes strukturelles Problem zur Folge. Cursor hat sich immer auf die Modelle von Anthropic und OpenAI verlassen, um Produkte voranzutreiben, aber diese beiden Unternehmen stellen jetzt selbst Programmiertools her. Claude Code und Codex verbreiten sich beide schnell und viele Entwickler haben mit der Migration begonnen. Das Paradoxe, mit dem Cursor konfrontiert ist, besteht darin, dass es sich auf Spitzenmodelle verlassen muss, um die Bedürfnisse der Nutzer zu erfüllen, die Modellhersteller aber auch seine direkten Konkurrenten sind. Ohne eine eigene steuerbare Modellbasis wird der Cursor immer von anderen gesteuert.

Aus dieser Perspektive ist es fast eine unvermeidliche Logik, Chinas Open-Source-Modell zur Feinabstimmung zu wählen, das stark genug ist, aber nicht zum eigenen Konkurrenten wird. Dies ist aber auch der Grund, warum Cursor nicht bereit ist, öffentlich zu sprechen. Im Jahr 2025 wird es mit einer Bewertung von 29,3 Milliarden US-Dollar der heißeste Star in der KI-Programmierbranche sein. Am 12. März berichtete Bloomberg, dass die Zielbewertung der neuen Finanzierungsrunde etwa 50 Milliarden US-Dollar beträgt. Zu diesem Zeitpunkt zuzugeben, dass das Kernmodell von der chinesischen Open-Source-Community stammt, steht der Bewertungserzählung nicht entgegen.

Composer 2 erzielte auf dem von Cursor entwickelten CursorBench 61,3 Punkte und übertraf damit die 58,2 Punkte von Claude Opus 4.6, aber immerhin handelt es sich hier um ein Zeugnis über selbst beantwortete Fragen und Selbstprüfung. Wenn andererseits ein fein abgestimmtes Produkt, das auf einem Open-Source-Modell basiert, bei Programmieraufgaben mit Giganten konkurrieren kann, ist diese Angelegenheit selbst möglicherweise interessanter als der Offenlegungsfehler von Cursor. Clément Delangue, Mitbegründer von Hugging Face, kommentierte: „Chinas Open Source ist heute die stärkste Kraft, die den globalen KI-Technologie-Stack prägt.“

Für Dark Side of the Moon war das Ergebnis dieser Kontroverse ein nahezu perfektes Markenereignis. Von der „verletzenden Partei“ zum „Partner“ erlangte es ein Gefühl der Präsenz in der globalen Entwicklergemeinschaft. Am Ende bestätigte Cursor persönlich, dass „Kimi K2.5 ausgewählt wurde, weil es das stärkste ist.“

Kimis „Goldene Woche“

Vor ein paar Tagen erlebte Kimi gerade einen extrem dichten Belichtungszyklus.

Am 16. März veröffentlichte Dark Side of the Moon ein rein architektonisches technisches Papier mit dem Titel „Attention Residuals“ (Attention Residuals), in dem versucht wurde, eine Grundkomponente in der Transformer-Architektur zu ersetzen, die seit ResNet im Jahr 2015 nahezu unberührt geblieben ist, die Restverbindung. In der Vergangenheit wurden die Ausgabe und die Eingabe jeder Schicht direkt addiert und unterschiedslos übertragen. Das Kimi-Team ermöglicht es jeder Ebene, „zurückzublicken“ und dynamisch auszuwählen, aus welchen vorherigen Ebenen Informationen extrahiert werden sollen. Experimente zeigen, dass die Trainingseffizienz um etwa 25 % verbessert und die Inferenzverzögerung um weniger als 2 % erhöht wird. Einer der Co-Autoren des Papiers ist neben Kimis Schlüsselforschern Su Jianlin und Zhang Yu ein 17-jähriger High-School-Schüler aus Shenzhen.


Am Abend der Veröffentlichung des Papiers kommentierte Musk X als „Beeindruckende Arbeit von Kimi“, und Kimi antwortete offiziell: „Ihre Rakete ist auch nicht schlecht.“ Andrej Karpathy sagte: „Es scheint, dass wir den Satz ‚Aufmerksamkeit ist alles, was Sie brauchen‘ nicht wörtlich verstanden haben.“ Der ehemalige OpenAI-Vizepräsident für Reinforcement Learning, Jerry Tworek, nennt es den Beginn von „Deep Learning 2.0“.

Am nächsten Tag, dem 17. März, erwähnte Huang Renxun in der Keynote der GTC 2026 mehrfach das chinesische Open-Source-Modell. Kimi K2.5 ersetzte DeepSeek vom letzten Jahr und wurde zum Benchmark-Modell, mit dem Huang Renxun der Welt die Bedeutung des Denkens demonstrierte.

Am 18. März hielt Yang Zhilin direkt eine Rede im GTC-Unterforum. Er ist neben Tesla AI Director und DeepMind Core Architect der einzige Vertreter eines unabhängigen großen Modell-Startup-Unternehmens auf der Gästeliste. Auch der Vortrag war voller Menschen. Er legte systematisch den technischen Weg hinter Kimi K2.5 offen und fasste die Modellentwicklung in drei Dimensionen zusammen: Token-Effizienz, langer Kontext und Agentencluster.

Bevor DeepSeek völlig populär wurde, war DeepSeek das chinesische Open-Source-Modellteam, das am meisten über GTC teilte.

Papers, GTC und Cursor, drei Dinge wurden innerhalb einer Woche nacheinander veröffentlicht, und diese schillernden Highlights haben alle die Bedeutung von „Zeiten ändern“ mit DeepSeek: In der Vergangenheit wurde jedes Paper von DeepSeek von der globalen Technologie-Community und den KOL-Chefs gesucht und erneut veröffentlicht. In der Vergangenheit war die GTC quasi eine „inoffizielle“ Auftaktkonferenz von DeepSeek. Sogar Cursor wurde von DeepSeek „stillschweigend versteckt“ und im Handumdrehen verwandelte sich alles in Kimi, die dunkle Seite des Mondes.

In DeepSeeks Schuhen stecken

Dies hat vielen Menschen klar gemacht, dass Kimi die Position von DeepSeek in der globalen KI-Community einnimmt.

Der Ausbruch von DeepSeek R1 Anfang 2025 hat die Wahrnehmung der gesamten Branche verändert und „chinesische KI“ von einem vagen Konzept in ein spezifisches und operatives Modellgewicht verwandelt. Doch seitdem ist es relativ ruhig um DeepSeek. V4/R2, auf die die Community schon lange gewartet hat, wurde nicht veröffentlicht. V3.1, V3.2 und andere Versionen wurden kontinuierlich aktualisiert, aber die Auswirkungen des „Neuschreibens der Regeln, sobald das Spiel gestartet wird“ wurden vorerst nicht reproduziert.

Kimi betrat zufällig diese Fensterperiode.

Nach dem Frühlingsfest 2025 stand Kimi Daily unter Druck. Dark Side of the Moon kürzte einen großen Teil seines Marketingbudgets und begann hinter verschlossenen Türen mit der Arbeit an Modellen. Im Juli wurde Kimi K2 mit einer MoE-Architektur mit Billionen Parametern veröffentlicht. Nach der Veröffentlichung von K2 übertraf die Zahl der Downloads am ersten Tag von Hugging Face alle anderen Modelle auf der Plattform. Anthropic-Mitbegründer Jack Clark bewertete es als „das beste Open-Source-Gewichtsmodell der Welt“.

Ende Januar 2026 wurde K2.5 mit nativer Multimodalität und Agent-Cluster-Architektur veröffentlicht und gewann in mehreren Agent-Bewertungen den besten Open-Source-Award der Welt. Nachdem der OpenClaw-Trend kam, ging Kimi Claw schnell online. Berichten zufolge überstieg der kumulierte Umsatz von Kimi in den letzten 20 Tagen weniger als einen Monat nach der Veröffentlichung von K2.5 den des gesamten Jahres 2025. Stripe-Daten zeigen, dass die Zahlungsaufträge einzelner Kimi-Abonnenten im Januar im Vergleich zum Vormonat um 8.280 % gestiegen sind.

Auch auf Kapitalebene beschleunigt sich das Tempo. Die C-Runde über 500 Millionen US-Dollar Ende 2025 mit einer Post-Money-Bewertung von 4,3 Milliarden US-Dollar; im Februar 2026 überstieg es 700 Millionen US-Dollar und die Bewertung stieg auf 10 Milliarden US-Dollar; Mitte März läuft eine neue Runde von 1 Milliarde US-Dollar, und die Bewertung hat 18 Milliarden US-Dollar erreicht. Die Marktwerte von Zhipu und MiniMax, die im gleichen Zeitraum an der Hongkonger Börse notiert waren, erreichten Mitte März das Niveau von 330 Milliarden HK$ bzw. 380 Milliarden HK$. Dark Side of the Moon ist noch nicht auf dem Sekundärmarkt erhältlich. Gemessen an der aktuellen Prämie des KI-Sektors bleibt nach der Listung nicht viel Raum für Fantasie.


Auf diese Weise nutzte Kimi die Methode von DeepSeek, um DeepSeeks Heiligenschein zu beseitigen.

Die Architektur von Kimi K2 ist direkt von DeepSeek V3 abgeleitet. Der MLA-Aufmerksamkeitsmechanismus und das MoE-Experten-Hybrid-Framework sind die ersten, die von DeepSeek entwickelt oder in großem Maßstab verifiziert wurden. Der Aufstieg von Kimi selbst ist eine Fortsetzung des Einflusses der DeepSeek-Technologie. Die Open-Source-Strategie von DeepSeek ist außerdem gründlicher und verwendet eine reine MIT-Lizenz ohne Beschränkungen der Umsatzschwelle, wodurch eine sehr hohe Durchdringungsrate im globalen Entwickler-Ökosystem erzielt werden kann. Kimis modifizierte MIT-Lizenz weist eine zusätzliche Ebene von Einschränkungen für die kommerzielle Nutzung auf. Dieser Cursor-Vorfall ist ein Beispiel.

Während der relativ ruhigen Zeit von DeepSeek übernahm Kimi das Mikrofon vom „China AI Open Source Representative“. Ob es sich um das Podium von Jen-Hsun Huang, die Modellbasis von Cursor oder um wissenschaftliche Arbeiten und Entwicklergemeinschaften handelt, Kimi füllt einen Erzählraum, der ständig neue Inhalte erfordert.

Darüber hinaus produziert Kimi nicht nur Modelle. Der Artikel „Attention Residuals“ geht auf die zugrunde liegende Struktur des Deep Learning ein, die sich in den letzten zehn Jahren nicht wesentlich verändert hat. Dies ist derselbe Ansatz wie der MLA von DeepSeek in der Vergangenheit, die beide versuchen, die Infrastruktur der Branche neu zu definieren.

Die Geschichte von Chinas KI-Open-Source wandelt sich von „einem DeepSeek“ zu einer Geschichte, in der ständig neue Spieler auftauchen, die den Heiligenschein wegnehmen. Dies ähnelt zunehmend dem Rhythmus des Silicon Valley. Auf OpenAI folgt Google, auf Google folgt Anthropic, und dann geht der Zyklus weiter.

Chinas Open-Source-Modelle übernehmen abwechselnd die Zeitpläne von Entwicklern auf der ganzen Welt. Während die Fähigkeiten des Modells rasant zunehmen, bleibt das Recht, sich zu äußern, nicht außer Acht gelassen: Wenn das neue Modell von DeepSeek erscheint, wird Kimis Aufmerksamkeit dann abgelenkt? Werden die neuen Werke von MiniMax, Qwen, Wisdom, Step und dem ebenso aggressiven Newcomer Xiaomi plötzlich ihre Spitzenpositionen wegnehmen? All dies ermöglicht die Fortsetzung dieses spiralförmigen Wandels, und das ist eine gute Sache für jeden chinesischen KI-Teilnehmer.