Inländische Großmodelle wurden in der vergangenen Woche häufig aktualisiert. Nach der Open Source von GLM-5.1 und MiniMax 2.7 ist auch die Kimi K2.6-Code-Vorschau von Dark Side of the Moon verfügbar. Es handelt sich um ein großes Modell mit Billionen Parametern, die speziell für die KI-Programmierung optimiert wurden. Auf der offiziellen Website heißt es, dass es bereits online ist.Um dieses große Modell erleben zu können, benötigen Sie jedoch Kimis Mitgliedschaftsplan, der bei 39 Yuan pro Monat beginnt und im Kimi Code verwendet werden kann.

Das große K2.6-Code-Vorschaumodell ist jedoch relativ zurückhaltend. Für die vorherige interne Beta gab es nicht viel Werbung. Erst als es in den letzten zwei Tagen veröffentlicht wurde, sah ich jemanden, der es erwähnte. Kimi-Beamte machten keine große Werbung dafür. Selbst auf der offiziellen Website sind noch keine konkreten Upgrades für dieses große Modell zu finden.
Dem internen Beta-Feedback und den Einführungen, an denen Leute im Internet teilgenommen haben, nach zu urteilen, wurde die K2.6-Code-Vorschau auf der Grundlage von K 2.5, einem großen Modell mit Billionen Parametern, verbessert. Die Hauptoptimierung ist immer noch die KI-Programmierung. Der SWE-Bench-verifizierte Listenwert von K 2,5 beträgt 76,8 %, und LiveCodeBench liegt bei 85 %.
Die Verbesserungsrichtung der K2.6-Code-Vorschau liegt hauptsächlich in der Argumentationstiefe, der Qualität der Agentenplanung und der Zuverlässigkeit mehrstufiger Toolaufrufe.Einige interne Tester sagten, dass die Denkkette den Stil von Opus habe (das ist so tiefgründig).

Was das spezifische Niveau angeht, gibt es einen großen Kerl, Versun, der seine eigene Programmierfähigkeitsbewertung durchgeführt hat.Die Punktzahl von K2.6-Code-Vorschau beträgt 89, was 6 Punkte höher ist als die Punktzahl von K 2.5 von 83.Zwischen den bisherigen Spitzenspielern klafft allerdings noch eine Lücke.
Im Vergleich zu anderen Herstellern, die in ihren Werbematerialien immer angeben, dass sie Opus 4.6 einholen oder übertreffen werden, bewerten einige Internetnutzer in der K2.6-Code-Vorschau es derzeit als Sonnet 4.6-Niveau, was ebenfalls sehr stark ist.

Die Bewertungen der Internetnutzer, die es verwendet haben, sind immer noch gut. Die Fähigkeit, Anweisungen zu befolgen, ist nicht schlecht, und die Fähigkeit ist auch gut. Jetzt in Kombination mit dem Coding Plan-Paket von Kimi bietet es zumindest eine leistungsstarke und kostengünstige Option für die KI-Programmierung.