DeepSeek organisiert intern ein neues Harness-Team mit der Leitung von Code-Agent-Produkten und einem internen Benchmarking von Claude Code von Anthropic.Chen Deli, ein leitender Forscher bei DeepSeek, veröffentlichte kürzlich Informationen in den sozialen Medien, um die Angelegenheit zu bestätigen. Er sagte: „DeepSeek organisiert ein neues Harness-Team, um Harness-orientierte Produkte und Forschung durchzuführen“, und sagte ganz deutlich: „Um es einfach auszudrücken: Es geht darum, Claude Code zu vergleichen und DeepSeek Code Harness durchzuführen.“


Dies ist keine gewöhnliche Rekrutierung. Aus den Rekrutierungsinformationen geht hervor, dass DeepSeek dieses Mal zwei Schlüsselpositionen eröffnet hat:Produktmanager für Kabelbäume und Forschungs- und Entwicklungsingenieur für KabelbäumeDer Arbeitsort ist derzeit auf Peking beschränkt. Das Büro von DeepSeek in Peking befindet sich im Raycom Information Center im Bezirk Haidian, ganz in der Nähe der Peking-Universität und der Tsinghua-Universität. Nach offiziellen Maßstäben liegt dieser Ort im „Centennial Beijing-Zhangjiakou AI Innovation Belt“, während er nach privaten Maßstäben auch in der kürzlich beliebten „Wang Huiwen Area“ liegt.



Bildquelle: Offizielle Rekrutierungsseite von DeepSeek

In der Stellenbeschreibung wird eine Kernformel an der auffälligsten Stelle platziert:

Modell + Geschirr = Agent.

Dieser Satz kann fast als DeepSeeks interne Definition der nächsten Stufe des Produktisierungspfads angesehen werden: Das Modell selbst ist nur die Basis des Agenten. Kontextverwaltung, Tool-Aufruf, Aufgabenplanung, Lesen und Schreiben von Dateien, Codeänderung, Terminalausführung, Feedback-Recycling und geschlossene Auswertungsschleife außerhalb des Modells sind die Schlüsselelemente, damit der Agent wirklich in den Workflow eintreten kann.

In den Rekrutierungsinformationen heißt es weiter: „Wir wandeln die hochmodernen Modellfunktionen von DeepSeek in führende Agentenprodukte um. Alle Arbeiten außer dem Modell selbst fallen in den Geltungsbereich von Harness.“ Darüber hinaus wird diese Position am gesamten Prozess der „DeepSeek-Desktop-Agent-Produkte“ beteiligt sein und „DeepSeeks Verständnis von Harness definieren“.

„Jiazi Guangnian“ analysierte, dass DeepSeek nicht einfach ein Code-Assistent-Plug-in ist, sondern eine Zwischenschicht, die das Modell vervollständigt und zum tatsächlichen Workflow führt.

Im vergangenen Jahr hat die Branche bewiesen, dass starke Codierungsfähigkeiten nicht bedeuten, dass Entwickler sie tatsächlich nutzen; Dass ein Modell Code schreiben kann, bedeutet nicht, dass es weiterhin eine technische Aufgabe ausführen kann.

Was die Arbeitsweise von Entwicklern wirklich verändert, ist nicht ein separates Claude-Modell, sondern Claude Code; kein separates GPT-Modell, sondern Codex; keine Code-Antwort in einer Chatbox, sondern ein Engineering-Agent, der das Terminal betreten, das Projekt verstehen, Dateien lesen und schreiben, Befehle ausführen, Fehler beheben, Git verwalten und Tools aufrufen kann.

Das Stärkste an DeepSeek war in der Vergangenheit das Modell. Jetzt wird damit begonnen, die Schicht „Hände“ oben auf dem Modell auszufüllen.

1. Warum DeepSeek den Schwerpunkt auf Harness legt


Im Kontext traditioneller KI-Produkte bedeutet „Code-Assistent“ normalerweise zwei Arten von Produkten: eines ist ein Vervollständigungs-Plug-in in der IDE und das andere ist ein Code-Q&A im Chat-Feld.

Aber das Wort, das in der Rekrutierung von DeepSeek immer wieder vorkommt, ist nicht Code Assistant, sondern Harness.

Harness bezieht sich im technischen Kontext ursprünglich auf „Test Harness“ oder „Operation Framework“. Im Kontext des Agenten handelt es sich eher um eine Reihe externer Systeme, die es dem Modell ermöglichen, tatsächlich zu agieren. Das Modell ist für das Verstehen, Denken und Generieren verantwortlich, und Harness ist dafür verantwortlich, diese Fähigkeiten mit der realen Umgebung zu verbinden.

In der Stellenbeschreibung wird erwähnt, dass diese Rolle die Planung der DeepSeek Harness-Produkt-Roadmap, die Verbindung von Forschern, Ingenieuren, Open-Source-Communities und Endbenutzern sowie eine intensive Kommunikation mit Forschern im Modellschulungsteam erfordert, um die gemeinsame Weiterentwicklung des Modells und des Harness zu erreichen.

Dieser Satz ist entscheidend.

Es veranschaulicht, was DeepSeek tun möchteDabei wird nicht nur das vorhandene Modell mit einer Hülle umhüllt, sondern das Agent-Produkt selbst zu einem Teil der Modellentwicklung gemacht.

In der Vergangenheit war die übliche Produktlogik großer Modellunternehmen: Das Forschungsteam trainierte zunächst ein Modell, und dann erstellte das Produktteam Anwendungen basierend auf den Modellfunktionen. Aber in der Agenten-Ära wird diese Ordnung gebrochen. Produkte sind nicht mehr nur ein Ventil für Modellfähigkeiten, sondern auch ein Übungsgelände für Modellfähigkeiten.

Wenn ein Code-Agent in einem echten Projekt ausfällt, liegt das möglicherweise nicht an der Produktinteraktion, sondern an der falschen Komprimierungsmethode des Modells für lange Kontexte. Es handelt sich möglicherweise nicht um ein Problem mit der Werkzeugaufrufverbindung, sondern um eine instabile Strategie für die Aufgabenzerlegung des Modells. Möglicherweise liegt es nicht an mangelnden Codierungsfunktionen, sondern an einem mangelnden kontinuierlichen Verständnis für technische Einschränkungen, Test-Feedback und Benutzerabsichten.

Daher besteht der Wert des Harness-Teams nicht nur darin, „Produkte herzustellen“, sondern echte Entwicklungsaufgaben in eine Feedbackquelle für die kontinuierliche Weiterentwicklung des Modells umzuwandeln.

2. Warum muss DeepSeek Code Harness hinzufügen?


DeepSeek hat schon früh auf Codierungsfunktionen gesetzt. Von DeepSeek-Coder bis DeepSeek-Coder-V2 investiert DeepSeek weiterhin in Codemodelle und unterstützt kontinuierliche Verbesserungen in Bezug auf Sprache, Kontextlänge und komplexe Aufgabenfunktionen. Das Problem besteht nicht darin, ob es über Codierungsfunktionen verfügt, sondern darin, dass dieser Teil der Funktionen in der Vergangenheit eher auf der Modellebene blieb und noch nicht zu einem hochfrequentierten Produkt im täglichen Arbeitsablauf der Entwickler geworden ist.


Zeitleiste der 27 Veröffentlichungen von DeepSeek in den letzten zwei Jahren. Die horizontale Achse zeigt die Anzahl der Deduplizierungsautoren für jedes Papier oder jeden technischen Bericht an. Die Farbe gibt die technische Richtung an. Diagramm „Jiuzi-Lichtjahre“.

Die Beliebtheit von Claude Code beweist eines: Der Wettbewerb in der KI-Codierung verlagert sich von der Konkurrenz bei den Modellfunktionen hin zur Konkurrenz bei Entwickler-Workflow-Portalen.

Dies ist auch eine Lektion, die DeepSeek jetzt nachholen muss.

Noch subtiler ist, dass die Entwicklergemeinschaft bereits eine Version von „DeepSeek Version Claude Code“ dafür erstellt hatte, bevor DeepSeek offiziell Maßnahmen ergriff.

Ein Open-Source-Projekt namens DeepSeek-TUI ist in der Entwicklergemeinschaft populär geworden.Es handelt sich um einen Codierungsagenten, der im Terminal ausgeführt wird. Es kann Dateien lesen und schreiben, Shell-Befehle ausführen, Webseiten durchsuchen, Git verwalten und Subagenten über die TUI-Schnittstelle koordinieren.


Offizielle Website von DeepSeek-TUI, Bildquelle: DeepSeek-TUI

Die Popularität von DeepSeek-TUI verdeutlicht zwei Probleme.

Erstens verfügt das DeepSeek-Modell bereits über die Grundlage für die Entwicklung von Code-Agenten in den Köpfen der Entwickler. Andernfalls wird die Community natürlich keine Produkte im Claude-Code-Stil entwickeln.

Zweitens fehlt DeepSeek nicht die Aufmerksamkeit des Models, sondern das offizielle Geschirr.

In den Augen der Entwickler ist die Attraktivität von DeepSeek-TUI sehr direkt: niedrige Kosten, inländische Verfügbarkeit, langer Kontext und relativ niedrige Bereitstellungsschwelle. Es ist nicht so, dass viele inländische Entwickler Claude Code nicht verwenden möchten, aber sie sind durch den Preis, die Zugriffsstabilität, das Kontosystem und die Unternehmenskonformität eingeschränkt.

Aber auch Gemeinschaftsprojekte haben natürliche Grenzen.

Unabhängig davon, wie aktiv ein Open-Source-Projekt eines Drittanbieters ist, ist es schwierig, den Entwicklungsrhythmus der internen Fähigkeiten des Modells wirklich zu erfassen. Es kann sich an die API anpassen, aber nicht umgekehrt bestimmen, wie das Modell trainiert wird. Es kann Eingabeaufforderungen, Toolketten und Interaktionsoptimierungen durchführen, es ist jedoch schwierig, systematisch massives Feedback zu realen Aufgaben in die Modellverbesserung einfließen zu lassen.

Die Bedeutung des offiziellen Geschirrs liegt genau hier.

DeepSeek stellt seinen eigenen Code Harness her, der mehrere Vorteile bietet, die Community-Projekte nicht haben: Modell-Teamzusammenarbeit, Schnittstellendesignrechte, geschlossener Regelkreis für Trainingsdaten, interne reale Aufgabenszenarien und langfristige Betriebsfähigkeiten für das Entwickler-Ökosystem.

Die Open-Source-Community hat den Weg bereits geebnet:Entwickler brauchen unbedingt eine DeepSeek-Version von Claude Code. Nun möchte DeepSeek diesen Weg zurückgehen und es zu seinem eigenen Hauptprodukt machen.

Und DeepSeek hat offiziell mit der Rekrutierung von Mitarbeitern begonnen, was bedeutet, dass es endlich bereit ist, persönlich vor Ort zu sein.

Chen Deli erwähnte auf dem Wuzhen-Gipfel der Weltinternetkonferenz 2025 im November letzten Jahres:„Eine der Kernstärken unseres Unternehmens ist Langfristigkeit, und wir halten an der Hauptlinie innovativer, intelligenter Durchbrüche fest.In diesem Prozess haben wir auch auf viele Dinge auf den Nebenstrecken verzichtet und auf die kurzen, flachen und schnellen Dinge auf den Nebenstrecken verzichtet. "

Nach dem Modellkrieg beginnt der eigentliche Agentenkrieg. Was DeepSeek dieses Mal ergänzen möchte, ist Harness, die kritischste Schicht zwischen Modellen und Aktionen.

DeepSeek正在给自己的模型,装上一双手。