NVIDIAHeuteVeröffentlichung von OpenReasoning-Nemotron, einer Sammlung von vier optimierten Inferenzmodellen mit 1,5 Milliarden, 7 Milliarden, 14 Milliarden und 32 Milliarden Parametern, alle abgeleitet von DeepSeek R1 0528 mit 67,1 Milliarden Parametern. Durch die Komprimierung eines umfangreichen „Lehrer“-Modells in vier Qwen-2.5-basierte „Schüler“-Modelle ermöglicht NVIDIA erweiterte Inferenzexperimente selbst auf Standard-Gaming-Geräten, ohne sich Gedanken über hohe GPU-Gebühren und Cloud-Nutzung machen zu müssen.

Der Schlüssel liegt nicht in den ausgefeilten Techniken, sondern in den Rohdaten. NVIDIA nutzte die NeMo Skills-Pipeline, um 5 Millionen Mathematik-, Naturwissenschafts- und Codelösungen zu generieren, und verfeinerte dann jede Lösung durch rein überwachtes Lernen. Derzeit erreichte das 32-Milliarden-Parameter-Modell 89,2 Punkte bei AIME24 und 73,8 Punkte beim HMMT-Wettbewerb im Februar, während selbst die 1,5-Milliarden-Parameter-Version solide Werte von 55,5 und 31,5 Punkten erreichte.

NVIDIA betrachtet diese Modelle als leistungsstarke Forschungs-Toolkits. Alle vier Prüfpunkte stehen auf Hugging Face zum Download zur Verfügung und bieten eine solide Grundlage für die Erforschung der durch Verstärkungslernen gesteuerten Inferenz oder die Anpassung von Modellen für bestimmte Aufgaben. Mit dem GenSelect-Modus (mehrere Iterationen pro Frage) ist es möglich, mehrere parallele Builds zu generieren und die beste Antwort auszuwählen, was zu einer außergewöhnlichen 32B-Modellleistung führt, die mit der o3-hohen Leistung von OpenAI bei mehreren Mathematik- und Codierungs-Benchmarks mithalten oder diese sogar übertrifft.

Da NVIDIA diese Modelle nur mit überwachter Feinabstimmung und nicht mit Reinforcement Learning trainiert hat, verfügt die Community über einen klaren, fortgeschrittenen Ausgangspunkt für zukünftige Reinforcement-Learning-Experimente. Für Gamer und Heimenthusiasten: Wenn Sie über eine leistungsstärkere Gaming-GPU verfügen, erhalten wir ein vollständig lokalisiertes Modell, das dem neuesten Stand der Technik sehr nahe kommen kann.