Heute Morgen um 9 Uhr erfüllte DeepSeek weiterhin seine Verpflichtung zur Open Source Week und veröffentlichte die Open SourceDeepGEMM. Nachdem dieser Beitrag weitergeleitet wurde, hat er sofort Interesse geweckt21.000Die Menge an Lektüre reicht aus, um seine Beliebtheit im In- und Ausland zu zeigen. Es versteht sich, dass DeepGEMM ein Projekt ist, auf das sich der Schwerpunkt konzentriertFP8Die effiziente GEMM-Bibliothek (General Matrix Multiplication) unterstützt die Matrix-Computing-Anforderungen gewöhnlicher und gemischter Expertengruppen (MoE) und kann die Ressourcenzuweisung dynamisch optimieren, um die Rechenleistungseffizienz zu verbessern.
Diese Bibliothek basiert aufCUDAentwickeln, übernehmenLeichtes Modul zur Just-in-Time-Kompilierung (JIT).Kompilieren Sie den Kernel dynamisch zur Laufzeit ohne Vorkompilierung und Installation.
Es ist erwähnenswert, dass DeepGEMM darauf ausgelegt istDeepSeek-V3/R1-ModellBietet einfache und effiziente zugrunde liegende Unterstützung für Training und Inferenz, insbesondere fürOptimierung der Hopper-Architektur-GPU (z. B. H800)., unter Berücksichtigung hoher Leistung und niedriger Kosten.
Als drittes Ergebnis der Open Source Week setzt die Veröffentlichung von DeepGEMM die bisherige Strategie von DeepSeek mit Open-Source-Modellen und -Tools (wie FlashMLA) fort und senkt die Anwendungsschwelle der Hochleistungs-Computing-Technologie weiter.
Darüber hinaus handelt es sich bei diesem Open Source um das dritte Projekt der „Open Source Week“ (24.–28. Februar) von DeepSeek, das bereits veröffentlicht wurdeFlashMLA (effizienter Dekodierungskernel) und DeepEP (Expertenbibliothek für parallele Kommunikation).