Am 27. Juni veröffentlichte Tencent öffentlich ein neues Mitglied der Hunyuan-Modellfamilie – das Modell Hunyuan-A13B – und kündigte an, dass es vollständig Open Source sein wird. Offiziellen Quellen zufolge kann das Modell Hunyuan-A13B unter extremen Bedingungen mit nur einer GPU-Karte der mittleren bis unteren Preisklasse eingesetzt werden.

Im Experiment zum mathematischen Denken führte das Modell Dezimalvergleiche genau durch und demonstrierte die Fähigkeit zur schrittweisen Analyse. Es dauerte 3 Sekunden, tief nachzudenken.
Auch das Modell Hunyuan-A13B brachte technologische Innovationen mit sich. Im Vortraining verwendete das Modell einen 20 Billionen hochwertigen Netzwerkwortkorpus und verbesserte das theoretische System des Skalierungsgesetzes der MoE-Architektur, wodurch quantifizierbare technische Leitlinien für den Entwurf der MoE-Architektur bereitgestellt wurden.
Hunyuan hat außerdem zwei neue Datensätze als Open-Source-Lösung bereitgestellt, um die Lücken in relevanten Bewertungsstandards in der Branche zu schließen. Darunter wird ArtifactsBench hauptsächlich zur Code-Evaluierung verwendet und erstellt einen neuen Benchmark mit 1825 Aufgaben; C3-Bench entwirft 1024 Testdaten für die Bewertung von Agent-Szenenmodellen, um Mängel in den Modellfunktionen aufzudecken.

Derzeit ist die Modell-API online auf der offiziellen Website von Tencent Cloud verfügbar.