Naver gab offiziell bekannt, dass es den in seinem KI-Modell verwendeten chinesischen visuellen Encoder Alibaba Qwen 2.5 vollständig entfernen und ihn vollständig durch einen selbst entwickelten visuellen Encoder ersetzen wird.Naver Cloud hat die Entwicklung seines selbst entwickelten visuellen Encoders Anfang letzten Monats abgeschlossen und mit der Internalisierungsarbeit begonnen, mit Plänen, ihn in Zukunft vollständig auf alle multimodalen Modelle anzuwenden.

Naver sagte, dass der neue Encoder auf der Grundlage der ursprünglichen Technologie „VUClip“ von Naver erheblich verbessert wurde und seine Leistung ein Niveau erreicht hat, das mit dem des weltweit führenden Modells Qwen vergleichbar ist.

Der visuelle Encoder ist ein Modul der multimodalen KI, das Bild- und Videoinformationen in verständliche Datenformate umwandelt, und wird als „Sehnerv“ des Modells bezeichnet.

Als Naver Anfang des Jahres an dem von der koreanischen Regierung geleiteten unabhängigen KI-Basismodellprojekt teilnahm, sorgte es für Kontroversen, weil es teilweise den visuellen Encoder von Alibaba Qwen 2.5 im HyperCLOVA X SEED 32B Sync-Modell verwendete.

Am 15. Januar gab das südkoreanische Ministerium für Wissenschaft, Technologie, Information und Kommunikation die Ergebnisse der ersten Überprüfungsrunde bekannt. Naver Cloud wurde aufgrund unzureichender Modelloriginalität und technischer Unabhängigkeit direkt eliminiert. Damit wurde auch NC AI eliminiert.

Damals argumentierte Naver, dass „der visuelle Encoder jederzeit ausgetauscht werden kann und keine unersetzliche Kernkomponente ist.“

Vier Monate später wurde der neue Encoder von Naver auf den Markt gebracht. Sein größtes Highlight ist, dass es bereits in der Trainingsphase mit Koreanisch als Mittelpunkt konzipiert wurde und Bilder und Koreanisch direkt miteinander verbindet, ohne eine Zwischenübersetzungsebene zu durchlaufen.

Der Verantwortliche von Naver Cloud betonte, dass der neue Encoder bei der Verarbeitung visueller Daten, die koreanische Geographie, Kultur oder Eigennamen enthalten, eine Verzerrung der Informationen während des Übersetzungsprozesses vermeiden kann.

Der Encoder-Austauschplan für das als Open Source veröffentlichte HyperCLOVA X SEED 32B Sync-Modell steht jedoch noch nicht fest.