Microsoft: Das Phi-2-Modell bietet eine bessere Leistung als die Konkurrenz und kann auf devices

Microsoft sagte am Dienstag, dass sein künstliches Intelligenzmodell Phi-2 eine bessere Leistung als Konkurrenzprodukte anderer Unternehmen wie Meta (MTEA) erbringt und auf Geräten ausgeführt werden kann. Microsoft sagte in einem Blog: „Das Phi-2-Modell hat nur 2,7 Milliarden Parameter, aber in verschiedenen umfassenden Benchmark-Tests übertrifft seine Leistung die des großen Sprachmodells (LLM) Mistral7B des europäischen KI-Startups Mistral, das 7 Milliarden Parameter hat, und des von Meta veröffentlichten KI-Modells Llama2 mit 13 Milliarden Parametern.“

„Bemerkenswert ist, dass das Phi-2-Modell das 70 Milliarden Parameter umfassende Llama2 bei mehrstufigen Inferenzaufgaben (d. h. Codierung und Mathematik) übertraf (die Llama2-Modellfamilie umfasst drei Parametervarianten mit 7 Milliarden, 13 Milliarden und 70 Milliarden Parametern).“

Microsoft fügte hinzu: „Darüber hinaus ist die Leistung des Phi-2-Modells trotz der kleineren Modellgröße mit der des kürzlich veröffentlichten Google Gemini Nano2 vergleichbar oder sogar besser.“ Microsoft gab bekannt, dass das Phi-2-Modell in Azure Studio eingeführt wird.

Es wird berichtet, dass Microsoft im Juni dieses Jahres das Phi-1-Modell mit nur 1,3 Milliarden Parametern veröffentlicht hat, das für Szenarien wie QA Q&A, Chat-Format und Code geeignet ist. Das Modell wird vollständig auf hochwertigen Daten trainiert und übertrifft ähnliche Modelle in Benchmark-Tests um das bis zu Zehnfache.

Microsoft hat im September dieses Jahres die Version Phi-1.5 aktualisiert und veröffentlicht, die ebenfalls über 1,3 Milliarden Parameter verfügt und Gedichte, E-Mails und Geschichten schreiben sowie Texte zusammenfassen kann. Bei den Maßstäben des gesunden Menschenverstandes, des Sprachverständnisses und des logischen Denkens konnte das Modell in einigen Bereichen mit Modellen mit bis zu 10 Milliarden Parametern mithalten.

Obwohl sich der Umfang von Phi-2, das Microsoft im November in einem Update veröffentlicht hat, im Vergleich zur Vorgängerversion verdoppelt hat, ist es immer noch viel kleiner als andere Mainstream-Sprachmodelle. Laut Microsoft zeigt Phi-2 erhebliche Verbesserungen beim logischen Denken und bei der Sicherheit, und mit der richtigen Feinabstimmung und Anpassung sind kleine Sprachmodelle leistungsstarke Werkzeuge für Cloud- und Edge-Anwendungen.