Kürzlich gaben Forscher zwei neue Forschungsergebnisse bekannt, die mithilfe künstlicher Intelligenz dreidimensionale Avatare aus Text generieren und so Anwendungen wie die virtuelle Anpassung und die Bearbeitung von Avatarformen ermöglichen. Diese Ergebnisse stammen von Forschern des deutschen Max-Planck-Instituts und anderer Institutionen und werden auf arXiv veröffentlicht.

Die erste Studie schlägt eine Methode namens DELTA vor, mit der dreidimensionale Avatare mit unabhängigen Körper- und Kleidungs-/Haarschichten erstellt werden können. Die Forscher verwendeten verschiedene 3D-Darstellungsmethoden, um Körper und Kleidung/Haare getrennt zu modellieren und so Avatare aus monokularen RGB-Videos zu erstellen. Diese Zerlegung ermöglicht Anwendungen wie virtuelle Anpassung und Formbearbeitung, bei denen Kleidung und Haare problemlos zwischen verschiedenen Körpertypen umgewandelt werden können.


Die zweite Studie nutzt stabile Diffusion und DELTA-Hybrid-3D-Darstellung, um eine Text-zu-Avatar-Methode namens TECA vorzuschlagen. Mit dieser Methode können hochwertige Avatare ausschließlich aus Textbeschreibungen generiert werden und eine leistungsstarke Attributbearbeitung ermöglicht werden. Das System verwendet zunächst eine stabile Diffusion, um Gesichtsbilder als Referenz zu generieren, und fügt dann nacheinander Haare, Kleidung und andere Elemente hinzu. Die Forscher sagten, dass die Qualität der mit dieser Methode generierten synthetischen Avatare erheblich verbessert wird und die Attributübertragung leistungsstarke Bearbeitungsmöglichkeiten ermöglicht.

Diese beiden Studien liefern neue Ideen für die digitale menschliche Generation. Durch die Verwendung von Algorithmen der künstlichen Intelligenz zur Dekonstruktion der verschiedenen Komponenten des digitalen Menschen können nicht nur realistische dreidimensionale virtuelle Bilder erstellt werden, sondern auch Anwendungen wie virtuelle Online-Anproben unterstützt werden, die tiefgreifende Auswirkungen auf den Mode-E-Commerce, soziale Plattformen und das Metaversum haben werden.