Forscher von Google haben ein Framework vorgestellt, mit dem sich ein Video anhand eines einzigen Bildes erstellen lässt. Damit baut Vlogger auf dem Erfolg der letzten generativen Diffusionsmodelle auf. Erst kürzlich hatIm Herbst 2023 kam mit "Hey Gen" eine KI
, mit der sich Video-Aufnahmen in verschiedene Sprachen übersetzen lassen – plötzlich ist jeder mehrsprachig, wenn er oder sie will. Vlogger soll das alles vereinen.Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen übermittelt werden. Mehr dazu in unserer
Das Forscherteam rund um den Doktoranden Enric Corona von der Universitat Politècnica de Catalunya hat eine Methode entwickelt, die insgesamt mehr können soll, als bisherige Arbeiten. Anhand einer zweistufigen Pipeline sollen sich realistische Sprechvideos erzeugen lassen. In der ersten Stufe werdenKörperbewegungen mithilfe von Audioeingaben und einem Referenzbild erzeugt, auf dem ein Mensch mit einer Pose abgebildet ist.
Darüber hinaus ermöglicht Vlogger es, in bereits erzeugten Videos Details wie Gesichtsausdrücke anzupassen. In einem Beispiel ist unter anderem zu sehen, wie eine Person in der gleichen Sequenz die Augen oder wahlweise den Mund schließt. Wie bei Hey Gen auch, ist es möglich, dass Videos in andere Sprachen übersetzt werden. An einem Beispielvideo fällt allerdings auf, dass die Lippenbewegungen nicht ganz zum Ton passen. Sie wirken teilweise nachsynchronisiert. Generell muten die mit Vlogger erzeugten Videos an manchen Stellen noch etwas künstlich an.
Deutschland Neuesten Nachrichten, Deutschland Schlagzeilen
Similar News:Sie können auch ähnliche Nachrichten wie diese lesen, die wir aus anderen Nachrichtenquellen gesammelt haben.
Herkunft: gala - 🏆 63. / 61 Weiterlesen »
Herkunft: heise_de - 🏆 20. / 68 Weiterlesen »
Herkunft: MEEDIA - 🏆 19. / 68 Weiterlesen »
Herkunft: heiseonline - 🏆 11. / 71 Weiterlesen »
Herkunft: heise_de - 🏆 20. / 68 Weiterlesen »
Herkunft: heise_de - 🏆 20. / 68 Weiterlesen »