EMO Project: generování videí z fotografie osoby

emo

S úžasem začínáme vidět některé věci, které umělá inteligence dokáže, aplikované na naše každodenní zařízení. Výsledky jsou skutečně překvapivé, a to je pouze špička ledovce. Dobrým příkladem je Projekt EMO, která spočívá ve generování výrazných videí z fotek a portrétů.

Jinými slovy: je to technologie, která dává život statickým fotografiím, dává jim zvuk a pohyb. V tomto příspěvku vysvětlíme, v čem tato myšlenka spočívá, na několika zajímavých příkladech.

Co je projekt EMO?

EMO je zkratka pro Emocionální portrét naživu, projekt vyvinutý Linrui Tian, ​​​​Qi Wang, Bang Zhang a Liefeng Bo, tři inženýři z Institute of Intelligent Computing, která je součástí čínského technologického a obchodního konglomerátu Alibaba.

Podle slov jeho tvůrců se jedná o expresivní generační systém pro audio řízené videoportréty. Je to docela hrubá definice toho, čeho je Project EMO schopen: vzít obraz člověka a dát mu výraz, hlas a pohyb. Vypadá to jako kouzlo.

Nejedná se o jednoduché animační triky, které by mohla dělat jakákoli aplikace, ale spíše precizní a vysoce precizní práce což se odráží v široké škále výrazů obličeje, stejně jako pohybů hlavy a rtů. K tomu se přidává zvuk, který také určuje podobu těchto pohybů.

Na druhou stranu vygenerovaná videa mohou mít neomezenou dobu trvání. Ve skutečnosti závisí na délce videa, ze kterého vycházejí.

Jak to funguje?

Obsluha tohoto neuvěřitelného nástroje je podrobně vysvětlena na samotné stránce. webové stránky projektu. Metoda je strukturována do dvou různých fází:

    1. Počáteční fáze kódování ve kterém jsou studovány všechny aspekty výchozího (nebo referenčního) obrázku, aby se lépe porozumělo tomu, jaký pohyb a animaci na něj lze aplikovat.
    2. Fáze zpracování. V něm předem vyškolený zvukový kodér zpracovává vkládání zvuku, zatímco je aplikována vrstva nebo maska ​​generování obrazu obličeje.

Některé detaily tohoto procesu by měly být zvýrazněny, zaměřeny na eliminaci šumu a zachování identity postavy. Na druhou stranu se další časové moduly používají k úpravě délky videa a rychlosti pohybu.

Výsledky, které se chystáme prezentovat níže (ať už nechat každý portrét mluvit nebo dokonce zpívat), lze definovat pouze jako velkolepé. Intervence AI slouží k dosažení vysoké úrovně realismu schopné nás zcela oklamat. Což je pořád znepokojující, opravdu.

Projekt EMO. Nějaké příklady:

Ukažme si některé příklady čeho může tato technologie dosáhnout. Jak uvidíte, můžeme použít obrázek skutečné postavy nebo obrázek generovaný AI. Můžeme ho přimět, aby se pohyboval a gestikuloval, aby mluvil jazykem, který chceme (říkal, co chceme, aby říkal), a dokonce ho přimějeme zpívat. Opravdové zázraky.

Toto je několik videí s fotografiemi, o kterých mluví projekt EMO. Herečka Audrey Hepburn ožívá, aby nám řekl o právu lidí plakat a vyjádřit své pocity:

Můžete také nechat mluvit postavy, které nejsou z masa a kostí. Tady máme Mona Lisa od Leonarda da Vinciho, kterému EMO Project vdechl život, aby ve hře recitoval monolog Rosalindy "Jak chceš" od Williama Shakespeara:

Zajímavé je, že můžeme také pořizovat snímky skutečných herců a přimět je, aby řekli cokoli. V tomto případě vidíme Rafael Phoenix ve své slavné roli Joker, ale vyslovit text, který odpovídá jinému filmu, Temný rytíř.

Nyní se přesuneme do světa hudby. V následujícím příkladu se jmenuje postava vygenerovaná AI SORA provést píseň „Nezačínej teď“ de Dua Lipa. Výsledek je překvapivě lidský:

Nakonec představujeme velmi mladé Leonardo DiCaprio zpívat téma filmu Godzilla složil rapper Eminem:

Etická a právní hlediska

Využití (nebo spíše zneužití) umělé inteligence je v současné době středem debat. převratná technologie, jejíž limity a možnosti zatím nejsme schopni zahlédnout a jehož zneužití by mohlo mít negativní důsledky v mnoha různých aspektech.

Aby si kryli záda, na stránce projektu EMO dávají jasně najevo, že všechny jejich testy a výtvory jsou určeny výhradně pro akademický výzkum a demonstraci efektů. Není třeba hledat postranní úmysly. Technologie, která může dosáhnout takového stupně přesnosti a realističnosti, však představuje skutečné nebezpečí pro každého, kdo ji chce použít k páchání podvodů, krádeží identity a jiných trestných činů.


Zanechte svůj komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *

*

*

  1. Odpovědný za údaje: Miguel Ángel Gatón
  2. Účel údajů: Ovládací SPAM, správa komentářů.
  3. Legitimace: Váš souhlas
  4. Sdělování údajů: Údaje nebudou sděleny třetím osobám, s výjimkou zákonných povinností.
  5. Úložiště dat: Databáze hostovaná společností Occentus Networks (EU)
  6. Práva: Vaše údaje můžete kdykoli omezit, obnovit a odstranit.