EMO projekt: generiranje videa iz fotografije osobe

emo

Počinjemo sa čuđenjem uviđati neke stvari koje je umjetna inteligencija sposobna učiniti primijenjene na naše svakodnevne uređaje. Rezultati su doista iznenađujući, a to je samo vrh ledenog brijega. Dobar primjer je Projekt EMO, koji se sastoji od generiranja izražajnih videozapisa iz fotografija i portreta.

Drugim riječima: to je tehnologija koja daje život statičnim fotografijama, dajući im zvuk i kretanje. U ovom postu objasnit ćemo od čega se ova ideja sastoji uz neke zanimljive primjere.

Što je EMO projekt?

EMO je akronim za Emotivni portret živ, projekt koji su razvili Linrui Tian, ​​​​Qi Wang, Bang Zhang i Liefeng Bo, tri inženjera iz Institut za inteligentno računalstvo, koja je dio kineskog tehnološko-poslovnog konglomerata Alibaba.

Prema riječima njegovih kreatora, to je sustav za ekspresivno generiranje video portreta vođenih zvukom. To je prilično gruba definicija onoga za što je Project EMO sposoban: uzeti sliku osobe i dati joj izraz, glas i pokret. Čini se kao magija.

Ovo nisu jednostavni animacijski trikovi koje bi svaka aplikacija mogla izvesti, već pedantan i precizan rad što se ogleda u širokom rasponu izraza lica, kao i pokreta glave i usana. Ovome je dodan zvuk, koji također određuje oblik tih pokreta.

S druge strane, generirani videozapisi mogu imati neograničeno trajanje. Oni zapravo ovise o duljini videa na kojem se temelje.

Kako se to radi?

Rad ovog nevjerojatnog alata detaljno je objašnjen na samoj stranici. web stranica projekta. Metoda je strukturirana u dvije različite faze:

    1. Početna faza kodiranja u kojem se proučavaju svi aspekti početne (ili referentne) slike, kako bi se bolje razumjelo koji se pokret i animacija mogu primijeniti na nju.
    2. Faza obrade. U njemu unaprijed obučeni audio koder obrađuje audio ugrađivanje, dok se sloj ili maska ​​za generiranje slike lica primjenjuje.

Treba istaknuti neke detalje ovog procesa, usmjerene na uklanjanje buke i očuvanje identiteta lika. S druge strane, drugi vremenski moduli koriste se za podešavanje trajanja videa i brzine kretanja.

Rezultati koje ćemo predstaviti u nastavku (bilo da svaki portret govori ili čak pjeva) mogu se definirati samo kao spektakularni. AI intervencija služi za postizanje visoke razine realizma sposobne da nas potpuno prevare. Što je još uvijek uznemirujuće, stvarno.

Projekt EMO. Neki primjeri:

Pokažimo neke primjere što ova tehnologija može postići. Kao što ćete vidjeti, možemo koristiti sliku stvarnog lika ili onu koju je generirao AI. Možemo ga natjerati da se kreće i gestikulira, da govori jezikom koji želimo (govoreći ono što želimo da kaže), pa čak i da pjeva. Prava čuda.

Ovo su neki video snimci fotografija o kojima priča EMO projekt. Glumica Audrey Hepburn oživljava da nam govori o pravu ljudi da plaču i izraze svoje osjećaje:

Također možete natjerati likove koji nisu od krvi i mesa da progovore. Ovdje imamo Mona Lisa, Leonardo da Vinci, kojoj je EMO Project udahnuo život da u predstavi recitira Rosalindin monolog "Kako hoćeš" od Williama Shakespearea:

Zanimljivo, možemo također slikati stvarne glumce i natjerati ih da kažu bilo što. U ovom slučaju vidimo Rafael Phoenix u svojoj poznatoj ulozi Joker, ali izgovaranje teksta koji odgovara drugom filmu, Vitez tame.

Sada prijeđimo na svijet glazbe. U sljedećem primjeru, lik koji je generirao AI nazvan SORA izvesti pjesmu "Ne počinji sada" de Dua Lipa. Rezultat je zapanjujuće ljudski:

Na kraju predstavljamo vrlo mladog Leonardo DiCaprio pjevajući filmsku temu Godzilla sastavio reper Eminem:

Etička i pravna razmatranja

Upotreba (ili bolje rečeno, zlouporaba) umjetne inteligencije trenutno je u središtu rasprave. Riječ je o disruptivna tehnologija čije granice i mogućnosti još nismo u stanju sagledati i koji bi, zloupotrijebljeni, mogli imati negativne posljedice u mnogo različitih aspekata.

Da bi im pokrili leđa, na stranici EMO Project vrlo jasno ističu da su svi njihovi testovi i kreacije namijenjeni isključivo akademskom istraživanju i demonstraciji učinaka. Ne treba tražiti prikrivene motive. Međutim, tehnologija koja može postići takav stupanj preciznosti i realizma predstavlja stvarnu opasnost za svakoga tko je želi koristiti za počinjenje prijevare, krađe identiteta i drugih zločina.


Ostavite svoj komentar

Vaša email adresa neće biti objavljen. Obavezna polja su označena s *

*

*

  1. Za podatke odgovoran: Miguel Ángel Gatón
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obvezi.
  5. Pohrana podataka: Baza podataka koju hostira Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.