Proyek EMO: pembuatan video dari foto seseorang

emo

Kita mulai takjub melihat beberapa hal yang mampu dilakukan oleh Kecerdasan Buatan pada perangkat kita sehari-hari. Hasilnya sungguh mengejutkan, dan itu hanyalah puncak gunung es. Contoh yang bagus adalah Proyek EMO, yang terdiri dari menghasilkan video ekspresif dari foto dan potret.

Dengan kata lain: ini adalah teknologi yang menghidupkan foto statis, menghasilkan suara dan gerakan. Dalam postingan kali ini kami akan menjelaskan terdiri dari apa ide ini dengan beberapa contoh menarik.

Apa itu Proyek EMO?

EMO adalah singkatan dari Potret Emote Hidup, sebuah proyek yang dikembangkan oleh Linrui Tian, ​​​​Qi Wang, Bang Zhang dan Liefeng Bo, tiga insinyur dari Institut Komputasi Cerdas, yang merupakan bagian dari konglomerat teknologi dan bisnis Tiongkok, Alibaba.

Menurut penciptanya, ini adalah sistem pembangkitan ekspresif untuk potret video berbasis audio. Ini adalah definisi kasar tentang kemampuan Project EMO: mengambil gambar seseorang dan memberinya ekspresi, suara, dan gerakan. Sepertinya ajaib.

Ini bukan trik animasi sederhana yang dapat dilakukan aplikasi apa pun, melainkan trik animasi sederhana pekerjaan yang teliti dan presisi tinggi yang tercermin dalam berbagai ekspresi wajah, serta gerakan kepala dan bibir. Ditambah lagi dengan audio, yang juga menentukan bentuk gerakan-gerakan ini.

Sebaliknya, video yang dihasilkan bisa berdurasi tidak terbatas. Mereka sebenarnya bergantung pada durasi video yang menjadi dasarnya.

Bagaimana cara kerjanya?

Pengoperasian alat luar biasa ini dijelaskan secara rinci di halaman itu sendiri. situs proyek. Metode ini disusun dalam dua fase berbeda:

    1. Fase pengkodean awal di mana semua aspek gambar awal (atau referensi) dipelajari, untuk lebih memahami gerakan dan animasi apa yang dapat diterapkan padanya.
    2. Fase pemrosesan. Di dalamnya, encoder audio terlatih memproses penyematan audio, sementara lapisan atau topeng pembuatan gambar wajah diterapkan.

Beberapa detail dari proses ini harus ditonjolkan, dengan fokus pada menghilangkan kebisingan dan menjaga identitas karakter. Di sisi lain, modul temporal lainnya digunakan untuk mengatur durasi video dan kecepatan gerakan.

Hasil yang akan kami sajikan di bawah ini (apakah membuat setiap potret berbicara atau bahkan bernyanyi) hanya bisa dikatakan spektakuler. Intervensi AI berfungsi untuk mencapai tujuan tersebut realisme tingkat tinggi yang mampu menipu kita sepenuhnya. Yang masih meresahkan, kok.

Proyek EMO. Beberapa contoh:

Mari kita tunjukkan beberapa contoh apa yang bisa dicapai oleh teknologi ini. Seperti yang akan Anda lihat, kita dapat menggunakan gambar karakter asli atau gambar yang dihasilkan oleh AI. Kita bisa membuatnya bergerak dan memberi isyarat, berbicara dalam bahasa yang kita inginkan (mengatakan apa yang kita ingin katakan) dan bahkan membuatnya bernyanyi. Keajaiban sejati.

Ini adalah beberapa video foto yang menjadi perbincangan oleh Proyek EMO. Aktris Audrey Hepburn hadir untuk memberi tahu kita tentang hak orang untuk menangis dan mengungkapkan perasaannya:

Anda juga bisa membuat karakter yang tidak terbuat dari daging dan darah berbicara. Di sini kita memiliki Mona Lisa, karya Leonardo da Vinci, yang dihembuskan oleh EMO Project dengan membacakan monolog Rosalinda dalam drama tersebut "Sesukamu" oleh William Shakespeare:

Anehnya, kami juga dapat mengambil gambar aktor sungguhan dan membuat mereka mengatakan apa pun. Dalam hal ini, kita lihat Rafael Phoenix dalam perannya yang terkenal sebagai The Joker, tetapi mengucapkan teks yang berhubungan dengan film lain, Ksatria yang gelap.

Sekarang mari kita beralih ke dunia musik. Dalam contoh berikut, karakter yang dihasilkan AI diberi nama SORA membawakan lagunya «Jangan Mulai Sekarang» de Dua Lipa. Hasilnya sungguh menakjubkan:

Akhirnya kami menghadirkan yang sangat muda Leonardo DiCaprio menyanyikan tema film Godzilla disusun oleh rapper Eminem:

Pertimbangan etis dan hukum

Penggunaan (atau lebih tepatnya, penyalahgunaan) Kecerdasan Buatan saat ini menjadi pusat perdebatan sebuah teknologi disruptif yang batasan dan kemungkinannya belum dapat kita lihat sekilas yang jika disalahgunakan, dapat menimbulkan konsekuensi negatif dalam berbagai aspek.

Untuk menutupi punggung mereka, di halaman Proyek EMO mereka memperjelas bahwa semua tes dan kreasi mereka dimaksudkan semata-mata untuk penelitian akademis dan demonstrasi efek. Tidak perlu mencari motif tersembunyi. Namun, teknologi yang dapat mencapai tingkat presisi dan realisme seperti itu merupakan bahaya nyata bagi siapa pun yang ingin menggunakannya untuk melakukan penipuan, pencurian identitas, dan kejahatan lainnya.


tinggalkan Komentar Anda

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

*

*

  1. Penanggung jawab data: Miguel Ángel Gatón
  2. Tujuan data: Mengontrol SPAM, manajemen komentar.
  3. Legitimasi: Persetujuan Anda
  4. Komunikasi data: Data tidak akan dikomunikasikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Basis data dihosting oleh Occentus Networks (UE)
  6. Hak: Anda dapat membatasi, memulihkan, dan menghapus informasi Anda kapan saja.