• 3 December 2024

ล่าสุด อาลีบาบา บริษัทยักษ์ใหญ่ด้านเทคโนโลยีจากประเทศจีน เปิดเผยว่า กำลังเตรียมสร้าง EMO เอไอสร้างวิดีโอที่ใช้เพียงภาคบุคคลเพียง 1 ภาพ ก็สามารถสร้างตัวละครที่ร้องเพลง พูด ขยับ ใบหน้า แสดงสีหน้า ท่าทางต่าง ๆ ได้

EMO ถูกคาดคะเนว่าย่อมาจาก Emotive Portrait Alive แต่ในกรณีนี้ ทำไมจึงไม่เรียกว่า EPO? การเล่นคำว่า “EMO (อีโม)” เป็นการสร้างจุดเด่นให้กับเอไอของตน กล่าวคือ ตัวละครในวิดีโอที่สร้างโดย EMO จะสามารถพูดคุย และร้องเพลงได้ แต่คู่แข่งอย่าง Sora ไม่สามารถพูดคุยได้

อาลีบาบา เปิดตัว EMO เอไอสร้างวิดีโอร้องเพลงจากภาพบุคคล หวังสู้ศึก GenAI
อาลีบาบา บิ๊กเทคจากจีน เปิดเผยโมเดล “EMO” เอไอแปลงภาพบุคคลเป็นวิดีโอที่สามารถร้องเพลง ขยับปาก แสดงสีหน้าท่าทางได้

EMO นำเสนอตัวอย่างวิดีโอที่เจนขึ้นคือ คลิปผู้หญิงญี่ปุ่นเดินบนถนนที่สร้างจาก Sora แต่ EMO ทำให้ผู้หญิงคนนั้นร้องเพลงได้ ซึ่ง Don’t Start Now ของ Dua Lipa เป็นเพลงที่เธอร้อง และอย่างไรก็ตาม โมเดล EMO ยังอยู่ในขั้นตอนของการพัฒนา และต้องเข้ากระบวนการด้านจริยธรรมเช่นเดียวกับ Sora โดยคลิปตัวอย่างที่ EMO เจนขึ้นมานั้นส่วนใหญ่ตัวละครไม่ได้แสดงอารมณ์รุนแรง เช่น โกรธจัด หรือร้องไห้หนัก

อาลีบาบามุ่งมั่นที่จะเป็นผู้นำด้านเทคโนโลยีเอไอของโลก โดยตั้งเป้าหมายที่จะใช้เอไอในการขับเคลื่อนธุรกิจให้เติบโต สร้างนวัตกรรมใหม่ ๆ และยกระดับคุณภาพชีวิตของผู้คน

ที่มาข้อมูลและรูปภาพจาก กรุงเทพธุรกิจ

เขียนโดย แอดมินแพท

Leave a Reply

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *