Alibaba EMO Video Model: આર્ટિફિશિયલ ઈન્ટેલિજન્સ ક્ષેત્રે સ્પર્ધા સતત વધી રહી છે. ઓપન AIના સોરા મૉડલને ટક્કર આપવા માટે ચીનની કંપની અલીબાબાએ એક નવો વીડિયો AI મૉડલ EMO રજૂ કર્યો છે. અલીબાબાની ઇન્સ્ટિટ્યૂટ ફોર ઇન્ટેલિજન્ટ કૉમ્પ્યૂટિંગ રિસર્ચએ તાજેતરમાં આ મૉડલ રજૂ કર્યું છે, જે ઓડિયો-ડ્રાઇવ પોટ્રેટ વીડિયોઝ બનાવવામાં નિષ્ણાત છે.
ચાઈનીઝ કંપની અલીબાબાનું ઈએમઓ વીડિયો મૉડલ ઓપનએઆઈના સોરા જેવું જ છે. EMO ને Emote Portrait Alive તરીકે વ્યાખ્યાયિત કરી શકાય છે, જે ફોટો અને ઑડિયો ફાઇલમાંથી ટૂંકો વિડિયો બનાવે છે. આ વીડિયોની મહત્તમ લંબાઈ 1 મિનિટ 30 સેકન્ડની છે, જેમાં પોટ્રેટ ગાઈ પણ શકે છે, બોલી શકે છે અને અહીંથી ત્યાં જઈ શકે છે.
ઉદાહરણ તરીકે, લિયોનાર્ડો દા વિન્સીની પ્રખ્યાત પેઇન્ટિંગ મોના લિસા પણ EMOની મદદથી વાત કરી શકે છે. આટલું જ નહીં, મોનાલિસા ગીતો પણ ગાઈ શકે છે અને આસપાસ જોઈ પણ શકે છે.
ઇએમઓ કઇ રીતે કરે છે કામ ?
EMOનો એક શ્રેષ્ઠ ભાગ એ છે કે તે ફોટામાં વ્યક્તિના ચહેરાના હાવભાવ બદલી શકે છે. એટલું જ નહીં તેના હોઠને વાસ્તવિક ઑડિયો સાથે સિંક કરી શકાય છે, જેનાથી એવું લાગે છે કે તે ખરેખર એક વાસ્તવિક વીડિયો છે. આ પ્રયોગ ફોટોગ્રાફ્સ, પેઇન્ટિંગ્સ, એનાઇમ-સ્ટાઇલ કાર્ટૂન, દરેક વસ્તુ સાથે કરી શકાય છે.
ઓપનએઆઈના સોરા મૉડલ વિશે વાત કરીએ તો, તે ટેક્સ્ટ અનુસાર સંપૂર્ણ વીડિયો તૈયાર કરે છે. તે ટેક્સ્ટ પ્રૉમ્પ્ટથી HD વિડિયો બનાવી શકે છે. જો કે, તેની ઍક્સેસ હજી દરેક માટે ઉપલબ્ધ નથી. કંપનીએ તેને રિસર્ચ ફિલ્ડમાં કામ કરતા કેટલાક પસંદગીના યૂઝર્સ માટે રિલીઝ કર્યું છે. આ અંગે ઓપનએઆઈના સીઈઓ સેમ ઓલ્ટમેને સોશિયલ મીડિયા પ્લેટફોર્મ X પર એક પોસ્ટ પણ શેર કરી હતી, જેમાં કંપનીએ વીડિયો પોસ્ટ દ્વારા સમજાવ્યું હતું કે તે કેવી રીતે કામ કરે છે.