Alibaba EMO Video Model: આર્ટિફિશિયલ ઈન્ટેલિજન્સ ક્ષેત્રે સ્પર્ધા સતત વધી રહી છે. ઓપન AIના સોરા મૉડલને ટક્કર આપવા માટે ચીનની કંપની અલીબાબાએ એક નવો વીડિયો AI મૉડલ EMO રજૂ કર્યો છે. અલીબાબાની ઇન્સ્ટિટ્યૂટ ફોર ઇન્ટેલિજન્ટ કૉમ્પ્યૂટિંગ રિસર્ચએ તાજેતરમાં આ મૉડલ રજૂ કર્યું છે, જે ઓડિયો-ડ્રાઇવ પોટ્રેટ વીડિયોઝ બનાવવામાં નિષ્ણાત છે.

Continues below advertisement


ચાઈનીઝ કંપની અલીબાબાનું ઈએમઓ વીડિયો મૉડલ ઓપનએઆઈના સોરા જેવું જ છે. EMO ને Emote Portrait Alive તરીકે વ્યાખ્યાયિત કરી શકાય છે, જે ફોટો અને ઑડિયો ફાઇલમાંથી ટૂંકો વિડિયો બનાવે છે. આ વીડિયોની મહત્તમ લંબાઈ 1 મિનિટ 30 સેકન્ડની છે, જેમાં પોટ્રેટ ગાઈ પણ શકે છે, બોલી શકે છે અને અહીંથી ત્યાં જઈ શકે છે.


ઉદાહરણ તરીકે, લિયોનાર્ડો દા વિન્સીની પ્રખ્યાત પેઇન્ટિંગ મોના લિસા પણ EMOની મદદથી વાત કરી શકે છે. આટલું જ નહીં, મોનાલિસા ગીતો પણ ગાઈ શકે છે અને આસપાસ જોઈ પણ શકે છે.


ઇએમઓ કઇ રીતે કરે છે કામ ?
EMOનો એક શ્રેષ્ઠ ભાગ એ છે કે તે ફોટામાં વ્યક્તિના ચહેરાના હાવભાવ બદલી શકે છે. એટલું જ નહીં તેના હોઠને વાસ્તવિક ઑડિયો સાથે સિંક કરી શકાય છે, જેનાથી એવું લાગે છે કે તે ખરેખર એક વાસ્તવિક વીડિયો છે. આ પ્રયોગ ફોટોગ્રાફ્સ, પેઇન્ટિંગ્સ, એનાઇમ-સ્ટાઇલ કાર્ટૂન, દરેક વસ્તુ સાથે કરી શકાય છે.


ઓપનએઆઈના સોરા મૉડલ વિશે વાત કરીએ તો, તે ટેક્સ્ટ અનુસાર સંપૂર્ણ વીડિયો તૈયાર કરે છે. તે ટેક્સ્ટ પ્રૉમ્પ્ટથી HD વિડિયો બનાવી શકે છે. જો કે, તેની ઍક્સેસ હજી દરેક માટે ઉપલબ્ધ નથી. કંપનીએ તેને રિસર્ચ ફિલ્ડમાં કામ કરતા કેટલાક પસંદગીના યૂઝર્સ માટે રિલીઝ કર્યું છે. આ અંગે ઓપનએઆઈના સીઈઓ સેમ ઓલ્ટમેને સોશિયલ મીડિયા પ્લેટફોર્મ X પર એક પોસ્ટ પણ શેર કરી હતી, જેમાં કંપનીએ વીડિયો પોસ્ટ દ્વારા સમજાવ્યું હતું કે તે કેવી રીતે કામ કરે છે.