Gemini Omni: ગૂગલ I/O 2026માં કંપનીએ તેના યુનિફાઇડ મલ્ટિમોડલ AI વીડિયો મોડલ Gemini Omniની જાહેરાત કરી હતી. કંપનીએ જણાવ્યું હતું કે આ મોડલ જેમિનીના રિયલ વર્લ્ડ નોલેજ અને રિઝનિંગને યુઝ કરતા કોઈ પણ ઈનપુટથી કાંઈ પણ જનરેટ કરી શકે છે. તેના ફર્સ્ટ જનરેશન મોડલ Omni Flashને રોલ આઉટ કરવામાં આવ્યું છે અને આજથી જેમિની એપ, ફ્લો બાય ગૂગલ અને યુટ્યુબ શોર્ટ્સ સહિત અન્યમાં એક્સેસ કરી શકાય છે. આ માટે APIને આગામી થોડા દિવસોમાં લોન્ચ કરવામાં આવશે. ચાલો જાણીએ કે આ મોડલ શું શું કરી શકે છે.

નવું મોડલ શું કરી શકે છે?

Continues below advertisement
Continues below advertisement

આ ગૂગલ મોડલ સિંક્રોનાઇઝ્ડ વીડિયો, વૉઇસ નેરેશન, ઓન સ્ક્રીન ટેક્સ્ટ અને બેકગ્રાઉન્ડ મ્યૂઝિક જનરેટ કરી શકે છે. આ માટે યુઝર્સને ફક્ત એક પ્રોમ્પ્ટ આપવાની જરૂર છે. એક લેખિત પ્રોમ્પ્ટના આધારે આ મોડલ બધું બનાવી શકે છે, જે તેને અન્ય મોડલોથી અલગ પાડે છે. ગૂગલ અગાઉ અલગ મોડલનો ઉપયોગ કર્યો છે, જેમ કે વીડિયો વીયો ને ઈમેજ માટે નેનો બનાના જેવા અલગ અલગ મોડલને યુઝ કરતું હતું.  નવું મોડેલ આ બધી ક્ષમતાઓને એક પ્લેટફોર્મમાં એકીકૃત કરે છે. અન્ય કંપનીઓની વાત કરીએ તો હવે યુઝર્સને વોઈસ ઓવર માટે ઈલેવન લેબ્સ અને મ્યૂઝિક માટે સુનોની વગેરેની જરૂર પડશે નહીં. તેમને Gemini Omniમાં એક જ જગ્યા પર તમામ ફીચર્સ મળી જશે. 

આ પણ વાંચોઃ ChatGPT ને ટક્કર આપવા આવી રહ્યું છે Apple નું નવું Siri, AI ની દુનિયામાં મચાવશે ધમાલ

Gemini Omniમાં શું ખાસ છે?

એઆઈ-જનરેટેડ વીડિયોમાં ફિઝિક્સને સચોટ રીતે રજૂ કરવું મુશ્કેલ કામ રહ્યું છે. આનો અર્થ એ છે કે મોડલો ઘણીવાર ઘણી વસ્તુઓ સમજવામાં નિષ્ફળ જાય છે, જેના કારણે જનરેટ થયેલા વીડિયો નકલી લાગે છે પરંતુ ડેમો આઉટપુટથી લાગી રહ્યું છે કે Gemini Omni આ મામલાથી અલગ છે. તે સિવાય એક  વાર કેરેક્ટર ડિફાઈન કર્યા બાદ તમામ લોકેશન, લાઈટિંગ કંડીશન અને એક્શનમાં આ અલગ હશે. એ જ રીતે યુઝર સ્ટાઈલ મોશનને નેરેટ કરીને પોતાનો પસંદગીનો વીડિયો જનરેટ કરી શકશે. 

Gemini Sparkની જાહેરાત

Gemini Omniની સાથે સાથે ગૂગલે Gemini Sparkની પણ જાહેરાત કરી છે. કંપનીએ તેને "તમારા પર્સનલ AI એજન્ટ" તરીકે ઓળખાવ્યું છે. તે ક્લાઉડ-આધારિત AI છે જે નોનસ્ટોપ કામ કરશે. ગૂગલ દાવો કરે છે કે તે તમારા ઇનબોક્સ અને ટુ-ડુ લિસ્ટમાંના તમામ કાર્યોને હેન્ડલ કરી શકે છે. તેને ગૂગલ પ્રોડક્ટ્સ ઉપરાંત 30 થર્ડ પાર્ટી ટૂલ્સમાં પણ ઈન્ટીગ્રેટ કરી શકાય છે 

Gemini 3.5 Flash

ગૂગલ I/O 2026માં  Gemini 3.5 Flashની પણ જાહેરાત કરવામાં આવી હતી. તેની સાથે ગૂગલે એક નવું 3.5 મોડલ ફેમિલી લોન્ચ કર્યું છે. તેને અત્યાર સુધીનું સૌથી મજબૂત એજન્ટિક મોડલ માનવામાં આવે છે. કંપની કહે છે કે તે ઝડપી અને વધુ ખર્ચ-કાર્યક્ષમ છે અને કોડિંગ અને એજન્ટિક બેન્ચમાર્કની દ્રષ્ટિએ તે ફેબ્રુઆરીમાં લોન્ચ થયેલા ગૂગલના જેમિની 3.1 પ્રો મોડેલને પાછળ છોડી દે છે. તે હવે ઘણી બધી ગૂગલ સેવાઓમાં ડિફોલ્ટ મોડેલ તરીકે સેવા આપશે.