Da li je Google konačno napravio najinteligentniji AI model?

U utorak, Google je predstavio Gemini 2.5, novu porodicu AI modela za rezonovanje, koji prave pauzu da „razmisle“ pre nego što odgovore na pitanje.

Lansiranje Gemini 2.5 Pro Experimental

Za početak ove nove linije modela, Google lansira Gemini 2.5 Pro Experimental, multimodalni AI model za rezonovanje, za koji kompanija tvrdi da je njen najinteligentniji model do sada.

Ovaj model će biti dostupan od utorka na platformi za programere Google AI Studio, kao i u aplikaciji Gemini za pretplatnike na napredni AI plan kompanije, Gemini Advanced, koji košta 20 dolara mesečno.

Google navodi da će svi njegovi budući AI modeli imati ugrađene sposobnosti rezonovanja.

Trka u razvoju AI modela za rezonovanje

Još od kada je OpenAI lansirao prvi AI model za rezonovanje u septembru 2024. godine, nazvan o1, tehnološka industrija se utrkuje da dostigne ili nadmaši njegove sposobnosti. Danas i kompanije Anthropic, DeepSeek, Google i xAI imaju AI modele za rezonovanje, koji koriste dodatnu računarsku snagu i vreme da provere činjenice i logički obrade probleme pre nego što pruže odgovor.

Tehnike rezonovanja pomogle su AI modelima da dostignu novi nivo u zadacima iz matematike i kodiranja. Mnogi u tehnološkom svetu veruju da će modeli za rezonovanje biti ključna komponenta AI agenata – autonomnih sistema koji mogu izvršavati zadatke uz minimalnu ljudsku intervenciju. Međutim, ovi modeli su i skuplji za korišćenje.

Google-ova prethodna iskustva sa rezonovanjem

Google je i ranije eksperimentisao sa AI modelima za rezonovanje, prethodno objavljujući „miseonu“ verziju Gemini modela u decembru. Ipak, Gemini 2.5 predstavlja najambiciozniji pokušaj kompanije da nadmaši OpenAI-ovu seriju o modela.

Performanse Gemini 2.5 u poređenju sa konkurencijom

Google tvrdi da Gemini 2.5 Pro nadmašuje njegove prethodne vrhunske AI modele, kao i neke od vodećih konkurentskih modela, na nekoliko testova. Konkretno, Google navodi da je Gemini 2.5 dizajniran da blista u kreiranju vizuelno privlačnih veb aplikacija i agentnih aplikacija za kodiranje.

Na evaluaciji koja meri sposobnosti uređivanja koda, nazvanoj Aider Polyglot, Google kaže da Gemini 2.5 Pro postiže rezultat od 68,6%, nadmašujući vodeće AI modele kompanija OpenAI, Anthropic i kineskog AI laboratorija DeepSeek.

Međutim, na drugom testu koji meri sposobnosti u razvoju softvera, SWE-bench Verified, Gemini 2.5 Pro postiže 63,8%, što je bolje od OpenAI-ovog o3-mini i DeepSeek-ovog R1, ali slabije od modela Claude 3.7 Sonnet kompanije Anthropic, koji je postigao 70,3%.

Na testu Humanity’s Last Exam, multimodalnom testu koji se sastoji od hiljada pitanja iz oblasti matematike, humanističkih nauka i prirodnih nauka, Google tvrdi da Gemini 2.5 Pro postiže rezultat od 18,8%, što ga svrstava iznad većine konkurentskih vodećih modela.

Kapacitet memorije i obrada velikih tekstova

Za početak, Google navodi da Gemini 2.5 Pro dolazi sa kontekstualnim prozorom od 1 milion tokena, što znači da model može obraditi otprilike 750.000 reči u jednom unosu – duže od celokupne trilogije „Gospodar prstenova“. Uskoro, Gemini 2.5 Pro će podržavati i duplo duži unos (2 miliona tokena).

Google još nije objavio API cene za Gemini 2.5 Pro, ali kompanija kaže da će podeliti više informacija u narednim nedeljama.

Lansiranje Gemini 2.5 Pro Experimental

Trka u razvoju AI modela za rezonovanje

Google-ova prethodna iskustva sa rezonovanjem

Performanse Gemini 2.5 u poređenju sa konkurencijom

Kapacitet memorije i obrada velikih tekstova

Kompas pravih vrednosti