Да ли је Google коначно направио најинтелигентнији AI модел?

У уторак, Google је представио Gemini 2.5, нову породицу AI модела за резоновање, који праве паузу да „размисле“ пре него што одговоре на питање.

Лансирање Gemini 2.5 Pro Experimental

За почетак ове нове линије модела, Google лансира Gemini 2.5 Pro Experimental, мултимодални AI модел за резоновање, за који компанија тврди да је њен најинтелигентнији модел до сада.

Овај модел ће бити доступан од уторка на платформи за програмере Google AI Studio, као и у апликацији Gemini за претплатнике на напредни AI план компаније, Gemini Advanced, који кошта 20 долара месечно.

Google наводи да ће сви његови будући AI модели имати уграђене способности резоновања.

Трка у развоју AI модела за резоновање

Још од када је OpenAI лансирао први AI модел за резоновање у септембру 2024. године, назван о1, технолошка индустрија се утркује да достигне или надмаши његове способности. Данас и компаније Anthropic, DeepSeek, Google и xAI имају AI моделе за резоновање, који користе додатну рачунарску снагу и време да провере чињенице и логички обраде проблеме пре него што пруже одговор.

Технике резоновања помогле су AI моделима да достигну нови ниво у задацима из математике и кодирања. Многи у технолошком свету верују да ће модели за резоновање бити кључна компонента AI агената – аутономних система који могу извршавати задатке уз минималну људску интервенцију. Међутим, ови модели су и скупљи за коришћење.

Google-оvа претходна искуства са резоновањем

Google је и раније експериментисао са AI моделима за резоновање, претходно објављујући „мисеону“ верзију Gemini модела у децембру. Ипак, Gemini 2.5 представља најамбициознији покушај компаније да надмаши OpenAI-ову серију о модела.

Перформансе Gemini 2.5 у поређењу са конкуренцијом

Google тврди да Gemini 2.5 Pro надмашује његове претходне врхунске AI моделе, као и неке од водећих конкурентских модела, на неколико тестова. Конкретно, Google наводи да је Gemini 2.5 дизајниран да блиста у креирању визуелно привлачних веб апликација и агентних апликација за кодирање.

На евалуацији која мери способности уређивања кода, названој Aider Polyglot, Google каже да Gemini 2.5 Pro постиже резултат од 68,6%, надмашујући водеће AI моделе компанија OpenAI, Anthropic и кинеског AI лабораторија DeepSeek.

Међутим, на другом тесту који мери способности у развоју софтвера, SWE-bench Verified, Gemini 2.5 Pro постиже 63,8%, што је боље од OpenAI-овог o3-mini и DeepSeek-овог R1, али слабије од модела Claude 3.7 Sonnet компаније Anthropic, који је постигао 70,3%.

На тесту Humanity’s Last Exam, мултимодалном тесту који се састоји од хиљада питања из области математике, хуманистичких наука и природних наука, Google тврди да Gemini 2.5 Pro постиже резултат од 18,8%, што га сврстава изнад већине конкурентских водећих модела.

Капацитет меморије и обрада великих текстова

За почетак, Google наводи да Gemini 2.5 Pro долази са контекстуалним прозором од 1 милион токена, што значи да модел може обрадити отприлике 750.000 речи у једном уносу – дуже од целокупне трилогије „Господар прстенова“. Ускоро, Gemini 2.5 Pro ће подржавати и дупло дужи унос (2 милиона токена).

Google још није објавио API цене за Gemini 2.5 Pro, али компанија каже да ће поделити више информација у наредним недељама.

Лансирање Gemini 2.5 Pro Experimental

Трка у развоју AI модела за резоновање

Google-оvа претходна искуства са резоновањем

Перформансе Gemini 2.5 у поређењу са конкуренцијом

Капацитет меморије и обрада великих текстова

Компас правих вредности