Kineski Kimi k1.5 izaziva OpenAI: Novi lider u AI trci?

Kimi k1.5 je multimodalni AI model koji može da razume tekstualne i vizuelne ulaze, kao što su fotografije i video snimci.

Trka u razvoju veštačke inteligencije (AI) se zahuktava, a Kina dominira globalnim razgovorima o ovoj temi. Dok se AI zajednica tek privikavala na mogućnosti DeepSeek-ovog modela DeepSeek-R1, koji parira modelu OpenAI-o1, pojavljuje se još jedan igrač koji tvrdi da je jednako dobar, ako ne i bolji od o1. Era kineskih AI modela je zvanično započela sa DeepSeek, a sada imamo Kimi k1.5, koji je prema određenim ključnim testovima nadmašio OpenAI GPT-4o i Claude 3.5 Sonnet.

Šta je Kimi k1.5?

Kimi k1.5 je najnoviji model koji je objavio pekinški AI startap Moonshot AI. Prema dostupnim informacijama, ovaj model se može meriti sa OpenAI-o1, a u nekim aspektima ga čak i nadmašuje. O1 model je dizajniran da provodi više vremena razmišljajući pre nego što odgovori, čime se povećava njegova sposobnost rešavanja složenih problema.

🚀 Introducing Kimi k1.5 — an o1-level multi-modal model

-Sota short-CoT performance, outperforming GPT-4o and Claude Sonnet 3.5 on 📐AIME, 📐MATH-500, 💻 LiveCodeBench by a large margin (up to +550%)
-Long-CoT performance matches o1 across multiple modalities (👀MathVista,… pic.twitter.com/ZbMcljcsSV

— Kimi.ai (@Kimi_Moonshot) January 20, 2025

Međutim, Kimi je prema testovima pokazao bolje rezultate u oblastima kao što su matematika, kodiranje i razumevanje tekstualnih i vizuelnih ulaza, uključujući fotografije i video zapise, što ga čini multimodalnim, za razliku od DeepSeek-R1. Baš kao i modeli iz DeepSeek, Kimi je razvijen uz znatno niže troškove u poređenju sa vodećim američkim AI modelima. Kimi k1.5 je dostupan preko platforme Kimi.ai i predstavlja prvog pravog konkurenta modelu o1.

Po čemu se Kimi razlikuje?

Prema dostupnim informacijama, Kimi k1.5 nije samo još jedan AI model, već se smatra velikim iskorakom u oblasti reinforcement learning (RL) i multimodalnog rezonovanja. Model može kombinovati vizuelne podatke, tekst i kod kako bi rešavao složene probleme. Na osnovu testova, nadmašio je GPT-4o i Claude 3.5 Sonnet u više kategorija. Tim koji stoji iza Kimi-ja objavio je detaljan izveštaj koji objašnjava kako je postignut ovaj napredak, kao i koje su bile najveće prepreke u njegovom razvoju.

U suštini, Kimi k1.5 je multimodalni large language model (LLM) koji je treniran primenom metoda reinforcement learning-a. Budući da može obrađivati više formata podataka, Kimi je veoma prilagodljiv model sa širokim spektrom primena. Dok konvencionalni AI modeli zavise od statičkih skupova podataka, Kimi uči kroz istraživanje i sistem nagrađivanja. Ovaj proces, kako se navodi, značajno poboljšava njegovu sposobnost rezonovanja i rešavanja složenih problema.

Na testu bolji od svih varijanti Open AI GPT-4 modela

Na testu MATH 500, Kimi k1.5 je postigao rezultat od 96.2, što je bolje od svih varijanti OpenAI GPT-4 modela. Na testu AIME (matematički test) postigao je 77.5, dok je na Codeforces (platforma za kodiranje) ostvario rezultat koji ga svrstava u 94. percentil.

Model je na mnogim testovima nadmašio GPT-4 i Claude 3.5 Sonnet za čak 550 procenata. U poređenju sa američkim modelima GPT-4 i Claude, Kimi se ističe u rezonovanju i sposobnosti rešavanja problema. Takođe je vrlo efikasan u obradi dugog konteksta i složenih matematičkih problema. Ipak, valja napomenuti da se često dovodi u pitanje pouzdanost rezultata testiranja, jer AI kompanije same sprovode testove i objavljuju rezultate.

Kako funkcioniše?

Kao što je već pomenuto, Kimi koristi reinforcement learning (RL) tehnike kako bi poboljšao donošenje odluka – unapređuje se kroz istraživanje i usavršavanje rešenja. Model koristi pristup Chain of Thought, što znači da složene probleme razlaže na manje korake kako bi poboljšao rezonovanje. Prema istraživačkom radu koji je objavljen, Kimi može obrađivati do 128k tokena, što mu omogućava da razume i generiše odgovore zasnovane na ogromnoj količini informacija. Pošto može istovremeno analizirati i tekst i slike, Kimi se može koristiti za zadatke poput analize teksta i slika, kao i za rešavanje problema koji zahtevaju vizuelni input.

Kada je reč o efikasnosti, model koristi metode poznate kao partial rollouts i length penalties, koje omogućavaju ponovno korišćenje prethodnih izlaza i izbegavanje nepotrebno dugih odgovora.

Šta je Kimi k1.5?

Po čemu se Kimi razlikuje?

Na testu bolji od svih varijanti Open AI GPT-4 modela

Kako funkcioniše?

Kompas pravih vrednosti