Почетна » Наука » DeepSeek представиo две верзије свог најновијег великог језичког модела

DeepSeek V4 Flash и V4 Pro — нови модели кинеске технолошке компаније

DeepSeek представиo две верзије свог најновијег великог језичког модела

Кинеска лабораторија за вештачку интелигенцију DeepSeek представила је две пробне верзије свог најновијег великог језичког модела, DeepSeek V4, дуго очекивано ажурирање прошлогодишњег модела V3.2 и пратећег R1 модела за резоновање који је изазвао велико интересовање у свету вештачке интелигенције.

На чему су засновани DeepSeek V4 Flash и V4 Pro модели?

Компанија наводи да су и DeepSeek V4 Flash и V4 Pro модели засновани на приступу „мешавине експерата“, са контекстуалним прозорима од по 1 милион токена — довољно да омогуће коришћење великих кодних база или докумената у упитима. Приступ „мешавине експерата“ подразумева активирање само одређеног броја параметара по задатку, како би се смањили трошкови извршавања.

Pro модел има укупно 1,6 трилиона параметара (49 милијарди активних), што га чини највећим моделом са отвореним тежинама доступним данас, надмашујући Moonshot AI-јев Kimi K 2.6 (1,1 трилион), MiniMax-ов M1 (456 милијарди), као и више него двоструко DeepSeek V3.2 (671 милијарда). Мањи V4 Flash има 284 милијарде параметара (13 милијарди активних).

Перформансе и поређења

DeepSeek тврди да су оба модела ефикаснија од DeepSeek V3.2 захваљујући архитектонским унапређењима, и да су готово „затворили јаз“ са тренутно водећим моделима, како отвореним тако и затвореним, на тестовима резоновања.

Компанија наводи да њен нови модел V4-Pro-Max надмашује своје open-source конкуренте у тестовима резоновања, и да превазилази OpenAI-јев GPT-5.2 и Gemini 3.0 Pro у појединим задацима. У бенчмарцима програмерских такмичења, DeepSeek наводи да су перформансе оба V4 модела „упоредиве са GPT-5.4“.

Поређење са најнапреднијим моделима

Ипак, модели изгледа благо заостају за најнапреднијим моделима у тестовима знања, конкретно за OpenAI-јевим GPT-5.4 и Google-овим најновијим Gemini 3.1 Pro. Ово заостајање указује на „развојну путању која касни за најсавременијим моделима приближно 3 до 6 месеци“, навела је лабораторија.

Оба модела, V4 Flash и V4 Pro, подржавају искључиво текст, за разлику од многих затворених конкурената који нуде подршку за разумевање и генерисање аудио, видео и слика.

DeepSeek V4 је знатно приступачнији од било ког водећег модела данас

Значајно је да је DeepSeek V4 знатно приступачнији од било ког водећег модела данас. Мањи модел V4 Flash кошта 0,14 долара по милиону улазних токена и 0,28 долара по милиону излазних токена, чиме поткопава цене GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini и Claude Haiku 4.5. Већи модел V4 Pro, са друге стране, кошта 0,145 долара по милиону улазних токена и 3,48 долара по милиону излазних токена, такође испод цена Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 и GPT-5.4.

Лансирање долази дан након што су Сједињене Америчке Државе оптужиле Кину за крађу интелектуалне својине америчких лабораторија за вештачку интелигенцију у индустријским размерама, користећи хиљаде прокси налога.

Сам DeepSeek је оптужен од стране Anthropic-а и OpenAI-ја за „дестилацију“, односно суштински копирање њихових модела вештачке интелигенције.

Извор: TechCrunch

Превод и припрема: Редакција Компас инфо
Повезани чланци:

Портал Компас Инфо посебну пажњу посвећује темама које се тичу друштва, економије, вере, културе, историје, традиције и идентитета народа који живе у овом региону. Желимо да вам пружимо објективан, балансиран и прогресиван поглед на свет око нас, као и да подстакнемо на размишљање, дискусију и деловање у правцу бољег друштва за све нас.