OpenAI-јev o3 систем постигао је 85 одсто на ARC-AGI тесту, што је знатно изнад претходног најбољег резултата вештачке интелигенције од 55 одсто и у рангу са просечним људским резултатом.
Нови модел вештачке интелигенције (AI) управо је постигао резултате на људском нивоу на тесту осмишљеном за мерење „опште интелигенције“.
Такође је остварио висок резултат на веома захтевном тесту из математике.
Стварање вештачке опште интелигенције (AGI) је главни циљ свих водећих истраживачких лабораторија за вештачку интелигенцију. На први поглед, чини се да је OpenAI направио значајан корак ка остварењу овог циља.
Иако скептицизам и даље постоји, многи истраживачи и девелопери вештачке интелигенције осећају да се нешто променило. За многе, могућност AGI-ја сада делује реалније, хитније и ближе него што су очекивали. Да ли су у праву?
Генерализација и интелигенција
Да бисмо разумели значај резултата o3 система, потребно је разумети суштину ARC-AGI теста. Технички гледано, овај тест мери „ефикасност узорка“ AI система у прилагођавању новим ситуацијама – односно, колико примера нове ситуације систем мора да види да би схватио како она функционише.
AI систем попут ChatGPT-а (GPT-4) није посебно ефикасан када је у питању коришћење малог броја примера. Он је „трениран“ на милионима примера људског текста, конструисањем вероватносних „правила“ о томе које комбинације речи су највероватније.
Резултат је прилично добар у обављању уобичајених задатака. Међутим, код неуобичајених задатака AI се лошије сналази, јер има мање података (мање примера) за такве ситуације, пише Gizmodo.
Све док AI системи не буду могли да уче из малог броја примера и прилагођавају се уз већу ефикасност узорка, њихова примена ће остати ограничена на веома репетитивне послове и задатке где су повремени неуспеси прихватљиви.
Способност тачног решавања претходно непознатих или нових проблема уз ограничен број примера података позната је као способност генерализације. Ова способност се широко сматра неопходним, па чак и основним елементом интелигенције.