Početna » Nauka » Kompanija „Open AI“ radi na alatu koji savršeno oponaša ljudske glasove

"Voice Engine" je tehnologija sintetičkog glasa

Kompanija „Open AI“ radi na alatu koji savršeno oponaša ljudske glasove

Open AI je otkrio novi alat za veštačku inteligenciju koji može oponašati ljudske glasove sa iznenađujućom preciznošću. AI glasovni generator ima niz potencijalnih primena, uključujući usluge pristupačnosti, ali takođe može izazvati zabrinutost zbog dezinformacija i drugih oblika zloupotrebe.

Šta je „Voice Engine“?

OpenAI je u petak podelio uzorke iz ranih testova alata, nazvanog „Voice Engine“, koji koristi uzorak od 15 sekundi nečijeg govora kako bi generisao ubedljivu repliku njihovog glasa. Korisnici zatim mogu pružiti odeljak teksta, a alat će ga pročitati glasom koji je generisala veštačka inteligencija.

Foto: Open AI

Već postoje nekoliko usluga za AI-generisane glasove dostupne javnosti, ali kao što je to učinjeno sa popularnim četbotom ChatGPT, OpenAI je pokazao posebno umeće u sticanju široke prihvaćenosti AI alata.

Alat za pretvaranje teksta u glas pomoću AI-a može pomoći pri prevodu, pomoći u čitanju deci ili pomoći ljudima koji su izgubili sposobnost govora, kaže kompanija. Ali neki skeptici brinu da bi takođe mogao podsticati stvaranje dezinformacija ili olakšati izvođenje prevara.

Trenuntno dostupan za malu grupu pouzdanih partnera

OpenAI kaže da se „Voice Engine“ trenutno koristi samo od strane „male grupe pouzdanih partnera“, uključujući kompanije za obrazovanje i zdravstvene tehnologije, i da će koristiti njihove testove kako bi odredili da li i kako omogućiti širu upotrebu. Ti testeri su se složili da neće ponovo kreirati glasove ljudi bez njihovog eksplicitnog pristanka i da će jasno identifikovati slušaocima da ono što čuju generiše veštačka inteligencija, prema kompaniji.

„Prepoznajemo da generisanje govora koji podseća na glasove ljudi nosi ozbiljne rizike, koji su posebno važni u izbornoj godini,“ saopštila je kompanija OpenAI u blog postu. Kompanija priznaje potrebu za velikim promenama kako postaje dostupnija veštački generisana audio sadržina, iako nema trenutnih planova da odmah objavi „Voice Engine“ javnosti. Na primer, kompanija je predložila postepeno ukidanje autentifikacije glasom za bankovne račune.

„Svaka široka implementacija tehnologije sintetičkog glasa trebalo bi da bude praćena iskustvima autentifikacije glasa koja proveravaju da li originalni govornik namerno dodaje svoj glas usluzi i listom glasova koji nisu prihvatljivi koji detektuju i sprečavaju kreiranje glasova koji su suviše slični prominentnim ličnostima,“ rekao je OpenAI.

„Voice Engine“ može koristiti uzorak glasa na jednom jeziku kako bi kreirao repliku glasa koji može govoriti na više drugih jezika.

 

 

Njihov blog post uključuje primer audio klipa ljudskog čitanja odlomka o prijateljstvu, zajedno sa AI-generisanim audiom koji zvuči kao ista osoba koja čita isti odlomak na španskom, mandarinskom, nemačkom, francuskom i japanskom jeziku. U svakom od AI-generisanih uzoraka, ton i naglasak originalnog govornika su zadržani.

Pregled funkcionalnosti „Voice Engine-a“ dolazi dok korisnici iščekuju javno puštanje u rad alata „Sora“,koji generiše AI videozapise. OpenAI je izlazak ovog alata najavio prošlog meseca.

Šta je „Sora“?

„Sora“ može kreirati realistične videozapise dužine 60 sekundi na osnovu tekstualnih uputstava, sa sposobnošću da prikaže scene sa više likova, određene vrste pokreta i složene detalje pozadine. ChatGPT kompanije OpenAI takođe može generisati slike na osnovu tekstualnog upita.

Osim toga, OpenAI je takođe najavio u ponedeljak da će ChatGPT biti dostupan svima bez potrebe za registracijom radi korišćenja usluge.

Kompanija je napomenula da može koristiti bilo koji tekst koji se unese u ChatGPT radi poboljšanja svojih modela, ali je rekla da se ova opcija može isključiti preko podešavanja čak i bez naloga. Međutim, bez naloga korisnici neće moći da sačuvaju ili pregledaju istoriju razgovora niti pristupe raznim funkcijama, uključujući glasovne razgovore i prilagođene instrukcije.

 

 

Izvor: Open AI, CNN

Prevod i priprema: Redakcija Kompas info
Povezani članci:

Portal Kompas Info posebnu pažnju posvećuje temama koje se tiču društva, ekonomije, vere, kulture, istorije, tradicije i identiteta naroda koji žive u ovom regionu. Želimo da vam pružimo objektivan, balansiran i progresivan pogled na svet oko nas, kao i da podstaknemo na razmišljanje, diskusiju i delovanje u pravcu boljeg društva za sve nas.