MIT i Harvard razvili alat za prepoznavanje AI generisanog teksta

Test je pokazao da su ispitanici sami uspeli da prepoznaju oko polovine lažno generisanih članaka, a uz pomoć GLTR-a procenat se popeo na 72%.

Marko Marković
29/07/2019

Nakon što je Adobe u saradnji sa istraživačima sa Berklija razvio alat za prepoznavanje manipulisanih slika, sa američkih univerziteta nam stiže još jedan, sličan, softver. Naime, istraživači sa MIT-IBM Watson AI Lab-a, u saradnji sa Harvard NLP napravili su algoritam koji prepoznaje tekst koji je generisan od strane Artificial Intelligence-a (AI).

Nazvan Giant Language Model Test Room (GLTR), alat se bazira na prepoznavanju obrazaca kojima se reči uobičajeno ređaju. Budući da algoritmi koji kreiraju lažan tekst koriste statističke podatke o tome koja reč se najčešće pojavljuje posle one koja je već napisana, developeri su odlučili da krenu iz suprotnog ugla.

GLTR koristi mašinsko učenje da reči podeli u tri grupe. Ukoliko je reč među 10 najverovatnijih u odnosu na prvu s leve strane, biće obeležena zelenom bojom. Ako je u prvih 100, biće obeležena žutom, u prvih 1.000 crvenom, a sve ostale će biti obeležene ljubičastom. Dakle, što je više zelenih reči, veća je verovatnoća da je tekst pisao AI.

Tim iza GLTR-a je iskoristio model GPT-2 117M kompanije OpenAI, koji je jedan od najvećih javno dostupnih modela za generisanje teksta. OpenAI je takođe koristio mašinsko učenje kako bi iz ogromne baze teksta izvukao obrasce, a rezultati su bili iznenađujuće uverljivi, iako ne savršeni. Naravno, moguće je da korisnik unese svoje komande kako bi povećao šanse da tekst deluje kao da ga je napisao čovek, što dodatno otežava prepoznavanje.

Da bi proverili uspešnost novog alata, istraživači su studentima Harvarda dali niz tekstova. Test je pokazao da su studenti sami uspeli da prepoznaju oko polovine lažno generisanih članaka, a uz pomoć GLTR-a procenat se popeo na 72%. Kako kažu članovi tima, cilj je da se razvije saradnja između ljudi i AI, što treba da pomogne u borbi protiv sve bržeg širenja lažnih vesti, twitter botova i deep fake videa.

Oni koji žele da više saznaju o načinu na koji funkcioniše GLTR, ili da ga isprobaju, mogu to da urade ovde.

Marko Marković

Objavio/la članak.

ponedeljak, 29. Jul, 2019.

IT Industrija

🔥 Najčitanije