Algoritmom protiv govora mržnje

Posljednjih godina govor mržnje u online prostoru se povećao gotov eksponencijalno, ovaj trend nažalost nije zaobišao ni naše govorno područje. O ulozi vještačke inteligencije u borbi protiv govora mržnje razgovarali smo sa bosanskohercegovačkom lingvistikinjom Marijom Runić.

Koja je uloga lingvista u izradi AI softvera za prepoznavanje govora mržnje i pežorativnih izraza?

Prije svega, potrebno je da znamo da govor mržnje i uvredljiv jezik nisu isto, iako su blisko povezani. To znači da govor mržnje može a ne mora da sadrži eksplicitno uvredljiv jezik. Ako izgovorite ili napišete „Ko ne bi mrzio jebene fašiste!“ vi niste upotrijebili govor mržnje.  Međutim, ako kažete ili napišete „Žene su najljepše kad se sagnu.“ vi ste upotrijebili govor mržnje, iako sam jezički niz ne sadrži nijednu pogrdnu riječ.

Govor mržnje određuje to što je usmjeren na određene grupe ili pripadnike tih grupa, shodno njihovom rodnom, etničkom, rasnom, religijskom ili seksualnom identitetu ili nekoj fizičkoj karakteristici (npr. osobe sa invaliditetom) i podstiče na nasilje i netrpeljivost prema njima. Ono što suštinski razlikuje govor mržnje od uvredljivog jezika jeste njihov zakonski status, ukoliko postoji, odnosno činjenica da govor mržnje nije dopušten u javnom prostoru.

S obzirom da je govor mržnje prvenstveno jezički fenomen, uloga lingvista jeste da razumiju i opišu kako se govor mržnje manifestuje u datom jeziku. Uzimajući u obzir definiciju jezika mržnje, koja pak nije ista za sve platforme niti postojeće dokumente u toj materiji, lingvisti učestvuju u izradi smjernica o tome šta predstavlja govor mržnje u nekom jeziku, koji i kakvi jezički podaci predstavljaju govor mržnje, pomažu u obuci ljudi koji evaluiraju dati sadržaj na internetu i učestvuju u anotiranju (označavanju) podataka na kome se treniraju određeni algoritmi za automatsko prepoznavanje govora mržnje. Iako oni koji se bave govorom mržnje ne moraju da budu i nisu samo lingvisti, za ispravno razumijevanje i prepoznavanje govora mržnje potrebno je lingvističko znanje.

Ocjenu sadržaja na internetu još uvijek rade za to obučeni ljudi, čije se zanimanje zove humani moderatori sadržaja ili evaluatori sadržaja na internetu. Znanja o govoru mržnje koje posjedujemo kao govornici jednog jezika u ovom trenutku uveliko prevazilaze mogućnosti vještačke inteligencije. Međutim, s obzirom na ogroman porast sadržaja na internetu, a shodno tome i sadržaja koji koristi govor mržnje, postaje sve teže pratiti govor mržnje oslanjajući se na ljudsku radnu snagu.

Koliki je obim posla u pitanju najbolje govori podatak da je u posljednjih nekoliko godina samo Facebook namjenski uposlio na desetine hiljada ljudi za ove zadatke i u tom smislu su i javni i privatni sektor sve više zainteresovani za razvijanje modela mašinskog učenja koji bi pomogao u bržem i tačnijem otkrivanju govora mržnje. Nedavno sam baš za jednu kompaniju razvijala testove za razumijevanje teksta na srpskom na osnovu kojih će sutra testirati i zapošljavati evaluatore sadržaja na internetu – eto gdje se nalaze buduća zanimanja.

Možete li nam ukratko objasniti na koji način vještačka inteligencija i njeni algoritmi prepoznaju govor mržnje?

Iako nisam iz računarskog svijeta, znam da postoji mnogo modela za otkrivanje govora mržnje i da se oni često kombinuju da bi se postigla veća tačnost. Suština većine modela je da se oni istreniraju na nekom setu podataka (tkv. training set) u kome su podaci označeni od strane evaluatora na osnovu unaprijed uspostavljenih kriterijuma (npr. ‘uvredljiv sadržaj’, ‘govor mržnje’, ‘neuvredljiv sadržaj’) i da zatim mašina uči obrasce u podacima putem metode mašinskog učenja.

Tradicionalni metodi se pak zasnivaju na ručnom dizajniranju i unošenju podataka koje onda algoritam nauči da prepozna u novim podacima, npr. uvredljivih riječi, raznih jezičkih templejta (Mrzim _ .), sadržaja koji je označen po osjećanjima koje izaziva (sentiment analysis), itd. Uglavnom, suština većine modela je da su oni nadzirani i da svaki ima brojne mane. Daću vam jedan primjer njihove nesavršenosti ‒ jedan od algoritama za okrivanje govora mržnje će označiti kao govor mržnje i rečenicu „Srbi su genocidaši.“ i rečenicu „Mrzim ljude koji kažu da su Srbi genocidaši.“

Nedavno je Facebook ukinuo stranicu jednog francuskog grada budući da njegov naziv asocira na jedan engleski pežorativ, šta se može učiniti da bi se izbjegle ovakve greške?

Ukoliko je sadržaj blokiran automatski, dakle uz pomoć algoritma, mogu da pretpostavim da  algoritam nije znao da je stranica na francuskom. Ovo su sasvim očekivane greške u procesu razvoja automatske detekcije govora mržnje i iako nisam iz oblasti programiranja, mogu da pretpostavim da bi algoritam bio precizniji ukoliko bi mu se napravila mogućnost da dobije neke metapodatke o stranici (npr. gdje je napravljena) ili jezičkog okruženja kojim bi zapravo prepoznao da je u pitanju francuski.

Sigurna sam da će FB to prevazići, iako problem pretjerane generalizacije govora mržnje, za koji sam dala primjer gore, jeste jedan od najvećih problema postojećih algoritama. Drugi problem jeste problem neprepoznavanja govora mržnje ili lake mogućnosti da se ti algoritmi zaobiđu: dovoljno je promijeniti ili izostaviti jedno slovo pa da vas algoritam više ne prepozna (pretpostavljam da  ste uočili na internetu oblike hebem, ebem i sl).

Koliko je BiH ali i ostale države BHS govornog područja daleko otišla u primjeni ove tehnologije?

Ja trenutno znam za jedan nekomercijalni istraživački projekat za hrvatski, The Linguistic Landscape of Hate Speech in Social Media, koji finansiraju Slovenački i Holandski fond za nauku a koji se konkretno tiče govora mržnje prema migrantima i LGBT osobama. Takođe znam da je u toku jedan komercijalni projekat za Microsoft, opet za hrvatski, u okviru koga su se sakupljale liste pogrdnih riječi i izraza prema ženama, LGBTQI+, etničkim i religijskim skupinama. Vjerujem da Microsoft razvija jezičke resurse za unaprijeđenje tehnologije za detekciju govora mržnje i da radi i na ostalim jezicima u regionu. Nisam upoznata sa ostalim projektima i platformama, ali su razvoji ovih tehnologija i metodologija na samom početku iako je sve dobilo na zamahu u posljednih nekoliko godina, što zbog razvoja i primjene zakonodavstva u ovoj oblasti, što zbog jačanje desnice i radikalizacije, što zbog komercijalnih interesa samih kompanija.

Mislim da se o primjeni ovih tehnologija ne može govoriti iz perspektive zemalja već iz perspektive kompanija koji su vlasnici tih podataka i jezika na kome su podaci. Odnos kompanija prema govoru mržnje je uslovljen zakonodavstvom zemlje u ovoj oblasti i njihov interes da razvijaju i primjenjuju tehnologiju za prepoznavanje i blokiranje govora mržnje je prvenstveno komercijalni. U pitanju je, dakle, strah od kazni i želja za očuvanjem društvenog ugleda, budući da niko ne želi postati kompanija u kojoj će razne radikalne ili desničarske grupe javno širiti mržnju prema drugim grupama. Isto tako znam da englesko govorno područje nije uniformno: s obzirom da govor mržnje nije krivično djelo u SAD-u, nešto što bi u Velikoj Britaniji bilo označeno kao govor mržnje, u SAD-u je pravno zaštićeno kao sloboda govora prema Prvom amandmanu Ustava, dakle najvišem pravnom aktu zemlje.

Na koji način algoritam može da prepozna izraze koji u sebi nose ironijsku notu ili preneseno značenje, a da ih pri tom ne obilježi kao govor mržnje?

Zasad nikako. Sve što je dvosmisleno ili se previše oslanja na kontekstualne informacije (npr. namjere govornika, širi kontekst ili znanja, što mi često popularno zovemo „čitanje između redova“) algoritam ne može da nedvosmisleno detektuje, sad ili u bližoj budućnosti. Takođe je zanimljivo pitanje tretmana humora.

Jezik je živ i konstantno se mijenja, da li ste primjetili svojevrsnu evoluciju govora mržnje to jest pojavu nekih novih termina kojima se pogrdno nazivaju pripadnici drugih etničkih skupina, seksualnih manjina?

Naravno, daću vam baš jedan skorašnji primjer. Nedavno sam sastavljala listu riječi posebno za bosanski, hrvatski i srpski, koji sadrži upravo uvredljive termine za pripadnike ovdašnjih nacija. Lista je već bila sačinjena na osnovu „Rečnika opscenih reči i izraza“ Danka Šipke iz 2000. godine, trebalo je da je dopunim novim terminima. Pored klasika iz 2. svjetskog rata ili ovih iz 90-tih, poput balija, poturica, srbočetnik, četnik, četo, ustaša, ujo, tuđmanovac koji su već bili u rječniku, poratno doba je donijelo i nove uvredljive izraze poput genocidaša, trofaznih, drugosrbijanaca, traktorista ali i brojne varijacije na temu: muslić, muslimančina, četalj, četnikuša, vlaščad, rvatina, ustašoid, thompsonovac, srbadija, itd. Takođe je bilo zanimljivo koliko ima pogrdnih termina u hrvatskom za simpatizere lijevih opcija od strane desnice (titoist, komunjara, titovac, srboljubac, Jugoslavenčina, srbofil, jugočetnik, antihrvat, udbaš, kosovac pa čak i jugonostalgičar) i ali koliko zapravo neke riječi dobijaju potpuno druge konotacije u zavisnosti ko ih upotrebljava i koliko to mašina ne može da nauči.

Jezik se mijenja ali prije svega se mijenja medijum na kome se jezik koristi i razne opscene riječi dobijaju drugačiju formu u internet okruženju (daću još jedan primjer grafičkih varijacija na dobro poznatu nam riječ u sva tri jezika: qrz, qrtz, qurac, qrc, kyrac, khurac, koorac, kurrac, itd) a često se kombinuju grafička rješenja usljed jezičkog kontakta.

Velikim digitalnim platformama se zamjera svojevrsna evropocentričnost, budući da su skocentrisane na uklanjanje sadržaja na jezicima zapadnog svijeta dok su mnogi azijski jezici sa velikim brojem govornika zapostavljeni, mislite li da je uzrok ovome nezainteresovanost tehnoloških giganata za te regione i procese logističke ili političke prirode?

Kao što sam rekla gore, interesi ovih kompanija su najviše komercijalne prirode i mislim da je evropocentričnost zapravo povezana sa time što je Evropska komisija zajedno sa Facebookom, Twitterom, YouTubeom i Microsoftom 2016. potpisala Kodeks ponašanja o nelegalnom govoru mržnje u online prostoru, kojim su se kompanije obavezale da će se boriti protiv nelegalnog govora mržnje na prostoru EU. Mislim da je politika EU najodlučnija i ulaže najviše resursa u u tom pravcu, što je povezano sa njenim istorijskim nasljeđem.

Primjer koji se često navodi je Njemačka, koja zahtijeva od kompanija da sadržaj koji je nedvosmisleno u suprotnosti sa zakonom (recimo negiranje holokausta, koje u tom kontekstu spada u najkažnjiviji oblik govora mržnje) mora biti uklonjen u roku od 24 sata, inače mogu dobiti kazne u iznosu do 50 miliona evra. Dakle, u pitanju su prosto pritisci nad kompanijama i Evropa u tome u ovom trenutku prednjači. Znam da je TikTok, kao najmlađa ali najmasovnija digitalna platforma među mlađom populacijom, posljedni ušao u obračun sa sadržajem koji promoviše mržnju i opasne ideologije, dijelom i zbog toga što je njihov sadržaj zasnovan prvenstveno na video materijalu.

Broj korisnika društvenih mreža kao i drugih platformi za online komunikaciju se povećava, koliko je bitno svojevrsno digitalno opismenjavanje koje bi ljude naučilo da prepoznaju govor mržnje u virtuelnom prostoru?

Mislim da opismenjavanje po pitanju govora mržnje nije vezano za medij u kome se pojavljuje već za vrijednosti društva u kome živimo ili želimo da živimo. A opismenjavanje društva po pitanju govora mržnje se postiže izgradnjom vrijednosti međusobnog uvažavanja, poštovanja različitosti i kulture dijaloga. Ako pak živimo u društvu u kome je nasilje doslovno na svakom ćošku, teško da ćemo biti sposobniji da razumijemo šta je govor mržnje u virtuelnom prostoru.

Uostalom, kako će pojedinac razumjeti da je negiranje genocida u Srebrenici govor mržnje kada čitav politički i kulturni establišment u jednom dijelu zemlje ne samo da to radi već negiranje promoviše kao najveći izraz odanosti kolektivu? Međutim, nije isključeno da će online prostor sutra uređivati neko drugi u naše ime.

 

 

Facebook
Twitter
LinkedIn