Emil Ștețco este cofondatorul Zetta Cloud, alături de George Bâra și Sebastian Ioniță. Compania a fost fondată în 2013 și se consideră specialiști în zona de procesare de limbaj natural, text analytics și inteligență de date. Ce fac ei? Softuri prin care poți să extragi informații din texte scrise pentru branduri. Dar au interes special pentru zona de presă. Primul produs lansat de ei este aplicația Știrili, care, cu ajutorul inteligenței artificiale, selectează cele mai bune articole pentru tine în cadrul unui rezumat scurt. De curând, au lansat în faza beta TrustServista, o unealtă prin care verifici sursele unui articol, pentru a vedea câtă încredere să ai în el.

Mai pe scurt, TrustServista nu îți spune dacă un articol de presă e fake news sau nu. Emil consideră că nici nu ar fi etic să dea o astfel de etichetă. În schimb, caută, cu ajutorul analizei de date, sursa primordială a articolului. Emil numește această sursă "pacientul zero" al știrii, cea care poate spune multe despre încrederea pe care o poți acorda informației. Au început să dezvolte soluția acum doi ani, pe când nu știam cu toții că lucrurile acestea se cheamă fake news. Dar ele există de când lumea. Tehnologia le poate identifica, iar Emil vrea ca TrustServista să ajute organizațiile de presă și cele care fac factchecking.

Drumul a început în 2013

Emil Ștețco povestește că primii pași în direcția interpretării textelor de presă și analizării datelor din ele au fost puși în 2013.

"Am aflat de pe Știrili de Google News Initiative și am trimis un mail echipei. În noiembrie 2015 am depus proiectul, înainte ca fenomenul fake news să ia o asemenea amploare. Am primit o finanțare de 50.000 de euro și practic așa s-a născut proiectul", spune Emil. Explică faptul că aplică în TrustServista principii de jurnalism de investigație și critical reading, dar într-un mod automatizat. Ce înseamnă automat? TrustServista folosește niște algoritmi de procesare de limbaj natural, adică înțelege ce e scris într-un articol, dar și text analytics, adică face legături între linkuri și diverse categorii de informații.

"Analizăm o cantitate mare de date și generăm automat legături semantice între bucăți de informație, între articole. Când procesăm un articol sunt create legături directe sau unele implicite, de tipul citărilor din alte surse. Noi le recunoaștem și ne ducem către sursa menționată", povestește Emil. După o asemenea analiză, TrustServista generează legături între articole și un scor de încredere pentru articole, care urmează a fi rafinat, pe măsură ce vor fi procesate și mai multe articole.

În căutarea știrii primordiale

De multe ori, atunci când cititorii urmăresc un site, nu realizează că informația a parcurs un traseu alambicat până să ajungă în fața ecranelor lor. Pe internet pot circula foarte multe zvonuri, lansate de site-uri anonime, care sunt preluate apoi pentru generarea de trafic, iar apoi ajung să devină adevăruri universale, deși nu au o sursă concretă. Uneori, mai ales în ultima vreme, sursa unor știri sunt tweet-urile. Jurnaliștii nu verifică mereu informațiile și le transmit mai departe. Din acest motiv, un produs ca TrustServista e esențial. Clujenii vor să ajungă la sursa primordială.

Analizăm o cantitate mare de date și generăm automat legături semantice între bucăți de informație, între articole. Când procesăm un articol sunt create legături directe sau unele implicite, de tipul citărilor din alte surse

"Informația se împrăștie în rețea foarte asemănător cu ce se întâmplă cu un virus. Noi am denumit informația primordială drept pacientul zero. Culegem pe traseu o mulțime de metadate pe care le folosim pentru a genera un scor de încredere", spune Emil Ștețco. El spune că TrustServista nu va stabili dacă ceva este fals sau adevărat, pentru că nu ar fi etic.

"Noi punem la dispoziția jurnaliștilor nu doar această informație, ci și cum am ajuns la ea, plus întregul graph pe care-l poate parcurge singur", explică unul dintre fondatorii Zetta Cloud.

Următorii pași pentru TrustServista

Momentan produsul e testat de jurnaliști și organizații de fact checking. În iunie, speră Emil, va apărea prima variantă, care va avea și abonamente pentru organizații. În timp, vor să dezvolte suport pentru mai multe limbi și mai multe surse, pentru că acum funcționează doar în engleză, și să dezvolte algoritmii. De asemenea, pentru utilizatorii obișnuiți, TrustServista se gândește să lanseze o extensie de browser care să poată să ofere un scor de încredere. În plus, vor lansa și un API care să poată fi integrat de publisheri sau chiar de rețele sociale.

"Din testele noastre avem indicatorii preciși în procent de 60%. Ne ducem la nivelul la care putem să ne dăm seama dacă un articol are destul context, dacă se vorbește de informațiile esențiale ale unei știri, dacă este obiectiv sau dacă este o opinie. De asemenea, ne uităm și la autor, vor fi mai mulți algoritmi introduși", spune Emil. Practic, pe viitor, TrustServista va putea analiza dacă sursa inițială este un cont de Twitter și va verifica numărul de followeri, dacă este prea mare sau prea mic, dacă a crescut brusc sau dacă e un cont făcut recent.

Informația se împrăștie în rețea foarte asemănător cu ce se întâmplă cu un virus. Noi am denumit informația primordială drept pacientul zero

"Vom lucra la zona de definire a unor rețete pe care apoi algoritmii de inteligență artificială să le identifice pe articole. Un exemplu clasic ar fi să izolăm rețeta unui clickbait, în care titlul are puține de-a face cu ceea ce conține", spune Emil.

Abonamentele vor fi diferite, în funcție de numărul de utilizatori, de configurări speciale pentru diverși clienți. TrustServista a avut chiar cereri de la o Școală de Jurnalism din Hong Kong care vrea să folosească produsul pentru studenți.

Emil crede că în momentul de față sunt în locul și momentul potrivit, pentru că produsul se lansează pe hype. În lumea în care vorbim de fake news, de bule informaționale, TrustServista poate oferi o soluție.