Urmărește episodul acesta și caută răspunsul la întrebarea de la minutul 1.18 al video-ului și câștiga licențe Bitdefender Total Security 2020. Răspunsurile le poți da în formularul de la finalul articolului sau dacă dai click aici.


Seria #NOHACK, powered by Bitdefender și start-up.ro, încearcă să-ți explice și să-ți rezolve dilemele cele mai mari când vine vorba de tehnologie și de protecția dispozitivelor și datelor noastre.

Machine learning e folosit pe scară largă, inclusiv în produsele care ne apără de infractorii cibernetici. Am vrut să aflăm cum.

Dacă ai văzut filme de la Hollywood ai putea crede că știi ce e machine learning sau ce e inteligența artificială. De multe ori acești doi termeni sunt folosiți ca să descrie același lucru, dar în realitate sunt diferiți. Cât de aproape suntem de singularitate și cât de mult pot gândi programele software singure?

Provocarea Cyber Trivia - recunoaște atacul cibernetic și câștigă

În fiecare episod al seriei #NOHACK vă oferim o provocare. Răspundeți corect la ea și noi vă premiem cu abonamente Bitdefender Total Security 2020 ce pot fi folosite pe maximum 5 dispozitive, ca voi să fiți în siguranță.

Acest tip de amenințare informatică e o formă de atac asupra parolelor voastre. Și de cele mai multe ori hackerii vor dori să aibă acces la ele ca să poată ulterior să-ți ia datele sau banii. Acest tip de atac ia cele mai folosite cuvinte folosite dintr-o limbă, aranjate într-o bază de date criptată, pe care le apoi le folosește pentru a-ți ghici parola.

Hackerii criptează cele mai folosite cuvinte, le compară ulterior și pot afla cheia către datele tale.

Indiciu: Gândește-te unde găsești cuvintele... de obicei.

Machine Learning - ce este și ce nu este?

În interviul din acest episod vorbim în detaliu despre machine learning cu doi oameni care știu la perfecție acest subiect.

Elena Burceanu este Senior Researcher la Bitdefender și coordonează departamentul de inteligență artificială și criptologie, iar Cătălin Coșoi e Senior Director Investigation & Foresnic Unit la Bitdefender.

„Machine learning se referă la capacitatea unui sistem sau a unui om de a face un sistem să învețe din date, din experiențe ale sistemului respectiv. Diferit față de până înainte de machine learning, când încercai să faci niște reguli. Sau față de programarea tradițională în care trebuie să-i dau tu modul în care să gândească algoritmul exact”, spune Elena Burceanu.

„Machine learning e o ramură a matematicii. Sunt în spate algoritmi matematici și nu este nimic ezoteric acolo. Nu este vorba de o inteligență artificială sau o singularitate cum se numește și nu o să vină să ne vâneze mai încolo cu pușca”, adaugă și Cătălin.

Cum se schimbă modul în care Bitdefender citește datele?

Odată cu implementarea algoritmilor de machine learning, lucrurile s-au schimbat și în Bitdefender, care are peste 72 de patente pentru folosirea ML în produsele lor sau chiar intern.

„Probabil ne uităm mult mai mult la date decât o făceam înainte, adică încercăm nu mai venim cu preconcepții și să forțăm noi ce-ar putea să facă un algoritm, ci să lăsăm, să-i lăsăm mână liberă un pic să înțeleagă ce e acolo”, spune Elena Burceanu.

Cătălin își amintește că-n anii 2000 un malware apărea poate o dată pe lună, iar în birourile Bitdefender aveau un girofar care marca apariția acestuia. Astăzi sunt sute de mii de viruși și malware de tot felul în fiecare zi. Ai avea nevoie de o armată ca să poți să vezi cum funcționează.

„Și atunci machine learning, acest domeniu, a venit cu suficienți algoritmi care să automatizeze procesul ăsta. Extras informații, procesat informații și creat detecții pentru acele amenințări.”, spune Cătălin Coșoi.

„Algoritmul este limitat de datele pe care le vede. Datele de pe care învață, încearcă să extragă el informație în momentul în care învață. În momentul în care este folosit, să zicem, vine un malware nou, acolo el poate să nu fi văzut ceva, să nu fi văzut tipul acela de infecție și poate să nu-l detecteze sau poate să îl „flaguiască” precum o chestie anormală, „uită-te tu omule pe ea și vezi dacă e ceva anormal în sensul rău sau pur și simplu a apărut o nouă aplicație care așa interacționează cu rețeaua”., spune Elena Burceanu despre limitele machine learning.

Machine learning ajută specialiștii, dar și oamenii normali

Algoritmii aceștia inteligenți sunt folosiți în două privințe. Dincolo de deciziile pe care le ia un algoritm singur pe dispozitivele și programele clienților, mai e folosit și intern de experții de securitate Bitdefender pentru a colabora la identificarea problemelor în seturi mari de date.

„Există niște algoritmi care se utiă pe foarte multe date, o parte îi cunoaște deja, aceste date le recunoaște și le scrie, „ok, despre asta știu, sunt aceste tipuri de amenințări”. Dar va descoperi și niște informații noi, pe care nu le-a văzut până atunci, nu știe ce să facă cu ele și atunci va cere ajutorul unui operator uman. Ce părere ai tu despre acest sample? Pare că e ceva în neregulă aici, dar eu nu am mai văzut așa ceva în trecut. Deci nu știu ce să fac cu datele respective”, spune Coșoi.

În plus, există o colaborare om-algoritm. În industria de securitate, cea care ne menține banii în siguranță, datele și viața noastră online, există două concepte care se numesc „false positive” și ”false negative”.

„Asta înseamnă ori să marchezi un fișier malițios din greșeală ca fiind ok, lucru care este destul de grav, pentru că înseamnă că las un virus să infecteze un client. Sau să marchez un fișier legitim ca fiind malițios și atunci nu las utilizatorul să-și execute anumite programe. E, noi trebuie să jonglăm cu acești algoritmi de machine learning astfel încât să avem acei doi parametri în niște norme optime pentru noi.”, spune Cătălin.

Etica folosirii algoritmilor autonomi

Unde se oprește etica unui algoritm de machine learning și cât de autonom poate fi. Specialiștii Bitdefender spun că nu poți interzice toporul doar pentru că are două funcții și poate răni pe cineva.

„Adică tu poți să pui niște bariere semnificative dezvoltării, de exemplu, in continent. Pentru că de exemplu în momentul ăsta China și America nu vor limita tehnologia, nu vor limita AI-ul, iar dacă Europa decide să facă asta, s-ar putea ca Europa să rămână mult în urmă față de avansul tehnologic pe care o să-l surprindă celelalte două”, spune Elena Burceanu,.

„În cercetare deja au început de câțiva ani în a rula modele de machine learning peste date criptate. Adică, când faci asta, privacy-ul tău nu mai este deloc expus. Sau datele personale nu sunt deloc expuse și rezultatul îl poți interpreta doar tu ca user, astfel încât, nu știu, putem să ne gândim la Facebook, dar putem să ne gândim la ceva mult mai privat, de exemplu rezultatul unor analize medicale”, mai spune Elena.

Un alt lucru ce mai trebuie înțeles sau rezolvat în machine learning este bias-ul. Adică faptul că anumiți algoritmi sunt construiți cu preconcepții împrumutate de la creatorii lor.

„Acum dacă datele, datele au tot timpul imperfecțiuni. Dacă datele nu mapează tot ce trebuie să acopere. De exemplu, cum a fost problema la Facebook, că oamenii de culoare nu erau identificați. Și au dat un label greșit pentru anumite poze. Adică nu au văzut, de exemplu, că acolo erau oameni. Mai sunt bias-uri în direcția femei versus bărbați”, a mai spus Elena Burceanu