Înainte să abordezi tehnicile de învățare automatizată, ar trebui să te întrebi dacă se potrivește produsului tău. Așadar, testează învățarea cu oameni înainte să treci la tehnologie. În timp ce testezi tehnologiile de machine learning vei înțelege când este nevoie ca o persoană să fie implicată și când tehnologia trebuie să preia controlul.
Pentru a funcționa eficient, învățarea automatizată are nevoie de date calitative și etichetate. În acest fel, tehnologia poate acționa cu precizie atunci când vine vorba de predicție, clasificarea și analiza datelor.
Etichetarea manuală poate lua destul de mult timp. Ceea ce se urmărește prin machine learning este să se preia sarcina la care se pricepe o persoană și să se transfere cunoștințele în aplicație, care preia și controlul, explică David Crawford, pe The Next Web.
Cum să implementezi algoritmi de machine learning
De exemeplu, reCAPTCHA este un serviciu gratuit de la Google care ajută site-urile să se protejeze de spam și alte abuzuri. Utilizatorul trebuie să identifice imaginile pentru a confirma că nu este un robot, în timp ce aplicația își pregătește algoritmii pentru a recunoaște obiecte din lumea reală. Imaginile în sine reprezintă așa-numitele ”training data”, iar pe măsură ce utilizatorii identifică obiectelele, datele primesc etichete corespunzătoare.
O acțiune similară se întâmplă și în cazul etichetării pe Facebook. În momentul în care indicăm anumite persoane din poză, aplicația însușește informațiile respective. Ulterior, când adaugi o altă poză în care apar persoanele respective, Facebook recunoaște fețele și îți sugerează nume pentru etichetare.
O altă valoare apare atunci când etichetarea are un impact imediat, cum ar fi clasificarea filmelor online. De exemplu, Netflix cere utilizatorilor să dea notele fimelor și, pentru a face valoarea imediată clară, le răspunde cu recomandări pe baza notei acordate.
Experiența utilizatorului este esențială
Modalitățile menționate presupun o implicare directă a utilizatorului în funcția de ”training data”, dar există și tactici care nu necesită implicarea lor activă. Una dintre acestea presupune observarea comportamentului. În acest fel, utilizatorul nu participă direct la procesul de etichetare și scade proabilitatea unei experiențe nesatisfăcătoare. De exemplu, magazinele online observă comportamentul de cumpărare pentru a recomanda produse și oferte.
În plus, utilizatorii ar putea să nu fie la fel de importanți pentru ”training data” în viitorul apropiat. Simulările sunt o modalitate perfectă de a eticheta datele. Jocurile de șah sau ping pong pe digital sunt dintre cele care pot fi simulate cu ușurință, în timp ce permit rularea unui număr mare de scenarii.
În cele din urmă, trebuie de atenționat asupra faptului că utilizatorii vor refuza să furnizeze date sau să-ți instruiască algoritmii dacă nu există valoare și dacă experiența nu este convingătoare. Indiferent de atribuția utilizatorului în etichetarea datelor – directă, indirectă sau inexistentă - experiența utilizatorului este esențială.