​Unul dintre cei mai cunoscuti cercetatori Google in domeniul inteligentei artificiale, Geoffrey Hinton, a prezentat in doua articole stiintifice o noua abordare cu ajutorul careia computerele pot identifica mai bine imagini si elemente din video-uri, pornind de la mai putine date. Hinton spune ca tehnologia actuala de recunoastere a imaginilor este imperfecta fiindca are nevoie de extrem de multe exemple de pornire si are dificultati in a recunoaste un obiect din diverse unghiuri.

HotNews.roFoto: Hotnews

Hinton, in varsta de 69 de ani, este unul dintre cei mai cunoscuti cercetatori in domeniul retelelor neurale, lucrand in domeniu de peste 40 de ani. Acum a prezentat pe larg o noua tehnica denumita "capsule networks" ce este gandita sa rezolve problemele actualelor sisteme de recunoastere a imaginilor.

Abordarea poate inseamna ca un computer va putea recunoaste cine este intr-o fotografie, chiar daca aceasta este din profil sau poate recunoaste cu acuratete obiecte, chiar daca in fotografii apar din diverse unghiuri care nu se regasesc in uriasa baza de date cu care computerul este ajutat de programatori.

Hinton spune ca este un mod mult mai eficient in care computerul poate recunoaste obiecte, iar tehnologia poate fi folosita si la video, dar si la audio.

Teoria porneste de la notiunea de capsula, un mic grup de neuroni virtuali, carora li s-a dat misiunea de a identifica parti mici dintr-o imagine mare si li s-au dat relatiile fixe dintre aceste parti.

"Capsule networks" se vrea a fi o idee care sa rezolve o slabiciune a soft-urilor actuale de recunoastere a imaginilor si anume faptul ca nu sunt extrem de bune in a generaliza in scenarii noi ceea ce invata, existand, spre exemplu, numeroase cazuri in care un obiect nu este identificat pentru ca in poza apare dintr-un alt unghi. Pentru ca sistemele actuale sa poata recunoaste un obiect din orice unghi trebuie sa primeasca o multime de fotografii din toate unghiurile pentru un obiect, insa tehnica propusa de Hinton poate face recunoastere foto eficienta cu mai putine date.

Aceste mici grupuri de neuroni virtuali, capsulele, primesc misiunea de a recunoaste anumte parti ale unei fotografii, de exemplu nasul unui pisici sau ochii si li se da si pozitia relativa in spatiu. Apoi, aceste mici retele pot recunoaste cand intr-o noua fotografie este un mod diferit de a privi o imagine pe care eja au "vazut-o" anterior.

Hinton spune ca tehnica prezentata de el a avut la testari jumatate dintre erorile actualelor tehnologii de "image recognition".In plus, pentru ca acum se poate generaliza si pentru perspective si configuratii foto nemaivazute pana acum, se poate estima ca soft-ul are nevoie de mult mai putine date pentru a oferi rezultate bune, spune Hugo Larochelle, seful laboratorului Google Brain din Montreal.

Hinton a venit cu imbunatatiri in modul in care soft-urile recunosc comenzi vocale, acestea fiind incluse in 2012 in sistemul de operare Android si in asistentul vocal Google.

Despre noua tehnica, Hinton spune insa ca ete in faza de test si ca a mers impresionant pe seturi mici de date, insa va trebui testata si pe seturi mai mari.

Retelele neurale (artificial neural network) sunt o ramura din stiinta inteligentei artificiale si sunt compuse din neuroni artificiali. Principala trasatura a acestor retele este capacitatea de a invata pe baza de exemple, folosindu-se de experienta anterioara pentru a-si imbunatati performantele.

Desi se aseamana in functionare cu creierul uman, retelele neurale au o structura diferita de cea a creierului. O retea neurala este mult mai simpla decat corespondentul sau uman, dar la fel ca si creierul uman, este compusa din unitati puternice cu capacitate de calcul, mult inferioare insa corespondentului uman, neuronul.

Printre domeniile in care aceste retele sunt eficiente se numara recunoasterea diverselor tipare, recunoasterea vocala, clasificarile, scanarea retinei si predictiile unor serii temporale.

Machine learning (ML) si inteligenta artificiala (AI) sunt notiuni care se regasesc deja in diverse produse Google (cum ar fi Photos, Gmail, Maps), nu reprezinta o noutate, nu sunt magie, insa acum in ultimii ani s-a vorbit mai mult pentru ca au nceput sa functioneze eficient.

Inteligenta artificiala reprezinta stiinta de a face sisteme informatice care pot fi considerate "inteligente" si pot rezolva probleme, iar machine learning (invatarea automatizata) reprezinta o disciplina mai restransa care presupune crearea de sisteme capabile sa invete din exemplele si din datele pe care le primesc. Intre aceste doua concepte exista o zona comuna si cel mai bun exemplu tine de faptul ca IBM Deep Blue, supercomputerul care in 1997 l-a invins pe Gary Kasparov, era un sistem de inteligenta artificiala care nu invata sa joace sah, ci era programat sa-l joace, in timp ce AlphaGo, care recent a invins campionul mondial la jocul de GO, invata si joaca tot mai bine, fiind net peste DeepBlue.

Surse: Reuters, Wired