Fathom: inteligenţă artificială la un stick distanţă

Fathom este un stick USB cu un processor Myriad 2 capabil să proceseze imagini în timp real. Stick-ul acesta are potenţialul de a schimba domeniul inteligenţei artificiale așa cum îl știm noi acum.

Să presupunem că vrei să construieşti un robot capabil să recunoască obiectele, sau să le ocolească, sau să le sorteze în funcţie de caracteristici, sau să caute o anumită jucarie undeva prin casă, sau toate acestea la un loc. Din proprie experienţă vorbesc aici, este al dracu de greu să faci toate acestea fără un program de recunoaştere în timp real a obiectelor și multe nopţi pierdute.

Pentru “Computer Vision” (CV) ai nevoie de un calculator puternic (Raspberry Pi 3 este foarte des folosit în astfel de aplicaţii), o librărie de procesare video/imagini precum OpenCV, poate şi un cont de cloud, şi cu siguranţă o tonă de programe. Google a făcut un pic mai uşoară munca celor care dezvoltă aplicaţii de CV prin TensorFlow. Dar chiar şi aşa, tot greu este să faci un robot să recunoască sau să distingă obiecte.

Stick-ul Fathom instalat pe o drona

Stick-ul Fathom instalat pe o drona

Să revenim la stick-ul nostru intelligent şi să descoperim de ce este în stare.

Fathom este un stick USB care se potriveşte în orice dispozitiv cu porturi USB. O listă de astfel de dispositive este data chiar de compania producatoare a stick-ului. Lista include platforme de hobby precum Raspberry Pi şi Arduino, dar şi camera video GoPro, şi bineînţeles orice înseamnă computer. Imediat după instalare, oricare din dispozitivele de mai sus devin capabile să utilizeze puterea procesorului Myriad 2 şi a reţele neuronale.

O versiune a unei reţele neuronale vine deja instalată odată cu stick-ul Fathom. Cu alte cuvinte, dacă vrei să faci un robot să ia decizii pe baza imaginilor capturate de o camera video, nu mai ai nevoie de OpenCV sau de procesare în cloud.

Tot ce înseamnă “Computer Vision” mănâncă o groază de resurse hardware şi energie. Dacă foloseşti CV pe o dronă sau un robot mobil, consumul de curent este important pentru fiecare componentă în parte. Ce este de reţinut aici este că procesorul Myriad 2 consumă puţin. Despre detaliile consumului o să vorbesc un pic mai încolo în articol.

Programare
Movidius, compania care a lansat Fathom, a creat Myriad Development Kit (MDK) care permite utilizatorilor să dezvolte și să compileze propriile programe, plus folosirea unor programe special concepute pentru a ajuta dezvoltarea de software. Framework-ul este denumit Fathom Deep Learning Software Framework şi are rolul de a compila algoritmii şi a transpune totul într-un limbaj înţeles de procesorul Myriad 2.

Myriad 2

Deep Learning pe platforma Myriad

Deep Learning pe platforma Myriad

Myriad 2 este creierul care face lucrurile să se întâmple. Procesorul rulează la 600MHz, ceea ce nu pare mult pentru un sistem de inteligenţă artificială. Pentru o putere de procesare mai mare, utilizatorul poate alege şi variant turbo care măreşte viteza procesorului peste viteza nominală.

Myriad 2 este capabil să facă un număr de doua trilioane de operaţii în fiecare secundă. Aceste date sunt valide dacă vorbim de o procesare pe 16 biţi. Consumul de energie este de peste 500 miliwaţi (0,5 waţi), aproximativ cât un sensor de temperature de exemplu. Este un consum foarte mic considerând că procesorul poate analiza în acelaşi timp intrările de la mai multe camere video.
Apropo de analizare, Myriad 2 poate procesa 16 imagini pe secundă.

Arhitectura procesorului este special concepută pentru “Computer Vision” şi reţele neuronale, ceea ce nu putem spune despre procesoarele folosite în mod uzual. De exemplu, GPU-ul plăci Raspberry Pi poate acoperi aplicaţii de CV, însă resursele consumate sunt mult mai mari în comparaţie cu un procesor dedicat doar pentru astfel de aplicaţii.

Alte detalii
Mă bucur când vad că România, şi mai exact Timişoara, are legătură cu dezvoltarea acestui produs. Compania Movidius are birouri în America, Irlanda şi în România.

Stick-ul nu este încă disponibil la scară largă, însă compania speră să lanseze produsul pe piată până la finele anului 2017. Referitor la preţ, targetul este de până într-o sută de dolari.

Şi o prezentare video a proiectului:

Leave a Reply

Câmpurile obligatorii sunt marcate cu *.