FaceApp a stav strojového učenia

2. 9. 2019 ǀ 5 minút

STIAHLI STE SI FACEAPP? VIETE, NA AKOM PRINCÍPE FUNGUJE? O STROJOVOM UČENÍ AJ RIZIKU VÝMENY SÚKROMIA ZA BEZPLATNÚ SLUŽBU SI PREČÍTAJTE V NAŠOM KOMENTÁRI.

FaceApp a stav strojového učenia

2. 9. 2019 ǀ 5 minút

STIAHLI STE SI FACEAPP? VIETE, NA AKOM PRINCÍPE FUNGUJE? O STROJOVOM UČENÍ AJ RIZIKU VÝMENY SÚKROMIA ZA BEZPLATNÚ SLUŽBU SI PREČÍTAJTE V NAŠOM KOMENTÁRI.

Pokiaľ ste nestrávili posledný mesiac na opustenom ostrove, zaplavili Vás na sociálnych sieťach zábavné obrázky toho, ako by Vaši priatelia vyzerali v osemdesiatich rokoch alebo ako príslušníci opačného pohlavia, a to všetko vytvorené virálnou aplikáciou FaceApp.

Možno ste si aplikáciu stiahli a sami vyskúšali. Poďme sa na túto aplikáciu pozrieť bližšie z hľadiska jej fungovania. Poskytuje totiž zaujímavú možnosť k preskúmaniu stavu strojového učenia v roku 2019 v súvislosti s témami, akými sú technológia, viralita a súkromie.

Technológia

V terminológii strojového učenia je stroj, ktorý vytvára obrázky, napr. ľudských tvárí, neurónovou sieťou nazývanou generátor. Generátor prijíma šumový vektor, t. j. zoznam náhodných čísel, a používa ho na generovanie obrázka. Šumový vektor zaisťuje rozmanitosť, inak by stroj zakaždým vygeneroval rovnakú tvár.

Testovanie generátora k vytváraniu tvárí, ktoré vyzerajú realisticky, by vyžadovalo milióny príkladov testovacích dát, kedy generátor vygeneruje obrázok, človek zhodnotí výsledky tým, že určí, ktoré časti obrázka nie sú realistické, a generátor potom upraví svoj model založený na ľudskej spätnej väzbe a skúsi to znovu.

V roku 2014 prišiel Ian Goodfellow s nápadom vložiť proti sebe dve neurónové siete namiesto vyžadovania ľudského zhodnotenia. Taký stroj nazývame generatívna kompetitívna sieť (Generative Adversarial Network – GAN), kedy jedna neurónová sieť funguje ako tvorca pokúšajúci sa vygenerovať realistické obrázky, zatiaľ čo druhá neurónová sieť funguje ako umelecký kritik poskytujúci spätnú väzbu o tom, ktoré časti generovaného obrázka obsahujú vady. Generatívna sieť nakoniec vytvorí obrázok, ktorý prejde porovnaním s kompetitívnou sieťou, t. j. vytvorí sa realistický obrázok.

Podmienená sieť GAN rozširuje tento koncept pridaním kategorického vstupu do GAN; napr. generovať iba staršie tváre. To vyžaduje testovacie dáta, ktoré sú označené vekom, takže GAN pozná charakteristiky staršej tváre. Generátor používa tieto testovacie dáta na generovanie tvárí rôznych vekových kategórií a diskriminátor používa testovacie dáta k posúdeniu, či je tvár dostatočne stará.

Podmienená sieť GAN dokáže generovať realistické tváre určitej kategórie, ale FaceApp robí niečo viac – generuje roztriedené tváre, ktoré vyzerajú ako konkrétna osoba. To vyžaduje podmienku GAN pre zachovanie identity, kde musí generatívna GAN začínať nie náhodným šumovým vektorom, ale skôr očesanou verziou konkrétneho vstupného obrazu tváre, neznečistenou informáciami o kategórii. Tento „nešumový“ vektor šumu potom môže byť privádzaný do podmienenej GAN, ako je uvedené vyššie.

Prekážky pre vstup

Všetko, čo bolo doteraz popísané, je v komunite strojového učenia dobre známe a je implementované do algoritmov otvoreného zdrojového kódu, ktoré sú k dispozícii v jednoducho použiteľných softvérových knižniciach. FaceApp pravdepodobne začal s týmito algoritmami a pridal nejakú „tajnú ingredienciu“.  Zdá sa, že tvorcovia odviedli dobrú prácu pri identifikácii ústredných rysov vstupného tvárového obrazu a zhromaždili mnoho testovacích dát roztriedených podľa podmienok, akými sú vek a výrazy tváre.

Jedna z dôležitých vecí, ktorú si je možné z prípadu FaceApp odniesť, je to, že v roku 2019 už neexistuje pre strojové učenie prekážka pre vstup. Každý programátor môže v jazyku Python vytvoriť prvotriednu aplikáciu, ktorá využíva najnovšie akademické prelomové algoritmy, bez toho, aby musel rozumieť detailom týchto algoritmov. To vytvára obrovské príležitosti pre inovácie, napr. ako tieto algoritmy kombinujete, aké problémy pomocou týchto algoritmov riešite, kde nájdete testovacie dáta.

Súkromie a viralita

Základné pravidlo pri hodnotení bezplatných online služieb znie: keď je služba bezplatná, produktom ste Vy. Ako FaceApp zamýšľa speňažiť svoju bezplatnú aplikáciu? Existuje niekoľko možností, od predaja pokročilejších funkcií úpravy fotografií až po vytvorenie databázy obrázkov, ktoré by mohli byť predané ako testovacie dáta iným spoločnostiam.

Bez ohľadu na základný obchodný model nie je pochýb o tom, že pri súhlase s podmienkami FaceApp sa vzdáte časti svojho súkromia. Dávate FaceApp právo prístupu k Vášmu fotoaparátu a Vašim fotografiám a navždy tiež udeľujete práva na všetky obrázky, ktoré nahráte. Tieto informácie môžu padnúť do nesprávnych rúk a byť zneužité, napr. k vytvoreniu realistických fotomontáží Vás na mieste činu k oklamaniu softvéru na rozpoznávanie tváre, ktorý sa čoraz častejšie používa ako forma identifikácie.

Napriek týmto potenciálnym rizikám sa milióny užívateľov zaregistrovali a úžasne sa bavili pohľadom na to, ako by mohli vyzerať o 30 rokov. Zaujímavé svedectvo o tom, kde sme sa v roku 2019 ocitli – sme čím ďalej tým bezstarostnejší, aj keď sa vzdávame svojho súkromia výmenou za bezplatné online služby. Spoločnosti možno čelia rastúcej regulácii ochrany osobných údajov (viď GDPR), ale doma zostávajú naše osobné online údaje do značnej miery nechránené.

Zdroj: Forbes India
Moshe KrancChief Technology Officer Ness Digital Engineering

Pokiaľ ste nestrávili posledný mesiac na opustenom ostrove, zaplavili Vás na sociálnych sieťach zábavné obrázky toho, ako by Vaši priatelia vyzerali v osemdesiatich rokoch alebo ako príslušníci opačného pohlavia, a to všetko vytvorené virálnou aplikáciou FaceApp.

Možno ste si aplikáciu stiahli a sami vyskúšali. Poďme sa na túto aplikáciu pozrieť bližšie z hľadiska jej fungovania. Poskytuje totiž zaujímavú možnosť k preskúmaniu stavu strojového učenia v roku 2019 v súvislosti s témami, akými sú technológia, viralita a súkromie.

Technológia

V terminológii strojového učenia je stroj, ktorý vytvára obrázky, napr. ľudských tvárí, neurónovou sieťou nazývanou generátor. Generátor prijíma šumový vektor, t. j. zoznam náhodných čísel, a používa ho na generovanie obrázka. Šumový vektor zaisťuje rozmanitosť, inak by stroj zakaždým vygeneroval rovnakú tvár.

Testovanie generátora k vytváraniu tvárí, ktoré vyzerajú realisticky, by vyžadovalo milióny príkladov testovacích dát, kedy generátor vygeneruje obrázok, človek zhodnotí výsledky tým, že určí, ktoré časti obrázka nie sú realistické, a generátor potom upraví svoj model založený na ľudskej spätnej väzbe a skúsi to znovu.

V roku 2014 prišiel Ian Goodfellow s nápadom vložiť proti sebe dve neurónové siete namiesto vyžadovania ľudského zhodnotenia. Taký stroj nazývame generatívna kompetitívna sieť (Generative Adversarial Network – GAN), kedy jedna neurónová sieť funguje ako tvorca pokúšajúci sa vygenerovať realistické obrázky, zatiaľ čo druhá neurónová sieť funguje ako umelecký kritik poskytujúci spätnú väzbu o tom, ktoré časti generovaného obrázka obsahujú vady. Generatívna sieť nakoniec vytvorí obrázok, ktorý prejde porovnaním s kompetitívnou sieťou, t. j. vytvorí sa realistický obrázok.

Podmienená sieť GAN rozširuje tento koncept pridaním kategorického vstupu do GAN; napr. generovať iba staršie tváre. To vyžaduje testovacie dáta, ktoré sú označené vekom, takže GAN pozná charakteristiky staršej tváre. Generátor používa tieto testovacie dáta na generovanie tvárí rôznych vekových kategórií a diskriminátor používa testovacie dáta k posúdeniu, či je tvár dostatočne stará.

Podmienená sieť GAN dokáže generovať realistické tváre určitej kategórie, ale FaceApp robí niečo viac – generuje roztriedené tváre, ktoré vyzerajú ako konkrétna osoba. To vyžaduje podmienku GAN pre zachovanie identity, kde musí generatívna GAN začínať nie náhodným šumovým vektorom, ale skôr očesanou verziou konkrétneho vstupného obrazu tváre, neznečistenou informáciami o kategórii. Tento „nešumový“ vektor šumu potom môže byť privádzaný do podmienenej GAN, ako je uvedené vyššie.

Prekážky pre vstup

Všetko, čo bolo doteraz popísané, je v komunite strojového učenia dobre známe a je implementované do algoritmov otvoreného zdrojového kódu, ktoré sú k dispozícii v jednoducho použiteľných softvérových knižniciach. FaceApp pravdepodobne začal s týmito algoritmami a pridal nejakú „tajnú ingredienciu“.  Zdá sa, že tvorcovia odviedli dobrú prácu pri identifikácii ústredných rysov vstupného tvárového obrazu a zhromaždili mnoho testovacích dát roztriedených podľa podmienok, akými sú vek a výrazy tváre.

Jedna z dôležitých vecí, ktorú si je možné z prípadu FaceApp odniesť, je to, že v roku 2019 už neexistuje pre strojové učenie prekážka pre vstup. Každý programátor môže v jazyku Python vytvoriť prvotriednu aplikáciu, ktorá využíva najnovšie akademické prelomové algoritmy, bez toho, aby musel rozumieť detailom týchto algoritmov. To vytvára obrovské príležitosti pre inovácie, napr. ako tieto algoritmy kombinujete, aké problémy pomocou týchto algoritmov riešite, kde nájdete testovacie dáta.

Súkromie a viralita

Základné pravidlo pri hodnotení bezplatných online služieb znie: keď je služba bezplatná, produktom ste Vy. Ako FaceApp zamýšľa speňažiť svoju bezplatnú aplikáciu? Existuje niekoľko možností, od predaja pokročilejších funkcií úpravy fotografií až po vytvorenie databázy obrázkov, ktoré by mohli byť predané ako testovacie dáta iným spoločnostiam.

Bez ohľadu na základný obchodný model nie je pochýb o tom, že pri súhlase s podmienkami FaceApp sa vzdáte časti svojho súkromia. Dávate FaceApp právo prístupu k Vášmu fotoaparátu a Vašim fotografiám a navždy tiež udeľujete práva na všetky obrázky, ktoré nahráte. Tieto informácie môžu padnúť do nesprávnych rúk a byť zneužité, napr. k vytvoreniu realistických fotomontáží Vás na mieste činu k oklamaniu softvéru na rozpoznávanie tváre, ktorý sa čoraz častejšie používa ako forma identifikácie.

Napriek týmto potenciálnym rizikám sa milióny užívateľov zaregistrovali a úžasne sa bavili pohľadom na to, ako by mohli vyzerať o 30 rokov. Zaujímavé svedectvo o tom, kde sme sa v roku 2019 ocitli – sme čím ďalej tým bezstarostnejší, aj keď sa vzdávame svojho súkromia výmenou za bezplatné online služby. Spoločnosti možno čelia rastúcej regulácii ochrany osobných údajov (viď GDPR), ale doma zostávajú naše osobné online údaje do značnej miery nechránené.

Zdroj: Forbes India
Moshe KrancChief Technology Officer Ness Digital Engineering

Prečítajte si tiež

Lekári sa obávajú inovácií. Darí sa nám vysvetľovať, že nie je prečo

Chceme napomôcť tomu, aby lekári predčasne neopúšťali ordinácie

Súboje v rámci modernizácie a vysvetliteľná umelá inteligencia

Expertný pohľad na technologické výzvy súčasnosti

Inteligentná mobilita vrátane inovácií v riešení prepojených áut

Inovatívne myslenie je pohonom nových modelov dopravy

Prečítajte si tiež

Lekári sa obávajú inovácií. Darí sa nám vysvetľovať, že nie je prečo

Chceme napomôcť tomu, aby lekári predčasne neopúšťali ordinácie

Súboje v rámci modernizácie a vysvetliteľná umelá inteligencia

Expertný pohľad na technologické výzvy súčasnosti

Inteligentná mobilita vrátane inovácií v riešení prepojených áut

Inovatívne myslenie je pohonom nových modelov dopravy