
Zastavte sa na chvíľu a pozrite sa von z okna. Pravdepodobne niekde vonku uvidíte strom. Poznáte jej druh? Ako často ju treba zalievať? Je to zdravé?
Pietro Perona si predstavuje svet, v ktorom by ste sa mohli pozerať na strom – alebo nespočetné množstvo iných predmetov – a pomocou smartfónu o ňom okamžite získať odborné znalosti. Zatiaľ čo vy nemusí o položke nič vedieť, „niekto bude vedieť, čo to je,“ hovorí Perona, profesor elektrotechniky Allen E. Puckett na Kalifornskom technologickom inštitúte (Caltech). 'A ak to niekto vie, mal by to vedieť aj [váš] iPhone.'
Nemyslí tým, že sa opýtate Google alebo Siri. Namiesto toho by ste odfotili objekt – napríklad strom – a algoritmus použitý v aplikácii alebo na webovej lokalite by ho dokázal rozpoznať porovnaním vášho obrázka s údajmi zozbieranými o rôznych druhoch stromov. Perona si predstavuje, že tento typ algoritmu funguje pre milióny iných pozorovateľných vecí, od rastlín a zvierat až po geologické formácie – dokonca aj rôzne symptómy súvisiace so zdravím, ako sú kožné vyrážky.
Perona skúma počítačové videnie a ako „reprodukovať schopnosť ľudského vizuálneho systému v stroji,“ hovorí. V posledných rokoch sa obzvlášť zaujímal o trénovanie počítačov na vykonávanie jemnej vizuálnej kategorizácie, čo je schopnosť veľmi špecificky identifikovať objekty, ako napríklad strom až po jeho druh alebo budovu podľa štýlu architektúry. Niektoré spoločnosti už používajú technológie, ktoré to dokážu – napríklad softvér na Facebooku dokáže rozpoznať tvár vašich priateľov na fotografiách.
V roku 2009 začala spoločnosť Perona skúmať myšlienku využitia strojového učenia na poskytovanie odborných znalostí o druhoch vtákov na požiadanie. Bol to prvý projekt v rámci prebiehajúcej spolupráce s profesorom informatiky Cornell University Serge Belongie Visipedia , čo je v podstate vizuálna encyklopédia, ktorá sa od ľudských expertov učí triediť predmety. Ich laboratóriá spolupracovali s odborníkmi na vtáky, aby označili tisíce internetových obrázkov vtákov z celej krajiny, pričom anotovali rozlišujúce detaily o ich zobákoch, očiach a inej morfológii. Tieto údaje potom vložili do svojho algoritmu, čím ho „učili“, ako identifikovať vtáky prostredníctvom ich pozorovateľných vlastností.
Počítačové vizuálne algoritmy „majú silné vzdelávacie komponenty, takže [môžete] vytvoriť veľmi všeobecný softvér, ktorý sa môže učiť z príkladu,“ hovorí Perona.
Výsledný vtáčí algoritmus dokáže doteraz identifikovať viac ako 550 druhov vtákov v Severnej Amerike, hovorí Perona, a nedávno bol aplikovaný na mobilnú aplikáciu s názvom Merlin , ktorý umožňuje používateľom nahrať alebo odfotografovať vtáka, aby zistil jeho druh.
Pre svoj ďalší projekt Visipedia Perona aplikuje algoritmus na stromy, pričom sa inšpiroval okolitými podmienkami v okolí Caltechu. 'Trochu som sa obával o budúcnosť stromov v Pasadene, pretože Kalifornia obmedzovala zalievanie a videl som, že veľa stromov umiera,' hovorí Perona. Myslel si, že algoritmus by mohol poskytnúť lepší inventár stromov na uliciach, z ktorých by verejní činitelia mohli vylepšiť svoje stratégie starostlivosti o svoje mestské lesy.
Našťastie, satelitné zobrazovacie služby, ako sú Mapy Google, poskytujú pravidelne aktualizované a verejne dostupné obrázky uličných stromov v mestských oblastiach, ako je Pasadena. Perona najal ľudských dobrovoľníkov, aby označili stromy z nestromových objektov na obrázkoch urobených v okolí Pasadeny, a potom použil informácie o druhoch z predchádzajúcej inventarizácie stromov vykonanej mestom na trénovanie identifikačných schopností algoritmu.
V teste overenia koncepcie, ktorý porovnával výstup algoritmu s mestským prieskumom stromov Pasadena, algoritmus správne zistil asi 80 percent stromov a z nich asi v 80 percentách prípadov identifikoval správny druh, hovorí Perona.
Perona predpokladá, že tento algoritmus budú používať predovšetkým urbanisti v celej krajine. Vylúčením potreby ľudských inšpektorov by technológia mohla potenciálne ušetriť desiatky tisíc hodín a možno aj milióny dolárov, odhaduje Perona. Okrem toho by sa algoritmus mohol použiť na pravidelnejšie vykonávanie stromových prieskumov, čo by umožnilo získať aktuálnejšie informácie o stave stromov v danej oblasti.
'Väčšina miest bude robiť prieskum každých 20-30 rokov, ale potenciálne by sme mohli mať prieskum každých šesť mesiacov,' hovorí Perona. „Mohli sme vidieť, ako sa mestské lesy v USA vyvíjajú v priebehu času oveľa presnejšie, ako reagujú na zmenu klímy, ako reagujú na vírus, ktorý sa šíri z jedného kraja do druhého. Bude to skôr ako vidieť akciový trh alebo niečo, čo sa neustále mení, a bude sa to aktualizovať, a nie zachovať si tento veľmi statický uhol pohľadu.“