Metti una foto su Google e ti dirà dove è stata scattata (senza GPS)

Naviga SWZ: Home Page » Tech
News del 09 Aprile 16 Autore: Pinter
Google ha sviluppato PlaNet, un sistema di reti neurali in grado di riconoscere il luogo in cui è stata scattata una fotografia semplicemente analizzando l’immagine. Il sistema, sebbene debba migliorare è comunque già efficace .

Google ha svelato in un articolo scientifico i risultati ottenuti dal progetto "PlaNet", un modello progettato per il riconoscimento del luogo la cui realizzazione richiede uno sforzo di calcolo che solo un gigante come Google può sostenere: questo sistema usa delle fotografie casualmente scaricate da internet. Gli ingegneri Google Tobias Weyand e James Philbin hanno istruito una rete neurale -una particolare tipologia di intelligenza artificiale che simula i metodi di apprendimento umani- con 126 milioni di immagini geolocalizzate prelevate dal Web (esclusi diagrammi, clip-art e foto osé).

Gli attuali sistemi di riconoscimento di località fotografate si basano principalmente sul confronto 2D dell´immagine con altre foto geolocalizzate, sono specializzate in particolari tipologie di soggetti e, secondo gli autori dell´articolo, raggiungerebbero buoni risultati solo nel riconoscimento di paesaggi o località molto note. PlaNet segue invece un approccio più "umano": raccoglie e integra i piccoli indizi visivi che appaiono nella foto e li riconduce alle aree geografiche nelle quali più probabilmente potrebbero esser state scattate.

In sostanza il sistema sfrutta le informazioni contenute nelle fotografie scomponendole a livello di pixel e confrontando le varie “tessere” del mosaico con la sterminata mole di immagini che Google ha indicizzato nel corso degli anni con il suo motore di ricerca, cercando il corrispondente più simile.

Metti una foto su Google e ti dirà dove è stata scattata (senza GPS) - immagine 1

E´ come trovarsi di fronte ad un puzzle e iniziare a confrontare tutte le tessere scomposte del puzzle con uno specifico numero di immagini già georeferenziate, fino a quando non si troverà l’immagine che sarà più probabile poter ricreare con quelle tessere. Nel caso di Google il confronto avverrà con svariati miliardi di immagini immagazzinate.

Nei test eseguiti, PlaNet riconosce senza problemi l´immagine della Tour Eiffel di Parigi, mentre è indeciso su una foto di un fiordo che potrebbe essere stata scattata in Norvegia o in Nuova Zelanda. Più problematiche le foto con pochi indizi e molto comuni, come una spiaggia, che potrebbe essere del Mediterraneo, del Messico o della California.

Messo alla prova con 2,3 milioni di immagini prelevate da Flickr, PlaNet è stato in grado di indovinare il luogo in cui esse erano state scattate a vari livelli: nel 3,6% dei casi ha infatti identificato l’esatta strada, mentre nel 10,1% dei casi il software si è fermato a riconoscere la città di provenienza. Le percentuali salgono ancora considerando le situazioni in cui il software ha indovinato solo la nazione dove fosse stata scattata l’immagine (il 28,4% dei casi) o il continente (il 48% dei casi).

Non siamo ancora di fronte a risultati impeccabili, ma sono comunque  migliori dei risultati ottenuti in precedenza dal altri sistemi simili e, secondo un primo testa a testa molto vicini a quelli realizzati con capacità umane. Dieci umani hanno sfidato PlaNet nel gioco online "GeoGuessr" cercando di riconoscere dove sono state scattate 50 foto panoramiche differenti. Dei 50 round totali, PlaNet ne ha vinti 28, con un errore di localizzazione medio di 1.131 km contro i 2.320 della controparte umana.

Gli sviluppi futuri che riguardano il progetto cercheranno di estendere il sistema con un´architettura di rete neurale a memoria di breve-lungo termine (LSTM), che assicurerebbe risultati 50% più precisi. In questo caso il riconoscimento non viene più fatto in base ad una singola foto ma ad una galleria di immagini relative allo stesso contesto.

La sofisticata intelligenza artificiale è stata alimentata con oltre 90 milioni di immagini georeferenziate da tutto il mondo. In uno studio con 2,3 milioni di immagini, PlaNet ha determinato il paese di origine il 28,4 per cento delle volte e il continente di origine nel 48 per cento dei casi. Benché non perfetto, i numeri di test iniziali sono significativamente migliori di quelli che si possono ottenere da qualunque persona che svolga la stessa prova.

Con l’apprendimento continuo, PlaNet potrebbe diventare sempre più preciso, tanto da rendere superfluo l’uso di strumenti di geolocalizzazione della immagini nel prossimo futuro.

La Community di SWZone.it

La community con le risposte che cerchi ! Partecipa é gratis !
Iscrizione ForumIscriviti al Forum

Newsletter

Vuoi ricevere tutti gli aggiornamenti di SWZone direttamente via mail ?
Iscrizione NewsletterIscriviti alla Newsletter

NOTIZIE CORRELATE