giovedì 3 marzo 2016

Il Software Che Riconosce Luoghi e Città Nelle Foto: PlaNet

«PlaNet ha un vantaggio sugli esseri umani, perché ha potuto visitare molti più posti di quanto qualsiasi essere umano potrà mai fare, imparando così a distinguere anche piccoli dettagli di scene differenti, che sono molto difficili da notare, anche per un essere umano che abbia viaggiato molto»

Quasi tutto sul nostro pianeta è conosciuto e catalogato e quest' "enciclopedia" è conservata al sicuro nei server di Google.
Il problema è: il capire dove una certa foto è stata scattata.
Se nella foto/immagine troviamo la statua della Liberta o il Colosseo è semplice risalire alla città ma se non ci sono punti di riferimento noti, come si fa?
Pare che Google abbia creato un sistema intelligente che può geolocalizzare quasi qualsiasi foto: un algoritmo che analizza l’immagine e indica il luogo in cui è stata scattata, anche se l'immagine non è geotaggata e sono presenti pochi dettagli significativi.
Stiamo parlando di PlaNet.
Questo algoritmo sfrutta potentissime reti neurali artificiali, oltre al Deep Learning, cioè l’apprendimento profondo, possibile grazie a tecnologie di intelligenza artificiale.
Su oltre 2 milioni di immagini Flickr e sottoposte a PlaNet, il 3.6 percento di esse è stato geolocalizzato con precisione assoluta, cioè individuando addirittura la strada.
Per il 10.1 percento invece è stata invece indicata la città, di un altro 28.4 percento è stata trovata la nazione, mentre di circa il 48 si è trovato il continente.
L’algoritmo è stato messo in competizione con gli umani, 10 esperti viaggiatori, giocando al quiz del sito Geoguessr.
Il gioco consiste nell’individuare il luogo in cui è stata scattata una certa foto di Google Maps.
La precisione della macchina si è dimostrata migliore del doppio rispetto a quella delle persone.
Gli sviluppatori hanno diviso la mappa del pianeta in 26mila quadrati di diverse dimensioni, più o meno grandi a seconda della quantità di fotografie a disposizione.
Se un luogo è molto fotografato, il quadratino è di dimensioni minori; se scarsamente fotografato, più ampio.
È stata quindi caricata la memoria di PlaNet, fatta di 128 milioni di immagini prese dal Web; per una parte di esse, 37 milioni, è stata impostata manualmente la localizzazione sulla mappa, mentre  le restanti (91 milioni di immagini) sono state usate come test.
PlaNet in sostanza funziona secondo calcoli probabilistici, grazie all'intelligenza artificiale.
Quando riceve un’immagine, calcola il valore di possibilità per ogni quadratino e infine decreta quale sia la zona più probabile.

Nessun commento:

Posta un commento