La realtà aumentata viene salutata dalla prossima grande cosa sui dispositivi mobili, per tutto, dai giochi al controllo dei prezzi delle case; indica uno smartphone che utilizza Yelp in una strada cittadina e la funzione Monocle ti offre recensioni e valutazioni per le attività commerciali.

Google Goggles può fare più o meno la stessa cosa, ma il product manager di Goggles, Shailesh Nalawadi, non è interessato all'argomento: "Non ci vediamo davvero come se lavorassimo sulla realtà aumentata, stiamo lavorando alla ricerca visiva".

Questo è il modo in cui gli umani lavorano, sottolinea, quindi ha senso solo che la ricerca funzioni visivamente. "L'80% delle informazioni viene consumato visivamente, e non attraverso nessuno degli altri sensi, perché è necessario tradurre e trascrivere ciò che si vede in parole?"

Anche se Nalawadi è realista su ciò che si può fare con una fotocamera del telefono oggi ("Il riconoscimento delle immagini è davvero difficile anche se non mancano i film di Hollywood che lo dimostrano già realizzato!"), Non pensa che abbiamo bisogno di occhiali adatti alla posizione o le lenti a contatto digitali che si prevede saranno in vendita entro il 2020; come suggerisce il nome Goggle, il telefono è il visualizzatore.

"Avete questi computer veramente veloci che portiamo tutti in giro nelle nostre tasche, che hanno capacità che non avreste avuto nei desktop solo cinque o dieci anni fa", dice.

"Ovviamente, a prescindere dalla potenza di questi dispositivi, la visione del computer è in grado di assorbire tutti i cicli della CPU che hai, quindi Goggles si prenderà cura del pesante sollevamento nel cloud."

Funziona solo a causa delle connessioni mobili a banda larga e mentre Nalawadi chiama il tempo di riconoscimento da tre a otto secondi che Goggles di solito prende "abbastanza fenomenale" ammette "ci rendiamo anche conto che non è abbastanza perché le capacità di attenzione delle persone sono davvero brevi."

Lungi dall'essere finito

Goggles è il frutto di tre o cinque anni di ricerca ed è tutt'altro che finito, dice.

"Abbiamo faticato e abbiamo costruito questa cosa in cui è possibile spostare la videocamera, puntarla su un oggetto e farlo tornare e dirti cosa sta guardando. La realtà è che siamo davvero lontani da quello stato".

Ciò che Nalawadi vuole fare è molto più ambizioso di una semplice stratificazione delle informazioni su dove ti trovi sullo schermo; vuole una ricerca visiva che possa affrontare il mondo intero.

"In primo luogo, spiega," si tratta di estendere le capacità di riconoscimento dei nostri computer. In questo momento abbiamo una serie molto ristretta di decine di milioni di oggetti che riconosciamo, ma il mondo è molto più grande di decine di milioni di oggetti ed è uno sforzo fenomenale cercare di ottenere queste informazioni nel nostro database e riconoscerle. "

GUARDA E CERCA: Goggles tratta i punti di riferimento come loghi e codici a barre; ti dice cosa stai guardando e fa apparire i risultati della ricerca

Nel corso del tempo Goggles riconoscerà piante e giochi di scacchi e presto tradurrà il testo su ciò che vedi.

Fare il database delle immagini Goggles può corrispondere più grande è solo l'inizio. C'è il problema di ricerca di base: "Stiamo spendendo molto tempo sulla qualità della ricerca, quando c'è una corrispondenza di successo, quali sono i risultati rilevanti che devono tornare?"

Un problema più ampio

Ma Nalawadi vuole anche affrontare il problema molto più ampio. "Attualmente c'è questa nozione che la realtà aumentata riguarda la visualizzazione di geodati curati. Penso che ci siano molte più informazioni in quella scena e hai davvero bisogno del riconoscimento delle immagini sovrapposto a questo per dare più informazioni su ciò che sta accadendo intorno a te. "

Pensa anche che il riconoscimento delle immagini renderà l'esperienza della realtà aumentata migliore rispetto alla posizione approssimativa che gli smartphone di oggi possono calcolare.