Captcha se puoi come hai allenato l'IA per anni senza rendertene conto
notiziaLe congratulazioni sono in ordine Tu, sì, caro lettore, hai fatto parte di qualcosa di incredibile. Grazie al tuo duro lavoro, milioni di libri contenenti praticamente la somma totale della conoscenza umana sono stati digitalizzati con successo, salvando i loro testi per le generazioni future. Tutto per colpa tua.
No sul serio.
Sapete come a volte vi verrà richiesto con a “Captcha” quando compili un modulo su internet per provare che sei completamente umano? Dietro le quinte di uno dei sistemi Captcha più popolari - Recaptcha di Google - i tuoi click umanoidi aiutano a capire cose che il computing tradizionale non è in grado di gestire e, nel processo, hai contribuito a formare l'intelligenza artificiale di Google per essere ancora più intelligente.
E pensavi di essere semplicemente loggato in qualche sito web o altro.
origini
Recaptcha (o “reCATCHA” se si preferisce) è iniziato come collaborazione da alcuni scienziati informatici della Carnegie Mellon University di Pittsburgh, rilasciati per la prima volta nel 2007, ed è stato rapidamente introdotto da Google nel 2009. La premessa era come descritto sopra: sposando gli utenti che è necessario dimostrare che sono umani per i dati che devono essere trascritti, entrambe le parti ne ricavano qualcosa.
Quindi, invece di digitalizzare i libri facendo svolgere da una persona il compito molto noioso di digitare o controllare manualmente un intero libro, invece milioni di persone possono collaborare inconsapevolmente per raggiungere lo stesso obiettivo. Ricorda come erano sempre le due parole che dovevi inserire? In teoria, solo uno era il “vero” test, e l'altra era una nuova parola che doveva ancora essere trascritta - ma come utente non sapresti quale era, quindi dovresti tentare di fare entrambe le cose con precisione.
L'app Google Libri su Android.
Recaptcha può persino controllare il proprio lavoro. Mostrando le stesse parole a più utenti, può verificare automaticamente che una parola sia stata trascritta correttamente confrontando più tentativi di più utenti in tutto il mondo.
Sorprendentemente, grazie alle confezioni Recaptcha che compaiono su migliaia di importanti siti Web e ricevendo decine di milioni di completamenti al giorno, entro il 2011 Recaptcha ha terminato di digitalizzare l'intero archivio di Google Libri - oltre a 13 milioni di articoli dal back-catalogo del New York Times risalenti al 1851.
Quindi cosa ha fatto Google dopo, senza libri rimasti per digitalizzare? In quella che fu forse una felice coincidenza, ciò coincise con la crescita dell'intelligenza artificiale e dell'apprendimento automatico.
Montaggio di allenamento
Nel 2012, Google ha iniziato a includere non solo parole, ma frammenti di foto da Google Street View - facendo in modo che gli utenti trascrivessero numeri di porta e altri segnali. E nel 2014, il sistema è diventato l'allenamento AI.
In sostanza, il modo in cui l'apprendimento automatico funziona è che si consegnano alla macchina una serie di dati già ordinati, ad esempio un mucchio di immagini di gatti che sono stati etichettati come gatti, e quindi utilizza queste informazioni per creare una rete neurale che consente per prelevare i gatti da altre immagini. Più immagini di gatti le dai da mangiare, più l'intelligenza artificiale diventa più precisa nel scegliere i gatti da altre immagini.
Un gatto. Nel caso non fossi sicuro.
Google ha innumerevoli motivi per voler addestrare l'IA a riconoscere oggetti nelle immagini: risultati migliori di Google Ricerca Immagini, risultati più precisi di Google Maps e la possibilità di cercare nella libreria di Google Foto tutte le foto che hai fatto di un oggetto o luogo specifico . Oh, e la piccola questione di assicurarsi che la tua auto senza conducente non colpisca nulla. Sai quando Recaptcha ti chiede di identificare i segnali stradali? Fondamentalmente stai giocando un ruolo molto piccolo nel pilotare un'auto senza conducente da qualche parte, ad un certo punto nel futuro.
Quindi è estremamente conveniente che Google abbia a disposizione centinaia di milioni di utenti di Internet a lavorare per questo: usando Recaptcha per affrontare questi problemi, Google può usare il nostro bisogno di dimostrare che siamo umani per costringerci a usare il nostro essere umano intuizioni per costruire il suo database.
Il sistema di auto senza conducente Waymo di Google.
Questo è il motivo per cui attualmente, invece di limitarsi a lanciare del testo, Recaptcha offre agli utenti più attività relative alle immagini: “Clicca tutte le immagini dei gatti”, “Fai clic su tutte le caselle sulla griglia sovrapponendo un'immagine che contiene un gatto”, e così via. Per migliaia di oggetti diversi.
Questo è un vantaggio particolarmente utile per Google, in quanto compete con altri giganti di Internet per far crescere i propri set di dati e algoritmi di apprendimento automatico: più dati possono essere analizzati, migliori saranno i risultati - dando ai suoi prodotti attuali e futuri un vantaggio competitivo.
Usare l'intelligenza artificiale per battere l'intelligenza artificiale
Divertente, c'è solo un problema con l'utilizzo di captcha per addestrare algoritmi di apprendimento automatico. Cosa si intende per esempio, per le persone che vogliono aggirare i captcha usando l'apprendimento automatico contro i captcha?
Lo sviluppatore dello scorso anno Francis Kim ha costruito una dimostrazione di concetto per battere Recaptcha usando le abilità di apprendimento automatico di Google contro di esso. In sole 40 righe di Javascript, è stato in grado di costruire un sistema che utilizza l'API di riconoscimento delle immagini Clarifai rivale per guardare le immagini che Google Recaptcha solleva e identificare gli oggetti richiesti dal captcha. Quindi se Recaptcha richiede all'utente di selezionare immagini di vetrine per dimostrare la loro umanità, Clarifai è in grado di sceglierle.
Anche ipoteticamente, questo genere di cose sarebbe anche possibile utilizzando la stessa tecnologia di Google. Poiché Google vuole vendere la sua tecnologia intelligente ad altre società, apre TensorFlow agli sviluppatori attraverso una stessa API. Ciò significa che potresti usare TensorFlow per ingannare il Captcha che forma TensorFlow. Ciò non funzionerebbe il 100% delle volte - ma una volta che un'IA è sufficientemente ben addestrata, dovrebbe essere in grado di fare il trucco in un gran numero di casi.
Ciò che è chiaro da Recaptcha non è solo che è un'idea geniale, ma anche che grazie al nostro duro lavoro, sta diventando sempre più difficile separare noi umani dalle macchine.
- TechRadar di Settimana AI è portato in associazione con Honor.