Dietro le quinte di molti siti web, i filtri collaborativi sfruttano le preferenze di persone simili a te per aiutarti a consigliare altri prodotti, storie o link di cui potresti godere.

Avrai visto questi filtri in azione nella funzione "I clienti che hanno acquistato questo oggetto hanno anche acquistato", in "Consigli in arrivo" di Digg e in molti altri luoghi.

A South By South West Interactive un pannello composto da rappresentanti di Digg, The Filter, Baynote, Netflix e Last.fm si sono riuniti per parlare dell'importanza di questi motori di raccomandazione.

Anton Kast, scienziato capo di Digg, ha spiegato come questi filtri sono iniziati con la posta elettronica e il filtraggio Usenet basato sulle valutazioni delle persone, prima di spostarsi dalla sfera della ricerca e nel web quotidiano.

"L'idea del filtro collaborativo è semplicemente combinare gli input di molte persone diverse per filtrare le informazioni meglio di quanto sarebbe altrimenti possibile, in particolare, si utilizzano le informazioni di molti giudizi indipendenti da molte persone, per fare qualcosa che non si sarebbe potuto fare solo con l'informatica, i metadati e fatti che non provenivano da veri umani. "

Kast continua: "Questa tecnica è ovunque, può sembrare oscura, può sembrare specializzata, ma in realtà è così semplice che è quasi universale."

Esempi comuni includono i filtri antispam di Gmail, il PageRank, la codifica dei video di YouTube, il voto su e giù per i commenti sui forum e sui sistemi di aiuto.

Questo è il filtro collaborativo, ma cos'è la raccomandazione?

"Qualsiasi filtro collaborativo in cui l'output è personalizzato", afferma Kast, indicando raccomandazioni su Amazon, di musica su Last.fm e film su Netflis come esempi.

E, naturalmente, il filtraggio collaborativo appare su Digg. "Su Digg chiunque può presentare una storia", afferma Kast. "E chiunque può votare su qualsiasi storia - questa è la parte filtrante, e qualunque sia la vittoria più popolare. È un filtro collaborativo gigantesco nel senso più semplice e classico, ma se accedi, guarderemo la tua cronologia delle votazioni, ti correleremo con altre storie di voto della gente, e trova storie che piacciono a queste altre persone e mostrale quelle, così ottieni un filtro collaborativo personalizzato. "

Ma ci sono quattro problemi di base con questo approccio, dice Kast.

La prima è la scarsità: "le persone che fanno il filtraggio sono scarse rispetto alla quantità di contenuti che ha bisogno di filtri", spiega Kast. "Se ci sono molte più storie Digg di quante persone ci votino, ovviamente non stiamo ottenendo una buona copertura.

"Il secondo è il problema del primo rapporto, in cui qualcosa è appena stato presentato e non si dispone di molte informazioni sul voto per scopi di filtraggio."

Terzo è ciò che Kast definisce "il problema delle pecore grigie" - dove tutto ciò che è più popolare va sulla home page, "e quindi cose che non sono particolarmente popolari ma che un piccolo gruppo di persone è pazzo - come si fa a servirlo? piccolo gruppo di persone? "

E infine, dice Kast, c'è opposizione dell'utente. "Digg ha questa affascinante storia in cui ogni tanto un gran numero di persone diventa incredibilmente entusiasta di una cosa e finisce sulla nostra home page e combatte obiettivi che dobbiamo rappresentare piccoli gruppi o avere contenuti diversi ma questo è solo un problema fondamentale - quando fai affidamento sulle persone, c'è volontà popolare ".