26.1.06

I motori di ricerca, la memoria collettiva

Tempo fa stavo guardando la visione del mondo secondo Google, (la chiamo così perché è molto più una weltanschauung che una zeitgeist) e, all'11° posto tra i termini più ricercati appare "Tori Spelling".
Uhm, questo nome non mi giungeva nuovo: che fosse la figlia del famoso produttore di telefilm Aaron Spelling (sapete? Quello di Charlie's angels, Starsky e Hutch, Fantasilandia, Love Boat, Cuore e Batticuore e di altre 100 serie).
Ci clicco sopra e appare una pagina in cui, come primo risultato, compare una poco lusinghiera immagine dell'attrice americana che, senza mutande, suona una batteria.
Interessante! Da perfetto voyeur, la clicco e scopro che la pagina che la doveva ospitare non esiste. Ovvero, non esiste più, poichè una volta esisteva, o, per meglio dire, tra i suoi attributi vi era anche quello dell'esistenza.
Mi domando quando avrà dovuto pagare la Spelling per farsi rimuovere
E mi dico anche che Google non può essere corruttibile: una volta apparso nel suo indice, è molto faticoso farsi rimuovere, se non con pagine aventi un PageRank più alto. Ogni giorno migliaia di richieste di rimozione arrivano a Google, ma se il motore di ricerca dovesse esaudirle tutte quante sarebbe costretto a impiegare centinaia di persone solo per queso compito.
Leggetevi cosa afferma Google a proposito:
Richieste di rimozione di collegamenti o di copie cache

Di quando in quando Google riceve richieste di utenti relative alla rimozione di collegamenti dagli indici. Sebbene si riservi il diritto di valutare tali richieste singolarmente, Google tende generalmente ad evadere tali richieste in accordo ai principi indicati di seguito.

Gli indici di Google sono costituiti da informazioni che sono state identificate, indicizzate e compilate tramite una procedura automatica senza alcuna revisione preventiva. Considerata la straordinaria quantità di informazioni regolarmente aggiunte, eliminate e modificate, Google non è in grado e non filtra il contenuto dei propri indici. Google può decidere, caso per caso, di rimuovere singoli siti Web dai propri indici se (i) il proprietario del sito ne limita l'accesso o (ii) se il sito viene rimosso dal Web su richiesta del proprietario stesso o da terzi. Tuttavia, se il gestore del sito non prende le misure necessarie per prevenire l'indicizzazione del sito, è possibile che il sistema di indicizzazione automatica di Google trovi ed includa nuovamente tale sito nei propri indici.

Google archivia molte pagine Web nella propria cache per consentire agli utenti di utilizzare le copie di backup in caso di problemi temporanei sul server. I proprietari dei siti Web possono impedire l'archiviazione delle versioni cache dei loro siti utilizzando il metatag NOARCHIVE. Inoltre, i proprietari dei siti possono richiedere l'immediata rimozione delle versioni cache della pagina dai Servizi di ricerca di Google. Google valuta tali richieste di rimozione individualmente e non garantisce la soddisfazione di ogni richiesta. La procedura necessaria per rimuovere le versioni cache e per impedire che un sito venga salvato nella cache e/o incluso nell'indice è descritta nella sezione Domande frequenti (FAQ) su Google, che può essere selezionata dalla pagina principale di Google.

Google e gli altri motori di ricerca, per merito/colpa della loro cache, diventano quindi una memoria collettiva, nella duplice accezione di "essere della collettività" e di collezionare. Colleziona e non rimuove, non come i siti di cui colleziona il contenuto, e, nel caso venga sollecitato opportunamente, fa apparire cose che parevano/volevano risultare rimosse.
L'esempio che ha scatenato questo articolo è frivolo e misero, ma immaginate cosa potrebbe succedere quando, per sbaglio, incuria o dolo, venissero pubblicate informazioni che non dovrebbero essere divulgate: se nel periodo di permanenza online uno spider di un motore di ricerca riesce a catturarle, ecco combinato il pasticcio.
Ecco quindi un esempio eccellente che poco ha a che vedere col mondo del gossip: nel 2003 Richard Smith, un esperto di tematiche di privacy e sicurezza, trovò delle pagine nella cache di Google tratte da sito dell'Information Awareness Office del Pentagono che erano state rimosse a seguito della pubblicazione di un reportage sullo sviluppo di un sistema informativo dedicato allo spionaggio delle attività dei cittadini americani per l'individuazione di attività terroristiche.

Credo quindi necessaria, da parte dei motori, una politica che accolga con favore e celerità le richieste di rimozione dati dalle cache, quando queste richieste siano ben argomentate; ma anche per chi ha un sito che si evolve frequentemente è necessario un processo di monitoraggio della cache dei motori di ricerca, in modo che il loro contenuto sia coerente con il contenuto delle proprie pagine.
Volete sapere come fare? Mandatemi un'email

Aggiornamento delle 10:30 - secondo la giustizia americana la cache di Google non viola le leggi sul copyright. E ci mancherebbe altro.

4 commenti:

Fattori Arcani ha detto...

E' vero che puoi impedire a google di inserire le tue pagine nella cache, ma è pur vero che da che mondo è mondo si dovrebbe chiedere il permesso.

Se mi inserisce nei suoi risultati io ne traggo vantaggio e quindi può starmi bene, ma dalla cache io non traggo nessun beneficio.

Guido ha detto...

A parte il fatto che ritengo discutibile la sostituzione di Zeitgeist con Weltanschauung, l'ultima parola si scrive con due U...

Stefano ha detto...

Sul refuso hai ragione, mi è rimasta la seconda "u" di Weltanschauung nella tastiera.

Io la definisco Weltanschauung non perchè mi piaccia buttar lì due termini mutuati dalla psicanalisi, ma perché da tanti "segni dei tempi" che ci vengono mostrati mese dopo mese è possibile, per ognuno, desumere la visione del mondo secondo Google, che è poi la visione del mondo di una notevole maggioranza di utilizzatori di Internet.

Stefano ha detto...

Dimenticavo, Guido. E dell'argomento del post cosa ne pensi?