28.12.05

[tendenze] I blog possono inquinare i motori di ricerca

In molti si chiedono ancora attraverso quali arcani algoritmi Google costruisce le sue classifiche.
Ebbene, anche io per farmene un'idea, sono andato a spulciare le query Google che conducono i miei lettori a leggere conneXioni, e vi ho trovato degli indizi molto interessanti; per cui ho deciso di esordire con un titolo opportunisticamente sensazionalistico.
Non mi meraviglia essere tra i primi posti dei risultati di Google per aver dato un'opinione sul nome del nuovo servizio VoIP Skypho, o anche essere il 4° in classifica per la query "aviano base militare mappa" per averne parlato il giugno scorso, o infine essere citato per i 4000 blog di Letizia Moratti.
I motori di ricerca, con Google in testa, sono il veicolo che conduce a questo blog ben il 33% dei suoi lettori: tale funzione deriva dalla fiducia che tutti abbiamo riversato nella loro potenziale autorevolezza.
Ho scandagliato quindi i motivi per cui i lettori arrivano qui dopo aver effettuato una ricerca sui vari motori e, oltre alle ricerche assolutamente contestuali ai contenuti del blog, ne appaiono alcune decisamente bizzarre.
Risultare quindi tra i primi posti per le query che seguono mi lascia un po' perplesso, sia per il risultato, sia per la scarsità di educazione ai metodi di ricerca degli utenti (le riporto così come sono state effettuate sul relativo motore. Grazie a Sitemeter e Google Analytics per l'individuazione dei referral). Dateci un'occhiata (ne vale la pena) e alla fine vi parlerò dei pericoli a cui stanno andando incontro i motori di ricerca a causa dell'errata indicizzazione del contenuto dei blog.
Questi risultati mi portano a una riflessione: i motori di ricerca conducono un eccellente lavoro di indicizzazione, ma tale eccellenza non è più sostenibile quando vengono presi in considerazione gli archivi dei blog, e non solamente i singoli articoli.
E' necessario anche affermare che per il momento l'incidenza non è molto alta, ma ciò di cui parlo costituisce un segnale d'allarme.
I blog possono avere dei PageRank molto alti, perchè molto linkati da altri siti. Questo, per il motore, implica una maggior affidabilità della fonte, ma in realtà si traduce in un'indicizzazione di contenuti estremamente disparati: in un archivio possono comparire da una settimana a un mese di commenti sugli argomenti più diversi, e, dipendentemente dalla grafomania dell'autore, il numero dei singoli documenti può variare da alcune unità a diverse decine.
Ritengo una mancanza grave che Google, proprietario di Blogger, la piattaforma che io utilizzo, non abbia ancora pensato che gli archivi contengano materiale così eterogeneo da inficiare la buona qualità delle ricerche.
E come affrontare i commenti spam? Ora, fortunatamente, tutte le piattaforme di blog gestiscono un sistema che limita l'inoltro automatico di commenti per contenere il dilagante problema dello spam anche sui blog. Ma, tale sistema è inseribile solo su richiesta dell'autore (almeno per quanto riguarda Blogger), mentre dovrebbe essere di default su tutti i blog.
Il pericolo a cui andiamo incontro è un peggioramento della qualità delle ricerche che però avrà il potere, come contropartita positiva, di costringere gli utenti dei motori ad affinare le proprie capacità nella ricerca.
In fondo, non sono poi così complesse le regole da seguire per effettuare una ricerca che fornisca risultati contestuali alla domanda.

2 commenti:

[m]m ha detto...

certo che con questo post prevedo una nuova ondata di inquinamento in arrivo, sulle stesse keyword bizzarre... :)

Stefano ha detto...

Acuta osservazione. Sono destinato quindi a diventare l'archetipo dell'inquinatore? Che destino cinico e baro