5 February 2007
La grande memoria di Google: i dati di storico
Uno degli aspetti che più mi affascinano di Google è la sua smisurata capacità di raccolta dati, che per molti utenti sembra ancora passare del tutto inosservata. Volutamente non parlo di elaborazione dati, perché imho, rispetto alla quantità e alla tipologia dei dati collezionati in quasi un decennio, molti passi in avanti non sono stati fatti. Per cui è legittimo pensare che la fase ‘Carissimo amico’ sia ancora in pieno corso. In definitiva, il search è molto meno ‘evoluto’ di quanto si voglia pensare.
Questa breve considerazione, per segnalarvi un bel post su Pandia: “Google may identify search engine spammers using historical data”, che introduce il passaggio successivo alla raccoltà, ossia la fase di elaborazione vera e propria, la relazione tra spam e l’uso di dati storici, analizzando le ‘contromosse’ che Google è in grado di mettere in atto grazie ai dati di storico che raccoglie, ogni istante, sempre, di tutto e…tutti.
Per quanti di voi appassionati di elaborazione dati o per quanti vogliano più semplicemente comprendere al meglio cosa siano i dati di storico per un motore di ricerca come Google, consiglio la lettura di un thread di Nicola proprio su BigTable.
Cheers!
Ultimi articoli pubblicati su Google:


























La profondità storica dei contenuti pubblicati su internet é particolarmente utile per condurre analisi sulla trasformazione della comunicazione e per verificare le evoluzioni delle linee editoriali di alcuni siti.
Google é “unico” proprio per la sua capacità di mantenere le informazioni nel tempo, anche se nel recente passato sono state diverse le interpretazioni della giurisprudenza sulla liceità di detta conservazione.
Si tratta del cosiddetto “diritto all’oblio”, spesso discusso sulle pagine web del sito Punto Informatico.
Per possibili approfondimenti, segnalo due utili collegamenti:
http://punto-informatico.it/p.aspx?id=1460780&r=PI
http://infolab.stanford.edu/~backrub/google.html
Comment by Claudio Iacovelli — 5 February 2007 @ 22:03