<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: Spider Sotto Controllo II</title>
	<atom:link href="http://www.marketingroutes.com/2007/04/04/spider-sotto-controllo-ii/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.marketingroutes.com/2007/04/04/spider-sotto-controllo-ii/</link>
	<description>Marketing, Comunicazione e Advertising</description>
	<lastBuildDate>Wed, 13 Apr 2011 15:50:28 +0200</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>By: Aggregatore News sui Motori di Ricerca &#187; Spider Sotto Controllo II</title>
		<link>http://www.marketingroutes.com/2007/04/04/spider-sotto-controllo-ii/comment-page-1/#comment-96588</link>
		<dc:creator>Aggregatore News sui Motori di Ricerca &#187; Spider Sotto Controllo II</dc:creator>
		<pubDate>Thu, 27 Sep 2007 10:00:20 +0000</pubDate>
		<guid isPermaLink="false">http://www.marketingroutes.com/2007/04/04/spider-sotto-controllo-ii/#comment-96588</guid>
		<description>[...] dopo il post, Google lancia Webmaster Tool &#8230;  Per leggere tutto il post Originale vai su: Marketing Routes               Post a [...]</description>
		<content:encoded><![CDATA[<p>[...] dopo il post, Google lancia Webmaster Tool &#8230;  Per leggere tutto il post Originale vai su: Marketing Routes               Post a [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Johnnie Maneiro</title>
		<link>http://www.marketingroutes.com/2007/04/04/spider-sotto-controllo-ii/comment-page-1/#comment-40378</link>
		<dc:creator>Johnnie Maneiro</dc:creator>
		<pubDate>Thu, 12 Apr 2007 17:47:36 +0000</pubDate>
		<guid isPermaLink="false">http://www.marketingroutes.com/2007/04/04/spider-sotto-controllo-ii/#comment-40378</guid>
		<description>@fradefra
Hai ragione &quot;motore &lt;&gt; spider&quot;, ma in tanti pensano che siano la stessa cosa. Infatti ci sono motori di ricerca che acquistano tecnologia offerta da terzi, ad esempio la tecnologia Inktomi che però è stata acquisita da Yahoo nel 2002.

@Stefano
Proprio il grafico 2 segnala che uno spider non si comporta come un canguro, quindi non salta di pagina in pagina, fa come nel grafico uno: parte, legge “html” e torna con il bottino :) 
Poco fa si parlava di nuova generazione di spider intelligenti, sicuramente c&#039;è stato un cambiamento nello spidering da un po’ di tempo a questa parte. Nel prossimo post parlerò delle mie osservazioni.

grazie dei commenti ;)</description>
		<content:encoded><![CDATA[<p>@fradefra<br />
Hai ragione &#8220;motore <> spider&#8221;, ma in tanti pensano che siano la stessa cosa. Infatti ci sono motori di ricerca che acquistano tecnologia offerta da terzi, ad esempio la tecnologia Inktomi che però è stata acquisita da Yahoo nel 2002.</p>
<p>@Stefano<br />
Proprio il grafico 2 segnala che uno spider non si comporta come un canguro, quindi non salta di pagina in pagina, fa come nel grafico uno: parte, legge “html” e torna con il bottino <img src='http://www.marketingroutes.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /><br />
Poco fa si parlava di nuova generazione di spider intelligenti, sicuramente c&#8217;è stato un cambiamento nello spidering da un po’ di tempo a questa parte. Nel prossimo post parlerò delle mie osservazioni.</p>
<p>grazie dei commenti <img src='http://www.marketingroutes.com/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Stefano "Free.9" Scardovi</title>
		<link>http://www.marketingroutes.com/2007/04/04/spider-sotto-controllo-ii/comment-page-1/#comment-40306</link>
		<dc:creator>Stefano "Free.9" Scardovi</dc:creator>
		<pubDate>Thu, 12 Apr 2007 15:13:23 +0000</pubDate>
		<guid isPermaLink="false">http://www.marketingroutes.com/2007/04/04/spider-sotto-controllo-ii/#comment-40306</guid>
		<description>C&#039;è anche la convinzione che lo spider sia qualcosa che &quot;si muove&quot; di pagina in pagina (un po&#039; anche come il ragno rappresentato nelle immagini in alto) ma in realtà lo spider non entra mai nel server e dunque non può indicizzare le pagine che non riesce a vedere dall&#039;esterno.

E per vederle c&#039;è ovviamente bisogno di qualcuno che glie le faccia vedere.

Lo spider si limita a prelevare il sorgente html (come qualunque browser) di una pagina di cui gli sia noto l&#039;indirizzo.

Il motore di ricerca quando ritiene di recuperare pagine nuove o di aggiornare quelle già presenti passa l&#039;URL al proprio spider che si limita a prelevarle inserendole in un certo modo nel DB, poi il motore elaborerà il DB ottenuto e presenterà le pagine alle interrogazioni degli utenti.

Nell&#039;attività di spidering non c&#039;è nulla di intelligente se non forse qualche filtro che fa scartare le pagine presenti in robots.txt e le pagine di spam con meri fini di indicizzazione.</description>
		<content:encoded><![CDATA[<p>C&#8217;è anche la convinzione che lo spider sia qualcosa che &#8220;si muove&#8221; di pagina in pagina (un po&#8217; anche come il ragno rappresentato nelle immagini in alto) ma in realtà lo spider non entra mai nel server e dunque non può indicizzare le pagine che non riesce a vedere dall&#8217;esterno.</p>
<p>E per vederle c&#8217;è ovviamente bisogno di qualcuno che glie le faccia vedere.</p>
<p>Lo spider si limita a prelevare il sorgente html (come qualunque browser) di una pagina di cui gli sia noto l&#8217;indirizzo.</p>
<p>Il motore di ricerca quando ritiene di recuperare pagine nuove o di aggiornare quelle già presenti passa l&#8217;URL al proprio spider che si limita a prelevarle inserendole in un certo modo nel DB, poi il motore elaborerà il DB ottenuto e presenterà le pagine alle interrogazioni degli utenti.</p>
<p>Nell&#8217;attività di spidering non c&#8217;è nulla di intelligente se non forse qualche filtro che fa scartare le pagine presenti in robots.txt e le pagine di spam con meri fini di indicizzazione.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Fradefra</title>
		<link>http://www.marketingroutes.com/2007/04/04/spider-sotto-controllo-ii/comment-page-1/#comment-40301</link>
		<dc:creator>Fradefra</dc:creator>
		<pubDate>Thu, 12 Apr 2007 15:03:43 +0000</pubDate>
		<guid isPermaLink="false">http://www.marketingroutes.com/2007/04/04/spider-sotto-controllo-ii/#comment-40301</guid>
		<description>Una cosa che mi piacerebbe fosse approfondita, e magari ci penso anche io, è che lo spider non è il motore, ma un agente.
Molti confondono lo spider col motore, dandogli quasi una propria intelligenza, che invece non ha.

Lo spider è solo un lettore di pagine su commissione di un meccanismo interno che lo fa muovere.

Questa cosa, apparentemente banale ed ovvia per alcuni, non lo è per molti e falsa molte delle idee che ci sono in giro.
Che ne pensi, Johnnie?</description>
		<content:encoded><![CDATA[<p>Una cosa che mi piacerebbe fosse approfondita, e magari ci penso anche io, è che lo spider non è il motore, ma un agente.<br />
Molti confondono lo spider col motore, dandogli quasi una propria intelligenza, che invece non ha.</p>
<p>Lo spider è solo un lettore di pagine su commissione di un meccanismo interno che lo fa muovere.</p>
<p>Questa cosa, apparentemente banale ed ovvia per alcuni, non lo è per molti e falsa molte delle idee che ci sono in giro.<br />
Che ne pensi, Johnnie?</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Stefano "Free.9" Scardovi</title>
		<link>http://www.marketingroutes.com/2007/04/04/spider-sotto-controllo-ii/comment-page-1/#comment-38333</link>
		<dc:creator>Stefano "Free.9" Scardovi</dc:creator>
		<pubDate>Wed, 04 Apr 2007 06:52:45 +0000</pubDate>
		<guid isPermaLink="false">http://www.marketingroutes.com/2007/04/04/spider-sotto-controllo-ii/#comment-38333</guid>
		<description>Solo una nota sulla frase &quot;Non esistono visite di spider con referrer provenienti da altri siti.&quot;

Il referer è una feature del programma che naviga che ha la cortesia di dire ad un server chi sia stato a segnalargli quella pagina.

Non è necessario per uno spider farlo e non sono sicuro che sia obbligatorio neppure per un browser (salvo che forse molti servizi smetterebbero di funzionare).

E&#039; comunque utile sapere tramite chi si è stati indicizzati, magari per farsi indicizzare maggiormente dalla stessa &quot;fonte&quot;, in questo caso si possono utilizzare url formattati appositamente.</description>
		<content:encoded><![CDATA[<p>Solo una nota sulla frase &#8220;Non esistono visite di spider con referrer provenienti da altri siti.&#8221;</p>
<p>Il referer è una feature del programma che naviga che ha la cortesia di dire ad un server chi sia stato a segnalargli quella pagina.</p>
<p>Non è necessario per uno spider farlo e non sono sicuro che sia obbligatorio neppure per un browser (salvo che forse molti servizi smetterebbero di funzionare).</p>
<p>E&#8217; comunque utile sapere tramite chi si è stati indicizzati, magari per farsi indicizzare maggiormente dalla stessa &#8220;fonte&#8221;, in questo caso si possono utilizzare url formattati appositamente.</p>
]]></content:encoded>
	</item>
</channel>
</rss>

