« Il cioccolato, il sesso e la salute dei denti!
Google Accessible Search: motore di ricerca per ciechi »

19 July 2006

Web Semantico: I webmaster sono degli incompetenti; parola di Google

Web SemanticoNon so quanti hanno letto in queste ore la notizia secondo cui Google, nella persona di Peter Norvig, (Director of Search) ha affermato che “i webmaster sono degli incompetenti”. Alcuni di voi si domanderanno che relazione possa intercorrere tra web semantico e l’incompetenza dei webmaster di tutto il mondo. Per contestualizzare, il monito è stato lanciato in occasione di una conferenza tenutasi a Boston, sponsorizzata dall’American Association for Artificial Intelligence (AAAI) per dibattere l’annoso tema del web semantico. A tale conferenza ha preso parte anche Tim Berners Lee, direttore del World Wide Web Consortium  che già nel ‘99, poco dopo la nascita di Google, esponeva la sua visione di web semantico :





"I have a dream for the Web in which computers become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize".

Come penso anche voi, sono rimasto basito dall’affermazione così forte che Norvig ha espresso (ve lo ricordate il Don’t be evil? Hihihihi), e a pensarci bene un intervento a livello di PR per salvare la faccia a seguito di una così rovinosa gaffe ancora non c’è stato. Inutile dire che sarebbe il caso che questo avvenisse il prima possibile, se non altro per ‘parare’ notevoli danni di immagine che questo causerà al big della Montagna con Vista a cui peraltro gli scandali negli ultimi mesi non sono mancati, oltre a essere stati piuttosto rumorosi e di bassa lega (primo fra tutti il Click Fraud del sistema Adwords, poi gli annunci pedopornografici e tanti altri a seguire…)

Cerchiamo di comprendere l’assurdità di quanto affermato da Peter Norvig, che suona più come un voler lanciare la patata bollente su terzi per distogliere l’attenzione sulla carente qualità del search offerto. A un’occhiata superficiale potrebbe apparire che di ‘cose’ nel Plex ne sono state fatte moltissime. In parte è vero, ma si tratta di ‘passi avanti’ quantitativi e non qualitativi. Tornando all’intervento del Director of Search:

"What I get a lot is: ‘Why are you against the Semantic Web?’ I am not against the Semantic Web. But from Google’s point of view, there are a few things you need to overcome, incompetence being the first," […] Norvig clarified that it was not Berners-Lee or his group that he was referring to as incompetent, but the general user. "We deal with millions of Web masters who can’t configure a server, can’t write HTML. It’s hard for them to go to the next step."

Adesso tenendo a mente il virgolettato che avete appena letto, date uno sguardo alle guideline per webmaster che da anni Google suggerisce di seguire, in modo da aiutarlo a superare i suoi limiti sostanziali e a migliorare il search (che però sta inchiodato ad un mattino di 7 anni fa).

Se date una letta a quelle linee guida (che comunque aiuteranno forse alcuni di voi a non incappare in penalty da parte del motore) noterete come non vi sia menzione alcuna al web semantico né a dettami tecnici per qualsivoglia webmaster che sarebbe utile seguire affinchè il tanto agognato passaggio dal significante al significato possa avvenire, grazie al supporto dei minus habens che popolano il web.

Il senso che traggo da quelle guideline (peccato che Google si fermi al lessico) è piuttosto: abbiamo un motore che funziona in un certo modo; non siamo in grado di gestire l’informazione mondiale (e quindi fare fede alla nostra mission?) se voi webmaster non costruite le vostre pagine come serve a noi…

Inoltre il considerare degli incompetenti i webmaster, cozza un po’ con quanto affermato sempre da Norvig, in un altro passaggio del suo discorso quando sostiene che la transizione al web semantico non solo è difficilmente realizzabile per incapacità dei webmaster, ma anche per il fatto che Google quotidianamente lotta contro coloro che avendo compreso i loro algoritmi, riescono a ‘ingannare’ il motore di ricerca (mmmm ma allora non sono proprio tutti incapaci questi webmaster…) :

“We deal every day with people who try to rank higher in the results and then try to sell someone Viagra when that’s not what they are looking for.”

Morale della favola, se pensate di trovare contenuti scritti da Google sul Web Semantico, sulle sue pagine non troverete nulla se non un accenno al semantico utilizzato dal  programma ‘Adsense for domain’ dedicato ai domini parcheggiati, se non in pagine di rimando contenute nella ‘sua’ directory (che poi è il clone meno aggiornato di DMOZ) che nulla hanno a che fare con Google e la sua mission.

Magari la prossima volta un po’ di autocritica….

Se vi interessa apporofondire il tema del web semantico, potete chiedere a Federico (il nostro guru della semantica), oppure recarvi sul sito del W3C o anche consultare Wikipedia. Up to you!

Social Bookmarking
blinkbits  BlinkList  blogmarks  co.mments  connotea  del.icio.us  De.lirio.us  digg  Fark  feedmelinks  Furl  LinkaGoGo  Ma.gnolia  NewsVine  Netvouz  RawSugar  Reddit  scuttle  Shadows  Simpy  Smarking  Spurl  TailRank  Wists  YahooMyWeb 

Non vorrei passare per avvocato di Google ma:
- google sta inchiodato (?) a 7 anni fa, così come lo sono msn, yahoo e ask
- google non ha un *vero* motore semantico per il web perchè non esiste un *vero* web semantico; anche se qualcosa di semantico Google ha cercato di proporlo: GoogleBase

Secondo te quali sono i suggerimenti che Google dovrebbe dare ai webmaster per spingerli verso il web semantico?

E se il (IMHO solo presunto) atteggiamento anti-semweb di Google fosse in qualche modo “strategico”? Google è leader nelle ricerche lessicali; perchè dovrebbe favorire lo sviluppo di una nuova tecnologia che potrebbe anche rappresentare la fine della sua leadership? (con ciò non voglio dire che un eventuale atteggiamento di questo tipo sia positivo, anzi …)
Una cosa “semantica” di successo abbiamo visto negli ultimi tempi: RSS. Nella ricerca negli RSS, Google ha visto nascere forti competitori (vedi Technorati).

Comment by bobo — 19 July 2006 @ 18:11

[quoto]
Secondo te quali sono i suggerimenti che Google dovrebbe dare ai webmaster per spingerli verso il web semantico?
[/quoto]

Ma google (o chi gestisce un motore di ricerca) non deeve dire cosa fare ai webmaster ;) occhio che non è questa la missione di google …

Ad esempio tu non dici ad un falegname come vuoi la tua sedia (tranne in pochi casi) ma ti limiti ad andare in un negozio tipo sedie & affinie scegli la tua sedia giudicandola in base al tatto, al colore (vista), al gusto (cervello) ..

Quindi da qui puoi vedere come un webmaster (rispettando tutti i canoni) può creare quello che vuole .. è google a doversi “adattare” alle varie pagine e trarre le sue informazioni da quello che “vede” :)

[quoto]
Una cosa “semantica” di successo abbiamo visto negli ultimi tempi: RSS. Nella ricerca negli RSS, Google ha visto nascere forti competitori (vedi Technorati).
[/quoto]

L’rss è semantico?? cioè se tu hai un rss contenente date riguardanti la seconda guerra mondiale ma non hai nessun riferimento ad essa al suo interno e poni la fatidica domanda “quando è iniziata la seconda guerra mondiale???” l’rss ti risponde giusto ?? :D

l’rss è sempre lessicale è un semplice XML con parole, tag e quant’altro .. e se technorati è riuscito a tener testa a google è solo perchè (secondo me) ha iniziato prima quest’avventura .. ;)

Comment by [CapoBecchino] — 20 July 2006 @ 08:49

Ciao Bobo, nessun problema, non fai la parte dell’avvocato del diavolo. Inchiodato (ossia fermo) a 7 anni fa. Comunque è vero che Yahoo et alii non sono meglio, nè hanno fatto chissà quali progressi. Solo che da loro non senti dire che i webmaster sono degli incompetenti. E ponendola ‘antipaticamente’ sul piano della competenza, come se poi la qualità degli algoritmi di google e del suo search fosse responsabilita’ dei webmaster, ti posso dire da user che Google si sta ponendo su un piano del tutto sbagliato.

Sul fatto dell’atteggiamente strategico la penso esattamente come te. Credo assolutamente non gli convenga spingere un discorso di tipo semantico, ma rimanere il primus inter pares, o per dirla in termini più semplici il meno mediocre, non può essere certo un atteggiamento che possiamo accettare ancora molto a lungo. Venendo a Google Base (che poi è solo uno dei tanti flop del Plex) o agli RSS: non basta sfruttare l’xml perchè si possa parlare di semantica, e sia Google Base che RSS di semantico non hanno assolutamente nulla.

Poi per quanto riguarda i consigli che io dovrei dare a Google per migliorare beh, non sta certo a me farlo; hanno oltre 5000 geni che lavorano per loro… Basterebbe che si concentrassero meno sui loro prodotti fallimentari che praticamente nessuno usa e un po’ di più sul search.

Comment by Jacopo Gonzales — 20 July 2006 @ 09:32

[quoto=CapoBecchino]
L’rss è semantico?? [cut] l’rss è sempre lessicale è un semplice XML con parole, tag e quant’altro
[/quoto]

[quoto=Jacopo Gonzales]
sia Google Base che RSS di semantico non hanno assolutamente nulla
[quoto]

Nella visone del W3C il web semantico si basa su RDF; esiste una forma di rappresentazione di RDF basata su XML.
Quindi potremmo dire, semplificando, che il web semantico non è altro che un web fatto di file XML che contengono triple RDF.
RSS è sì un semplice XML ma contiene triple RDF (vedi RSS 1.0).
Per togliere ogni dubbio ecco la pagina del W3C su RDF [ http://www.w3.org/RDF/ ] dove si cita anche RSS. Con una ricerca si possono trovare anche altre pagine che possono far luce sul legame tra RSS (che a volte viene indicato anche come RDF Site Summary) e il semantic-web;
esempi:
Roncaglia: “Blogosfera e feed RSS: una palestra per il Semantic Web?” [ http://eprints.rclis.org/archive/00002761/01/roncaglia.pdf ]
http://www.xml.com/pub/a/2001/05/02/semanticwebsite.html
http://en.wikipedia.org/wiki/RSS_(protocol)

IMHO Peter Norvig ha magari esagerato ma forse voleva semplicemente avanzare un dubbio che in passato molti hanno già espresso (esempio Roncaglia nelle prime pagine del documento sopra citato).
Inoltre credo che quando Norvig parla di webmaster non si riferisce ai professionisti ma a normali utenti che producono contenuti.

“A naso”, mi viene da fare questa ipotesi:
TBL e Google hanno differenti visioni sul futuro del web:
TBL vede un web in cui la semanticità sarà fornita dai dati RDF (diciamo dato-centrico);
Google vede un web che sarà interpretato semanticamente dai motori di ricerca, senza bisogno di dati RDF (diciamo centrato sugli algoritmi).

Comment by emmeesse — 20 July 2006 @ 13:55

@ Emmeesse

Concordo su quanto dici, ma a quanto ne so (magari sbaglio ma non credo) su RSS e Google Base (giusto per riferirmi agli esempi emersi) io non vedo tracce di Web Ontology Language, il che vale a dire, che senza il supporto di questo markup addio semantica e relazioni tra i significati….

Comment by Jacopo Gonzales — 20 July 2006 @ 14:22

[...] Vi segnalo un articolo di Jacopo su Marketing Router che commenta l’affermazione di Peter Norvig, (Director of Search di Google), “i webmaster sono degli incompetenti”. Da questo punto di vista nasce una discussione sul blog…continua Vuoi ricevere gratis le ultime novita’ di Wmtools? Lascia qui la tua email… Tuo Nome E-mail [...]

Pingback by » Web semantico: i webmaster sono incompetenti - Web Marketing e Posizionamento — 20 July 2006 @ 19:14

[quoto]
RSS e Google Base (giusto per riferirmi agli esempi emersi) io non vedo tracce di Web Ontology Language, il che vale a dire, che senza il supporto di questo markup addio semantica e relazioni tra i significati
[/quoto]

Qui [ http://inamidst.com/rss1.1/#s6 ] trovi l’RDF Schema/OWL per RSS 1.1; qui [ http://web.resource.org/rss/1.0/schema.rdf ] quello per RSS 1.0

La semanticità di RSS sta ad esempio nella possibilità di fare ad un motore di ricerca semantico la richiesta di tutti i post scritti da emmeesse nel 2006.

Ora se fai un’interrogazione di questo tipo ad un motore di ricerca lessicale [ http://www.google.it/search?hl=it&q=emmeesse+2006&meta=lr%3Dlang_it ] questo visualizzerà anche pagine che contengono frasi tipo “un pacchetto di emmeesse” oppure “KIT PARABOLA DA 100 + LNB EMMEESSE OFFERTA SOLI € 53,00″.

Il motore di ricerca semantico saprebbe invece distinguere dove emmeesse è un autore e non una marca, e dove 2006 è una data e non il codice di un prodotto di un catalogo di costumi da bagno.

Se io avessi una mia descrizione FOAF (ovvero RDF) [ http://www.ldodds.com/foaf/foaf-a-matic.it.html ] collegata ai dati RDF dei miei post il motore di ricerca semantico saprebbe anche distinguere tra le varie persone che sul web si firmano emmeesse e saprebbe quindi selezionare i soli i post che ho scritto io, individuo univoco nell’Universo, come se motore il motore di ricerca semantico mi conoscesse personalmente :)

Comment by emmeesse — 21 July 2006 @ 08:55

Il riferimento fatto nell’articolo parla di semanticità e standard; che nel web ce ne sia ancora poca è un dato di fatto e che il web, soprattutto quello italiano sia ancora dietro rispetto altre realtà, un dato di fatto da non dimenticare.

Per il commento e la semantica, direi comunque che il semantico sul quale scrivete ne è una prova fattiva che la critica è più che giusta, Wordpress come altri CMS semantici e in linea con gli standard W3C, è la risposta, siamo ancora all’inizio certo, di fatto però anche l’utilizzo e l’interessamento di Google verso Orion non possono essere considerati staticità dei sitemi. Lo stesso vele per MSN Search che rispetto alla concorrenza (minore risultati) restituisce risultati molto più attinenti rispetto alle ricerche, Yahoo sembra essere in affanno.

Credo che bisognerebbe tenere in considerazione alcuni aspetti; la semantica e cos’è, la programmabilità dei TAG, XML e XHTML, non è un caso che scrivo questo, sono anni che seguo gli argomenti se pure trovo ancora molta confusione da parte degli operatori italiani, basterebbe digitare su Google: W3C Standard.

Webmaster incompetenti? Ce ne sono tanti, molta è la fretta di arrivare a risultato, i software che fanno tutto non rispettando lo standard, l’ignoranza che questi strumenti portano a chi li utilizza, ricorderete che i codici li si scriveva tutti o quasi a mano… non conoscere quello che si poteva scrivere voleva dire… ingnoranza. E’ il caso del XHTML semantico?

Alex

Comment by Alex — 22 July 2006 @ 13:19

[...] Web Semantico: I webmaster sono degli incompetenti; parola di Google [...]

Pingback by emmeesse » Blogosfera italiana — 23 July 2006 @ 09:07

[...] Web Semantico: i Webmaster sono degli incompetenti [...]

Pingback by » Dal Web Semantico ai Sistemi Cognitivi - 1 parte - Marketing Routes — 5 August 2006 @ 18:03

[...] Web Semantico: i Webmaster sono degli incompetenti [...]

Pingback by » Dal Web Semantico ai sistemi cognitivi - 3 parte - Marketing Routes — 7 August 2006 @ 11:17

[...] Web Semantico: i webmaster sono degli incompetenti [...]

Pingback by » Motori di Ricerca e Intelligenza Artificiale - Marketing Routes — 24 August 2006 @ 18:27

[...] Web Semantico: i Webmaster sono degli incompetenti [...]

Pingback by Dal Web Semantico ai sistemi cognitivi - 2 parte — 20 September 2006 @ 22:31

[...] Web semantico: i webmaster sono degl incompetenti, parola di Google (16 link in entrata) [...]

Pingback by Numeri — 31 December 2006 @ 13:16

Leave a comment

About Marketing Routes:

Blog multi-autore che ha come focus il mondo del marketing, dell'advertising e della comunicazione online ed offline. Non solo un bookmark da controllare giornalmente ma un dispensatore di notizie, consigli, strategie per tutti coloro che operano in questi settori. Nato con la convinzione che di blog riguardanti il marketing, la comunicazione e la pubblicità ce ne siano molti, ma quelli veramente di qualità sono pochi, Marketing Routes vuole apportare agli utenti della rete i modi di vedere, le esperienze e le considerazioni di diversi giovani professionisti del settore così da aprire un dibattito con gli utenti senza mai prendersi troppo sul serio.

Creative Commons License

Design © 2006 by Consulenzaweb.com | Powered by WordPress