« I video nelle serp di Google
Il cloaking di Yahoo! »

20 May 2007

Il web semantico non può essere morto perchè non è ancora nato

Modugno "Volare"Il mio amico Jac mi ha girato il link di una news che riguarda un certo “scientist” di Yahoo dal cognome stravagante. Lo ha fatto perchè sa che da anni mi occupo “per diporto” di web semantico, o meglio di semantic search, ovverosia della “querelle afona” (perchè sconosciuta agli utenti e sottaciuta dai ‘player’’) tra motori di ricerca lessicali e motori di ricerca semantici.

Ecco lo “state of the art”, come dicono i web cowboys, secondo lo “scienziato” di Yahoo:

“Mor Naaman, a research scientist with Yahoo Research Berkeley, stood in front of a roomful of semantic Web researchers and declared that the semantic Web is dead. This happened last week at the International World Wide Web Conference in Alberta, Canada, as Naaman describes on the Yahoo Research Berkeley blog”

Locus Primus: Yahoo, in più di 10 anni di vita, non è stato in grado di sorpassare, non dico qualitativamente, ma nemmeno quantitativamente, la ricerca lessicale che attualmente fa di Google il motore di ricerca più usato e migliore (sic) del world wide web.

Locus secundus: Yahoo non dispone di “scienziati”

Locus tertius: Il web semantico è semplicemente il futuro del web, o – per lo meno – lo è nell’ambito dei motori di ricerca.  Chi non capisce questa cosa, per quanto abbia nomi strani o parli a platee di “sematic researchers” mi pare completamente obnubilato, come chi, nell’Inghilterra di primi del ‘900 insisteva nel dire che le carrozze non sarebbero mai state sostituite dalle autovetture, perche’ queste erano poco sicure e troppo rumorose.

Nell’insipidume delle dichiarazioni di Naaman troviamo però una frase che è degna di (involontario) interesse:

Naaman dice: "the grand vision of ‘A Semantic Web’ will not be achieved, mostly because users cannot be expected to annotate media with complex labels”.

La frase in sè è priva di senso, anche se di sicuro effetto per la platea dei “semantic researchers”, ma può esserci utile.

Dunque, Naaman dice che il problema sono gli utenti “cioè lui quando non fa speech e noi durante tutta la nostra navigazione quotidiana” che “cannot be expected to annotate media with complex labels”; qui non si capisce che cosa voglia dire Naaman con “annotate”, perchè il ruolo del web semantico non ha niente a che fare con un ruolo attivo – immediato o anche differito – degli utenti che sono – e devono essere nonostante tutte le web(.)crapZERO  BULLSHIT – che girano da qualche anno sui nostri schermi - e devono rimanere passivi (ovverosia non devono fare sforzi che non siano quelli rivolti al che cosa vogliono cercare e non al “come diavolo coinciderà quello che voglio cercare con il sistema che me lo può far trovare” , che è l’attuale (10 years old) trend di Google ed epigoni ( o pre-epigoni, come nel caso dei Yahoo).

Il web semantico non è una cosa difficile da spiegare, ma sembra essere molto difficile da fare per un popolo di ignoranti come gli americani, che prendono in giro la gente con banner (non pagati ai web-underdog-affiliates) che pensano di darci risposte “intelligenti” a domande preconfezionae (oltre che inutili) come: ”perchè il cielo è (sempre più) blu?”.

Il web semantico non ha niente a che fare con l’ask jeeves style (che si è rivelato un flop anche per altri motivi), ma vuol dire fare in modo che le informazioni che vengono raccolte nei database di tutti i cleaenest  server della Kalifornia e dintorni abbiano un senso “umano”, se “semantico” può risultare di difficile comprensione.

Il proliferare delle “long query” nei motori di ricerca non è che la cifra della disperazione dei navigatori che – impossibilitati ad avere una risposta semantica formulata in una maniera concisa (e non con la frase “qual è la montagna più alta del mondo”, che può soddisfare la curiosità di qualche idiota wanna-extend-the-democracy-with-our-huge-tanks) ai propri bisogni (sapere è potere quando non si sa che cosa si troverà) sono costretti a usare i motori di ricerca come dei “quotations reservoirs”, ovviamente attingendo alla propria acqua marcescente di sapere e al proliferare di citazionismo dei motori di ricerca che, ancora oggi, sono sempre più bravi nelle “stringhe lunghe” e sempre più (ma per poco) incapaci di rispondere alle query più semplici; ma le query non sono domande: se io cerco “golf” su un motore di ricerca ho il diritto (dopo 10 anni di huge investments) di trovare una serp che:

  1. disambigui (La macchina? La maglia? Lo sport?).
  2. Prescinda (non fermandosi prima, ma oltrepassando) la lessicalità del testo contenuto (citai anni fa l’esempio ‘scandaloso’ del sito ufficiale di Tiger Woods che - non contenendo in alcuna parte della home page il termine “golf” - non appariva nemmeno nei più remoti risultati di ricerca di Google).
  3. Ranki i risultati di ricerca non secondo la logica calvinista del back linking (ho tanti amanti e quindi sono una bella donna…), ma possa riuscire a capire quale sia la qualità di una pagina web (e di un sito, perché le pagine senza i siti non esistono…) dalla pagina stessa, senza usare la logica “borbonica” della digi-raccomandazione degli inbound links.

Beh, nonostante quello che dice lo “scienziato-pensiero” di Naaman e nonostante il fatto che Google ancora abbia raggiunto l’unico traguardo della semanticità legato all’assimilazione dei plurali ai singolari (sono intanto spariti gli “aaa latent semantic indexing cercansi” dagli Adwords di Google, a riprova che forse qualcuno di “umano” hanno infine trovato e forse assoldato :), sono certo che la search non potrà andare avanti a lungo con il citazionismo e il “longtailismo delle query”; lasciando da parte Yahoo (che ha dimostrato l’efficienza dello ius primi anni), Google dovrà venire prima o poi a patti col fatto che cambiare il modo di ragionare (si licet) degli esseri umani rende nel breve periodo, rende anche nel medio (dopo la IPO), ma non può durare in eterno.

Il latent semantic indexing (LSI o LSA Analysis) è solo una della soluzioni (la più meccanica e quindi la più desiderata da una società che – per bocca dei BrinBoys – si sente ancora una società di tecnologia, come fosse la Sun o la Magneti Marelli) alla situazione lessicalistica e non più lessicale di un plex di motori di ricerca che – Google in prims – mischia i cavalli con gli stilisti e con la potenza delle automobili; come ho già detto in un recente pezzo su Marketing Routes, c’è solo un motore di ricerca che può decidere (anche se con l’ormai tradizionale “betaversionheit”) di passare dal motore di ricerca lessicale a quello semantico, e distinguere la semantica del web dalla semantica dei motori di ricerca è un artificio che può andar bene solo a uno scienziato di una società che – nata in un garage – ha mantenuto la sua mentalità (si fa quel che si può) nonostante tutti gli aumenti di capitale e le IPO  e nulla ha fatto se non affastellare servizi di dating, finanza e meteo in una home page che solo dopo 10 anni può essere considerata passabile per un esame di grafica all’IPSIA.  Purtroppo veniamo da 10 anni di brainwashing che ci fa credere che sia insensato cercare “Melchiorre Gioia” su un motore di ricerca perchè i risultati non riguardano un nostro patriota in primis, ma i trans che lo danno a 20 euro a fine Viale Zara.

Per ora siamo costretti a cercare “Melchiorre Gioia NOT trans”; unico problema? Google – oltre a non avere abbastanza competenze umane (e non tanto umanistiche) per creare un motore di ricerca “sensato” (buon sinonimo di “semantico”) – quali interessi ha a passare da un web citazionista e quindi aleatorio a uno “semantic-centered”? Nessuno; quindi dovremo aspettare ancora tanto tempo e forse l’ingresso (al DelaView o solo nel world WILD web) di qualcuno che si ricordi come pensa l’essere umano (anche quello americano); a occhio e croce, non sarà nè Bill no-more-malaria Gate$ nè la Benettoned couple di Filo e Young. A loro lasciamo la croce e teniamo d’occhio i BrinBoys.

Social Bookmarking
blinkbits  BlinkList  blogmarks  co.mments  connotea  del.icio.us  De.lirio.us  digg  Fark  feedmelinks  Furl  LinkaGoGo  Ma.gnolia  NewsVine  Netvouz  RawSugar  Reddit  scuttle  Shadows  Simpy  Smarking  Spurl  TailRank  Wists  YahooMyWeb 

Sono d’accordo con te Federico. Penso che se c’è qualcosa di pronto per il web semantico, siamo proprio noi “utenti”, sono i motori di ricerca invece che non sanno cosa fare. Mi sembra davvero una irresponsabilità che Naaman dica che gli utenti non siano pronti per il web semantico quando tutti noi viviamo della/in semantica, nell’offline però.(Non arrabbiarti, ti fa male alla salute) :)

Comment by Johnnie Maneiro — 20 May 2007 @ 22:38

Caro Fede,
Chapeau! E ROTFL per la search patriottica, per le risate devo aver svegliato i vicini…
Comunque butto lì la provocazione: non è che il web semantico farà morire i motori di ricerca decretando l’ascesa della “next big thing” quale ad esempio il fatidico “agent”?

Comment by Fabio Montuori — 20 May 2007 @ 23:48

Penso abbiate travisato il senso della dichiarazione di Naaman.
Iniziamo dal principio, il semantic web si basa sulla definizione di una struttura semantica, di una ontologia su cui basare i contenuti, non sui contenuti stessi.
E basta fare un giro sulla rete per scoprire che per una caso banale come “classificare un libro” esistano qualche decina di standard di classificazione: tutti semnatici e tutti legittimi.
Bastava leggere la dichiarazione per intero di Naaman (cito a memoria): “Il web semantico, per come lo abiamo inteso fino ad ora, è morto; prenderanno sempre più piede soluzioni come i microformats”; e prenderanno sempre più piede per il semplice motivo che si basano su (X)HTML e non su schemi chiusi e spesso in contraddizione uno con l’altro.
Io sono d’accordo con Naaman, ma sono pronto ad essere smentito: fornitemi una struttura semantica di Marketing Routes in XML + RDF (o XML Schema), così da poterlo navigare con un web browser semantico (Tabulator, DISCO, OntoWiki … scegliete voi quello che vi porta più traffico).

Comment by An — 21 May 2007 @ 09:41

Questo articolo, se mi è concesso, abbassa un po la media dei precedenti, sembra che chi scriva parli ad un comizio del partito dei “delusi da google”. mi chiedo se sono l’ unico a NON volere che un futuro web semantico passi per le soliti nomi…

Mi permetto di replicare ad An che OWL è una buona alternativa ai sistemi chiusi e che penso non sia poi così impossibile costruirne una per Marketing Routes. Il punto sta che molto probabilmente Marketing Routes e le major non vedo i vantaggi di affrontare tale lavoro…

Comment by Danilo Bonardi — 21 May 2007 @ 10:28

Concordo con Bonardi,
credo che nel post ci siano troppe affermazioni infondate e gratuite (nel caso suggerirei una lettura di http://research.yahoo.com - sezione “Eventi”).
Se Yahoo! è il 2 MDR al mondo ci sarà pure un motivo…
Come utente osservo che la qualità delle SERP di Yahoo! in ogni caso è in costante miglioramento negli ultimi mesi.

Comment by paocavo — 21 May 2007 @ 11:20

Hai ragione An. Forse abbiamo, anzi sicuramente, confuso “semantic web” con “semantic search”, e dai commenti si capisce che c’è un po’ di confusione.
Forse per il fatto che la dichiarazione arriva proprio da una persona, anche se sotto il nome di un motore di ricerca, Yahoo. Allora, se noi adetti lavori siamo così confusi, vuol dire che ha ragione Naaman, non siamo pronti… :). Magari c’è un po’ di delusione dettata dal fatto che tutti ci aspettiamo che Yahoo un giorno ci proponga qualcosa di impattante e che finalmente il concorrente naturale di Google diventi quello che doveva essere già da tempo, Yahoo 2.0? (Ma forse sto andando offtopic) :)

Comment by Johnnie Maneiro — 21 May 2007 @ 11:41

Credo semplicemente che dovresti documentarti meglio prima di scrivere qualcosa, e non inserire troppe affermazioni infondate e gratuite.. Un buon giornalista non deve esprimere solo giudizi PERSONALI…

Comment by Demetrio — 21 May 2007 @ 15:29

[...] Per saperne di più clicca QUI [...]

Pingback by Provocazione sul web semantico « Anna Torcoletti — 21 May 2007 @ 21:52

Mi scuso con tutti per il ritardo (qualora percepito) di questa mia risposta con chi ha voluto essere così gentile da commentare il mio post, ma il ritardo è giustificato da null’altro che dal fatto che, come suggerito da “In principio era il Verbo…” (AKA AN) mi sono documentato e ho scoperto che, circa 7 anni fa ho depositato un brevetto che parla proprio di web semantico; e un ulteriore flash back delle mie passate esperienze intellettuali mi spinge a stimolare AKA a non usare termini squisitamente filosofici; non perchè non si possa fare, ma perchè si rischia di non fare capire il proprio pensiero.

Cito testualmente: “Iniziamo dal principio, il semantic web si basa sulla definizione di una struttura semantica, di una ontologia su cui basare i contenuti, non sui contenuti stessi”

Ontologia? Mmmm. Lo usano gli Americani abbinandolo a XML e RDF; noi possiamo evitarlo.

Semantica su cui “basare” i contenuti, ma non sui contenuti?

Mi spieghi meglio che cosa intendi? Anche perchè poi – a seguito di multipli “giri” sulla rete, parli di classificazioni di libri che mi pare tu abbini fantasticamente al web semantico, ma non voglio credere che tu faccia riferimento a un tagging e labelling a mo’ di Thesaurus bibliotecario anni ’50 (in u.s.a, perchè in Italia usiamo la semanticissima CDD che ci permette solo di capire che un libro di sociologia parla di sociologia e che una biografia deve essere classificata – semanticamente – “sotto” le biografie), perchè il bello del web semantico (di cui la ricerca semantica è il cuore e sarà l’esempio, oltre che motore immobile, sempre per rimanere in ambito ontologico…) sarà che le “etichette” non sono attribuite intenzionalmente bensì “estratte” (così come fa la nostra mente” a un contesto di “segni” che non sono solo significanti (come accade ancora ora e accadrà per lungo tempo) e avranno un “peso” diverso a seconda del contesto (semantico) in cui ci si trova.

Il principio del web semantico è la ricerca semantica e essa sarà anche il suo completamento, quando i suoi principi verranno estesi a tutto il web. Per ora accontentiamoci delle dichiarazioni di Naaman e del veltronismo di Lee, che sogna un web per i ciechi quando ancora non resce a distinguere fra un equino e uno stilista, o dei BrinBoys, che sognano di vendere automatiche a chi gioca a quake e Ferrari a chi gioca a Formula 1.

Se qualcosa non è chiaro, sono a disposizione, ma non vorrei ulteriormente abbassare la media di MarketingRoutes ;)

Comment by Federico Riva — 22 May 2007 @ 09:14

Leave a comment

About Marketing Routes:

Blog multi-autore che ha come focus il mondo del marketing, dell'advertising e della comunicazione online ed offline. Non solo un bookmark da controllare giornalmente ma un dispensatore di notizie, consigli, strategie per tutti coloro che operano in questi settori. Nato con la convinzione che di blog riguardanti il marketing, la comunicazione e la pubblicità ce ne siano molti, ma quelli veramente di qualità sono pochi, Marketing Routes vuole apportare agli utenti della rete i modi di vedere, le esperienze e le considerazioni di diversi giovani professionisti del settore così da aprire un dibattito con gli utenti senza mai prendersi troppo sul serio.

Creative Commons License

Design © 2006 by Consulenzaweb.com | Powered by WordPress