Progettare un sito puntando ad ottenere un ottimo posizionamento sui motori di ricerca significa prestare attenzione a molteplici aspetti e curare i minimi dettagli.
Prendiamo in considerazione la struttura dei link, in particolare come vengono separate le parole che costituiscono un URL. Si possono incontrare URL di questo tipo:
http://www.sito.it/offerta_articoli_prima_infanzia.php
o di quest’altro:
http://www.sito.it/offerta-articoli-prima-infanzia.php
Apparentemente non sembrano molto diversi tra di loro, non trovate? Agli occhi di Google invece si. Le parole del primo URL vengono viste come offerta_articoli_prima_infanzia, quelle del secondo come offerta articoli prima infanzia.
Secondo voi quale delle due modalità di visualizzazione è più efficace in un ottica di search engine optimization? Senza dubbio la seconda.
Un test condotto da Olivier Duffez ha dimostrato che Google ignora il segno _ (underscore) come separatore di due parole e considera invece valido il segno – (hyphen).
Beh è interessante che qualcuno abbia finalmente fatto una ricerca per stabilirlo.
Quello che secondo è più interessante da dibattere è quanto siano oggi importanti i nomi delle pagine, ai fine del posizionamento. Personalmente, le nostre evidenze tendono a ridimensionare sempre più questo aspetto, però mettere una parola definitiva sull’argomento mi sembra dura. Anche il test che tu citi, è fatto su una kws list troppo particolare per essere probante nel “mondo reale”.
In ogni caso, i miei sentiti complimenti per il blog, è un po’ che ti seguo e mi sembra davvero uno dei più interessanti :-)
I contenuti sono senza dubbio più importanti delle parole contenute in un link. E’ vero che il test effettuato non ci da la certezza assoluta che Google si comporti (e soprattutto si comporterà) sempre in questo modo, ci fornisce però una buona traccia da seguire.
Il tuo dubbio nel mettere una parola definitiva sull’argomento è più che legittimo, l’attività di SEO è ben lontana dall’essere una scienza esatta.
Grazie per i complimenti. :)
Io più che delle parole contenute nel link mi riferivo proprio alla struttura della URL. Ancora ieri un cliente mi riportava il caso di un sito con cui voleva scambiare link e che glielo rifiutava perchè “il vostro sito ha URL con parametri e quindi non è indicizzabile”.
Si stratificano un po’ di miti nel tempo e diventa difficile fare chiarezza poi…
La mia esperienza mi dice ad esempio che è molto più importante “in termini generali” l’anchor text che non la URL del link.
Ci risentiamo su queste pagine :-)
Io mi sento di contraddirti.
Scrivere prola1_parola2 non vuol dire scriverle attaccate.
Anzitutto perchè lo stesso Google, in Blogger nomina i singoli item dei post con le prime parole intervallate dall’underscore.
Secondo facendo dei testi:
http://www.google.com/search?struttura+dna
mappa al primo risultato una pagina chiamata struttura_dna.asp (ed è mia la pagina ;-)
Cercando
http://www.google.com/search?struttura_dna
si cerca per la singola struttura chiamata così, e non per strutturadna (che ha risultati diversi)
http://www.google.com/search?strutturadna
Infine cercando
http://www.google.com/search?struttura-dna
trovo si risultati con “struttura dna”.. (?)
Secondo me c’è una sostanziale differenza tra il test svolto da te e quello di Olivier Duffez.
Tu hai provato ad effettuare una ricerca usando una chiave di ricerca contenuta più volte nella pagina, non semplicemente nel link.
Una piccola precisazione:
offerta_articoli_prima_infanzia *non* viene indicizzato da Google come offertaarticoliprimainfanzia ma come offerta_articoli_prima_infanzia.
Ovvero, il termine viene inserito nell’indice con tutti gli underscore e non trasformato in un’unica parola priva di essi.
L’unica volta in cui Google accorpa i testi è quando, all’interno del testo della pagina, trova singoli caratteri distanziati da uno spazio. Ad esempio, c a v a l l o viene indicizzato come “cavallo”, tutto unito.
In ogni caso, come dicevate, questi fattori e tutti quelli che sono direttamente dipendenti dalle scelte del webmaster, hanno valenza sempre minore, specie su Google, che oggi può essere considerato uno dei motori che in assoluto dà maggiore peso a fattori esterni alle caratteristiche delle pagine.
Proprio la presenza di termini nell’URL è uno di quei fattori la cui influenza è talmente bassa che il webmaster farebbe bene a preferire URL mnemonici e semplici a quelle bruttissime file di keyword.
C’è di più: i classici key1-key2-key3-key4 sono *palesi* indicatori di pagine in cui si vuole spingere l’ottimizzazione: un segnale che è sconsigliato fornire ai motori di ricerca.
Per terminare, ecco due vecchissimi post (il secondo è del 2002) di GoogleGuy in cui viene detto abbastanza esplicitamente come Google tratta underscore e trattini:
http://www.webmasterworld.com/forum3/23371.htm
http://www.webmasterworld.com/forum3/4572.htm
Il posizionamento richiede spesso test e analisi, tuttavia ci sono alcuni fattori molto semplici le cui caratteristiche sono ormai conosciute da anni.
I test di cui si sente davvero la mancanza sono quelli su LSI, sull’eventuale sfruttamento di informazioni storiche o di informazioni di tipo antropico (il comportamento degli utenti).
Spero che le informazioni siano d’aiuto.
Hai ragione, in effetti ho sbagliato io a scrivere la parola, non è che Google attacca le parole ignorando gli underscore, semplicemente non li considera separatori di parole.
Come ho scritto nel mio primo commento a questo post, i contenuti sono senza dubbio prevalenti rispetto ad eventuali keyword contenute nel link e non credo che il passare dagli underscore agli hyphen faccia schizzare in alto il posizionamento di un sito. E’ utile però conoscere anche i dettagli per poi decidere se vale la pena sfruttarli o meno.
Concordo con te sulla scarsità di informazioni su argomenti quali il Latent Semantic Indexing rispetto alle nozioni sui criteri di ottimizzazione “classici”. Anzi se hai qualche buon link… ;)
Grazie delle tue precisazioni, sempre preziose.
Non conosco link a test realmente scientifici sul LSI. Nessuno è stato finora in grado di dimostrare che un motore di ricerca sfrutta effettivamente tale tecnologia.
Posso dare solo dei link di approfondimento, per chi fosse interessato a saperne di più. Il primo è un’eccellente guida:
http://javelina.cet.middlebury.edu/lsa/out/cover_page.htm
http://lsi.research.telcordia.com/lsi/demos.html
http://en.wikipedia.org/wiki/Latent_Semantic_Indexing
http://www.threadwatch.org/node/1336
Visto che la LSA si basa sull’occorrenza di termini, ricordo che tempo fa il gruppo del forum di HTML.it che partecipava al concorso Velocipedi Equestri fece dei test utilizzando termini correlati, sparsi tra documenti diversi.
Tuttavia non ho seguito i risultati, ma non escludo che in parte siano stati inficiati dal fatto che molti test venivano fatti contemporaneamente, rendendo difficile l’identificazione di quali fattori contribuivano realmente al miglioramento della posizione.
Per chi volesse saperne di più, può rivolgersi direttamente a loro, sul forum di HTML.it o quello di Giorgiotave.it
Il primo e il secondo sito li avevo già visitati e salvati su hard disk un po’ di tempo fa quando li vidi citati su webmasterworld.
Il primo soprattutto lo trovai molto interessante.
Grazie ancora.