E’ risaputo che Google utilizza un elevato numero di fattori per decidere dove e come posizionare una pagina all’interno delle proprie SERP. Alcuni di questi segnali sono relativi alla qualità e all’importanza di tale pagina mentre altri servono ad indicare quanto essa sia rilevante rispetto ai termini inseriti dall’utente nella casella di ricerca.
Uno dei segnali per considerare rilevante una pagina è naturalmente la presenza, nel testo della pagina stessa, delle parole oggetto della query. Oltre alla presenza è ovviamente considerato anche quante volte tali termini sono ripetuti.
Un altro fattore analizzato da Google è la prossimità (o vicinanza) tra le varie parole chiave all’interno del testo della pagina.
Un interessante brevetto depositato da Google nel 2004 e segnalato su SEO by the Sea potrebbe fornire utili indicazioni su come i motori di ricerca possono interpretare la vicinanza semantica tra i vari termini anche in presenza dei diversi livelli di formattazione di un documento HTML.
Immaginate ad esempio un frammento di codice come questo:
[html]
<h2>Informazioni su Saturno</h2>
<ul>
<li>Periodo orbitale intorno al Sole dura 10.756,2 giorni</li>
<li>Periodo di rotazione è pari a 10 ore e 13 minuti</li>
<li>Massa è 95 volte quella della Terra</li>
<li>Volume è 744 volte quello della Terra</li>
<li>Distanza dal Sole 1.429 milioni di kilometri</li>
</ul>
[/html]
Osservando una lista come questa è immediato considerare ogni elemento della lista come semanticamente rilevante rispetto a Saturno, anche se i vari elementi si allontanano sempre più dal termine “Saturno”. E’ quindi ipotizzabile che tale pagina sia rilevante (nella stessa misura) per i termini “Satuno Massa”, “Saturno Volume” e “Saturno Distanza”.
I vari codici utilizzati per le intestazioni (h1, h2, h3 …etc…) permettono di introdurre un concetto che verrà trattato nel testo sottostante. E’ naturale quindi pensare che se nell’intestazione inserisco il termine “Saturno”, sia il lettore che il motore di ricerca si aspettino che nelle righe successive ci si riferisca al pianeta con gli anelli.
Relativamente alle associazioni tra intestazioni e liste (<ul> e <ol>)Â il brevetto di Google ci permette di formulare alcune considerazioni:
- se i termini compaiono nello stesso elemento della lista sono considerati semanticamente vicini;
- se uno dei termini appare come elemento della lista e l’altro nell’intestazione, i due termini possono essere considerati approssimativamente equidistanti (semanticamente) rispetto ad altri due termini che si trovano rispettivamente nell’intestazione e in un elemento della lista;
- due termini che invece appaiono in due diversi elementi di una lista possono essere considerati molto più distanti rispetto ai due casi precedenti.
Ritornando all’esempio della lista precedente, è possibile quindi dire che i termini “Saturno” e “Massa” sono semanticamente più vicini rispetto a “Terra” e “Volume”; anche se questi ultimi due sono l’ultima parola di un punto della lista e la prima del successivo.
Prima però di prendere queste considerazioni come dogmi di fede da applicare in ogni situazione, ricordate che il brevetto a cui fanno riferimento risale al 2004. Tuttavia rimane uno spunto interessante per capire come i motori di ricerca possono interpretare il testo a seconda di come venga presentato sotto forma di linguaggio HTML.