Se qualcuno intende pubblicare un contenuto testuale su un sito web solitamente non utilizza il formato PDF. Esistono però numerose realtà, soprattutto aziendali, che utilizzano principalmente questo formato all’interno del loro flusso documentale. Convertire tutto il materiale disponibile in formato PDF nella versione HTML richiedere sicuramente tempo e risorse, oltre a modificare l’aspetto finale di tali documenti. Quindi pubblicare file in formato PDF diventa una necessità.
Se però si vogliono rendere i propri file PDF facilmente rintracciabili attraverso i motori di ricerca è bene seguire queste semplici regole:
1) Essere sicuri che i PDF siano testuali e non basati su immagini
I file PDF non sono tutti uguali. Infatti alcuni programmi generano le pagine dei file PDF come immagini e questo rende impossibile la scansione dei contenuti testuali da parte di un motore di ricerca.
2) Inserire le proprietà del documento
Nonostante molti quando salvano un file in formato PDF non si occupano di questi dettagli, è estremamente utile inserire le proprietà di un documento PDF come il Title e il Subject, se vuoi facilitare la corretta analisi del tuo documento da parte dei motori di ricerca. Inserendo infatti tali informazioni renderai più facile ai motori comprendere la natura ed i contenuti del tuo documento. I dati inseriti nei campi Title e Subject saranno anche visualizzati sulle SERP dei motori di ricerca, esattamente come avviene per i tag Title e Meta tag Description delle pagine web.
3) Ottimizzare il testo contenuto nei file PDF esattamente come fai per quello delle pagine web
Le regole base utilizzate per ottimizzare i testi per il Web valgono anche per i documenti in formato PDF.
4) Inserisci dei link nei file PDF
E’ importante inserire dei link di approfondimento all’interno dei file PDF, ovviamente purché siano pertinenti al contenuto trattato e utilizzando un anchor text rilevante.
5) Non salvare il file PDF usando un formato troppo recente
Anche se utilizzi la versione più recente di Acrobat, fai attenzione a salvare il documento che vuoi ottimizzare in un formato PDF non superiore alla versione 1.6. Questo rappresenta anche un vantaggio offerto ai lettori che non hanno installato l’ultimissima versione di Acrobat Reader che saranno così in grado di consultare il tuo documento.
6) Riduci le dimensioni del tuo documento PDF
Utilizzando la funzione PDF Optimizer di Adobe Acrobat è possibile ridurre le dimensioni di un file PDF. E’ inoltre consigliabile attivare l’opzione “Optimize the PDF for fast web view” in modo che il PDF venga caricato una pagina alla volta, senza che l’utente debba attendere il caricamento di tutto il file prima di poter iniziare la lettura.
7) Posizione i file PDF in modo che non siano nascosti nei meandri del tuo sito web.
Se vuoi che i file PDF pubblicati sul tuo sito siano individuati facilmente dai motori di ricerca, è opportuno posizionarli dandogli la giusta evidenza e non nascondendoli in pagine che si trovano nella “periferia” del tuo sito web.
8) Inserisci prima i contenuti più importanti
Per fare in modo che i motori di ricerca individuino prima i contenuti più rilevanti del tuo documento PDF, inserisci tali contenuti nelle prime righe e nelle prime pagine del documento.
9) Fai attenzione alle modifiche
Ogni volta che apporti delle modifiche al file PDF fai attenzione a ricontrollare i punti precedenti, come ad esempio la versione con la quale salvi il file.
Tiz, mi ricordavo che i link nei pdf non vengono seguiti, mi sbaglio ?
Ciao, i link vengono seguiti. Anzi, nei documenti PDF non è possibile inserire un link con l’attributo nofollow.
vero mi ricordavo male, grazie.
Posso aggiungere anche:
10) fornire un nome “parlante” al file
11) ottimizzare il percorso, non una cosa tipo nomedomino/file/docs/nome file.pdf
12) un po’, di bottoni social per condividere il file. I PDF piacciono ;)
13) inserire il PDF non sono sul proprio hosting ma anche su servizi tipo slide share ed issuu che oltre ad offrire il plugin per ‘sfogliarlo’ viene inserito in un altro repository
14) creare un template stampabile, senza sfondi scuri che uccidono i toner!
15) fare aprire il file PDF in una nuova finestra del browser in modo che quando si chiude il PDF non chiude tutto il sito
16) attenzione alla cache di google per i PDF a volte li mantiene anche quando rimossi da server
ciao
Ottimi consigli William, hai fatto bene ad aggiungerli :)
Grazie Tiziano!
Ottimo articolo…iomi ero fermata soloall’idea di ottimizzare ilpercorso come ha scritto William. Riguardoilpunto 15 di Willam…è consigliabilefare aprire un pop up per il file pdf?
Dobbiamo mettere a breve in rete il PDF di un giornale. Possono esserci problemi per contenuto duplicato? Gli articoli del giornale saranno singoli post di wordpress, mentre il pdf riguarderà l’intero giornale.
Ritengo che non dovrebbero esserci particolari problemi. Sarebbe diverso se per ogni post ci fosse la relativa versione in formato PDF generata in automatico.
Comunque utilizzando il file robots.txt è possibile fare in modo che il bot di Google non effettui il crawling di tali documenti.
un articolo molto interessante ed utile, complimenti per la chiarezza espositiva… condivido sulel mie pagine… buon lavoro
Grazie Alessandro, buon lavoro anche a te :)
Ciao Tiziano
Complimenti per la chiartezza delle informazioni e per il supporto che dai alle domande di chi legge.
Potrei condividere un pdf di terze parti – mettendo un canonical – su un mio sito web povero di testo al fine di tematizzarlo agli occhi di Google?
Ciao, non ho capito dove vuoi mettere il canonical esattamente
Premetto che è solo un’idea ma se mettessi un canonical al pdf – di terze parti – nel mio ipotetico sito con poco testo al fine di “tematizzarlo”?
Provo a spiegarmi meglio….
Faccio un piccolo sito di scarpe e metto dei link- con canonical- a dei pdf presi da siti di scarpe autorevoli
In teoria Google non mi penalizza per il contenuto duplicato ma da al mio sito piu’ autorevolezza di quanta ne avesse prima
Sbaglio?!
Se i link sono fatti in modo corretto non dovresti correre dei rischi. Mi sfugge un po’ il nesso con l’autorevolezza.
Ciao Tiziano
Pensavo ad un siti povero di testo ed alla valutazione dello stesso da parte di Google e dato che l’autorevolezza è un fattore importante per l’indicizzazione ho solo pensato che mettere un pdf “preso” da una fonte autorevole e messo nel mio sito – con in canonical – potesse aiutare.
Articolo e discussione veramente interessante, userò quanto ho appreso per il sito di un mio cliente. Un grazie in particolare a William Barzaglia.