PianetaTech.it

Documenti scannerizzati indicizzati su Google

di il 31 ottobre 2008 · 6 commenti

in Novità

Online è presente un notevole numero di documenti convertiti in formato elettronico mediante uno scanner. Nonostante l’utilità di questi documenti sia rappresentata dai testi che contengono, essi vengono normalmente interpretati come immagini, rendendo quindi impossibile indicizzare il loro contenuto ai fini di una ricerca.

Google ha però deciso di applicare la tecnologia OCR (Optical Character Recognition) per interpretare i testi nei documenti scannerizzati disponibili online in formato PDF.

Ecco alcuni esempi di questa applicazione (cliccando sul link “Versione HTML” è possibile vedere il testo elaborato da Google):

[repairing aluminum wiring] (primo risultato)
[spin lock performance] (primo risultato)
[Mumps and Severe Neutropenia] (terzo risultato)
[Steady success in a volatile world] (primo risultato)


Non vuoi perdere gli aggiornamenti di Motoricerca e ricevere anche preziosi ed utili consigli per ottimizzare il tuo sito? Iscriviti alla NEWSLETTER.

{ 6 commenti }

1 daniele 31 ottobre 2008 alle 11:50

si dice scansionati…

2 Tiziano Fogliata 31 ottobre 2008 alle 13:16

Grazie per il tuo prezioso contributo, comunque vanno bene entrambi

3 Franco 31 ottobre 2008 alle 13:21

Sicuri che non si dice “scansionati”?

4 daniele 31 ottobre 2008 alle 14:37

grazie tiziano per la presa per il…

5 hanna 1 novembre 2008 alle 20:54

io dico: scannati

6 hanna 1 novembre 2008 alle 20:56

scansionati si dice dei virus

I commenti a questo post sono chiusi.

Post precedente:

Post successivo: