Documenti scannerizzati indicizzati su Google

Online è presente un notevole numero di documenti convertiti in formato elettronico mediante uno scanner. Nonostante l’utilità di questi documenti sia rappresentata dai testi che contengono, essi vengono normalmente interpretati come immagini, rendendo quindi impossibile indicizzare il loro contenuto ai fini di una ricerca.

Google ha però deciso di applicare la tecnologia OCR (Optical Character Recognition) per interpretare i testi nei documenti scannerizzati disponibili online in formato PDF.

Ecco alcuni esempi di questa applicazione (cliccando sul link “Versione HTML” è possibile vedere il testo elaborato da Google):

[repairing aluminum wiring] (primo risultato)
[spin lock performance] (primo risultato)
[Mumps and Severe Neutropenia] (terzo risultato)
[Steady success in a volatile world] (primo risultato)

Archiviato in Novità
Parole chiave: , ,
Scritto da Tiziano Fogliata :: venerdì 31 ottobre 2008 alle 11:45  

  Lascia un commento

Su questo argomento puoi consultare anche i seguenti articoli:
Google riconosce i documenti Open Office
Oltre ai formati HTML, PDF e Microsoft Office, Google
Google Docs non elimina definitivamente i documenti
Pare che Google Docs, nonostante assicuri la riservatezza dei
MotoNews - Come è nato Gmail e i consigli per scaricare i documenti da Google Docs
Paul Buchheit parla di Gmail e Adsense — Paul

6 commenti a “Documenti scannerizzati indicizzati su Google”

  1. daniele scrive:

    si dice scansionati…

  2. Grazie per il tuo prezioso contributo, comunque vanno bene entrambi

  3. Franco scrive:

    Sicuri che non si dice “scansionati”?

  4. daniele scrive:

    grazie tiziano per la presa per il…

  5. hanna scrive:

    scansionati si dice dei virus

Lascia un commento

Motoricerca.net fa parte del network Blogcenter
Questo blog è pubblicato sotto una Licenza Creative Commons

Visita anche: Jugo, Pandemia, TF Blog.