Reconhecimento óptico de caracteres A tecnologia (OCR) permite editar texto em imagem gráfica ou documento digitalizado. É amplamente utilizado para converter livros e documentos em arquivos eletrônicos, para informatizar um sistema de manutenção de registros em um escritório ou para publicar o texto em um site.
O OCR torna possível editar o texto, pesquisar uma palavra ou frase e aplicar técnicas como tradução automática, texto para fala e mineração de texto.
O Microsoft Office inclui o Microsoft Document Imaging OCR, no entanto, existem várias outras alternativas freeware que também funcionam, incluindo o software aplicativo que acompanha o scanner ou o dispositivo all-in-one. Essencialmente, para digitalizar e converter uma imagem em texto usando o OCR, você precisa seguir as etapas padrão:
- Coloque o documento na mesa do scanner.
- No computador, use o software aplicativo do scanner e o OCR como tipo.
- Selecione a área pretendida para fazer uma varredura de OCR e verifique a visualização.
- Digitalize e salve o arquivo de texto e edite o mesmo em qualquer aplicativo de processamento de texto.
Você também pode optar por instalar um aplicativo para executar o OCR em vez do programa padrão do scanner.
FreeOCR pode digitalizar a partir da maioria dos scanners TWAIN e WIA e também pode abrir PDFs digitalizados e imagens TIFF de várias páginas. Free OCR inclui o motor OCR compilado com o Tesseract, também conhecido como GUI Tesseract. FreeOCR é freeware, inclusive para uso comercial. O FreeOCR requer o.NET Framework v2.0. O FreeOCR v4 está prestes a ser lançado.
Existem vários serviços on-line gratuitos na Web que permitem executar um OCR em uma imagem ou um documento digitalizado em seu navegador.
- NewOCR.com é um serviço de OCR on-line gratuito. NewOCR.com analisa o texto em qualquer arquivo de imagem que você envia, e depois converte o texto da imagem em texto. O serviço oferece uploads ilimitados e análise de layout (reconhecimento de texto em várias colunas). O serviço amigável não requer registro e suporta 29 idiomas, embora o site seja bastante básico e amador. O serviço aceita qualquer arquivo JPEG, PNG, GIF, BMP e TIFF de várias páginas de até 5 MB, bem como documentos PDF de várias páginas de até 20 MB.
- O Free-OCR.com é outra ferramenta gratuita de OCR on-line. Você pode fazer o upload dos seus arquivos de imagem (JPG, GIF, TIFF BMP ou PDF) com tamanho não superior a 2 MB, maior ou menor que 5000 pixels e há um limite de 10 uploads de imagens por hora. O Free-OCR pode manipular imagens com texto de várias colunas e também suporta 29 idiomas. Uma restrição estranha é que leva apenas a primeira página de um documento PDF durante a execução do OCR.
- O serviço OCR on-line gratuito permite que você reconheça textos e caracteres de documentos digitalizados em PDF (incluindo arquivos de várias páginas), fotografias e imagens capturadas por câmeras digitais. Ele permite que os usuários selecionem 32 idiomas para reconhecer documentos multilíngües e convertê-los diretamente em vários formatos, como PDF, DOC, XLS, RTF, HTML e TXT. Você pode optar por armazenar os arquivos OCR online no seu espaço de trabalho seguro ou baixá-los para o seu PC.
Tenho certeza de que essa lista não é exaustiva. Por que você não adiciona mais serviços e aplicativos como comentários a esta postagem, caso saiba de mais alguma coisa?