OCR

O que é OCR?

O OCR é a sigla para Optical Character Recognition (em português, Reconhecimento Óptico de Caracteres), uma tecnologia utilizada para reconhecer palavras e letras em uma imagem por meio da extração do texto, possibilitando o armazenamento do conteúdo e facilitando a manipulação dos dados.

Quais são os benefícios do OCR?

Ao utilizar o OCR em um documento digitalizado, por exemplo, podemos ter acesso facilitado à esse documento, pois todo o conteúdo da imagem digitalizada é tratada como um documento de texto, o que facilita a pesquisa do documento pois é possível localizar esse documento utilizando apenas palavras-chaves, um pedaço do texto ou algum número de contrato para encontrá-lo, sem a necessidade do usuário precisar informar muitos detalhes para a pesquisa.


Para mais detalhes sobre pesquisa de documentos com OCR no Orquestra ECM clique aqui.

Você também pode visualizar o texto extraído das imagens na importação de documentos, para saber mais clique aqui.

Recomendações para uso do OCR

Para um melhor funcionamento do OCR é preciso que a imagem tenha o texto nítido, por isso seguir algumas boas práticas com a qualidade da imagem pode ajudar:

  • Resolução em 300 DPIs;
  • A imagem deve estar em tons de cinza (coloração);
  • Alinhamento do texto na horizontal;
  • Fundo da imagem com o texto deve estar limpo.