O que é OCR?
O OCR é a sigla para Optical Character Recognition (em português, Reconhecimento Óptico de Caracteres), uma tecnologia utilizada para reconhecer palavras e letras em uma imagem por meio da extração do texto, possibilitando o armazenamento do conteúdo e facilitando a manipulação dos dados.
Quais são os benefícios do OCR?
Ao utilizar o OCR em um documento digitalizado, por exemplo, podemos ter acesso facilitado à esse documento, pois todo o conteúdo da imagem digitalizada é tratada como um documento de texto, o que facilita a pesquisa do documento pois é possível localizar esse documento utilizando apenas palavras-chaves, um pedaço do texto ou algum número de contrato para encontrá-lo, sem a necessidade do usuário precisar informar muitos detalhes para a pesquisa.
Para mais detalhes sobre pesquisa de documentos com OCR no Orquestra ECM clique aqui.
Você também pode visualizar o texto extraído das imagens na importação de documentos, para saber mais clique aqui.
Recomendações para uso do OCR
Para um melhor funcionamento do OCR é preciso que a imagem tenha o texto nítido, por isso seguir algumas boas práticas com a qualidade da imagem pode ajudar:
- Resolução em 300 DPIs;
- A imagem deve estar em tons de cinza (coloração);
- Alinhamento do texto na horizontal;
- Fundo da imagem com o texto deve estar limpo.