Formation Omnipage

Présentation

La reconnaissance optique de caractères (ROC, en anglais optical character recognition : OCR), ou encore appelé vidéocodage (traitement postal, chèque bancaire) désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. Elle réalise beaucoup moins que l'être humain qui, lui, exécute, en plus de la reconnaissance, la compréhension du message, sa mémorisation, voire son analyse critique dans un seul temps.

Un ordinateur réclame pour l'exécution de cette tâche un logiciel de ROC. Celui-ci permet de récupérer le texte dans l'image d'un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement, et stocké dans une base de données ou du moins, sur un support sûr et exploitable par un système informatique.

(Wikipédia)

Objectifs

  • Retouche le texte et scanner pour archiver tout document.

Public

  • Tous ceux qui veulent découvrir l'ocr pour une utilisation dédiée à l'archivage ou le travail du texte.

Pré-requis

  • Il est nécessaire de maîtriser l'outil informatique

Compléments d'informations

  • Principe de l'OCR (reconnaissance optique de caractères).
  • La récupération des images et des textes
  • Paramétrage d'Omnipage selon la qualité de la page
  • Détection automatique des composantes de la page
  • Les documents mono colonne
  • Les documents multi-colonnes
  • Les documents multi-pages
  • Le traitement du texte après OCR
  • L'exportation du texte et des images (les formats de fichier)