Comment convertir des documents numérisés en Word - The Happy Android

Si vous avez besoin de numériser un livre au format texte, vous pouvez vous poser plusieurs questions. Qu'en est-il de la qualité, est-ce bon? Non seulement cela peut être fait, mais il existe également plusieurs façons de convertir un document numérisé en Word. Voyons voir:

  • En numérisant le document au format PDF et en le modifiant ultérieurement avec Adobe Acrobat XI Pro pour l'enregistrer au format Word. La version Pro d'Acrobat est payante, mais vous pouvez acheter une licence d'essai gratuite de 30 jours.
  • Sur le site Web OnlineOCR.net . Cette application Web vous permet de convertir des documents au format PDF, JPG, TIFF et GIF en Word, Excel et texte. Dans la version gratuite, nous pouvons convertir jusqu'à 15 pages par heure et des documents de pas plus d'une page.
  • En numérisant le document au format (OCR) et en l'enregistrant sous forme de texte. Ensuite, nous pouvons ouvrir Word et le modifier ou l'enregistrer au format .doc.
  • Utilisation d'un programme de reconnaissance optique de caractères :
    •  VueScan (disponible pour Windows, Mac OS X et Linux)
    • Kooka  (pour Linux)
    • Office Lens (pour Android et iOS )
    • CamScanner (pour Android et iOS )

Le moyen le plus efficace de tout ce que nous pourrions dire est d'utiliser Adobe Acrobat Pro, mais seulement si l'analyse est très, très propre et de haute qualité. Les applications de reconnaissance optique de caractères ont parcouru un long chemin, mais elles présentent toujours des lacunes avec des éléments tels que le gras ou l'italique, et la transcription de certains mots en fonction du type de police du document original peut être erronée.

Essayez de numériser et de transmettre ce document à Word pour voir ce qui se passe

Depuis le scanner lui-même

Certains scanners incluent la fonction de reconnaissance optique (OCR) dans leur propre programme de numérisation. Pour numériser un document en texte, il vous suffit de définir le format de numérisation et d'en rechercher un qui fait référence à l'OCR ou similaire (cela dépend de la marque / du modèle du scanner).

Passez de PDF à Word avec Adobe Acrobat XI Pro

Une fois Adobe Acrobat XI Pro téléchargé et installé ( vous disposez d'une version d'essai gratuite de 30 jours ICI ), allez dans « Outils -> Reconnaissance de texte -> Dans ce fichier ».

Dans la fenêtre " Reconnaître le texte " , cliquez sur " Modifier " et choisissez la langue du texte, le style de sortie et la résolution.

Revenez enfin dans " Outils -> Edition de contenu -> Editer texte et images " et modifiez le texte si vous avez besoin de corriger un mot. Pour terminer, cliquez sur " Fichier -> Enregistrer sous " et enregistrez-le au format Word.

OnlineOCR

OnlineOCR est une application Web pour transférer des images ou des fichiers PDF vers Word et il est très facile à utiliser. Je vais vous expliquer comment cela fonctionne: Entrez //www.onlineocr.net/ et cliquez sur " Sélectionner un fichier ". Sélectionnez le document numérisé, puis choisissez la langue et le format de sortie dans les 2 menus déroulants que vous avez au centre de l'écran.

Pour terminer, cliquez sur « Convertir ». Juste en dessous, il apparaîtra un aperçu de texte brut que vous pouvez modifier si vous avez besoin de corriger des mots. Enfin, cliquez sur " Télécharger le fichier de sortie " et vous pouvez télécharger le fichier au format Word. Voici un exemple de PDF converti en Word avec OnlineOCR:

  • PDF original:

  • Document converti:

Si cette application web ne vous satisfait pas, vous pouvez essayer d'autres alternatives similaires telles que FreeOCR ou Free-Online-OCR .

Programmes de reconnaissance optique de caractères (OCR)

Si vous ne souhaitez pas modifier vos documents en ligne et que vous avez besoin d'une application de bureau, vous pouvez utiliser des applications comme VueScan (qui est également disponible pour Mac et Linux en plus de l'omniprésent Windows).

Une autre possibilité consiste à utiliser votre appareil Android ou iOS pour numériser le document et le convertir directement en texte. Il existe des applications telles que Office Lens (pour Android et iOS ) ou CamScanner (pour Android et iOS ) qui exécutent l'ensemble du processus à partir de la même application. Il est recommandé dans ces cas de nettoyer l'image avant de la convertir en texte. Si vous voulez en savoir plus sur cette méthode, jetez un œil à CE POST .

À mon avis, la technique de reconnaissance optique des caractères, bien qu'elle se soit beaucoup améliorée ces dernières années, est encore à des années-lumière d'être une technique parfaite. Beaucoup de détails, de nombreux mots qu'il "traduit" avec des lettres et des symboles incorrects qui jonchent le texte. Il lui manque toujours cette intelligence supplémentaire qui lui fait voir que " t &! $ Olog1a " ne peut être une traduction valide d'aucun mot dans un texte. Je ne vois toujours pas de compréhension en lecture, mais une simple reconnaissance visuelle de lettres individuelles qui forment des mots sans les intégrer avec le reste du texte. Cependant, je suis convaincu que le moment où nous ferons ce dernier grand bond se rapproche chaque jour.

Avez-vous installé Telegram ? Recevez le meilleur article de chaque jour sur notre chaîne . Ou si vous préférez, découvrez tout sur notre page Facebook .