Page 2 sur 2
Re: technique OCR en 2022
Publié : Lun 10 Oct 2022 14:19
par geibi
Dernier message de la page précédente :
Merci pour la référence ! Ce n'est pas du FOSS mais c'est offline, gratuit, apparemment sans merdouille à l'intérieur, ça utilise Tesseract en moteur OCR et une imprimante virtuelle pour la création du PDF, et en plus c'est un projet maintenu. Que du bon jusque là, je vais regarder de plus près.
De mon côté, oui, je connais bien Tesseract que j'utilisais déà entre 2009 et 2013, à la mimine. Les nouveautés côté front-ends ont l'air intéressantes, il va falloir que je trouve du temps pour regarder ça. Le problème reste toujours l'intégration entre une OCR correcte et la création/manipulation "user-friendly" d'un PDF. C'est là que les gros du secteur pro se positionnent, naturellement. Dur de lutter en open-source.
Ma solution personnelle : un mix de Tesseract,
PDFCreator,
PDF-XChange Viewer et un p'tit coup de
PDFTK Builder de temps à autre.
- Attention, les dernières versions de PDFCreator font polémique en incluant des merdwares.
- PDF-XChange Viewer n'est plus maintenu mais toujours distribué. Son remplaçant est plus puissant mais plus lourd et ne me sert à rien.
- Tesseract et PDFTK Builder c'est du sourceforge donc

Vraiment intéressant ton PDF24, là. Merci encore.
Re: technique OCR en 2022
Publié : Lun 10 Oct 2022 21:54
par Yeolo
moi j'utilise ABBYY FineReader 14 il marche super bien
pour des pdf ou scan
Re: technique OCR en 2022
Publié : Mer 12 Oct 2022 06:35
par Jambon
geibi a écrit : ↑Lun 10 Oct 2022 14:19
[*]Attention, les dernières versions de PDFCreator font polémique en incluant des merdwares.
Il y a eu un fork de PDFCreator pour virer les merdes =>
https://github.com/clawsoftware/clawPDF
Re: technique OCR en 2022
Publié : Mer 12 Oct 2022 12:05
par geibi
Yeolo a écrit : ↑Lun 10 Oct 2022 21:54
moi j'utilise ABBYY FineReader 14 il marche super bien
pour des pdf ou scan
Il a super bonne réputation en effet.
Un peu cher pour moi mais apparemment efficace.
Jambon a écrit : ↑Mer 12 Oct 2022 06:35
geibi a écrit : ↑Lun 10 Oct 2022 14:19
[*]Attention, les dernières versions de PDFCreator font polémique en incluant des merdwares.
Il y a eu un fork de PDFCreator pour virer les merdes =>
https://github.com/clawsoftware/clawPDF
Raaaaaaah lovely !
M'en vais tester ça, mon PDFCreator de 2008 qui imprime au mieux en PDF 1.4 commence à dater.
Un merci sincère à toutes les réponses sur ce fil. Que j'utilise ou pas les outils cités, c'est super intéressant d'avoir tous ces retours !
Re: technique OCR en 2022
Publié : Mer 2 Nov 2022 07:59
par Le Rabatteur
j'utilise ocr text recognition tool pas mal...
très intéressé par le sujet
après reste la traduction... quand on a le jargon de la Cage ça devient plus compliqué