technique OCR en 2022
- geibi
- Dragon de bronze
- Messages : 35
- Inscription : Mar 20 Sep 2022 22:18
- Localisation : dans le phare ouest
- Version de D&D préférée : AD&D2
- Univers de D&D préféré : Dark Sun
- Race : Thri-kreen
- Classe : Gladiateur
- Alignement : -
- Dieu : -
Re: technique OCR en 2022
Dernier message de la page précédente :
Merci pour la référence ! Ce n'est pas du FOSS mais c'est offline, gratuit, apparemment sans merdouille à l'intérieur, ça utilise Tesseract en moteur OCR et une imprimante virtuelle pour la création du PDF, et en plus c'est un projet maintenu. Que du bon jusque là, je vais regarder de plus près.De mon côté, oui, je connais bien Tesseract que j'utilisais déà entre 2009 et 2013, à la mimine. Les nouveautés côté front-ends ont l'air intéressantes, il va falloir que je trouve du temps pour regarder ça. Le problème reste toujours l'intégration entre une OCR correcte et la création/manipulation "user-friendly" d'un PDF. C'est là que les gros du secteur pro se positionnent, naturellement. Dur de lutter en open-source.
Ma solution personnelle : un mix de Tesseract, PDFCreator, PDF-XChange Viewer et un p'tit coup de PDFTK Builder de temps à autre.
- Attention, les dernières versions de PDFCreator font polémique en incluant des merdwares.
- PDF-XChange Viewer n'est plus maintenu mais toujours distribué. Son remplaçant est plus puissant mais plus lourd et ne me sert à rien.
- Tesseract et PDFTK Builder c'est du sourceforge donc
- Yeolo
- Dracoliche
- Messages : 207
- Inscription : Mar 3 Août 2021 13:33
- Localisation : loiret proche montargis
- Version de D&D préférée : AD&D2
- Univers de D&D préféré : Royaumes Oubliés
- Race : Demi-elfe
- Classe : Mage
- Alignement : Neutre Bon
- Dieu : ?
Re: technique OCR en 2022
moi j'utilise ABBYY FineReader 14 il marche super bien
pour des pdf ou scan
pour des pdf ou scan
- Jambon
- Dracoliche
- Messages : 953
- Inscription : Lun 15 Fév 2016 07:02
- Localisation :
- Version de D&D préférée : D&D3.5
- Univers de D&D préféré : ?
- Race : Petites-gens
- Classe : Voleur
- Alignement : Chaotique Bon
- Dieu : FSM
Re: technique OCR en 2022
Il y a eu un fork de PDFCreator pour virer les merdes => https://github.com/clawsoftware/clawPDF
Mes trucs de mj en vrac: ici
- geibi
- Dragon de bronze
- Messages : 35
- Inscription : Mar 20 Sep 2022 22:18
- Localisation : dans le phare ouest
- Version de D&D préférée : AD&D2
- Univers de D&D préféré : Dark Sun
- Race : Thri-kreen
- Classe : Gladiateur
- Alignement : -
- Dieu : -
Re: technique OCR en 2022
Il a super bonne réputation en effet.
Un peu cher pour moi mais apparemment efficace.
Raaaaaaah lovely !Jambon a écrit : ↑Mer 12 Oct 2022 06:35Il y a eu un fork de PDFCreator pour virer les merdes => https://github.com/clawsoftware/clawPDF
M'en vais tester ça, mon PDFCreator de 2008 qui imprime au mieux en PDF 1.4 commence à dater.

Un merci sincère à toutes les réponses sur ce fil. Que j'utilise ou pas les outils cités, c'est super intéressant d'avoir tous ces retours !
- Le Rabatteur
- Dragon de bronze
- Messages : 11
- Inscription : Ven 12 Août 2022 06:33
- Localisation :
- Version de D&D préférée : ?
- Univers de D&D préféré : ?
- Race : ?
- Classe : ?
- Alignement : ?
- Dieu :
Re: technique OCR en 2022
j'utilise ocr text recognition tool pas mal...
très intéressé par le sujet
après reste la traduction... quand on a le jargon de la Cage ça devient plus compliqué
très intéressé par le sujet
après reste la traduction... quand on a le jargon de la Cage ça devient plus compliqué