Page 2 sur 2
Re: Requête de Sap - Mise en page
Publié : Dim 12 Jan 2020 14:50
par Sap
Dernier message de la page précédente :
et Concernant le poids des fichiers, celui sur lequel j'ai fait la modif est 2 fois moins lourd^^
Re: Requête de Sap - Mise en page
Publié : Dim 12 Jan 2020 16:28
par Nephren-Ka
2 fois moins lourd parce le document a été recompressé lors de l'enregistrement par Acrobat (en perdant au passage de la qualité). Quant aux erreurs dont je parle, il s'agit bien d'erreurs de reconnaissance des caractères (pas seulement de reproduction des fautes typographiques d'origine).
Cela veut dire que si on veut faire une recherche plein texte, on sait que statistiquement, 1 à 4 pages sur 100 ne seront pas indexées. Je sais que cela veut aussi dire que 96 à 99 pages le seront, mais la politique du DDD depuis quelques années est de faire les choses à fond...
En tout cas, c'est une initiative qui pourra donner de très bonnes bases pour des restaurations futures.
Re: Requête de Sap - Mise en page
Publié : Dim 12 Jan 2020 17:31
par Sap
Je réfléchis à voix haute : je ne connais pas les détails mais je n'ai pas l'impressions qu'il y ai de compression ou de perte de qualité. En revanche on dirait qu'il a vectorisé le texte, on peut zoomer autant qu'on veut, on n'a pas crénelage mais un texte très propre. Je pense que le gain au niveau de la taille du fichier vient de là.
Pour les d'erreurs, forcement il peut y avoir quelques coquilles avec l'OCR, donc on aurait pas 100% des mots indexé, et s'il faut du 100%, il va falloir plusieurs relectures, pas d'autre choix aujourd'hui.
Re: Requête de Sap - Mise en page
Publié : Dim 12 Jan 2020 22:50
par szass
Si on veut du 100%, le mieux est de tout réécrire et de tout refaire en MEP, et faire de vraies restaurations donc.
C'est toujours un atelier que nous envisageons de faire un jour. Mais le DDD, dans ce domaine, s'est pour le moment concentré à faire des trads avant tout.
On a un parfait exemple de ce qu'il est possible de faire en restaurations, avec les règles révisées D&D de Khelben.
De mon avis, l'OCR c'est sympa, mais ça pu du cul quand même (car pas optimal). Et corriger de l'OCR prend beaucoup de temps (et à voir si c'est faisable à partir d'un pdf en restant sur un format pdf, ce qui ne semble pas être le cas).
Tout refaire sur Indesign donc (et logiciels assimilés) est de très loin la meilleure chose à faire. Et je pense que ça ne demande pas énormément plus de boulot que la correction d'OCR

Re: Requête de Sap - Mise en page
Publié : Lun 13 Jan 2020 08:25
par Toko
Non, mais refaire les MeP demande au préalable d'avoir récupéré le texte via ocr. (Relire/corriger quelques coquilles est tout de même beaucoup moins chronophage que tout réécrire !)
Donc, tout passer à l'ocr permettrait de disposer d'une première base de travail pour de futures restaurations (et pour le DRS).
Par ailleurs, même si le texte reconnu est entaché d'erreurs, l'ocr permet de faire facilement du copier-coller (citation, etc.), quitte à corriger ensuite les quelques, ce qui peut-être pratique pour les membres et les utilisateurs. (Là encore c'est moins long que ressaisirle texte.)
Je pense que cette tâche peut avoir un certain intérêt.
Re: Requête de Sap - Mise en page
Publié : Lun 13 Jan 2020 14:40
par szass
Oui, je me suis mal exprimé. Par "tout réécrire" je n'entendais pas tout retaper à la main.
L'OCR est nécessaire en effet, comme première étape.

Re: Requête de Sap - Mise en page
Publié : Ven 7 Fév 2020 15:55
par Sap
Du coup qu'est ce qu'on fait ? on laisse tomber ou je passe l'ocr ?
Re: Requête de Sap - Mise en page
Publié : Ven 7 Fév 2020 16:03
par szass
Tu peux passer l'OCR du coup

Re: Requête de Sap - Mise en page
Publié : Ven 7 Fév 2020 16:13
par Sap
ok, j'avais déja commencé

j'ai déposé sur le ftp, dans le dossier OCR, la parti add1, je déposerai dd et add2 prochainement.
J'ai gardé le même nom de fichier et j'ai suffixé "_ocr".
Re: Requête de Sap - Mise en page
Publié : Ven 7 Fév 2020 16:28
par Toko
Après avoir jeté un œil sur le GdM 1ère édition, l'OCR me semble assez efficace.
Merci pour ce coup de main qui se révélera utile !
Je ferme sujet et on poursuit les discussions dans la rubrique de la Forge dédiée aux restaurations à laquelle tu as désormais accès !