Les traitements effectués par ISAKO

 

 

A. Traitement sur les images

Il s'agît de traitements automatiques suivis par un contrôle qualité.

 

Recadrage : Afin de réduire la zone non-significative des images.

Redressage : Afin d'aligner - selon les limites de la numérisation initiale -  les lignes et les marges des images (voir notes ci-dessous).

Nettoyage : Il est également possible de nettoyer des imperfections en dehors de la zone imprimée.

 

 

Exemple :

(Image n°19 de « Œuvres de Descartes : Discours de la Méthode (1824) René Descartes »)

 

Image issue de la numérisation

 

après recadrage et redressage

 

 

Notes concernant le redressement :

Pour un même ouvrage, le redressement peut être efficace sur une page et beaucoup moins sur une autre. Les lignes peuvent devenir plus inclinées alors que les marges sont droites. Parfois, c'est l'un OU l'autre.

Cela est lié à l'algorithme utilisé. Par exemple, prise en compte des marges externes de la zone imprimée ou un traitement plus fin, mot par mot, ligne par ligne, donnant parfois un effet de vagues.

Pour les besoins des quatre ouvrages traités ici, le traitement basé sur les marges externes a été utilisé.
Pour un travail à plus grande échelle il conviendra de combiner plusieurs méthodes.

 

 

 

B. Traitements sur le contenu

Il s'agît de traitements automatiques suivis par un contrôle qualité.

 

Nettoyage des entêtes et des bas de pages : Exclure les éléments non significatifs de la Reconnaissance Optique de Caractères.

(Pour comparaison, le texte de l'ouvrage « Père Goriot » n'a pas été nettoyé.)

 

Exemple :

(Images n°36 et 37 de « La Science et l'Hypothèse (1902) Henri Poincaré »)

 

Images avec entêtes et bas de pages

 

Texte extrait sans entêtes et bas de pages

 

 

 

l'expérience n'aurait aucune part.

La notion du nombre rationnel ne leur semblant

pas présenter de difficulté, ils se sont surtout efforcés

de définir le nombre incommensurable. Mais avant de

reproduire ici leur définition, je dois faire une observation,

afin de prévenir l'étonnement qu'elle ne manquerait

pas de provoquer chez les lecteurs peu familiers

avec les habitudes des géomètres.

Les mathématiciens n'étudient pas des objets, mais

des relations entre les objets ; il leur est donc indifférent

de remplacer ces objets par d'autres, pourvu

que les relations ne changent pas. La matière ne leur

importe pas, la forme seule les intéresse.

Si l'on ne s'en souvenait, on ne comprendrait pas

que  M. Dedekind  désigne  par  le  nom  de  nombre incommensurable un simple symbole, c'est-à-dire quelque

chose de très différent de l'idée que l'on croit se faire

d'une quantité, qui doit être mesurable et presque tangible.

Voici maintenant quelle est la définition de

M. Dedekind :

On peut répartir d'une infinité de manières les

nombres commensurables en deux classes, en s'as-

sujettissant à cette condition qu'un nombre quelconque

de la première classe soit plus grand qu'un

nombre quelconque de la seconde classe.

Il peut arriver que parmi les nombres de la première

classe, il y en ait un qui soit plus petit que tous

les autres ; si, par exemple, on range dans la première