![]() |
|
|||
A. Traitement sur les images
Il s'agît de
traitements automatiques suivis par un contrôle qualité.
Recadrage : Afin de réduire la zone non-significative des
images.
Redressage : Afin d'aligner - selon les limites de la
numérisation initiale - les lignes et
les marges des images (voir notes ci-dessous).
Nettoyage : Il est également possible de nettoyer des
imperfections en dehors de la zone imprimée.
Exemple :
(Image n°19 de « Œuvres
de Descartes : Discours de la Méthode (1824) René
Descartes »)
Image issue de la numérisation |
|
après recadrage et redressage |
|
|
|
|
Notes concernant le redressement :
Pour un même ouvrage, le redressement peut être efficace sur une page et
beaucoup moins sur une autre. Les lignes peuvent devenir plus inclinées alors
que les marges sont droites. Parfois, c'est l'un OU l'autre.
Cela est lié à l'algorithme utilisé. Par exemple, prise en compte des
marges externes de la zone imprimée ou un traitement plus fin, mot par mot,
ligne par ligne, donnant parfois un effet de vagues.
Pour les besoins des quatre ouvrages traités ici, le traitement basé sur
les marges externes a été utilisé.
Pour un travail à plus grande échelle il conviendra de combiner plusieurs méthodes.
B. Traitements sur le contenu
Il s'agît de traitements
automatiques suivis par un contrôle qualité.
Nettoyage des entêtes et des bas de pages : Exclure les éléments non significatifs
de la Reconnaissance Optique de Caractères.
(Pour
comparaison, le texte de l'ouvrage « Père Goriot » n'a pas été nettoyé.)
Exemple :
(Images n°36 et
37 de « La Science et l'Hypothèse
(1902) Henri Poincaré »)
|
Images avec entêtes et bas de pages |
|
Texte extrait sans entêtes et bas de pages |
|
|
|
l'expérience
n'aurait aucune part. La notion du nombre
rationnel ne leur semblant pas présenter de
difficulté, ils se sont surtout efforcés de définir le
nombre incommensurable. Mais avant de reproduire ici leur
définition, je dois faire une observation, afin de prévenir
l'étonnement qu'elle ne manquerait pas de provoquer
chez les lecteurs peu familiers avec les habitudes
des géomètres. Les mathématiciens n'étudient
pas des objets, mais des relations entre les objets ;
il leur est donc indifférent de remplacer ces objets par
d'autres, pourvu que les relations ne changent
pas. La matière ne leur importe
pas,
la forme seule les intéresse. Si l'on ne s'en souvenait, on ne
comprendrait pas que M. Dedekind
désigne par le
nom de nombre incommensurable un simple symbole,
c'est-à-dire quelque chose de très différent de
l'idée que l'on croit se faire d'une quantité, qui doit être
mesurable et presque tangible. Voici maintenant
quelle est la définition de M. Dedekind : On peut répartir
d'une infinité de manières les nombres
commensurables en deux classes, en s'as- sujettissant
à cette condition qu'un nombre quelconque de la première
classe soit plus grand qu'un nombre quelconque
de la seconde classe. Il peut arriver que
parmi les nombres de la première classe, il y en ait
un qui soit plus petit que tous les autres ; si,
par exemple, on range dans la première |