La grande aventure de la numérisation des livres

Foto: Martina Schneibergová

Toutes les six semaines, un camion chargé de livres anciens quitte la Bibliothèque nationale de Prague pour se rendre dans les centres de numérisation de la société Google en Allemagne ou en Italie. Pour des raisons de sécurité, les lieux concrets où se trouvent ces centres sont gardés secrets. La Bibliothèque nationale de Prague et Google se sont associés pour réaliser un projet d’une importance considérable pour la culture mondiale. Google s’est engagé à numériser une partie importante des fonds historiques de la Bibliothèque nationale, et un accord sur cette coopération a été signé en 2010. La réalisation du projet a commencé cette année.

Photo: Martina Schneibergová
La Bibliothèque nationale de Prague est ainsi devenue la douzième bibliothèque européenne avec laquelle Google a conclu un accord de ce genre. Ces trois dernières années, les bibliothécaires de Prague ont donc choisi des livres considérés comme « numérisables » selon les paramètres de Google. Un des principaux paramètres est l’ancienneté de ces ouvrages. Il doit s’agir de livres qui sont entrés dans le domaine public et dont l’usage n’est plus restreint par la loi. Secrétaire de la Bibliothèque nationale pour les sciences, la recherche et les relations internationales, Adolf Knoll précise quelles sont certaines des autres conditions établies par Google qui réduisent le choix des livres pouvant être numérisés :

Adolf Knoll
« Il s’agit notamment des livres qui sont très abîmés. Il existe un manuel de Google qui définit clairement jusque dans quelle mesure un livre peut être abîmé pour pouvoir encore être admis dans le processus de numérisation. Google refuse également les grands formats car il ne dispose pas de scanners de grandes dimensions, pas plus qu’il n’accepte les ouvrages d’une valeur supérieure à 10 000 dollars qu’il serait obligé d’assurer. »

Google prend à sa charge les principaux frais de l’opération, c’est-à-dire non seulement ceux liés à la numérisation mais aussi au transport. La Bibliothèque nationale ne paie, elle, que les préparatifs pour la numérisation et le contrôle après le retour des livres. Avant d’être admis par Google, les livres doivent être indexés et dotés d’un code-barres. Chaque livre destiné à la numérisation est examiné attentivement et soumis à une série de mesures préparatoires. Les conservateurs de la Bibliothèque nationale doivent d’abord « faire sa toilette ». Cette tâche est confiée au département de restauration de la Bibliothèque nationale. Sa directrice, Jana Dřevíkovská, répertorie ces différentes tâches :

Photo: Martina Schneibergová
« Les travaux de restauration commencent par le nettoyage mécanique de chaque volume, puis par une analyse qui définit les mesures de prévention devant être prises. Il s’agit de menus travaux de restauration qui sont réalisés sur place. Nous voulons minimaliser ces opérations pour pouvoir expédier un grand nombre de livres. Nous cherchons donc surtout à les stabiliser, à améliorer leur consistance pour que les scannéristes puissent les manipuler sans qu’ils se disloquent. La manipulation de ces ouvrages doit se faire dans la sécurité. Les livres trop abîmés passent dans un atelier spécial où ils sont soumis aux procédés de restauration habituels. Depuis 2011, nous avons préparé près de 115 000 ouvrages historiques à la numérisation et nous espérons que toute l’opération s’achèvera en 2016. »

140 000 volumes seront numérisés au cours de la réalisation de ce projet de coopération et seront presque aussitôt mis à la disposition des lecteurs et spécialistes du monde entier sur Google Books. Simultanément, la Bibliothèque nationale de Prague poursuit son propre projet de numérisation des fonds. Ce projet est mené par ses propres spécialistes et sur ses propres scanners. Chef de la section « Numérisation et technologie » de la Bibliothèque nationale, Luděk Tichý constate que ces procédés diffèrent dans une certaine mesure de ceux utilisés par Google. Tandis que chez Google les travaux sont effectués par les scannéristes avec une part importante de travail manuel, à Prague la numérisation est plus automatisée :

Photo: International Dunhuang Project,  CC BY-SA 3.0 Unported
« Au début, le livre choisi est dépoussiéré et nettoyé. Puis le livre est catalogué, c’est-à-dire que l’employé chargé de ce travail recherche sur ordinateur si le livre ne figure pas déjà dans un catalogue et enfin le livre passe sous un scanner, ou si vous préférez un numériseur. Cet appareil de numérisation est automatique et travaille seul, mais, parfois, les pages sont collées par exemple, et le scannériste doit donc contrôler l’ensemble du processus sur un moniteur et intervenir manuellement quand cela est nécessaire. Ensuite, le livre passe au contrôle final qui exige la plus grande part du travail manuel et où nous employons aujourd’hui trente à quarante personnes. Ces employés contrôlent sur leurs ordinateurs les livres page par page. Ils vérifient si le texte est bien numérisé, si l’ensemble de la page est bien visible, elles veillent à ce que toutes les pages aient le même format. C’est en cela que réside l’importance de cette manufacture. »

Le centre de numérisation de la Bibliothèque nationale est composé de deux départements où travaillent au total quelque soixante scannéristes sur huit machines. Ils numérisent près de 50 000 pages par jour. Plus le nombre d’ouvrages numérisés augmente, plus le coût de la numérisation d’un livre diminue. Grâce au nombre élevé soumis au procédé, la numérisation d’un livre ne coûte en moyenne que huit couronnes (0,30 euro).

Photo: Martina Schneibergová
La numérisation permettra de sortir de l’oubli, entre autres, les fonds de la Bibliothèque slave, un des départements de la Bibliothèque nationale tchèque qui réunit des livres et des documents écrits sur les pays slaves et publiés dans ces pays. Dans ces fonds se trouvent beaucoup de raretés, comme par exemple un ensemble de manuscrits et de livres sur la ville de Dubrovnik ou une importante collection de littérature russe des XVIIIe et XIXe siècles rassemblée par l’éditeur et libraire de Saint-Pétersbourg Alexandre Philippovich Smirdine et qui compte près de 14 000 volumes. Selon Lukáš Babka, directeur de la Bibliothèque slave, 20 à 25 000 ouvrages de sa bibliothèque seront également numérisés :

Photo: Martina Schneibergová
« Pour la Bibliothèque slave et pour le public mondial, ce projet revêt une importance spéciale surtout parce que la majorité de ces livres ne sont pas écrits en tchèque. L’utilité de ce projet est donc globale, car ces livres ne seront pas lus seulement par les Tchèques mais par les spécialistes du monde entier. (…) Nous proposons à la numérisation des collections complètes d’ouvrages des XVIIIe et XIXe siècles. Notre choix est limité par la date de publication de ces livres dont l’ancienneté doit dépasser 140 ans. Les éditions postérieures ne sont pas admises par Google à cause des droits d’auteurs. »

La direction de la Bibliothèque slave aimerait numériser cependant aussi des livres plus récents. Elle propose donc à Google d’inclure au projet les livres imprimés entre 1874 et 1900. Il va de soi que ne pourront être admis que les livres entrés dans le domaine public et qui ne sont plus protégés par les droits d’auteurs. Les négociations sur cette question avec Google sont en cours.