PAGE ACCUEIL

Entretien avec Emmanuelle Bermès

19 Mars 2018

Entretien avec Emmanuelle Bermès

Gallica a 20 ans. Quel regard portez-vous sur l’évolution de la bibliothèque numérique de la BnF depuis sa création en 1998 ?

En 20 ans, Gallica est devenu une bibliothèque collective. Le choix de construire Gallica en partenariat, avec d’autres bibliothèques françaises, date de 2003. Ce choix répondait à la nécessité de faire de la sélection et de la numérisation des documents une problématique nationale. Il a été favorisé par une dynamique de numérisation de masse, encouragée par l’Europe à partir 2007, qui a pris la forme de projets internationaux comme Europeana, et qui a permis, en France, de débloquer des financements du CNL. La BnF a ouvert un tiers du marché de la numérisation des imprimés à des partenaires, qui nous envoient leurs collections à numériser. D’autres bénéficient de subventions ou intègrent dans Gallica leurs fichiers déjà numérisés : au total, Gallica compte actuellement près de 400 partenaires. Le partenariat aboutit, dans certains cas, à la création d’une bibliothèque « en marque blanche », comme dans le cas de la Bibliothèque numérique diplomatique du Ministère de l’Europe et des Affaires Étrangères, lancée en mars 2018. Nous fournissons l’infrastructure du site et notre partenaire constitue son fonds numérique à partir du fonds national. Chaque institution prend en charge la moitié des frais.

Où situez-vous la BnF dans sa transition numérique ?

Je distingue trois étapes dans la transition numérique de la BnF. La période 1998-2008 est une phase d’expérimentation, qui a vu la naissance de Gallica et la création d’un département dédié aux projets numériques. À partir de 2008, c’est toute la bibliothèque qui est numérique : le département de la bibliothèque numérique disparaît et son personnel est réaffecté dans d’autres départements. Tous les métiers de la Bibliothèque sont désormais passés au numérique. La troisième phase, celle qui est décrite dans le Schéma numérique que nous avons mis à jour en 2016, est une phase de décloisonnement. Avec le numérique, en effet, la séparation matérielle entre les départements de la BnF est de plus en plus abstraite. Le numérique permet d’accéder dans une même démarche à des documents conservés au département des Cartes et plans, dans celui des Estampes ou dans celui de l’Audiovisuel. Notre archive web, qui est un nouveau type de collection, associe tous les départements à la constitution d’une seule archive.

La transition numérique a également fait évoluer les règles du catalogage...

Le catalogage des bibliothèques s’effectue au format MARC, qui a été inventé dans les années 1960. Depuis environ deux ans, nous cherchons, en effet, à élaborer de nouveaux formats et de nouveaux standards, en utilisant le code international RDA (« Ressource, Description et Accès ») et en nous inspirant du web sémantique. C’est un changement de logique. Le catalogage au format MARC, qui reprenait la fiche de bibliothèque, était descriptif et centré autour du document. Une œuvre était définie par son titre, son auteur, son éditeur, sa date de publication, etc. Or, les gens, sur internet, ne recherchent pas des documents mais des contenus, des personnes, des lieux, des concepts, des idées, etc. La consultation d’un document, en appui d’une recherche, n’intervient qu’au bout de la chaîne. Nos nouveaux standards tentent de reproduire cette démarche. Les notices que nous élaborons ne décrivent pas seulement le document, mais identifient également un certain nombre de concepts. Les catalogues de bibliothèques offraient déjà cette approche thématique à travers les autorités, mais avec le numérique elle devient beaucoup plus centrale. Cette démarche remet aussi en cause certaines traditions de catalogage, comme la règle qui limitait la rédaction d’une notice aux trois premiers auteurs d’un collectif. L’adaptation du catalogue aux usages du numérique et du web a produit un ensemble de petites révolutions dans les pratiques de conservation.

Le site data.bnf.fr est la partie visible de la transition bibliographique. Quel est son projet ?

Data.bnf.fr préfigure l’avenir des catalogues. On y trouve le catalogue actuel de la BnF, ainsi que des informations sur les auteurs, sur les contenus des documents et des liens vers d’autres documents. L’adoption du modèle FRBR (Functional Requirements for Bibliographic Records) est une des innovations très importantes de ce site. Ce modèle permet de relier entre elles l’ensemble des éditions d’une œuvre, ainsi qu’un ensemble de créations dérivées : les traductions, les adaptations pour la scène ou le cinéma, les mises en musique, etc. Et ceci n’est qu’un aspect de la transition en cours : Gallica et l’OCR permettent d’offrir un accès direct aux contenus des documents. Les fonds de la bibliothèque se transforment peu à peu en data exploitable. Toutes ces évolutions nous engagent à redéfinir nos métadonnées, à trouver de nouveaux modèles d’organisation de l’information, à travailler sur l’extraction des entités nommées qui permettra d’accéder plus finement aux contenus. Data.bnf.fr ouvre un grand nombre de perspectives à moyen et à long terme. Je considère que notre mission, de plus en plus, est de mettre à disposition des chercheurs des corpus de données numériques.

En quoi le projet Corpus, que vous coordonnez depuis 2016, contribue-t-il lui aussi à la transformation de la BnF ?

Le projet Corpus a pour objectif de réfléchir aux services que la BnF rendra, dans les prochaines années, à tous ceux qui souhaiteront exploiter ses ressources numériques, Gallica au même titre que data.bnf.fr ou que les archives de l’internet. Nous avons travaillé en partenariat avec plusieurs équipes de chercheurs, et nous avons constaté que les attentes étaient assez différentes d’une discipline à l’autre. Les attentes des chercheurs portent sur la numérisation et le distant reading, sur les métadonnées, sur la cartographie, sur la recherche d’images, etc. Un chercheur du Labex Obvil a par exemple effectué une recherche sur la démographie des auteurs, à partir du catalogue data.bnf.fr, en exploitant des données comme la date de naissance et de mort, ou le sexe de l’auteur, qui sont considérées comme secondaires dans l’univers bibliographique. D’une équipe à l’autre, les compétences ne sont pas non plus les mêmes. Certaines équipes sont peu formées à l’informatique et connaissent bien nos collections : elles attendent que nous leur proposions une plateforme et des outils de recherche performants. Inversement, un chercheur en algorithmique, par exemple, recherche des corpus complexes pour tester des outils et des modèles : il ne connait pas les collections et a besoin d’être accompagné par un conservateur. La création d’un laboratoire spécialisé dans les questions liées au domaine des humanités numériques devrait nous permettre de proposer une nouvelle offre de services d’ici 2020.

Le numérique a-t-il modifié le rapport de la BnF à son public ?

Il y a eu une prise de conscience très forte, ces dernières années, de la mission de service public de la BnF. Cette prise de conscience a été largement favorisée par la transition numérique et elle est portée par l’actuelle présidence. Nous cherchons à multiplier les interactions avec le public, en organisant des événements comme le hackathon. Le site API et données répertorie les interfaces d’exploitation des données de la BnF qui permettent aux usagers de créer de nouveaux services. Le site Gallica Studio référence et encourage les créations des internautes. Nous essayons également de toucher de nouveaux publics. Nous avons été community manager d’un jour sur le site du Huffington Post et nous sommes présents sur les réseaux sociaux. Gallica, par exemple, valorise ses contenus sur Twitter, Facebook, Pinterest et plus récemment Instagram. Le fil #TrouveUnSosieDansGallica a beaucoup de succès. Au-delà de la dimension ludique de ces initiatives, nous essayons de faire passer le message que la BnF est la bibliothèque de tous les citoyens français, où qu’ils soient et quel que soit leur niveau d’éducation et d’approche de la culture. Nous essayons également de montrer d’autres visages de l’institution. Les gens connaissent bien la mission patrimoniale de la BnF, comme l’a montré le succès de l’exposition sur François Ier (mars-juin 2015). Ils sont au courant que nous conservons des manuscrits enluminés et des incunables, et que ces trésors sont accessibles sur Gallica. Ils savent moins que la BnF possède une immense archive de l’internet, qui a fêté ses 20 ans en 2016, que nous préservons aussi le patrimoine des jeux vidéos et que Gallica offre des contenus insoupçonnés comme des photos de spectacles de rue, de marionnettes, de masques, de décors d’opéra ou toute la collection des appareils de lecture de Charles Cros, qui regroupe des tourne-disques, des gramophones et d’autres machines bizarres…

propos recueillis par Romain Jalabert