Université d’été | Bi-licence "Lettres – Informatique" | Ateliers
PAGE ACCUEIL
HyperPaulhan
HyperPaulhan
Le projet est désormais hébergé à cette nouvelle adresse:
https://eman-archives.org/Paulhan
Nous nous proposons, dans le cadre de ce projet, de mettre en place une base documentaire, critique et intertextuelle, disponible à tous sur Internet à partir des archives déposées au fonds Jean Paulhan à l’Institut mémoire de l’édition contemporaine (IMEC) en 1993.
Ce projet associe des chercheurs du Labex (Didier Alexandre, Michel Murat, Clarisse Barthélémy, Camille Koskas), Claire Paulhan et la société des Lecteurs de Jean Paulhan (SLJP) ainsi que l’IMEC avec qui nous avons signé un accord de collaboration scientifique. Le projet repose sur la numérisation d’une partie du fonds Paulhan à partir des documents appartenant d’une part au fonds Paulhan de l’IMEC, d’autre part à des fonds connexes déposés à l’IMEC (par exemple pour l’établissement de correspondances croisées). Ces documents sont transcrits et présentés par les chercheurs associés qui mènent aussi un travail d’indexation des correspondances de manière à permettre une recherche hypertextuelle aisée.
L’objectif est de valoriser les fonds de l’IMEC, qui comprennent de très riches et très nombreuses collections autour de Jean Paulhan (correspondances, dossiers de presse, manuscrit) mais aussi d’apporter des éclairages sur des pans, parfois mal connus, de la vie littéraire des années 1920 à 1960 dont Jean Paulhan a été l’un des acteurs importants. L’architecture de base du site repose sur un classement chronologique de la correspondance. Ce choix permet de réunir sur un seul support numérique des correspondances que les contraintes de l’édition papier imposent de publier en volumes séparés, et qui comprennent encore de très nombreux inédits. L’utilisateur pourra ainsi accéder à un mois, une semaine, une journée de la vie de Jean Paulhan, voir quelles lettres ont été écrites et reçues ce jour-là et obtenir une image précise des activités de Jean Paulhan et du réseau où elles s’inscrivent à un moment donné, informations dont l’intérêt pour l’histoire littéraire est évident. L’apport du site pour les chercheurs se joue prioritairement dans cette approche chronologique qui permet de valoriser une correspondance prolifique, de résoudre par recoupements certains problèmes de datation, mais aussi de mettre en évidence les échos, les redites, les contradictions qui se jouent d’une lettre à l’autre. Afin de documenter un axe original de recherche et en raison de leur intérêt dans l’itinéraire intellectuel de Jean Paulhan, deux tranches historiques ont été retenues : la période allant de 1925 à 1936, soit La NRF telle que Jean Paulhan la dessine, et la période allant de 1950 à 1958 et qui correspond à la relance de la revue après la guerre.
La perspective générale du site est donc celle d’une correspondance générale de Paulhan, mise en relation avec d’autres événements de la vie littéraire et politique par le moyens de données intégrées au site ou d’hyperliens. A partir de cette base documentaire en bonne partie inédite, le but est de montrer le monde de Jean Paulhan, ses réseaux, son influence. Jean Paulhan, par la multiplicité des auteurs qu’il a côtoyés, des revues qu’il a dirigées et auxquelles il a participé, autant que par la variété de son œuvre, se prête tout particulièrement à cette structure hypertextuelle.
HyperPaulhan
Thomas Bleton
Etudiant associé au Projet Paulhan
Camille Koskas
Université Paris Sorbonne
HyperPaulhan
Rapport ANR 2015
Corpus numérisés :
Les correspondances sont numérisées en concentrant le travail sur deux tranches chronologiques, retenues pour leurs enjeux clés, et le rôle joué par Jean Paulhan dans la vie littéraire de la période : 1925-1936, soit la période de la direction de La N.R.F et de la conquête d’une place centrale dans la vie littéraire, et la période 1950-1958, observatoire sur les nouvelles formes de la vie littéraire après l’épreuve de la guerre et de l’épuration intellectuelle, moment aussi de la reprise de La N.N.R.F aux côtés de Marcel Arland. Sont d’abord numérisées les correspondances inédites, ou épuisées : le projet ne se superpose à aucun projet d’édition de correspondance en cours. A ce jour, 2400 images ont été numérisées, ce qui représente 22 correspondances, dont le nombre de lettres peut être très variable : certains dossiers ne comprennent que quelques lettres, d’autres au contraire représentent des ensembles très imposants : le dossier des lettres de Gabriel Bounoure à Paulhan comprend ainsi 268 lettres. Le corpus est numérisé au rythme des autorisations obtenues par Claire Paulhan auprès des ayants droit. Notons que ces fonds sont régulièrement enrichis par des lettres retrouvées, ou envoyées par des ayants droit. Le projet peut lui-même stimuler les recherches des ayants droit : ainsi, suite à la demande d’autorisation de numériser les lettres de Rolland de Renéville à Jean Paulhan, l’ayant droit de Rolland de Renéville a fait parvenir à Claire Paulhan les copies des lettres de réponse de Jean Paulhan à Rolland de Renéville, qui ont été également numérisées.
Le corpus de travail comprend donc deux spécificités : l’enjeu particulier du projet est tout d’abord lié au cas d’un corpus qui appartient entièrement au XXe siècle. Cela engage de nombreuses questions d’ordre juridique - puisque nous sommes constamment confrontés à des textes sous droit. Pour les études vingtiémistes en cours dans le Labex Obvil (Apollinaire, Ponge), notre projet est donc amené à jouer un rôle pilote. Le projet nécessite une réflexion sur la protection de la propriété intellectuelle dans le cadre d’un travail scientifique en littérature numérique ; il oblige à un travail de préparation bibliographique rigoureux, et à une interaction avec les auteurs, leurs ayants droit, les maisons d’édition. Autre trait spécifique du projet : il s’agit de correspondances, et non de bibliothèques de monographies. Les correspondances à traiter sont nombreuses (on recense plus de 2000 correspondants de Jean Paulhan à l’Imec), de taille variable, d’une inégale précision dans la datation, et les formats des lettres, du billet à la lettre fleuve, sont très différents. Cette spécificité implique la mise en place d’un modèle documentaire et d’indexation spécifique : à ce titre également, le projet constitue un prototype.
Méthodologie de travail
Depuis septembre 2014, des séjours à l’Imec ont lieu à raison de deux ou trois jours par mois afin de numériser le corpus : une douzaine de séjours ont été réalisés depuis cette date. Un espace de travail nous est réservé à l’Imec, avec deux scanners, et deux ordinateurs à notre disposition. Le projet bénéficie du recrutement récent d’Amaury Nauroy, qui aide au travail de préparation des dossiers, de numérisation et de transcription. L’achat d’un second scanner, mais aussi la meilleure maîtrise du processus (scanner et entrée des métadonnées sur le logiciel Filemaker) ont permis une amélioration significative de la rentabilité des séjours à l’Imec. La numérisation suppose un important travail en amont mené par Claire Paulhan, travail de tri, de classement et de datation des lettres, ainsi que de demandes d’autorisation auprès des ayants droits. Nous bénéficions pour les transcriptions de l’aide de membres volontaires de la SLJP, grâce à la mise en place d’un protocole simple de transcription sur traitement de texte : 460 lettres ont été transcrites à ce jour. Enfin, les noms propres et titres d’œuvres sont indexés pour chaque lettre. Il s’agit donc d’un projet mené collectivement, qui mobilise différents acteurs : les ingénieurs du Labex travaillent ainsi en étroite collaboration avec les informaticiens de l’Imec.
Définition des besoins et outil numérique de recherche
La spécificité de notre corpus implique la mise en place d’un modèle documentaire et d’indexation spécifique : c’est une tâche à laquelle nous avons été confrontés dès les débuts du projet (mise en place d’un identifiant pertinent et implémentation des métadonnées pour chaque lettre). Compte tenu de cette spécificité, deux types de besoins ont émergé :
- Besoins en terme d’indexation : celle-ci constitue une des clés d’interrogation du corpus et demande une réflexion sur les éléments de la lettre qu’il est pertinent d’indexer, et sur les formes d’autorité à suivre ou à mettre en place pour cela. Une première vague d’indexation a été réalisée sur une cinquantaine de lettres (indexation des titres d’œuvre, noms de personne, lieux, événements comme une remise de prix littéraire, éditeurs), à titre expérimental, afin de guider la mise en place du site. L’indexation demande un travail de réflexion collective avant qu’un modèle définitif soit arrêté. L’élaboration d’un thésaurus qui permettrait de procéder à une indexation thématique des lettres a pour l’instant été suspendue, faute de moyens suffisants, mais elle constitue une des ambitions du projet, et pourra être menée à bien ultérieurement.
- Besoin en terme d’outils de visualisation : nous souhaiterions nous appuyer sur les outils de modélisation des réseaux existants, dont l’intérêt semble évident dans le cadre d’une correspondance : il s’agira de tracer la carte des réseaux dans lesquels Jean Paulhan évolue grâce à des outils numériques de cartographie, par constellation. Nous souhaitons également examiner la possibilité de constituer des cartes thématiques (épuration, surréalisme, présence de l’art, nouveaux collaborateurs de la NRF) afin de présenter ces réseaux. Nous souhaitons également explorer la possibilité d’un repérage, peut-être en partie automatique, de certains types de lexique : repérage, par exemple, des éléments d’ordre axiologique, renvoyant à l’exercice du jugement critique au sein des lettres, puisque celles-ci constituent un espace d’appréciation, d’interrogation sur la valeur littéraire, mais un jugement au jour le jour, informel, plus instable et moins définitif que celui exprimé dans les écrits publics.
Intérêt scientifique du projet
La constitution de ce corpus numérique représente un enjeu patrimonial évident à travers la valorisation des très riches collections de l’Imec, mais s’inscrit aussi au cœur des problématiques portées par le Labex Obvil. Les correspondances de Jean Paulhan constituent un témoignage très riche sur la vie littéraire des années 1920-1960, dont celui-ci a été un acteur essentiel. A travers la constitution de cette base documentaire en grande partie inédite, le but est de montrer le monde de Jean Paulhan, ses réseaux, son influence, mais aussi, puisque les correspondances sont un lieu d’exercice du jugement littéraire au jour le jour, en train de se constituer, de donner à voir ses prises de position et leur évolution quant à la valeur littéraire. Le cas de Jean Paulhan, par la multiplicité des auteurs qu’il a côtoyés, des revues qu’il a dirigées ou auxquelles il a participé, autant que par la variété de son œuvre, se prête tout particulièrement à ce type de structure. Grâce aux possibilités d’interrogations qu’il offre, le support numérique permet de circuler dans un large corpus, dont la consultation papier n’est pas toujours aisée, en raison de son caractère éclaté : par exemple, l’utilisation du logiciel Medite qui permet de comparer les lettres et d’en détecter les thèmes communs (sachant que Paulhan se répète beaucoup dans les lettres qu’il écrit dans une même période) offre la possibilité de resserrer la datation des lettres en s’appuyant sur celles qui ont déjà pu être datées.
Une journée d’étude est en cours d’organisation pour le 9 juin 2015, à l’abbaye d’Ardenne : celle-ci sera l’occasion d’une réflexion, avec les différents acteurs du projet (chercheurs, ingénieurs, membres de la SLJP transcripteurs) sur les questions que posent les transcriptions et l’indexation des lettres.