Les TEI de la Très Grande Bibliothèque (TGB) du Labex Obvil et de la BnF sont désormais référencées et téléchargeables sur le site api.bnf.fr, en tant que jeu de données, à l’adresse :
http://api.bnf.fr/documents-de-gallica-produits-au-format-tei-par-obvil
Le jeu contient la conversion au format TEI de l'OCR d’environ 130 000 monographies numérisées de Gallica, mises à disposition pour la recherche dans le cadre du projet de Très Grande Bibliothèque (TGB) réalisé par le Labex Obvil, en coopération avec la BnF. Les documents sont indexés par auteurs, par siècles et selon la classification Dewey, et peuvent donc aisément constituer des corpus thématiques (littérature et belles-lettres, histoire de France, droit, journalisme, édition, philosophie, etc.).
Le site API et jeux de données décrit et documente l’ensemble des API qui permettent d'interroger et de récupérer les métadonnées des catalogues de la BnF.