Le corpus BFM2019 de la Base de français médiéval a été publié : accéder au corpus.
Le graphisme du portail BFM-TXM a été entièrement repensé et embelli à cette occasion. Les conditions d’utilisation ont été simplifiées et tous les textes sont diffusés sous licence ouverte Etalab.
Le corpus BFM2019 comprend une quinzaine de nouveaux textes et atteint environ 4 700 000 mots. Tous les textes sont encodés selon les recommandations du consortium TEI, balisés pour le discours direct, automatiquement annotés en morphosyntaxe et lemmatisés. L’étiquetage morphosyntaxique a été vérifié pour 4 nouveaux textes (38 textes vérifiés, soit près de 1 000 000 mots) et la lemmatisation pour 18 textes (environ 400 000 mots).
Le corpus s’enrichit aussi de trois nouvelles éditions originales :
- La Vie de saint Alexis par T. Rainsford et C. Marchello-Nizia
- L’Image du monde de Gossouin, version en prose, par N. Kanaoka
- Les Quinze Joies de mariage, par N. Kanaoka sur la base de l'édition imprimée établie par M. Guéret-Laferté, S. Louis et C. Mira, Rouen, Presses universitaires de Rouen et du Havre, 2009.