Université d’été | Bi-licence "Lettres – Informatique" | Ateliers
PAGE ACCUEIL
Édition numérique
Odette
- Frédéric Glorieux
Version en ligne — Odette est un logiciel libre développé par Frédéric Glorieux qui transforme un document traitement de texte (odt) vers un format structuré strictement sémantique (XML/TEI). Le principe consiste à exploiter toutes les fonctionnalités avancées d’un logiciel bureautique (tables des matières, styles, index…), pour les retranscrire en balises normalisées, cf. Glorieux, 2015.
→XML stats
- Frédéric Glorieux
XML stats est un outil pédagogique et professionnel utile à l’exploration rapide d’un ou plusieurs fichiers XML. Il a été commencé en 2012 par Frédéric Glorieux pour une étude sur le balisage des dictionnaires, l’outil continue sa vie à l’OBVIL. Il fournit différentes statistiques relatives aux balises et au texte qu’elles contiennent, notamment la liste des mots les plus fréquents pour une balise.
→RngDoc, documenter un schéma XML (Relax-NG)
- Frédéric Glorieux
RngDoc est un outil pour extraire et produire la documentation d’un schéma XML/Relax-NG. Il a été initié, développé et maintenu par Frédéric Glorieux depuis 2005. L’OBVIL utilise cet outil pour regénérer régulièrement la documentation du schéma Teibook, que consulte ses éditeurs XML.
→Dramagraph
- Frédéric Glorieux
- Marc Douguet
Démonstration — “Dramagraph” est un logiciel d’analyse de textes théâtraux en XML/TEI développé par Frédéric Glorieux et Marc Douguet. Des perfectionnnements décisifs ont été proposés par Didier Alexandre et Georges Forestier. Il est utilisé par l’OBVIL pour son édition électronique de Molière.
→Livrable
- Frédéric Glorieux
TEI > epub, Démonstration — XML/TEI permet de structurer précisément les textes, pour la recherche et la publication. Epub est un format de livre électronique ouvert, qui, principalement, compresse des fichiers HTML. Livrable dépend de Teinte, une librairie TEI basée sur un schéma Relax-NG qui canalise le balisage, afin d’assurer la transformation en HTML.
→Debook
- Frédéric Glorieux
Epub > TEI — Debook délie un livre électronique (epub) pour essayer de reconstituer un texte cohérent en XML/TEI. Afin de constituer un corpus, il est parfois utile de partir de fichiers epub. Nativement, il s’agit de pages HTML, avec cet avantage relativement à un site web, que les pages ne comportent pas de navigations parasites, et que l’ordre est nscrit dans un fichier de configuration (epub/content.opf).
→Reteint
- Frédéric Glorieux
TEI ► docx — Reteint transforme un fichier XML/TEI en docx (format traitement de textes compatible avec Microsoft.Word, LibreOffice, OpenOffice…), en assurant un stylage optimal pour un retour du document bureautique vers TEI (avec par exemple Odette). Attention cependant, XML/TEI est un format plus complexe que docx, c’est une conversion avec risque de pertes en structure (mais pas en texte). C’est un complément nécessaire à toute bibliothèque TEI, afin de faciliter la réutilisation des textes.
→