# Notes GT3 Ariane : Recensement de scripts à des fins éditoriales Consortium Ariane ## Prépa bilan pré-AG 2025 (30 Octobre 2025) 16h-17h Jorge F., Andrés E., Benjamin G. ### Cette année : - Passage de 5 à 11 membres fonctionnant sans financement. - Stabilisation des procédures, notamment auprès des nouveaux membres (dont formation Scenari/GitLab). - Mise en place d'install partys - Compatibilité avec le vocabulaire TadiRaH envisagé (conclusion : sous réserve de moyens). ### À venir : - Passer à un rythme d'install party mensuel - Diffusion autour de l'initiative, notamment auprès de listes de diffusion, afin de repérer d'autres scripts et de compléter le recensement - Journées EdiScript Yourself en mars 2026 à Tours (sous réserve de moyens) - Publication d'une version 1.0 du recensement pour Novembre 2026 ## Réunion du 30 octobre 2025 14h-16h Jorge F., Andrés E., Alexandre W., Benjamin G., Mathilde LM., Demande de financement de l'axe 1 du GT3 ARIANE pour l'aide au recensement de scripts. Une réponse du CoPil devait être donnée le 10 octobre, mais aucune décision n'a été prise, car il n'y avait pas assez de personnes présentes. Sans budget supplémentaire, le GT3 est en lien avec : - Une personne de Biblissima+ intéressée par le projet et qui travaille sur la réconciliation des identifiants via OpenRefine et les LLM. - Une personne du CERES (Sorbonne Université), travaillant aussi sur les LLM et les corpus de données textuelles. - La Maison de la Recherche en Sciences Humaines de Caen a été sondée, en particulier les équipes travailant sur MaX. Georges prévoit une journée autour des scripts à la MSH Val-de-Loire, Jules et Vincent sont intéressés. Georges a un projet de publication relatif au recensement des scripts qui a été retenu. ## Réunion du 23 juin 2025 14h-16h Jorge, Alexandre, Vincent, Benjamin, Jules, Mathilde, Daphné Echanges autour de la mise en place d'une taxonomie basée sur Tadirah suite à un test de Jorge. Le retour est mitigé car il implique une charge de travail supplémentaire Envisagé : - Conserver a minima le travail de taxonomie entamé, sans aller dans les niveaux les plus profonds N4 et N5, et passer le critère Type d'opération en critère mot clé libre (sans dépasser la limite de 8 valeurs au total). PS (JF) : a posteriori, je pense que la limite du nombre de valeurs, non pas technique mais lié à un souci de lisibilité, rend son usage pas assez intéressant. - Ultérieurement, si une relation par exemple avec DARIAH et des moyens peuvent être débloqués, envisager un export des sources Scenari vers SKOS Tadirah, par exemple. Si oui, il faudra ajouter au préalable des URI pour chaque valeur de critère qui aurait un équivalent Tadirah. A faire - Tests de scripts à 2,3,4 personnes en septembre (Date à déterminer) - Achever la rédaction/validation des notices pour atteindre le nombre de 50 avant l'AG du 14 novembre. => réunion en Octobre ## Réunion du 3 mars 2025 14h-15h30 Jorge, Marine, Alexandre, Vincent Migration des notes du document Framapad vers le [Kanboard](https://kanboard.huma-num.fr/?controller=BoardViewController&action=show&project_id=1607) : 32 scripts ajoutés. - A assigner : 17 - A rédiger : 4 - A contrôler : 11 :warning: Pas de modèle de tâche possible pour en créer une nouvelle :bulb: Idée : créer une tâche-modèle, mais impossible à épingler ## Réunion du 10 février 2025 Définition/texte de présentation : Les scripts recensés ici sont des fichiers ou ensemble de fichiers informatiques servant à l'édition scientifique comportant un volet numérique dans une démarche open source. Ils permettent d'effectuer une à quelques opérations, et sont classés selon différents critères retenus pour proposer à différents utilisateurs un moyen de les distinguer. Ce recensement ne contient pas de logiciels faisant l'objet d'une visibilité suffisante auprès des communautés intéressées, mais peut être alimenté par des scripts faisant partie de ceux-ci. -------------------- Affinage des critères : SSH Opn Marketplace : tools, workflow et scripts ne sont pas équivalents. En revanche, les valeurs de critères activities pourraient être réemployés avec intérêt en tant que sous-types de nouveaux grand types (Conversion, Analyse, Affichage, etc). -------------------- Formation Scenari/Git : 17 24, 27, 31 mars, 3 avril, 5, 12, 15, 19, 22, 26 mai que les lundi. Schéma de David : autre : Segmenter, , Détecter. Distinguer ce qui rentre/sort : format. => un tableau comparatif de catégories/critères : Scenari actuel/TAPOR/SSH OpenMarketplace/Article A.Pinche https://vocabs.dariah.eu/tadirah/en/page/enriching Taxonomie. Prérequis : Logiciel installé sur le poste de travail Dépendences : un paragraphe de notice à part entière Autre : SKOSMOS, OpenTheso, IDKey Tuto : Alexandre intéressé pour regard extérieur. Lecteur : Jules. Kanboard : API => y passer le contenu du framapad https://codimd.math.cnrs.fr/ => y passer le contenu du framapad => Vincent (avec Jorge, Jules, voire Marine et Alexandre) ## Copie du document Framapad (archivé le 3 mars 2025) https://annuel2.framapad.org/p/ariane-gt3-script-a5x2?lang=fr Interface de recherche https://axe-1-gt3-outils-et-pratiques-editoriales.gitpages.huma-num.fr/scripts/recensement (URL stable et communicable) Template de recensement Nom : URL : Prérequis : Logiciel/Invite de commande/Navigateur web Opération : Conversion/Métadonnées/Linguistique/Vérification/Edition critique/Catalogage/Balisage automatique/Affichage Langage de développement : XSL/PHP/Python/JS/... format d’entrée/sortie : HTML/CSV/TEI/TXT/DOCX/LaTeX/... Licence : Modifiable/Non modifiable/Réutilisable/Non réutilisable/Inconnue Accompagnement : aucun/tutoriels/développeur/communauté/inconnu Description : Contexte d'utilisation : Scripts intégrés dans Scenari Vérification Benjamin ------- [GP maj dans scenari 17/09/2024] Nom : Circe (~ Web UI) URL : https://pypi.org/project/circe-certic/ ; https://circe.unicaen.fr/ui/ Interface graphique : Les deux Opération : Conversion Compétence/langage informatique : python format d’entrée/sortie : HTML, PDF, TEI, Markdown, DocX (et plein de formats de Pandoc…) Licence : Modifiable, Réutilisable (CeCILL-B, compatible GNU GPL) Accompagnement : inconnu Description : API web pour la transformation de documents. Contexte d'utilisation : Maintenu par le CERTIC (Université de Caen) [GP vu] [BG màj dans scenari 17/09/2024] Nom : ODD 2 Manual URL : https://gitlab.com/Annegf/xslt4tei/-/tree/main/odd2manual Interface graphique : Sans Opération : Conversion Compétence/langage informatique : XSL format d’entrée/sortie : TEI, HTML Licence : GNU GPL (cachée ici : https://gitlab.com/Annegf/xslt4tei/-/commit/a86bd04e906ad105e929e509a1c67f15a410d13b#55c47ccf0acc678bfaf7675cdf30850275a13562_7_7) Accompagnement : inconnu Description : Crée un manuel au format HTML à partir d'un fichier ODD. Contexte d'utilisation : [MD màj dans scenari 17/09/2024] Nom : QTEI URL : https://github.com/ieg-dhr/QTEI Interface graphique : Avec (oui car le programme est une interface graphique en soi, mais pour le faire marcher, il nécessite un poil de HTML, et il peut être intégré comme module dans un projet JS, donc « Avec » ou « Les deux » ?) Opération : Affichage Compétence/langage informatique : JS format d’entrée/sortie : TEI, JSON, HTML Licence : Modifiable, Réutilisable (AGPL-3.0) Accompagnement : Communauté Description : Affiche au choix plusieurs vues (TEI, HTML, Carte avec Leaflet, Facsimile avec IIIF) Contexte d'utilisation : [MD] Nom : Heimdall URL : https://gitlab.huma-num.fr/datasphere/heimdall Interface graphique : Sans Opération : Conversion Compétence/langage informatique : XQuery format d’entrée/sortie : CSV, XML Licence : Réutilisable, Modifiable (GNU Affero) Accompagnement : Inconnu Description : Conversion CSV, XML vers XML Contexte d'utilisation : créé par Estrades et Datasphere (portés par la Maison Interuniversitaire des Sciences de l'Homme - Alsace (MISHA — UAR 3227) et le laboratoire Arts, civilisation et histoire de l'Europe (ARCHE — UR 3400) Nom : TEI-garage https://teigarage.tei-c.org/ ; https://github.com/TEIC/TEIGarage Interface graphique : Les deux Opération : Conversion Compétence/langage informatique : non (optionnel), sinon image Docker format d’entrée/sortie : csv, DocBook, ePub3, LaTeX, Markdown, doc, NLM DTD 3.0, sxw, odt, PDF, TXT, RDF XML, rtf, TEI P5 XML, TEI XML, VerbatimXML, xHTML, XML, XSL-FO Licence : Réutilisable, Modifiable (GNU GPL3) Accompagnement : Communauté Description : Conversion de documents/Présentations/feuilles de calcul webservice et API REST (code source disponible à https://github.com/TEIC/TEIGarage/) Contexte d'utilisation : Fin vérification Benjamin ------- ---- début vérif Marine Nom : bibtex-tidy Lien (application) : https://flamingtempura.github.io/bibtex-tidy/index.html Lien (dépôt) : https://github.com/FlamingTempura/bibtex-tidy Interface graphique : Les deux Opération : conversion, vérification Compétence/langage informatique : TeX, TS format d’entrée/sortie : bibTeX Licence : réutilisable, modifiable (MIT) Accompagnement : Développeur Description : application en ligne de formatage et nettoyage de fichiers bibtex (bibliographie LaTeX). Contexte d'utilisation : Rédaction en LaTeX Nom : NakalaQuartoView URL : https://gitlab.huma-num.fr/mshs-poitiers/plateforme/nakala-quarto-view Interface graphique : Sans Opération : création de fichiers MD à partir de résultats de requêtes sur l'API Nakala, puis transformation en HTML par Quarto.=> Affichage / exposition Compétence/langage informatique : Python (optionnel), Markdown (optionnel) format d’entrée/sortie : MD/Html/Javascript Licence : indéterminée Accompagnement : Développeur, tutoriel Description : script Python pour générer un site web statique à partir de collections déposées sur Nakala Contexte d'utilisation : bibliothèque virtuelle en ligne Nom : IIIF-AV-player URL : https://github.com/DDMAL/IIIF-AV-player Interface graphique : Les deux Opération : Affichage Compétence/langage informatique : JS format d’entrée/sortie : MEI/JSON Licence : Modifiable/Réutilisable Accompagnement : Communauté Description : Visualiseur de fichier MEI sous forme de partition avec lecture audio/video en parallèle Contexte d'utilisation : Nom : Max URL : https://mrsh.unicaen.fr/max/ Interface graphique : Avec Opération : Affichage Compétence/langage informatique : XSL/XQuery format d’entrée/sortie : HTML/XML/TEI Licence : Modifiable/Réutilisable Accompagnement : développeur/communauté Description : MaX est un outil générique extensible capable de produire des interfaces de lecture pour tous les standards XML. Il propose cependant par défaut un certain nombres de modules pour la TEI. Il fournit un moteur de recherche XQuery, et embarque OpenSeadragon pour les images. Contexte d'utilisation : Il est développé par le CERTIC et le pôle Document Numérique. Il est testé sur les plateformes macOS et Linux/Debian. Nom : TeiPublisher URL : https://teipublisher.com/exist/apps/tei-publisher-home/index.html Interface graphique : Avec Opération : Affichage Compétence/langage informatique : PHP/Xquery format d’entrée/sortie : HTML/TEI Licence : Modifiable/Réutilisable Accompagnement : développeur Description : Outil de publication TEI Contexte d'utilisation : ---- fin vérif Marine ------ début vérif Guillaume Nom : Transcript URL : https://gitlab.com/eman8/transcript Interface graphique : Les deux Opération : Affichage/Balisage Compétence/langage informatique : PHP/Javascript format d’entrée/sortie : TEI Licence : Inconnue Accompagnement : communauté/développeur Description : Extension Omeka Classic permettant d'éditer et d'afficher des transcriptions en XML - l'installation du plugin dans Omeka nécessite des compétences en langages web (PHP, javascript, etc.), mais son utilisation se fait via une interface web. Contexte d'utilisation : plugin développé par et pour la plateforme EMAN. La possibilité de réutilisation sur d'autres instances Omeka Classic n'est pas précisé par la licence. Nom : Transcript for Omeka-S URL : https://gitlab.com/eman8/transcript-omeka-s Interface graphique : Avec Opération : Affichage/Balisage Compétence/langage informatique : PHP/Javascript format d’entrée/sortie : TEI Licence : Inconnue Accompagnement : communauté/développeur Description : Extension Omeka S permettant d'éditer et d'afficher des transcriptions en XML - l'installation du plugin dans Omeka nécessite des compétences en langages web (PHP, javascript, etc.), mais son utilisation se fait via une interface web. Contexte d'utilisation : plugin développé par et pour la plateforme EMAN. La possibilité de réutilisation sur d'autres instances Omeka S n'est pas précisé par la licence. Nom : Webmedia (modèle Scenari) URL : https://download.scenari.software/Webmedia@5.0.1/ Interface graphique : Avec Opération : Affichage Compétence/langage informatique : HTML format d’entrée/sortie : HTML/DOCX/MP4/XML Licence : Modifiable/Réutilisable Accompagnement : communauté Description : Webmedia permet de structurer, enrichir et diffuser des contenus audiovisuels et sonores sur le Web (émissions de radio, valorisation de cours et conférences...). Contexte d'utilisation : À installer sur un environnement SCENARIchain. Nom : Twine URL : https://twinery.org/ Interface graphique : Avec Opération : Affichage Compétence/langage informatique : JS format d’entrée/sortie : HTML Licence : Modifiable/Réutilisable Accompagnement : communauté Description : Édition non linaire, à embranchement - CC BY-SA Contexte d'utilisation : ? Nom : Tei2Txt URL : https://github.com/haoess/dta-tools/blob/master/tei2txt/share/xslt/tei2txt.xsl Interface graphique : Sans Opération : Conversion Compétence/langage informatique : XSL format d’entrée/sortie : TEI/TXT Licence : Modifiable/Réutilisable Accompagnement : développeur Description : Conversion de fichier TEI en texte brut. Contexte d'utilisation : Utilisé par le projet Deutsches Textarchiv Nom : Alto2txt URL : https://github.com/Living-with-machines/alto2txt/ Interface graphique : Sans Opération : Conversion Compétence/langage informatique : XSL/Python format d’entrée/sortie : XML/TXT Licence : Modifiable/Non modifiable/Réutilisable/Non réutilisable/Inconnue Accompagnement : communauté Description : conversion de fichers ALTO/METS issu des OCR vers du plein texte, avec un minimum de métadonnées résiduelles Contexte d'utilisation : ATR ----- Fin vérif Guillaume ----- début vérif David Nom : Diva.js (Document Image Viewer with AJAX) URL : https://github.com/ddmal/diva.js Interface graphique : Avec Opération : Affichage Compétence/langage informatique : HTML/JS format d’entrée/sortie : HTML/JSON Licence : Modifiable/Réutilisable (MIT License) Accompagnement : communauté (wiki et ticket/issue) Description : Visionneuse d'images de livre basée sur IIIF Contexte d'utilisation : exposition / Bibliothèque virtuelle. Note: MAJ 2024 Nom : EVT (Edition Visualization Tool) URL : https://sourceforge.net/projects/evt-project/ Interface graphique : Avec Opération : Edition critique/Affichage Compétence/langage informatique : XSL (XSLT/XPath/XSL-FO), JavaScript format d’entrée/sortie : HTML/XHTML/TEI Licence : Modifiable/Réutilisable (GNU General Public License version 2.0) Accompagnement : communauté / feedback to evt.developers@gmail.com Description : Éditions critiques diplomatiques et/ou interprétatives à partir de documents encodés en XML TEI. Contexte d'utilisation : exposition / Bibliothèque virtuelle (avec possibilité de sélection par entités nommées, mots-clés, etc. Affichage de la ressource image, zoom, lien image-texte). Note: dernière MAJ 2020 Nom : Versioning Machine URL : http://v-machine.org/download/ Interface graphique : Avec Opération : Edition critique/Affichage Compétence/langage informatique : XSL/JS format d’entrée/sortie : HTML/TEI Licence : Modifiable/Réutilisable (GNU General Public License) Accompagnement :communauté Description : Edition critique de versions de texte affichées en parallèle Contexte d'utilisation : Dernière version 5.0. Notes: Peut nécessiter de passer par une transformation XSLT dans Oxygen. Dernière release 2016. Plus aucune activité, ni site présenté, ni référence, sur le site web après cette date. deux pages en erreur "type 404". Nom : Converter RDF to TEI URL : https://gitlab.huma-num.fr/axe-1-gt3-outils-et-pratiques-editoriales/scripts/scripts-tei-afe/-/blob/db1f1702ed8952222a1bc8e622319ac6fa055ac2/converterRDFtoTEI.ipynb Interface graphique : Sans (notebook Jupyter) Opération : Conversion Compétence/langage informatique : Python format d’entrée/sortie : RDF/TEI/XML Licence : Modifiable/Réutilisable [ Sauf indication contraire, les scripts dans ce dépôt sont mis à disposition pour la contribution et le développement avant leur publication dans le cadre du consortium ARIANE, qui devra déterminer quelle est la licence qui permet leur utilisation, modification et partage. ] Accompagnement : Développeur (ticket/issue sur le dépôt Gitlab) Description : Script pour convertir un thesaurus Opentheso (RDF) en taxonomie XML-TEI Contexte d'utilisation : adapté aux applications de recherche et d'éducation ----- fin vérif David Restent à intégrer Nom : Storymap URL : https://github.com/jakobzhao/storymap Interface graphique : Avec/Sans/Les deux Opération : Conversion/Métadonnées/Linguistique/Vérification/Edition critique/Catalogage/Balisage automatique/Affichage Compétence/langage informatique : XSL/PHP/Python/JS/... format d’entrée/sortie : HTML/CSV/TEI/TXT/DOCX/LaTeX/... Licence : Modifiable/Non modifiable/Réutilisable/Non réutilisable/Inconnue Accompagnement : aucun/tutoriels/développeur/communauté/inconnu Description : Contexte d'utilisation : Nom : HeuristToR URL : https://alietteroux.github.io/HeuristToR/ Interface graphique : Avec/Sans/Les deux Opération : Conversion/Métadonnées/Linguistique/Vérification/Edition critique/Catalogage/Balisage automatique/Affichage Compétence/langage informatique : R format d’entrée/sortie : XML Licence : Modifiable/Réutilisable (GPL V2 et supérieure) Accompagnement : aucun/tutoriels/développeur (bug report) Description : Analyses quantitatives sur une base de données Heurist (préalablement exportée en XML) Contexte d'utilisation : ----- David Nom : XMLify URL : https://gitlab.huma-num.fr/mshs-poitiers/plateforme/xmlify Interface graphique : Les deux Opération : Conversion/Métadonnées Compétence/langage informatique : Python (optionnel) format d’entrée/sortie : CSV/TEI/Sitemap Licence : Modifiable/Non modifiable/Réutilisable/Non réutilisable/Inconnue Accompagnement : tutoriel/développeur Description : XMLify transforme une feuille de calcul CSV contenant des métadonnées (avec entête de colonnes) avec un fichier de mapping (correspondance) dans l'une des sorties suivantes: fichier d'entête XML TEI fichier XML Nakala (v.1 obsolète) fichier Sitemap Options de traitement spécifiques: les "feuilles" XML vides peuvent êtres supprimées les branches XML peuvent êtres répétées ou fusionnées Contexte d'utilisation : exportation d'un tableur de métadonnées vers plusieurs formats. ----- fin David ----- Debut Rédaction de fiches Andrés Nom : CETEIcean URL : https://github.com/TEIC/CETEIcean Interface graphique : Sans (bibliothèque JavaScript) Opération : Affichage Compétence/langage informatique : JavaScript/CSS format d’entrée/sortie : TEI/HTML Custom Elements Licence : Réutilisable, Modifiable (BSD 2-clause) Accompagnement : Développeur/Communauté Description : bibliothèque JavaScript qui permet d'afficher des documents TEI XML directement dans un navigateur web sans transformation préalable en HTML. Elle utilise les standards Web Components, particulièrement des Custom Elements, pour convertir dynamiquement les éléments TEI en éléments HTML personnalisés avec le préfixe "tei-". La bibliothèque préserve intégralement la structure et les informations du schéma TEI qui permettent de créer des applications web à partir des documents sources avec CSS et JavaScript. Contexte d'utilisation : Développé par Hugh Cayless et Raffaele Viglianti, CETEIcean est utilisé notamment par le Digital Latin Library (DLL) pour un workflow de développement distribué via GitHub Pages, et dans l'enseignement TEI au Maryland Institute for Technology in the Humanities. Il permet un workflow "push to publish" où les éditeurs peuvent voir immédiatement le rendu de leurs documents TEI en poussant simplement vers GitHub, sans nécessiter de compétences XSLT. ----- Comentaire: j'ai mis le repo et non pas la doc dont le lien est ici : https://www.balisage.net/Proceedings/vol21/html/Cayless01/BalisageVol21-Cayless01.html#d486437e34 je n'ai pas compris l'idée du TARIAH mais je le placerais ici : https://vocabs.dariah.eu/tadirah/digitalPublishing Nom : dbTagger URL : https://github.com/aerhard/dbTagger Interface graphique : Avec (plug-in pour oXygen XML Editor) Opération : Balisage automatique Compétence/langage informatique : Java/XQuery/JSON format d’entrée/sortie : XML/TEI (insertion d'identifiants depuis bases de données) Licence : Réutilisable, Modifiable (Apache-2.0) Accompagnement : Développeur Description : Plug-in pour oXygen XML Editor qui ajoute des boîtes de dialogue (pop-up pour) faciliter la recherche d'identifiants ou de noms (personnes, lieux, références bibliographiques dans les documents TEI) dans des bases de données locales ou distantes et leur insertion dans des documents XML. Le plug-in permet des recherches configurables sur serveur, des modèles définis par l'utilisateur pour formater les données récupérées pour l'annotation. Contexte d'utilisation : Dévélopé par Alexander Erhard, dbTagger est conçu pour faciliter l'enrichissement sémantique de documents XML/TEI en permettant aux éditeurs de rechercher et d'insérer rapidement des identifiants d'autorité depuis des bases de données externes au document en cours d'annotation. ----- Comentaire: j'ai mis aussi JSON parce que les requêtes à la Base de données remontent en JSON. En core une fois, je n'ai pas compris l'idée du TARIAH mais je le placerais dans l'un de ces deux : https://vocabs.dariah.eu/tadirah/associating https://vocabs.dariah.eu/tadirah/visualAnnotation ----- *Prises par Andrés sans les consensus de l'équipe :* ----- **Nom** : Dépôt par lot dans Nakala **URL** : https://github.com/MSHB-Plateforme-Humanites-Numeriques/depot-lot-nakala **Interface graphique** : Sans (scripts Python en ligne de commande) **Opération** : Catalogage **Compétence/langage informatique** : Python **Format d'entrée/sortie** : CSV, ODS, XLSX / Dépôt API Nakala **Licence :** Attribution-NonCommercial-ShareAlike 4.0 International **Accompagnement** : Développeur/Communauté (guide Jupyter Notebook détaillé, scripts d'exemple) **Description** : Ensemble de scripts Python pour faciliter le dépôt automatisé de données par lot dans l'entrepôt Nakala via son API. L'outil comprend un guide sous forme de Jupyter Notebook expliquant la construction des scripts, ainsi que plusieurs scripts spécialisés : dépôt par lot (statut privé), publication par lot (statut public), suppression par lot, et demande de modération par lot. Des modèles de tableurs (ODS/XLSX) sont fournis pour faciliter la saisie des métadonnées, avec conversion CSV pour utilisation par les scripts. **Contexte d'utilisation** : Développé par la Plateforme Humanités Numériques de la MSHB (Maison des Sciences de l'Homme en Bretagne), cet outil s'adresse aux chercheurs et projets académiques français ayant des besoins de dépôt massif de données dans Nakala. Il permet d'automatiser les workflows de dépôt tout en respectant les recommandations de qualité des données de l'entrepôt. L'outil est adapté aux projets de recherche qui produisent grandes quantités de données nécessitant un traitement par lot plutôt qu'un dépôt individuel manuel. **Taxonomie** : https://vocabs.dariah.eu/tadirah/publishing Nom : SimplEAD URL : https://francearchives.gouv.fr/simplead/ Interface graphique : Avec (service en ligne) Opération : Conversion Compétence/langage informatique : Aucune (interface web) Format d'entrée/sortie : XLSX, ODS / XML EAD2002 Description : Service en ligne gratuit (francearchives.gouv.fr) permettant la conversion d'instruments de recherche archivistiques saisis sous forme de fichiers tableur (.xlsx ou .ods) en XML EAD2002 valide. L'outil propose des modèles de fichiers structurés en trois onglets : intitulé_inventaire (métadonnées éditoriales correspondant à <eadHeader>), description_du_fonds (description de niveau fonds correspondant à <archdesc>), et description_cote (description des unités documentaires sur 5 niveaux hiérarchiques maximum correspondant aux éléments <c>). Le service supporte l'indexation multiple (lieux, personnes, institutions, matières) avec séparateur "@" et impose des champs obligatoires pour assurer la validité EAD. Contexte d'utilisation : SimplEAD s'adresse aux archivistes et professionnels du patrimoine souhaitant produire des instruments de recherche conformes au standard EAD2002 sans compétences techniques en XML. L'outil facilite la transition du tableur vers le XML structuré en respectant les bonnes pratiques archivistiques. Il permet un workflow simple : téléchargement du modèle, saisie locale des données, upload du fichier complété et téléchargement de l'EAD généré. La limitation à 5 niveaux hiérarchiques encourage des arborescences efficaces pour la recherche documentaire. ----- Comentaire: En core une fois, je n'ai pas compris l'idée du TARIAH mais je le placerais dans: https://vocabs.dariah.eu/tadirah/en/page/converting Cela dit sur le site de FranceArchives apparait classé comme "Classer et décrire" je laisse les entités Tadirah: https://vocabs.dariah.eu/tadirah/en/page/description et https://vocabs.dariah.eu/tadirah/en/page/managing ou https://vocabs.dariah.eu/tadirah/en/page/organizing ----- *Ajoutée par Andrés sans les consensus de l'équipe :* ----- **Nom** : Mynkl **URL** : https://mynkl.huma-num.fr/ **Interface graphique** : Avec (application web) **Opération** : Catalogage **Compétence/langage informatique** : Aucune (interface web) **Format d'entrée/sortie** : CSV / Dépôt Nakala (données et métadonnées) **Licence** : Creative Commons Attribution Non Commercial Share Alike 2.0 Generic **Accompagnement** : Tutoriels (documentation détaillée avec captures d'écran) Tikets sur la plateforme **Description** : Mynkl est une application web qui facilite le dépôt en lot de données et métadonnées sur l'entrepôt Nakala d'Huma-Num. L'outil permet aux utilisateurs de préparer leurs dépôts via un fichier CSV structuré comportant un minimum de 7 colonnes obligatoires (Linked In Item, Title, Creator, Created, Type, License, plus colonnes pour collections) et d'autres métadonnées optionnelles Dublin Core. L'application propose un environnement de gestion complet permettant la publication en masse, la gestion des collections, l'ajout/suppression de métadonnées et de médias, ainsi que la modification du statut (privé/public) des données. L'authentification se fait via l'interface avec la clé API Nakala de l'utilisateur. **Contexte d'utilisation** : Développée par le consortium CAHIER er maintenue par le consortium ARIANE, l'application Mynkl s'adresse aux chercheurs et institutions souhaitant déposer grandes quantités de données sur Nakala sans manipuler individuellement chaque élément. L'outil simplifie le workflow de dépôt en permettant la préparation locale des métadonnées dans un tableur, puis leur transfert automatisé vers l'entrepôt. Il facilite particulièrement la gestion de projets comportant de nombreux fichiers liés (archives numérisées, corpus audio, collections d'images) en automatisant l'association fichiers-métadonnées via un système de préfixes de nommage. **Taxonomie** : https://vocabs.dariah.eu/tadirah/publishing ----- Fin Rédaction de fiches Andrés A tester (ajouté le 17/09/2024) Nom : Page2tei URL : https://github.com/TEI4HTR/page2tei Interface graphique : Sans Opération : Balisage automatique/Conversion Compétence/langage informatique : XSL/XML format d’entrée/sortie : PAGE/TEI Licence : Modifiable/Réutilisable Accompagnement : développeur Description : transformations de fichiers PAGE (issu de l'ATR) vers TEI Contexte d'utilisation : développé à l'origine dans le cadre du projet LECTAUREP (INRIA - AN) Nom : Namedropper Oxygen URL : https://github.com/ecds/namedropper-oxygen Interface graphique : Avec Opération : Balisage automatique Compétence/langage informatique : XSL/PHP/Python/JS/... format d’entrée/sortie : HTML/CSV/TEI/TXT/DOCX/LaTeX/... Licence : Modifiable/Non modifiable/Réutilisable/Non réutilisable/Inconnue Accompagnement : aucun/tutoriels/développeur/communauté/inconnu Description : Contexte d'utilisation : 15/07/24 - Retour vérification : Contexte d'utilisation : comment l'utiliser ? (À quoi ça sert ?) Manque un champ Note/commentaire Nom de la licence : Jusqu'où aller dans le détail ? => on nomme les licences. Cas de figure - QTEI (interface graphique ? veut dire tout prêt, ou bien besoin d'installer quelque chose pour y accéder) => Plutôt qu'interface graphique, critère Interface utilisateur, Utilisation ou Prérequis : logiciel/Invite de commande/Navigateur web. Critère Langage informatique => Langage de développement ou langage d'utilisation - CIRCE UI : 20aine de formats. Se limiter à un nombre précis, à ce qui semble le plus connu ? Champs facultatifs : Description => Commentaire Autre champ => Citation, Contact, Contributions Usage Propossition d'Ajout le 04/11/2024 Nom : staticSearch URL : https://doi.org/10.5281/zenodo.6329800 Opération : Moteur de recherche (static) Interface graphique : Avec (html+css+js) format d’entrée/sortie : HTML Compétence/langage informatique : XSL/JS Accompagnement :Documentation Nom ; Odd2xsl URL: https://github.com/TEIC/TEI-Simple/tree/master/processingModel Nom : ekdosis URL: https://www.ekdosis.org/fr/ Prérequis: Latex ? Opération: Langage de développement : Latex format d’entrée/sortie : Latex TEI(sortie) Description : Paquet Latex pour l'édition edoctique . ----- On pourai également ajouter Solr et ElasticSearch , mais pareil est-ce que ça a sa place dans script ? A ce moment la on classe ou Lucène ? on pourai également ajouter blackLab CQL
{}