# Notes GT3 Ariane : Recensement de scripts à des fins éditoriales
Consortium Ariane
## Prépa bilan pré-AG 2025 (30 Octobre 2025)
16h-17h
Jorge F., Andrés E., Benjamin G.
### Cette année :
- Passage de 5 à 11 membres fonctionnant sans financement.
- Stabilisation des procédures, notamment auprès des nouveaux membres (dont formation Scenari/GitLab).
- Mise en place d'install partys
- Compatibilité avec le vocabulaire TadiRaH envisagé (conclusion : sous réserve de moyens).
### À venir :
- Passer à un rythme d'install party mensuel
- Diffusion autour de l'initiative, notamment auprès de listes de diffusion, afin de repérer d'autres scripts et de compléter le recensement
- Journées EdiScript Yourself en mars 2026 à Tours (sous réserve de moyens)
- Publication d'une version 1.0 du recensement pour Novembre 2026
## Réunion du 30 octobre 2025
14h-16h
Jorge F., Andrés E., Alexandre W., Benjamin G., Mathilde LM.,
Demande de financement de l'axe 1 du GT3 ARIANE pour l'aide au recensement de scripts.
Une réponse du CoPil devait être donnée le 10 octobre, mais aucune décision n'a été prise, car il n'y avait pas assez de personnes présentes.
Sans budget supplémentaire, le GT3 est en lien avec :
- Une personne de Biblissima+ intéressée par le projet et qui travaille sur la réconciliation des identifiants via OpenRefine et les LLM.
- Une personne du CERES (Sorbonne Université), travaillant aussi sur les LLM et les corpus de données textuelles.
- La Maison de la Recherche en Sciences Humaines de Caen a été sondée, en particulier les équipes travailant sur MaX.
Georges prévoit une journée autour des scripts à la MSH Val-de-Loire, Jules et Vincent sont intéressés.
Georges a un projet de publication relatif au recensement des scripts qui a été retenu.
## Réunion du 23 juin 2025
14h-16h
Jorge, Alexandre, Vincent, Benjamin, Jules, Mathilde, Daphné
Echanges autour de la mise en place d'une taxonomie basée sur Tadirah suite à un test de Jorge.
Le retour est mitigé car il implique une charge de travail supplémentaire
Envisagé :
- Conserver a minima le travail de taxonomie entamé, sans aller dans les niveaux les plus profonds N4 et N5, et passer le critère Type d'opération en critère mot clé libre (sans dépasser la limite de 8 valeurs au total).
PS (JF) : a posteriori, je pense que la limite du nombre de valeurs, non pas technique mais lié à un souci de lisibilité, rend son usage pas assez intéressant.
- Ultérieurement, si une relation par exemple avec DARIAH et des moyens peuvent être débloqués, envisager un export des sources Scenari vers SKOS Tadirah, par exemple.
Si oui, il faudra ajouter au préalable des URI pour chaque valeur de critère qui aurait un équivalent Tadirah.
A faire
- Tests de scripts à 2,3,4 personnes en septembre (Date à déterminer)
- Achever la rédaction/validation des notices pour atteindre le nombre de 50 avant l'AG du 14 novembre. => réunion en Octobre
## Réunion du 3 mars 2025
14h-15h30
Jorge, Marine, Alexandre, Vincent
Migration des notes du document Framapad vers le [Kanboard](https://kanboard.huma-num.fr/?controller=BoardViewController&action=show&project_id=1607) : 32 scripts ajoutés.
- A assigner : 17
- A rédiger : 4
- A contrôler : 11
:warning: Pas de modèle de tâche possible pour en créer une nouvelle
:bulb: Idée : créer une tâche-modèle, mais impossible à épingler
## Réunion du 10 février 2025
Définition/texte de présentation :
Les scripts recensés ici sont des fichiers ou ensemble de fichiers informatiques servant à l'édition scientifique comportant un volet numérique dans une démarche open source.
Ils permettent d'effectuer une à quelques opérations, et sont classés selon différents critères retenus pour proposer à différents utilisateurs un moyen de les distinguer.
Ce recensement ne contient pas de logiciels faisant l'objet d'une visibilité suffisante auprès des communautés intéressées, mais peut être alimenté par des scripts faisant partie de ceux-ci.
--------------------
Affinage des critères :
SSH Opn Marketplace : tools, workflow et scripts ne sont pas équivalents.
En revanche, les valeurs de critères activities pourraient être réemployés avec intérêt en tant que sous-types de nouveaux grand types (Conversion, Analyse, Affichage, etc).
--------------------
Formation Scenari/Git :
17 24, 27, 31 mars, 3 avril, 5, 12, 15, 19, 22, 26 mai
que les lundi.
Schéma de David :
autre : Segmenter, , Détecter.
Distinguer ce qui rentre/sort :
format.
=> un tableau comparatif de catégories/critères : Scenari actuel/TAPOR/SSH OpenMarketplace/Article A.Pinche
https://vocabs.dariah.eu/tadirah/en/page/enriching Taxonomie.
Prérequis : Logiciel installé sur le poste de travail
Dépendences : un paragraphe de notice à part entière
Autre : SKOSMOS, OpenTheso, IDKey
Tuto : Alexandre intéressé pour regard extérieur. Lecteur : Jules.
Kanboard : API => y passer le contenu du framapad
https://codimd.math.cnrs.fr/ => y passer le contenu du framapad => Vincent (avec Jorge, Jules, voire Marine et Alexandre)
## Copie du document Framapad (archivé le 3 mars 2025)
https://annuel2.framapad.org/p/ariane-gt3-script-a5x2?lang=fr
Interface de recherche
https://axe-1-gt3-outils-et-pratiques-editoriales.gitpages.huma-num.fr/scripts/recensement
(URL stable et communicable)
Template de recensement
Nom :
URL :
Prérequis : Logiciel/Invite de commande/Navigateur web
Opération : Conversion/Métadonnées/Linguistique/Vérification/Edition critique/Catalogage/Balisage automatique/Affichage
Langage de développement : XSL/PHP/Python/JS/...
format d’entrée/sortie : HTML/CSV/TEI/TXT/DOCX/LaTeX/...
Licence : Modifiable/Non modifiable/Réutilisable/Non réutilisable/Inconnue
Accompagnement : aucun/tutoriels/développeur/communauté/inconnu
Description :
Contexte d'utilisation :
Scripts intégrés dans Scenari
Vérification Benjamin -------
[GP maj dans scenari 17/09/2024]
Nom : Circe (~ Web UI)
URL : https://pypi.org/project/circe-certic/ ; https://circe.unicaen.fr/ui/
Interface graphique : Les deux
Opération : Conversion
Compétence/langage informatique : python
format d’entrée/sortie : HTML, PDF, TEI, Markdown, DocX (et plein de formats de Pandoc…)
Licence : Modifiable, Réutilisable (CeCILL-B, compatible GNU GPL)
Accompagnement : inconnu
Description : API web pour la transformation de documents.
Contexte d'utilisation : Maintenu par le CERTIC (Université de Caen)
[GP vu]
[BG màj dans scenari 17/09/2024]
Nom : ODD 2 Manual
URL : https://gitlab.com/Annegf/xslt4tei/-/tree/main/odd2manual
Interface graphique : Sans
Opération : Conversion
Compétence/langage informatique : XSL
format d’entrée/sortie : TEI, HTML
Licence : GNU GPL (cachée ici : https://gitlab.com/Annegf/xslt4tei/-/commit/a86bd04e906ad105e929e509a1c67f15a410d13b#55c47ccf0acc678bfaf7675cdf30850275a13562_7_7)
Accompagnement : inconnu
Description : Crée un manuel au format HTML à partir d'un fichier ODD.
Contexte d'utilisation :
[MD màj dans scenari 17/09/2024]
Nom : QTEI
URL : https://github.com/ieg-dhr/QTEI
Interface graphique : Avec (oui car le programme est une interface graphique en soi, mais pour le faire marcher, il nécessite un poil de HTML, et il peut être intégré comme module dans un projet JS, donc « Avec » ou « Les deux » ?)
Opération : Affichage
Compétence/langage informatique : JS
format d’entrée/sortie : TEI, JSON, HTML
Licence : Modifiable, Réutilisable (AGPL-3.0)
Accompagnement : Communauté
Description : Affiche au choix plusieurs vues (TEI, HTML, Carte avec Leaflet, Facsimile avec IIIF)
Contexte d'utilisation :
[MD]
Nom : Heimdall
URL : https://gitlab.huma-num.fr/datasphere/heimdall
Interface graphique : Sans
Opération : Conversion
Compétence/langage informatique : XQuery
format d’entrée/sortie : CSV, XML
Licence : Réutilisable, Modifiable (GNU Affero)
Accompagnement : Inconnu
Description : Conversion CSV, XML vers XML
Contexte d'utilisation : créé par Estrades et Datasphere (portés par la Maison Interuniversitaire des Sciences de l'Homme - Alsace (MISHA — UAR 3227) et le laboratoire Arts, civilisation et histoire de l'Europe (ARCHE — UR 3400)
Nom : TEI-garage
https://teigarage.tei-c.org/ ; https://github.com/TEIC/TEIGarage
Interface graphique : Les deux
Opération : Conversion
Compétence/langage informatique : non (optionnel), sinon image Docker
format d’entrée/sortie : csv, DocBook, ePub3, LaTeX, Markdown, doc, NLM DTD 3.0, sxw, odt, PDF, TXT, RDF XML, rtf, TEI P5 XML, TEI XML, VerbatimXML, xHTML, XML, XSL-FO
Licence : Réutilisable, Modifiable (GNU GPL3)
Accompagnement : Communauté
Description : Conversion de documents/Présentations/feuilles de calcul
webservice et API REST (code source disponible à https://github.com/TEIC/TEIGarage/)
Contexte d'utilisation :
Fin vérification Benjamin -------
---- début vérif Marine
Nom : bibtex-tidy
Lien (application) : https://flamingtempura.github.io/bibtex-tidy/index.html
Lien (dépôt) : https://github.com/FlamingTempura/bibtex-tidy
Interface graphique : Les deux
Opération : conversion, vérification
Compétence/langage informatique : TeX, TS
format d’entrée/sortie : bibTeX
Licence : réutilisable, modifiable (MIT)
Accompagnement : Développeur
Description : application en ligne de formatage et nettoyage de fichiers bibtex (bibliographie LaTeX).
Contexte d'utilisation : Rédaction en LaTeX
Nom : NakalaQuartoView
URL : https://gitlab.huma-num.fr/mshs-poitiers/plateforme/nakala-quarto-view
Interface graphique : Sans
Opération : création de fichiers MD à partir de résultats de requêtes sur l'API Nakala, puis transformation en HTML par Quarto.=> Affichage / exposition
Compétence/langage informatique : Python (optionnel), Markdown (optionnel)
format d’entrée/sortie : MD/Html/Javascript
Licence : indéterminée
Accompagnement : Développeur, tutoriel
Description : script Python pour générer un site web statique à partir de collections déposées sur Nakala
Contexte d'utilisation : bibliothèque virtuelle en ligne
Nom : IIIF-AV-player
URL : https://github.com/DDMAL/IIIF-AV-player
Interface graphique : Les deux
Opération : Affichage
Compétence/langage informatique : JS
format d’entrée/sortie : MEI/JSON
Licence : Modifiable/Réutilisable
Accompagnement : Communauté
Description : Visualiseur de fichier MEI sous forme de partition avec lecture audio/video en parallèle
Contexte d'utilisation :
Nom : Max
URL : https://mrsh.unicaen.fr/max/
Interface graphique : Avec
Opération : Affichage
Compétence/langage informatique : XSL/XQuery
format d’entrée/sortie : HTML/XML/TEI
Licence : Modifiable/Réutilisable
Accompagnement : développeur/communauté
Description : MaX est un outil générique extensible capable de produire des interfaces de lecture pour tous les standards XML. Il propose cependant par défaut un certain nombres de modules pour la TEI. Il fournit un moteur de recherche XQuery, et embarque OpenSeadragon pour les images.
Contexte d'utilisation : Il est développé par le CERTIC et le pôle Document Numérique. Il est testé sur les plateformes macOS et Linux/Debian.
Nom : TeiPublisher
URL : https://teipublisher.com/exist/apps/tei-publisher-home/index.html
Interface graphique : Avec
Opération : Affichage
Compétence/langage informatique : PHP/Xquery
format d’entrée/sortie : HTML/TEI
Licence : Modifiable/Réutilisable
Accompagnement : développeur
Description : Outil de publication TEI
Contexte d'utilisation :
---- fin vérif Marine
------ début vérif Guillaume
Nom : Transcript
URL : https://gitlab.com/eman8/transcript
Interface graphique : Les deux
Opération : Affichage/Balisage
Compétence/langage informatique : PHP/Javascript
format d’entrée/sortie : TEI
Licence : Inconnue
Accompagnement : communauté/développeur
Description : Extension Omeka Classic permettant d'éditer et d'afficher des transcriptions en XML - l'installation du plugin dans Omeka nécessite des compétences en langages web (PHP, javascript, etc.), mais son utilisation se fait via une interface web.
Contexte d'utilisation : plugin développé par et pour la plateforme EMAN. La possibilité de réutilisation sur d'autres instances Omeka Classic n'est pas précisé par la licence.
Nom : Transcript for Omeka-S
URL : https://gitlab.com/eman8/transcript-omeka-s
Interface graphique : Avec
Opération : Affichage/Balisage
Compétence/langage informatique : PHP/Javascript
format d’entrée/sortie : TEI
Licence : Inconnue
Accompagnement : communauté/développeur
Description : Extension Omeka S permettant d'éditer et d'afficher des transcriptions en XML - l'installation du plugin dans Omeka nécessite des compétences en langages web (PHP, javascript, etc.), mais son utilisation se fait via une interface web.
Contexte d'utilisation : plugin développé par et pour la plateforme EMAN. La possibilité de réutilisation sur d'autres instances Omeka S n'est pas précisé par la licence.
Nom : Webmedia (modèle Scenari)
URL : https://download.scenari.software/Webmedia@5.0.1/
Interface graphique : Avec
Opération : Affichage
Compétence/langage informatique : HTML
format d’entrée/sortie : HTML/DOCX/MP4/XML
Licence : Modifiable/Réutilisable
Accompagnement : communauté
Description : Webmedia permet de structurer, enrichir et diffuser des contenus audiovisuels et sonores sur le Web (émissions de radio, valorisation de cours et conférences...).
Contexte d'utilisation : À installer sur un environnement SCENARIchain.
Nom : Twine
URL : https://twinery.org/
Interface graphique : Avec
Opération : Affichage
Compétence/langage informatique : JS
format d’entrée/sortie : HTML
Licence : Modifiable/Réutilisable
Accompagnement : communauté
Description : Édition non linaire, à embranchement - CC BY-SA
Contexte d'utilisation : ?
Nom : Tei2Txt
URL : https://github.com/haoess/dta-tools/blob/master/tei2txt/share/xslt/tei2txt.xsl
Interface graphique : Sans
Opération : Conversion
Compétence/langage informatique : XSL
format d’entrée/sortie : TEI/TXT
Licence : Modifiable/Réutilisable
Accompagnement : développeur
Description : Conversion de fichier TEI en texte brut.
Contexte d'utilisation : Utilisé par le projet Deutsches Textarchiv
Nom : Alto2txt
URL : https://github.com/Living-with-machines/alto2txt/
Interface graphique : Sans
Opération : Conversion
Compétence/langage informatique : XSL/Python
format d’entrée/sortie : XML/TXT
Licence : Modifiable/Non modifiable/Réutilisable/Non réutilisable/Inconnue
Accompagnement : communauté
Description : conversion de fichers ALTO/METS issu des OCR vers du plein texte, avec un minimum de métadonnées résiduelles
Contexte d'utilisation : ATR
----- Fin vérif Guillaume
----- début vérif David
Nom : Diva.js (Document Image Viewer with AJAX)
URL : https://github.com/ddmal/diva.js
Interface graphique : Avec
Opération : Affichage
Compétence/langage informatique : HTML/JS
format d’entrée/sortie : HTML/JSON
Licence : Modifiable/Réutilisable (MIT License)
Accompagnement : communauté (wiki et ticket/issue)
Description : Visionneuse d'images de livre basée sur IIIF
Contexte d'utilisation : exposition / Bibliothèque virtuelle.
Note: MAJ 2024
Nom : EVT (Edition Visualization Tool)
URL : https://sourceforge.net/projects/evt-project/
Interface graphique : Avec
Opération : Edition critique/Affichage
Compétence/langage informatique : XSL (XSLT/XPath/XSL-FO), JavaScript
format d’entrée/sortie : HTML/XHTML/TEI
Licence : Modifiable/Réutilisable (GNU General Public License version 2.0)
Accompagnement : communauté / feedback to evt.developers@gmail.com
Description : Éditions critiques diplomatiques et/ou interprétatives à partir de documents encodés en XML TEI.
Contexte d'utilisation : exposition / Bibliothèque virtuelle (avec possibilité de sélection par entités nommées, mots-clés, etc. Affichage de la ressource image, zoom, lien image-texte).
Note: dernière MAJ 2020
Nom : Versioning Machine
URL : http://v-machine.org/download/
Interface graphique : Avec
Opération : Edition critique/Affichage
Compétence/langage informatique : XSL/JS
format d’entrée/sortie : HTML/TEI
Licence : Modifiable/Réutilisable (GNU General Public License)
Accompagnement :communauté
Description : Edition critique de versions de texte affichées en parallèle
Contexte d'utilisation :
Dernière version 5.0.
Notes: Peut nécessiter de passer par une transformation XSLT dans Oxygen. Dernière release 2016. Plus aucune activité, ni site présenté, ni référence, sur le site web après cette date. deux pages en erreur "type 404".
Nom : Converter RDF to TEI
URL : https://gitlab.huma-num.fr/axe-1-gt3-outils-et-pratiques-editoriales/scripts/scripts-tei-afe/-/blob/db1f1702ed8952222a1bc8e622319ac6fa055ac2/converterRDFtoTEI.ipynb
Interface graphique : Sans (notebook Jupyter)
Opération : Conversion
Compétence/langage informatique : Python
format d’entrée/sortie : RDF/TEI/XML
Licence : Modifiable/Réutilisable [ Sauf indication contraire, les scripts dans ce dépôt sont mis à disposition pour la contribution et le développement avant leur publication dans le cadre du consortium ARIANE, qui devra déterminer quelle est la licence qui permet leur utilisation, modification et partage. ]
Accompagnement : Développeur (ticket/issue sur le dépôt Gitlab)
Description : Script pour convertir un thesaurus Opentheso (RDF) en taxonomie XML-TEI
Contexte d'utilisation : adapté aux applications de recherche et d'éducation
----- fin vérif David
Restent à intégrer
Nom : Storymap
URL : https://github.com/jakobzhao/storymap
Interface graphique : Avec/Sans/Les deux
Opération : Conversion/Métadonnées/Linguistique/Vérification/Edition critique/Catalogage/Balisage automatique/Affichage
Compétence/langage informatique : XSL/PHP/Python/JS/...
format d’entrée/sortie : HTML/CSV/TEI/TXT/DOCX/LaTeX/...
Licence : Modifiable/Non modifiable/Réutilisable/Non réutilisable/Inconnue
Accompagnement : aucun/tutoriels/développeur/communauté/inconnu
Description :
Contexte d'utilisation :
Nom : HeuristToR
URL : https://alietteroux.github.io/HeuristToR/
Interface graphique : Avec/Sans/Les deux
Opération : Conversion/Métadonnées/Linguistique/Vérification/Edition critique/Catalogage/Balisage automatique/Affichage
Compétence/langage informatique : R
format d’entrée/sortie : XML
Licence : Modifiable/Réutilisable (GPL V2 et supérieure)
Accompagnement : aucun/tutoriels/développeur (bug report)
Description : Analyses quantitatives sur une base de données Heurist (préalablement exportée en XML)
Contexte d'utilisation :
----- David
Nom : XMLify
URL : https://gitlab.huma-num.fr/mshs-poitiers/plateforme/xmlify
Interface graphique : Les deux
Opération : Conversion/Métadonnées
Compétence/langage informatique : Python (optionnel)
format d’entrée/sortie : CSV/TEI/Sitemap
Licence : Modifiable/Non modifiable/Réutilisable/Non réutilisable/Inconnue
Accompagnement : tutoriel/développeur
Description : XMLify transforme une feuille de calcul CSV contenant des métadonnées (avec entête de colonnes) avec un fichier de mapping (correspondance) dans l'une des sorties suivantes:
fichier d'entête XML TEI
fichier XML Nakala (v.1 obsolète)
fichier Sitemap
Options de traitement spécifiques:
les "feuilles" XML vides peuvent êtres supprimées
les branches XML peuvent êtres répétées ou fusionnées
Contexte d'utilisation : exportation d'un tableur de métadonnées vers plusieurs formats.
----- fin David
----- Debut Rédaction de fiches Andrés
Nom : CETEIcean
URL : https://github.com/TEIC/CETEIcean
Interface graphique : Sans (bibliothèque JavaScript)
Opération : Affichage
Compétence/langage informatique : JavaScript/CSS
format d’entrée/sortie : TEI/HTML Custom Elements
Licence : Réutilisable, Modifiable (BSD 2-clause)
Accompagnement : Développeur/Communauté
Description : bibliothèque JavaScript qui permet d'afficher des documents TEI XML directement dans un navigateur web sans transformation préalable en HTML. Elle utilise les standards Web Components, particulièrement des Custom Elements, pour convertir dynamiquement les éléments TEI en éléments HTML personnalisés avec le préfixe "tei-". La bibliothèque préserve intégralement la structure et les informations du schéma TEI qui permettent de créer des applications web à partir des documents sources avec CSS et JavaScript.
Contexte d'utilisation : Développé par Hugh Cayless et Raffaele Viglianti, CETEIcean est utilisé notamment par le Digital Latin Library (DLL) pour un workflow de développement distribué via GitHub Pages, et dans l'enseignement TEI au Maryland Institute for Technology in the Humanities. Il permet un workflow "push to publish" où les éditeurs peuvent voir immédiatement le rendu de leurs documents TEI en poussant simplement vers GitHub, sans nécessiter de compétences XSLT.
----- Comentaire: j'ai mis le repo et non pas la doc dont le lien est ici :
https://www.balisage.net/Proceedings/vol21/html/Cayless01/BalisageVol21-Cayless01.html#d486437e34
je n'ai pas compris l'idée du TARIAH mais je le placerais ici : https://vocabs.dariah.eu/tadirah/digitalPublishing
Nom : dbTagger
URL : https://github.com/aerhard/dbTagger
Interface graphique : Avec (plug-in pour oXygen XML Editor)
Opération : Balisage automatique
Compétence/langage informatique : Java/XQuery/JSON
format d’entrée/sortie : XML/TEI (insertion d'identifiants depuis bases de données)
Licence : Réutilisable, Modifiable (Apache-2.0)
Accompagnement : Développeur
Description : Plug-in pour oXygen XML Editor qui ajoute des boîtes de dialogue (pop-up pour) faciliter la recherche d'identifiants ou de noms (personnes, lieux, références bibliographiques dans les documents TEI) dans des bases de données locales ou distantes et leur insertion dans des documents XML. Le plug-in permet des recherches configurables sur serveur, des modèles définis par l'utilisateur pour formater les données récupérées pour l'annotation.
Contexte d'utilisation : Dévélopé par Alexander Erhard, dbTagger est conçu pour faciliter l'enrichissement sémantique de documents XML/TEI en permettant aux éditeurs de rechercher et d'insérer rapidement des identifiants d'autorité depuis des bases de données externes au document en cours d'annotation.
----- Comentaire: j'ai mis aussi JSON parce que les requêtes à la Base de données remontent en JSON.
En core une fois, je n'ai pas compris l'idée du TARIAH mais je le placerais dans l'un de ces deux :
https://vocabs.dariah.eu/tadirah/associating
https://vocabs.dariah.eu/tadirah/visualAnnotation
-----
*Prises par Andrés sans les consensus de l'équipe :*
-----
**Nom** : Dépôt par lot dans Nakala
**URL** : https://github.com/MSHB-Plateforme-Humanites-Numeriques/depot-lot-nakala
**Interface graphique** : Sans (scripts Python en ligne de commande)
**Opération** : Catalogage
**Compétence/langage informatique** : Python
**Format d'entrée/sortie** : CSV, ODS, XLSX / Dépôt API Nakala
**Licence :** Attribution-NonCommercial-ShareAlike 4.0 International
**Accompagnement** : Développeur/Communauté (guide Jupyter Notebook détaillé, scripts d'exemple)
**Description** : Ensemble de scripts Python pour faciliter le dépôt automatisé de données par lot dans l'entrepôt Nakala via son API. L'outil comprend un guide sous forme de Jupyter Notebook expliquant la construction des scripts, ainsi que plusieurs scripts spécialisés : dépôt par lot (statut privé), publication par lot (statut public), suppression par lot, et demande de modération par lot. Des modèles de tableurs (ODS/XLSX) sont fournis pour faciliter la saisie des métadonnées, avec conversion CSV pour utilisation par les scripts.
**Contexte d'utilisation** : Développé par la Plateforme Humanités Numériques de la MSHB (Maison des Sciences de l'Homme en Bretagne), cet outil s'adresse aux chercheurs et projets académiques français ayant des besoins de dépôt massif de données dans Nakala. Il permet d'automatiser les workflows de dépôt tout en respectant les recommandations de qualité des données de l'entrepôt. L'outil est adapté aux projets de recherche qui produisent grandes quantités de données nécessitant un traitement par lot plutôt qu'un dépôt individuel manuel.
**Taxonomie** : https://vocabs.dariah.eu/tadirah/publishing
Nom : SimplEAD
URL : https://francearchives.gouv.fr/simplead/
Interface graphique : Avec (service en ligne)
Opération : Conversion
Compétence/langage informatique : Aucune (interface web)
Format d'entrée/sortie : XLSX, ODS / XML EAD2002
Description : Service en ligne gratuit (francearchives.gouv.fr) permettant la conversion d'instruments de recherche archivistiques saisis sous forme de fichiers tableur (.xlsx ou .ods) en XML EAD2002 valide. L'outil propose des modèles de fichiers structurés en trois onglets : intitulé_inventaire (métadonnées éditoriales correspondant à <eadHeader>), description_du_fonds (description de niveau fonds correspondant à <archdesc>), et description_cote (description des unités documentaires sur 5 niveaux hiérarchiques maximum correspondant aux éléments <c>). Le service supporte l'indexation multiple (lieux, personnes, institutions, matières) avec séparateur "@" et impose des champs obligatoires pour assurer la validité EAD.
Contexte d'utilisation : SimplEAD s'adresse aux archivistes et professionnels du patrimoine souhaitant produire des instruments de recherche conformes au standard EAD2002 sans compétences techniques en XML. L'outil facilite la transition du tableur vers le XML structuré en respectant les bonnes pratiques archivistiques. Il permet un workflow simple : téléchargement du modèle, saisie locale des données, upload du fichier complété et téléchargement de l'EAD généré. La limitation à 5 niveaux hiérarchiques encourage des arborescences efficaces pour la recherche documentaire.
----- Comentaire:
En core une fois, je n'ai pas compris l'idée du TARIAH mais je le placerais dans:
https://vocabs.dariah.eu/tadirah/en/page/converting
Cela dit sur le site de FranceArchives apparait classé comme "Classer et décrire" je laisse les entités Tadirah:
https://vocabs.dariah.eu/tadirah/en/page/description
et
https://vocabs.dariah.eu/tadirah/en/page/managing
ou
https://vocabs.dariah.eu/tadirah/en/page/organizing
-----
*Ajoutée par Andrés sans les consensus de l'équipe :*
-----
**Nom** : Mynkl
**URL** : https://mynkl.huma-num.fr/
**Interface graphique** : Avec (application web)
**Opération** : Catalogage
**Compétence/langage informatique** : Aucune (interface web)
**Format d'entrée/sortie** : CSV / Dépôt Nakala (données et métadonnées)
**Licence** : Creative Commons Attribution Non Commercial Share Alike 2.0 Generic
**Accompagnement** : Tutoriels (documentation détaillée avec captures d'écran) Tikets sur la plateforme
**Description** : Mynkl est une application web qui facilite le dépôt en lot de données et métadonnées sur l'entrepôt Nakala d'Huma-Num. L'outil permet aux utilisateurs de préparer leurs dépôts via un fichier CSV structuré comportant un minimum de 7 colonnes obligatoires (Linked In Item, Title, Creator, Created, Type, License, plus colonnes pour collections) et d'autres métadonnées optionnelles Dublin Core. L'application propose un environnement de gestion complet permettant la publication en masse, la gestion des collections, l'ajout/suppression de métadonnées et de médias, ainsi que la modification du statut (privé/public) des données. L'authentification se fait via l'interface avec la clé API Nakala de l'utilisateur.
**Contexte d'utilisation** : Développée par le consortium CAHIER er maintenue par le consortium ARIANE, l'application Mynkl s'adresse aux chercheurs et institutions souhaitant déposer grandes quantités de données sur Nakala sans manipuler individuellement chaque élément. L'outil simplifie le workflow de dépôt en permettant la préparation locale des métadonnées dans un tableur, puis leur transfert automatisé vers l'entrepôt. Il facilite particulièrement la gestion de projets comportant de nombreux fichiers liés (archives numérisées, corpus audio, collections d'images) en automatisant l'association fichiers-métadonnées via un système de préfixes de nommage.
**Taxonomie** : https://vocabs.dariah.eu/tadirah/publishing
----- Fin Rédaction de fiches Andrés
A tester
(ajouté le 17/09/2024)
Nom : Page2tei
URL : https://github.com/TEI4HTR/page2tei
Interface graphique : Sans
Opération : Balisage automatique/Conversion
Compétence/langage informatique : XSL/XML
format d’entrée/sortie : PAGE/TEI
Licence : Modifiable/Réutilisable
Accompagnement : développeur
Description : transformations de fichiers PAGE (issu de l'ATR) vers TEI
Contexte d'utilisation : développé à l'origine dans le cadre du projet LECTAUREP (INRIA - AN)
Nom : Namedropper Oxygen
URL : https://github.com/ecds/namedropper-oxygen
Interface graphique : Avec
Opération : Balisage automatique
Compétence/langage informatique : XSL/PHP/Python/JS/...
format d’entrée/sortie : HTML/CSV/TEI/TXT/DOCX/LaTeX/...
Licence : Modifiable/Non modifiable/Réutilisable/Non réutilisable/Inconnue
Accompagnement : aucun/tutoriels/développeur/communauté/inconnu
Description :
Contexte d'utilisation :
15/07/24 - Retour vérification :
Contexte d'utilisation : comment l'utiliser ? (À quoi ça sert ?) Manque un champ Note/commentaire
Nom de la licence : Jusqu'où aller dans le détail ? => on nomme les licences.
Cas de figure
- QTEI (interface graphique ? veut dire tout prêt, ou bien besoin d'installer quelque chose pour y accéder)
=> Plutôt qu'interface graphique, critère Interface utilisateur, Utilisation ou Prérequis : logiciel/Invite de commande/Navigateur web.
Critère Langage informatique => Langage de développement ou langage d'utilisation
- CIRCE UI : 20aine de formats. Se limiter à un nombre précis, à ce qui semble le plus connu ?
Champs facultatifs :
Description => Commentaire
Autre champ => Citation, Contact, Contributions
Usage
Propossition d'Ajout le 04/11/2024
Nom : staticSearch
URL : https://doi.org/10.5281/zenodo.6329800
Opération : Moteur de recherche (static)
Interface graphique : Avec (html+css+js)
format d’entrée/sortie : HTML
Compétence/langage informatique : XSL/JS
Accompagnement :Documentation
Nom ; Odd2xsl
URL: https://github.com/TEIC/TEI-Simple/tree/master/processingModel
Nom : ekdosis
URL: https://www.ekdosis.org/fr/
Prérequis: Latex ?
Opération:
Langage de développement : Latex
format d’entrée/sortie : Latex TEI(sortie)
Description :
Paquet Latex pour l'édition edoctique .
-----
On pourai également ajouter Solr et ElasticSearch , mais pareil est-ce que ça a sa place dans script ? A ce moment la on classe ou Lucène ?
on pourai également ajouter blackLab CQL