Gestion des données
Introduction
La gestion de la donnée du RZA repose sur la Politique des données de l’InEE définissant les principes généraux d’utilisation, de stockage, de diffusion et de réutilisation des données.
La gestion de la donnée repose sur une bonne compréhension du cycle de vie de la donnée depuis la création des données à leur réutilisation.
Cycle de vie de la donnée, source : inist.fr
Elle s’inscrit également dans une feuille de route nationale des Infrastructures de recherche et européenne (eLTER) et relève du Groupe de travail « Données et Science ouverte ».
Ce groupe de travail créé en 2021, prend la suite du projet inter-ZA BED « Bancariser Ensemble des Données » lancé en 2017. Il vise à accompagner les Zones ateliers dans la production de données FAIR (Findable, Accessible, Interoperable, Reusable) dans :
- l’acquisition et la production de données tant pour les sciences de l’environnement que pour les sciences humaines et sociales
- le développement de solutions techniques originales pour la gestion des échantillons et des données
- la mise en accessibilité des données
- l’interopérabilité
- la réutilisation des données produites par le réseau.
Aujourd’hui, une dizaine de personnes chercheurs et data scientist réparties dans toutes les Zones Ateliers contribuent à ce projet. N’hésitez pas à prendre part à ce projet en vous abonnant à la liste de diffusion!
Recommandations
Le RZA conseille aux producteurs de donnés :
- d’élaborer à l‘échelle de leur projet et dès le lancement un Plan de Gestion de la Donnée. L’outil DMP-OPIDOR assiste dans cette démarche, avec des indications à chaque étape.
- de produire des fiches de métadonnées et à procéder à la DOI-isation des jeux de données, attribuer un identifiant unique aux jeux de données, via le dépôt des jeux de données dans des entrepôts L’outil Geoflow (open sourcen développé par E. Blondel avec le soutien financier du RZA, INRAe, IRD et FAO) est recommandé, notamment pour faciliter la réactualisation des informations sur certains jeux de données (séries longues).
- de structurer les données en conformité avec les principes FAIR
- de publier leurs données dans un entrepôt de données préférentiellement institutionnel sécurisé, voire certifié, tel que InDoRES (CNRS-INEE), et Nakala (TGIR Huma-Num) pour les données spécifiques Sciences Humaines et Sociales
- d’anticiper les conditions juridiques d’utilisation des données après la fin du projet de recherche en choisissant des licences explicitant les droits attachés aux données (Etalab ou CC BY par exemple).
- de discuter de toute question légale ou éthique particulière avec le Délégué à la Protection des Données (DPD) de l’établissement employeur
Consultation des données du RZA
Géocatalogue :
Le RZA dispose d’un portail et d’un géocatalogue (GeoNetwork 4.0.5.SNAPSHOT) élaborés avec l’UMS 3468 BBEES (CNRS, MNHN) et hébergé par le centre de calcul de l’IN2P3 à Lyon. Ce géocatalogue est commun différentes Zones Ateliers, consultable via le visualiseur du portail LTER France Metadata.
Les mots clés à utiliser sont « Zone Atelier X » ou « ZAX ». Exemple : « Zone Atelier Alpes » ou « ZAA »
Ce catalogue est moissonné par les principaux catalogues nationaux et internationaux d’intérêt. La fréquence de mise à jour des données est variable en fonction des séries. La politique d’utilisation des données est précisée dans chaque fiche de métadonnées.
Si vous souhaitez réaliser ou modifier une fiche de métadonnées, merci de contacter l’administrateur du Geocatalogue () pour vous donner des droits d’accès.
Le groupe de travail « Données et Sciences ouverte » propose une production de fiche de métadonnées simplifié avec l’outil Geoflow et Geometa sous R.
Ce géocatalogue moissonne les bases de métadonnées des différentes ZAs :
| Nom ZA | Liens | Mots-clés |
| ZAA | LECA GeoNetwork | « Zone Atelier Alpes » ou « ZAA » |
| ZAAJ | dataOSU UBFC | « Zone Atelier Arc Jurassien » ou « ZAAJ » |
| ZAAR | OSURIS GeoNetwork | « Zone Atelier Armorique » ou « ZAAr » |
| ZABR | MetaZABr GeoNetwork | « Zone Atelier Bassin Rhone » ou « ZABR » |
| ZABRi | Indigeo GeoNetwork | « Zone Atelier Brest Iroise » ou « ZABRi » |
| ZAHG | A venir | |
| ZAL | DoTeRR GeoNetwork | « Zone Atelier Loire » ou « ZAL » |
| ZAM | ORDar OTELo | « Zone Atelier Moselle » ou « ZAM » |
| ZAPVS | A venir | |
| ZAPYGAR | Dynafor GeoNetwork | |
| ZAS | A venir | |
| ZATA | A venir | |
| ZATU | CEBA UCA | « ZATU » |
| ZAARG | A venir |
Si vous souhaitez moissonner la base de métadonnées du géocatalogue : http://meta.data-za.org/catalogue/srv/fre/catalog.search#/search
Dans ce cas, merci de nous indiquer cette opération au mail suivant :
Les fiches de métadonnées et des jeux de données du RZA sont aussi disponibles au niveau européen sur dip.biosense.rs.
InDoRES :
Pour déposer des données dans un autre entrepôt, l’entrepôt à privilégier pour les données du RZA est DataInDoRES : Inventaire des Données de la recherche en Environnement et Sociétés. Ce service est mis à disposition par l’INEE et géré par BBEES.
Un sous-espace dédié aux données du RZA y a été créé : https://data.indores.fr/dataverse/RZA. Ce portail permet de découvrir les bases et jeux de données par projets, de déposer les données dans un entrepôt sécurisé. Vous y trouverez également des ressources sur les pratiques qui facilitent le partage et la réutilisation des données.
Formulaire de contact pour la création de compte et codes d’accès d’InDoRES
Nakala :
Nakala est un service de l’IR Huma-Num permettant de partager, publier et valoriser tous types de données numériques documentées (fichiers textes, sons, images, vidéos, objets 3D, etc.) dans un entrepôt sécurisé afin de les publier en accord avec les principes du FAIR
Il propose également un dispositif d’exposition des métadonnées qui permet leur référencement par des moteurs de recherche spécialisés comme ISIDORE.
Nakala s’inscrit dans un dispositif cohérent de services mis en place par Huma-Num pour faciliter l’accès, le signalement, la conservation et l’archivage à long terme des données de la recherche en SHS.
Vocabulaire contrôlé :
Lors de la production des fiches de métadonnées et du choix des noms des variables (dictionnaire de données), nous invitons à privilégier le thésaurus EnvThes du réseau eLTER. Les autres thésaurus à privilégier sont : LOTERRE Biodiversité, THEIA/OZCAR, GEMET et AGROVOC
Interactions du GT Données et Science ouvertes :
Le RZA intéragit avec:
- les différentes Zones Ateliers avec pour rôle de :traduire les approches nationales et européennes (outils, partage de bonnes pratiques, guides utilisateurs, actions fédératrices et formation)
- BBEES : pour des aspects de formation, en fournissant des cahiers des charges pour des interventions ciblées et pour des actions de maintenance des serveurs à l’IN2P3
- le Pôle National des Données de la Biodiversité (PNDB), l’IR Ozcar (OZCAR), le Pôle THEIA, le Pôle “DataTerra” et le projet Terra Forma
- l’InEE : assurer une veille sur les expériences des ZAs en lien avec la gestion de données, et apporter des éléments de synthèse en lien avec les données, la mise en cohérence des outils et pratiques au regard des différents enjeux/type de données
- les réseaux sur les données du monde académique (RBDD, RDA-France, SIST,) : action de veille et partage d’expérience
Personnes contacts :
- Nord-Ouest : Mathias Rouan, Françoise Le Moal
- Nord-Est : Isabelle Charpentier, Sylvie Damy
- Sud-Est : Cécile Pignol, David Saramia
- Sud-Ouest: Wilfried Heintz
