Groupe de travail "Atelier Données"

Mission pour les Initiatives Transverses et Interdisciplinaires du CNRS

Présentation

Le groupe de travail "Atelier Données", actuellement composé de représentants de plusieurs réseaux s’attache à construire une réflexion sur la gestion des données porteuse d’une vision « métiers » et « réseaux ».

A partir d’une réflexion de type « cycle de vie de la donnée », il se propose de cartographier les usages dans chaque réseau autour de la gestion de la donnée.

Notre lettre de mission contient les élements suivants :

  • Construire et diffuser une vision transversale de la gestion des données afin d’enrichir la pratique de chaque réseau dans le domaine des données et permettre le développement de la complémentarité entre réseaux.
  • Valoriser l’apport des expériences et expertises « métier » dans une vision transversale de gestion de données dans les réseaux technologiques et scientifiques de la MI.
  • Sensibiliser les communautés professionnelles de l’appui à la gestion des données (organisation de journées thématiques par exemple).
  • Identifier les problématiques concernant les « data » dans chaque réseau (livrables à définir).
  • Mettre en commun et partager de nouvelles pratiques en réseau et au sein de chaque réseau.

En 2017, le groupe a proposé un document qui cartographie les usages dans chaque réseau autour de la gestion de la donnée.

En 2018, le groupe a organisé une journée thématique inter-réseaux « Interopérabilité et pérennisation des données de la recherche : Comment FAIR en pratique ? (pdf, visio) ».

En 2019, le groupe a participé aux journées R2T2 « Atelier données : un gt inter-réseaux pour des apports croisés des métiers sur la gestion des données de la recherche (pdf, visio) » et a ouvert la liste de discussion donnees-inter-reseaux.

En 2020, le groupe a organisé à Grenoble un hackathon intitulé « Comment améliorer le dépôt et le partage de données de recherche ? » et un webinaire participatif intitulé « Data Paper : une incitation à la qualification et à la réutilisation des jeux de données.

Gt données

En janvier 2021, le groupe de travail publie le « guide de bonnes pratiques sur les données de la recherche » qui présente les différentes actions faites par les réseaux autour de la gestion des données. Ce guide reprend les 7 étapes définies dans le document « Cartographie des actions des réseaux métiers autour de la gestion des données » proposé en 2017. Le contenu de ce guide a été présenté le 3 février lors d'un webinaire.

En avril 2021, Relier, le REseau quaLIté en Enseignement superieur et Recherche nous a rejoint.

En Juin 2021, RIS, le Réseau Interdisciplinaire autour de la Statistique nous a rejoint.

Le 5 juillet 2021 de 14h à 17h , le groupe de travail a réalisé un webinaire sur la « qualité des données ».

Le guide de bonnes pratiques sur la gestion des données de la recherche

Les présentations et les vidéos de la journée

Qualité des données

(05/07/2021)

La qualité des données est un thème transversal aux métiers de la recherche. Cette notion se retrouve sur toutes les étapes du cycle de vie de la donnée mais elle recouvre des concepts différents (qualité des données, des métadonnées, du code, de la documentation, de l'archivage, ...) mais quelque soit l'étape, elle peut toujours être vue sous deux angles : qu'est ce qu'une donnée de qualité ? quelle organisation faut-il mettre en place pour arriver à obtenir des données de qualité ?

Les documents

  • Programme (pdf)
  • Quel lien entre qualité et données ? (Alain Rivet, Cermav et Henri Valeins, RMSB) (pdf)
  • Processus de contrôle et qualification des données dans un système d’observation océanographique (Christine Coatanoan, Ingénieur Gestion de données au Sismer, Ifremer Brest) (pdf)
  • Cycle de vie de la donnée ouverte de qualité (Geoffrey Aldebert, Etalab) (pdf)
  • Enjeux de la qualité des référentiels et des métadonnées pour la communauté scientifique : vocabulaires contrôlés, alignements pour une meilleure fairisation et réplicabilité d’un modèle de données - au travers de l’exemple des outils de Frantiq. (Blandine Nouvel, Centre Camille Jullianet Véronique Humbert, Archéologie des Sociétés Méditerranéennes) (pdf)
  • Retour d’expérience en écologie végétale sur les étapes d’homogénéisation des données (Eric Garnier, chercheur CNRS au CEFE) (pdf)

Les présentations et les vidéos de la journée

Data paper

une incitation à la qualification et à la réutilisation des jeux de données

(05/11/2020)

Dans le cadre d’une science ouverte et participative, le data paper permet de rendre plus visible tous les types de données et jeux de données de recherche dont on peut estimer que le potentiel de réutilisation est fort. Il garantit la qualité de ces données, en précise les modalités d’acquisition ainsi que les conditions et droits d’utilisation.

Néanmoins, pourquoi cette forme éditoriale rencontre-t-elle un tel engouement ? Si certaines communautés produisent depuis plusieurs années ce type d’article, la libération de la donnée dans le cadre de la science ouverte, son dépôt favorisé ou imposé par les organismes financeurs en entrepôts institutionnels ouverts, l’application des principes FAIR contribuent fortement à promouvoir le data paper comme qualifiant incontournable, assurant d’exploiter les « bonnes » données.

Alors, cet élan est-il un reflet fidèle de la réalité, les pratiques de la recherche scientifique sont-elles en train de changer, les différents acteurs dans la production des données sont-ils plus impliqués dans la transparence et la mise à disposition des données ? Est-ce une opportunité pour les personnels d’accompagnement de la recherche pour valoriser leur rôle ? Et comment rédiger un data paper, ou le publier ? Comment sont-ils expertisés, sur quels critères ? Le data paper devient-il un enjeu important dans l’évaluation du producteur de données ?Ce webinaire est ainsi l'occasion de laisser largement la place aux échanges pour tenter de partager vos points de vue, pour comprendre quelles sont les raisons qui vous amènent à devenir consommateur de data papers. Comment avez-vous connu ce format éditorial : grâce à votre veille, en découvrant l'existence de data journals ou de rubriques consacrées au data paper au sein d'une revue académique, parce que tout le monde en parle, en voulant utiliser ou publier des données ? Qu'avez-vous trouvé dans le data paper qui ne serait pas dans les portails de métadonnées ? Le data paper vous semble-t-il désormais indispensable et une forme nécessaire de publication accompagnant les données ?. Autant de questions que ce webinaire souhaite aborder pour évaluer la place que prend le data paper dans l’écosystème de la donnée scientifique.

Les Documents

Les Vidéos de la journée

Interopérabilité et pérennisation des données de la recherche

comment FAIR en pratique ? Retours d’expériences

(https://gt-donnees2018.sciencesconf.org/)

Contact

gt-donnees-inter-reseaux@groupes.renater.fr