Lettre d’information numéro 30

Date de publication

1 décembre 2022

Mireille Brenel, Cédric Mercier, Stela Suhan, Adib Kassas, Claire Ménard, et al.. Rapport d’analyse – Enquête : Les données de la recherche à l’université ParisSaclay, panorama et perspectives. Université Paris-Saclay. 2022. ⟨hal-03857804⟩ https://hal-universite-paris-saclay.archives-ouvertes.fr/hal-03857804


2023-02-09-14:00 : Quatrième rencontre du groupe RDA France https://scienceouverte.unistra.fr/agenda/evenement/news/rencontrez-les-membres-de-la-research-data-alliance-2/
Ordre du Jour : prévision sur la plénière de l’organisation du 21 au 23 mars 2023 retour par des personnels sur les groupes de travail suivants: “Professionalising Data Stewardship” (IG) par Soizic Lesteven (CDS) “FAIR for Research Software” (WG), et une mise en pratique sur un logiciel existant par Jérôme Pansanel (IPHC) “The”Global Open Research Commons” (GORC) International Model” (WG) par Françoise Genova (CDS) “The Data Management Plan Common Standards” (WG) par Paulette Lieby (ICube)


Video : De la pierre au joyau : les métadonnées au service de la qualité des données.
Ce webinaire s’est tenu le 01/12/22. L’ouverture de l’entrepôt national Recherche.data.gouv est l’occasion de nous réinterroger sur les pratiques en matière de curation des données et métadonnées dans les entrepôts de données de la recherche. À travers trois retours d’expérience, nous proposons d’explorer les méthodes mises en place par les services d’appui à la recherche pour accompagner les équipes de recherche dans le dépôt de leurs données et les processus qui permettent d’assurer la conformité des jeux de données et de leur documentation avec les principes FAIR. La curation est-elle gage de qualité ? Telle est la question de fond qui soutiendra les échanges entre les intervenants et les participants. https://www.youtube.com/watch?v=LvqYI7gLs4w


Video : Toulouse Dataviz : Quarto - le nouvel outil pour créer vos dataviz
Qui n’a pas rêvé de scrapper un site web avec Python, de mettre en forme les valeurs extraites avec R, puis d’en faire un graphique interactif en Observable. Après 10 ans d’amélioration de R Markdown, l’équipe de Posit (ex RStudio) crée Quarto, un notebook open-source qui sublime le R Markdown, exécute du code en 4 langages (Python, R, Julia et Observable), permet une dizaine de formats de sortie à travers Pandoc et la publication en ligne vers 3 plateformes. https://www.youtube.com/watch?v=Cwg7tdSdRvY
le site du GT Atelier Données est construit à l’aide de Quarto, le code source est disponible à cette adresse https://gitlab.math.unistra.fr/miti-gt-donnees/DEMO-QUARTO


The Turing Way: A Handbook for Reproducible Data Science https://github.com/alan-turing-institute/the-turing-way


Python pour la data-science: <Ce site web rend public le contenu du cours de deuxième année (Master 1) de l’ENSAE: Python pour la data-science. Régulièrement mis à jour : pour Décembre : Maîtriser les expressions régulières et Génération d’images avec Python, DALL-E et StableDiffusion https://pythonds.linogaliana.fr/


Parquet devrait remplacer le format CSV https://www.icem7.fr/cartographie/parquet-devrait-remplacer-le-format-csv/