Contribuer à l’Ouverture des Données En SHS

AAP INTERNES 2020

Porteur du projet : karine.onfroy@u-bordeaux.fr

LE PROJET

Parce que l’ouverture et le partage des données scientifiques constituent un enjeu majeur pour le 21eme siècle, le développement d’une culture de la gestion et du partage des données chez tous les acteurs de la Recherche (basée sur la mise en œuvre des principes FAIR – Facile à trouver, Accessible, Interopérable, Réutilisable) , et plus particulièrement en SHS, communauté aujourd’hui encore peu acculturée aux enjeux de la Science Ouverte, doit être encouragé.

L’ouverture des données de la recherche ou Open Research Data consiste à mettre en libre accès les données issues d’un projet de recherche.

La volonté d’ouverture des données de la recherche est liée à plusieurs mouvements :

  • La science ouverte (Open Science), qui comprend le libre accès (Open access), les données ouvertes (Open Data), l’évaluation ouverte par les pairs (Open Peer Review), la science participative ou citoyenne (Citizen Science).
  • L’ouverture des données (Open Datapromue par des administrations publiques engagées dans l’Open Government Data et des acteurs privés. 
  • Les mouvements citoyens des communs (Commons) de la connaissance, des logiciels libres (Free Software Movement), du code source ouvert (Open Source)…

Le mouvement mondial en faveur de la Science Ouverte se développe depuis une trentaine d’année avec l’arrivée d’Internet. Le web a favorisé la concentration de l’Edition, ce qui a eu pour effet, l’augmentation des coûts de la diffusion internationale de la science, au détriment des financements de la recherche qui ont été captés par ces oligopoles. En réaction, des initiatives ont été prises un peu partout, pour développer d’autres manières d’échanger entre les communautés scientifiques, pour reprendre la maîtrise de la diffusion de la production scientifique.

Le terme de Science Ouverte recouvre beaucoup de domaines différents. Source : Knoth, Petr; Pontika, Nancy (2015): Open Science Taxonomy. figshare. Figure. (https://doi.org/10.6084/m9.figshare.1508606.v3)

Avec l’augmentation exponentielle du nombre de données numériques traitées par les chercheurs, et pouvant circuler facilement, il est essentiel de partager les bonnes pratiques de gestion de ces données entre acteurs de la Recherche.

Mais ouvrir ses données dans le respect de son projet (cad les données brutes ou analysées, les textes, les codes informatiques …), ce n’est pas simple et cela prend du temps ! Cela nécessite des compétences administratives, juridiques et techniques :

  • Respecter les obligations liées aux financements européens, français et aux politiques des établissements.

En France

– En 2018, le Plan national pour la science ouverte annoncé par Frédérique Vidal, rend obligatoire l’accès ouvert, pour les publications et, dans une certaine mesure, pour les données issues de recherches financées par appels à projets sur fonds publics. Un COmité pour la Science Ouverte (COSO) est mis en place pour soutenir les initiatives majeures de structuration du paysage concernant les publications et les données.

– L’ANR dans son plan d’action 2019« demande à ce que les publications consécutives aux projets qu’elle finance, soient déposées en texte intégral dans une archive ouverte, et imposera de plus un plan de gestion des données (DMP) pour les projets financés à partir de 2019 ».

– En novembre 2019, le CNRS publie sa feuille de route pour la Science Ouverte. Les données produites par les chercheurs et les chercheuses CNRS ou avec des moyens mis en oeuvre par le CNRS doivent être, dans la mesure du possible, rendues accessibles et ré-utilisables.

En Europe

– A partir de 2017, le libre accès aux données devient une obligation pour tous les nouveaux projets européens financés dans le cadre d’Horizon 2020.

  • Appréhender les outils et formats permettant de bien ouvrir ses données afin qu’elles soient réutilisables par tous

– Si les données sont communicables, les rendre accessibles et ré-utilisables selon les principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable).

– Rejoindre les standards du Web sémantique et commencer par appliquer l’échelle des 5 étoiles de l’Open Data proposé par Tim Berners-Lee.

Il s’agit ainsi d’une démarche transdisciplinaire qui ne relève pas uniquement de la responsabilité des chercheurs mais concerne spécialistes en traitement de données, information documentaire, juristes, informaticiens, experts en valorisation et montage de projets … et elle se réalise dans l’univers numérique en perpétuelle mutation.

« Les données doivent être aussi ouvertes que possibles, et fermées autant que nécessaire ».

L’ouverture des données garantit l’intégrité, la transparence et la qualité des données. C’est un moyen de rendre davantage visible la Recherche, et de valoriser, ses travaux et résultats.

L’un des objectifs du mouvement de la science ouverte est de rendre les résultats de la recherche scientifique accessibles à tous : publications, données de la recherche, logiciels, cahiers de laboratoires… En permettant une diffusion et une réutilisation sans entrave des résultats de la recherche, la science ouverte a pour ambition de :

  • démocratiser l’accès aux savoirs ;
  • rendre la science plus cumulative, plus fortement étayée par les données, plus transparente ;
  • augmenter l’efficacité de la recherche en évitant de dupliquer les efforts, en réutilisant des données ou du matériel scientifique.

Ainsi, le mouvement de la science ouverte favorise les avancées scientifiques et l’innovation, mais aussi la confiance des citoyens dans la science en rendant cette dernière plus intègre.

De plus les données scientifiques produites aujourd’hui sont les archives de demain, elles constituent en cela un patrimoine qu’il faut conserver et valoriser.

L’idée est vraiment d’impulser une science plus ouverte, plus transparente au sein des laboratoires des membres du réseau métier SO MATé.

Pour se familiariser avec cette thématique, des interviews vont être réalisés dès 2021 avec des chercheurs et doctorants volontaires, qui, à partir d’un exemple qu’ils auront choisi (une publication, une thèse ou un jeu de données), vont décrire leur démarche scientifique et les problèmes qu’ils ont rencontré (ou pas) en passant de l’idée à  sa valorisation scientifique.

Des liens avec des projets similaires en France et à l’étranger, avec les TGIR PROGEDO ET HUMA-NUM, et avec des personnes ressources au sein des URFIST,  des bibliothèques, des Directions Informatiques, des Plateformes Universitaires de Données, des services « Soutien à la Recherche », juridiques …de nos établissements seront une aide précieuse tout au long du projet transdisciplinaire par nature.

Plusieurs objectifs :

  • Instaurer un dialogue autour du Partage des Données de la Recherche pour démarrer, comprendre et se former et étudier les modalités d’implication envisageables par chacun
  • Appréhender les choix et difficultés des chercheurs et doctorants dans les diverses étapes que sont la collecte, l’analyse, le partage et la sauvegarde de données
  • Fouiller à travers les spécificités des pratiques disciplinaires et thématiques pour être en mesure de proposer un accompagnement adapté
  • Proposer un accompagnement pour faire en sorte que les données produites soient progressivement structurées en conformité avec les principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable), préservées et, quand cela est possible ouvertes.

Notre atout :
l’intervieweur est un ingénieur qui travaille sur les données de la recherche en SHS, impliqué dans un réseau professionnel moteur sur la thématique de la Science Ouverte et qui collabore avec les acteurs incontournables de la gestion des données de la recherche au sein de son établissement (DSI, Soutien à la Recherche, DPO, Montages de projets ..)

Réalisation de data interviews
  • Travail d’enquêtes (2021-2022) destiné à appréhender les pratiques et les difficultés des chercheurs dans les diverses étapes de leur démarche scientifique et ceci à partir d’un exemple qu’ils choisissent. Il peut s’agit d’un article, d’un jeu de données ou d’une thèse …publié ou en cours de rédaction.

Cette étape nous permet ainsi d’organiser des actions au plus près des besoins.

Formations et entraide / nouvelles formes de publications scientifiques
  • Data Paper Team : exercice d’intelligence collective autour des Data Papers en SHS en collaboration avec le réseau des URFIST (dès sept. 2022)
  • Software Heritage : présentation de l’archive des logiciels par la community manager de la plateforme (30 sept. 2022)
  • HackaViz : organisation d’une journée de formation avec Alain ROAN de Toulouse DataViz (Bordeaux 14 juin 2022)
Organisation d’ateliers de sensibilisation et d’accompagnement autour des données de la recherche
  • « Journey to Open Science » : Ateliers de sensibilisation à l’Open Access en partenariat avec la Direction de la documentation de l’Université de Bordeaux  (Open Access Week 2021 et 2022)
  • Organisation de la Journée d’études «La protection des données de santé : du soin à la recherche» en partenariat avec la CNIL, le DPO de l’Université de Bordeaux et la DRV (23 juin 2022 à Bordeaux) >> SciencesConf
  • Ateliers « dépôt-party » OSKAR / ORCID en partenariat avec la Direction de la documentation de l’Université de Bordeaux (Mars 2022 à BSE et Mai 2022 au LABPSY)
  • Cafés « Data-sharing » en partenariat avec la Direction de la documentation de l’Université de Bordeaux (Avril et Mai 2022 à BSE et au LABPSY)
  • MATé La Science Ouverte ! : Série de 4 wébinaires à destination des  ingénieurs du réseau national MATE SHS (sept.oct 2021) >> SciencesConf
Création de ressources pédagogiques sur la thématique de l’ouverture des données de la recherche avec DORANUM (DOnnées de la Recherche Apprentissage NUMérique – CNRS, GIS Réseau URFIST)
  • La gestion des données de sa recherche : de la collecte à la publication d’un data paper (en cours)
  • Les données confidentielles issues de la statistique publique (en cours)

CODE SHS a été retenu pour une communication lors du colloque POST VERITE organisé à l’occasion des 30 ans de l’Institut Universitaire de France :

  • Univ Bordeaux. (2021, 6 octobre). « Do you trust me ? » Initier une démarche scientifique plus ouverte au sein de laboratoires en Sciences humaines et sociales et favoriser la confiance envers la science. [Vidéo]. Canal-U. https://www.canal-u.tv/108364.

Mais aussi :

  • 1ère Semaine Data-SHS organisée par la Plateforme Universitaire de Données de Bordeaux (PUD-B) du 5 au 9 décembre 2022 à Bordeaux >> PROGEDO
  • 9èmes Journées Annuelles de MATE-SHS sur le thème de la Recherche Reproductible (16 et 17 mai 2022 sur le nouveau Campus Condorcet ) >> SciencesConf
  • AG du département SHS “CHANGES” de l’Université de Bordeaux (25 juin 2021)
  • 8èmes Journées Annuelles de MATE-SHS. Univ Bordeaux. (2021, 24 juin). Journées MATE-SHS 2021 / Comment favoriser les pratiques d’ouverture des données ? Comprendre et enquêter. [Vidéo]. Canal-U. https://www.canal-u.tv/107701.

Le projet CODE SHS a nominé aux Talents U 2022 de l’Université de Bordeaux (catégorie Recherche & Innovation). https://www.u-bordeaux.fr/actualites/decouvrez-les-talents-u-2022

L’EQUIPE

Grégoire Le Campion
PASSAGES - Bordeaux
Fabien Cerbelaud
GEOLAB - Limoges
Gautier Debruyne
COMPTRASEC - Bordeaux
Gaelle Deletraz
PASSAGES - Pau
Laure Gayraud
CEREQ - Bordeaux
Mélanie Lecouedic
ITEM - Pau
Viviane Le Hay
Sciences Po Bordeaux
Nelly Martin
MIGRINTER - Poitiers
Karine Onfroy
GREThA - Bordeaux
Solenne Roux
LABPSY - Bordeaux
Frédéric Santos
PACEA - Bordeaux

Les experts

Pour nous accompagner dans cette démarche, des experts ont récemment rejoint CODE-SHS. Motivés et intéressés par une collaboration inter-métiers en lien direct avec des chercheurs de diverses disciplines, ils vont participer à l’animation de cette communauté, aider au développement d’outils spécifiques et créer une dynamique par le biais de réunions régulières.

Arnaud Caillo
PACEA - Bordeaux
Frédérique Flamerie De Lachapelle
Université de Bordeaux
Sabrina Granger
ENSSIB - Lyon

Les ambassadeurs

L’enquête est aussi un moyen d’évaluer le degré d’appétence de chacun des interviewés pour le partage des données et pour les outils de la Science Ouverte et le cas échéant les leviers qu’il pourrait être possible d’actionner. Les membres de SO MATé encouragent les participants à être ambassadeurs vis-à-vis de leurs pairs. En effet, la singularité du projet CODE-SHS consiste à inviter les acteurs à s’emparer du mouvement en faveur d’une science plus transparente et réutilisable sur le plan individuel (mais aussi au niveau des laboratoires et des discipline SHS) de sorte que les spécificités de la recherche en SHS soit mieux prises en compte.

(liste en cours de création)

« Ainsi Ingénieurs SO MATé, Ambassadeurs et Experts co-construisent une véritable communauté de pratiques favorisant le dialogue informel autour de la Science Ouverte. »

Le réseau  métier SO MATÉ (Sud-Ouest Méthodes, Analyses, Terrains et Enquêtes), créé en février 2019, réunit 27 ingénieurs (Universités, EPST et PUD) du grand Sud-Ouest de la France et s’intéressant de manière large, à la collecte, au traitement, à l’accès et à la préservation de données et corpus en Sciences Humaines et Sociales.

SO MATÉ est le groupe local du grand Sud Ouest de la France du réseau national métier MATÉ-SHS, un réseau de l’InSHS (Institut national des Sciences Humaines et Sociales) du CNRS. Les actions de MATÉ-SHS sont financièrement soutenues par l’InSHS, la TGIR-Progedo et les laboratoires CNRS impliqués dans ces actions.

Les membres du réseau SO MATÉ se sont donnés pour objectif d’impulser une science plus ouverte, plus transparente au sein de leurs laboratoires respectifs.

Ils ont notamment propulsé le projet CODE SHS (projet de confinement …) et organisé à Bordeaux en Juin 2021 les Journées Annuelles de MATE-SHS sur cette thématique.

CODE-SHS s’appuie sur une collaboration étroite avec des projets similaires (programmes et projets de recherche) et des réflexions internes (groupes de travail données ou Science Ouverte, enquêtes internes au sein de laboratoires ..).

Nous souhaitons faire émerger des collaborations avec les TGIR PROGEDO et HUMA-NUM, les services Soutien à la Recherche, Informatiques et de Montage de projets des Universités, les PUD ..qui apparaissent comme des ressources précieuses pour orienter nos actions de sensibilisation.

CODE-SHS repose sur le développement d’une expertise collective et interdisciplinaire pour accompagner l’ouverture des données en SHS.

POLITIQUE DE PROTECTION DES DONNÉES PERSONNELLES

Les informations recueillies vont faire l’objet d’un traitement dans le cadre du projet CODE-SHS « Contribuer à l’Ouverture des Données En SHS », piloté par Karine ONFROY (coordinatrice du réseau SO-MATÉ et ingénieure d’études en production, traitement, analyse de données et enquêtes à BSE). Ceci sous couvert de son Directeur d’Unité Mixte de Recherche CNRS, Monsieur Tanguy BERNARD.

Finalités du projet

Le traitement vise à engager une réflexion coordonnée, à destination de la communauté SHS du grand Sud-Ouest de la France, autour du Partage de Données et des principes FAIR.
Les membres volontaires de SO MATÉ vont, en lien avec les membres de leur laboratoire (chercheur.es, doctorant.es …), réaliser un état des lieux de la connaissance et de l’utilisation des données ouvertes en recherche avec leur propre regard disciplinaire et à être force de propositions pour accompagner l’adoption de nouvelles pratiques. L’enjeu consiste à discuter de l’opportunité et des dispositifs à mettre en œuvre pour encourager l’ouverture les données de la recherche à l’échelle de sa communauté scientifique.
Des entretiens semi-directifs sont menés auprès de chercheurs, enseignants-chercheurs et doctorants en SHS afin de saisir leurs pratiques actuelles en matière de science ouverte et de pouvoir les accompagner au mieux sur ces questions. Ces entretiens font l’objet d’un enregistrement sonore afin de faciliter le travail de transcription et d’analyse.

Nature des données collectées

Données d’identification et sur la vie professionnelle (enregistrements sonores et transcriptions des entretiens, formulaires de consentement à l’enregistrement sonore et à la transcription de l’interview) issues de la réalisation d’entretiens auprès de chercheurs, enseignants-chercheurs et doctorants sur les pratiques et les besoins d’accompagnement à l’ouverture des données de la recherche scientifique.

Base légale du traitement

La base légale du traitement repose sur l’exécution d’une mission de recherche publique.

Participation libre

La participation au projet contribuer à l’ouverture des données est entièrement libre et volontaire. Il fait suite à un premier contact par mail sollicitant la participation au projet, permettant d’améliorer l’accompagnement du public-cible sur les questions de science ouverte.

Pseudonymisation / confidentialité

Le projet Contribuer à l’Ouverture des Données En SHS prend les engagements suivants :

  • Les données sont traitées à des fins statistiques et de compréhension des problématiques abordées dans le projet
  • L’identité sera dissimulée à l’aide d’un numéro aléatoire dans tous les écrits produits sur la base des entretiens (comptes rendus d’entretien, notes d’analyse échangées entre les ingénieurs, publications …)
  • Seule la responsable de projet détient la table de correspondance qui permet de faire le lien entre l’identité de l’interviewé et le numéro aléatoire attribué dans les écrits produits.

Destinataires des données personnelles

Les données collectées seront communiquées aux seuls destinataires suivants : les membres du projet chargés du traitement des données d’entretiens (équipe principale du projet, membres de SO-MATÉ)

Transfert de données

Toutes les données seront gardées en France.

Durée de conservation

Les données personnelles sont conservées en base active 24 mois après la fin de ce projet afin de continuer le travail d’analyse et de publier des premiers résultats. Après cette date et en cas de succès, elles pourront faire l’objet d’un réemploi dans le cadre d’un projet ayant la même finalité. Le cas échéant, elles seront définitivement archivées dans un entrepôt de données sécurisé.

Mesure de sécurité

Afin de sécuriser l’activité scientifique du projet et de garantir la confidentialité et la qualité des données tout au long de leur cycle de vie, plusieurs dispositions sont mises en place :

  • Pseudonymisation de l’ensemble des données à caractère personnel dans un répertoire chiffré.
  • Anonymisation des données lors de la diffusion.
  • Stockage et hébergement des données personnelles du projet sur l’espace Core du CNRS géré par SO-MATE (accès restreint aux seuls membres du projet).
  • Stockage de la preuve du consentement (entretiens) sur le cloud personnel Core géré par le CNRS de la chargée de mise en oeuvre du projet.
  • Utilisation exclusive des messageries institutionnelles (Universités / CNRS / EPST) pour les échanges d’informations.
  • Inscription des traitements de données personnelles propres à ce projet dans le registre des activités de traitement de la structure de rattachement du responsable de traitement.
  • Réalisation d’un Plan de Gestion des Données pendant le temps du projet.
  • Chiffrement de l’espace de travail dédié au projet sur les PC individuels des membres du projet.

Diffusion

Les résultats de cette recherche seront diffusés de façon anonyme dans des séminaires et des colloques scientifiques, dans des revues professionnelles et académiques et dans des médias destinés au grand public.

Vous pouvez poser des questions au sujet de ce projet à tout moment en communiquant avec la responsable du projet par courrier électronique : karine.onfroy@u-bordeaux.fr

Vous pouvez accéder et obtenir copie des données vous concernant, vous opposer au traitement de ces données, les faire rectifier ou les faire effacer. Vous disposez également d’un droit à la limitation du traitement de vos données. Vous pouvez exercer ces droits en vous adressant :

  • Soit directement au Responsable du Traitement :
Monsieur Tanguy BERNARD, Directeur de BSE
16 avenue Léon Duguit, 33608 Pessac
tanguy.bernard@u-bordeaux.fr
  • Soit au Délégué à la Protection des Données de BSE :
CNRS Service Protection des Données
2 rue Jean Zay
54500 Vandœuvre-lès-Nancy
Dpd.demandes@cnrs.fr

Après nous avoir contactés, si vous estimez que vos droits Informatique et Libertés ne sont pas respectés, vous avez la possibilité d’introduire une réclamation en ligne auprès de la CNIL ou par courrier postal. CNIL, 3 Place de Fontenoy, TSA 80715 – 75334 Paris Cedex 07, https://www.cnil.fr/