Read this in English

Cette observation a été écrit par Caroline Winter, avec remerciements à Shahira Khair pour ses commentaires et contributions.

En bref:

Titre Sondage sur la capacité des services institutionnels de gestion des données de recherche rapports Insights
Créateur Portage, Group d’exerperts sur la recherche et l’intelligence (GERI)
Date de publication 2020–2021
Mots clés gestion des données, Canada, mise en œvre

En mai 2018, les trois organismes du Canada ont publié une ébauche d’un Politique de gestion des données de recherche (GDR) aux fins de consultation, l’une des nombreuses politiques liées à la gestion des données, y compris la Politique des trois organismes sur le libre accès aux publications (2015) et la Déclaration de principes des trois organismes sur la gestion des données numériques (2016) (voir « Le Politique des trois organismes sur la gestion des données de recherche »). La version finale de la Politique des trois organismes sur la GDR a été publiée en mars 2021 (voir « Mise à jour : Gestion des données de recherche au Canada »).

En vertu de la politique, les établissements de recherche qui administrent les fonds des trois organismes sont tenus d’élaborer des stratégies de GDR d’ici le 1er mars 2023 (Gouvernement du Canada 2021). Alors que les établissements commençaient à élaborer leurs politiques de GDR en réponse à l’ébauche de politique des trois organismes, le Groupe d’experts sur la recherche et l’intelligence (GERI) du réseau Portage a mené deux sondages pour déterminer dans quelle mesure les établissements étaient prêts à mettre en œuvre la Politique de GDR et quels services Portage et d’autres intervenants pourraient offrir en soutien.

Sondage sur la stratégie institutionnelle de GDR

Le sondage sur la stratégie institutionnelle de GDR de Portage (Portage 2019) a été mené en juin 2019 et a reçu 88 réponses de 63 établissements. Il a révélé que la plupart des établissements répondants avaient entamé le processus d’élaboration d’une stratégie institutionnelle de GDR, même si bon nombre d’entre eux en étaient au stade de la planification. Parmi ceux-ci, beaucoup ont noté que le développement a l’arrêt, en attendant la publication de la politique finale de GDR des trois organismes. Sur la base des réponses à l’enquête, le GERI a suggéré des mesures à prendre pour aider les établissements à développer leurs stratégies, notamment en partageant les stratégies finales pour servir d’exemples, en facilitant les communautés de pratique pour aider les groupes de travail institutionnels à apprendre les uns des autres et en fournissant des conseils explicites sur la manière dont stratégies peuvent répondre aux exigences de la politique des trois organismes.

L’enquête sur la capacité des services GDR institutionnels et les rapports d’analyse

À l’automne 2019, le GERI a mené le Sondage sur la capacité des services institutionnels de gestion des données afin d’établir une référence pour la capacité des établissements de recherche au Canada à soutenir les activités de GDR décrites dans l’ébauche de la politique de GDR des trois organismes (Cooper et al. 2020). Il a reçu 85 réponses de 77 établissements, dont des universités, des collèges, des CEGEPs, des centres et établissements de recherche et des organismes gouvernementaux (2). Un résumé analytique a été publié en janvier 2020 (Cooper et al. 2020).

Le premier rapport Insights, publié en juin 2020, s’est concentré sur la capacité au sein des organisations, avec des conclusions clés liées à la politique, aux structures organisationnelles, aux budgets et aux collaborations internes et externes (Abel et al., 3). S’appuyant sur les résultats discutés dans le rapport initial, il a noté que les bibliothèques et les unités administratives de la recherche dirigeaient le plus souvent l’élaboration de stratégies et de politiques de GDR dans les universités et les collèges (4). En ce qui concerne les structures de travail, environ la moitié des établissements (principalement des universités) avaient des groupes de travail institutionnels formels sur la GDR, la plupart dirigés par des bibliothèques ou des groupes d’administration de la recherche (8).

En termes de structure de personnel, environ le tiers (33,8 %) des établissements, principalement des universités, avaient créé de nouveaux postes pour assumer des responsabilités de GDR et un peu moins du tiers (28,6 %) avaient réaffecté du personnel existant pour les assumer, mais un peu plus du tiers (37,7 %) n’avaient pas de personnel responsable de la GDR (9). Bien que le financement soit crucial pour le développement des capacités, une seule institution a fait état d’un budget institutionnel dédié à la GDR ; la forme de financement la plus courante consistait à utiliser les budgets opérationnels (27,3 %) et de nombreux établissements (37,7 %) ont déclaré ne pas avoir de budget dédié à la GDR (15–16). La plupart des établissements ont participé à des initiatives collaboratives nationales (65,6 %) ou régionales (72,1 %) de GDR (13).

Le deuxième rapport Insights, publié en février 2021, se concentre sur le personnel hautement qualifié (PHQ), l’infrastructure et les services (Cooper et al. 2021a). Il a examiné l’expertise en GDR dans 12 catégories de compétences (par exemple, la connaissance des politiques nationales, le développement de logiciels, la gestion des données, la création de métadonnées), organisées en étapes du cycle de vie des données, comme décrit dans L’introduction à gestion des données de recherche de Portage. Il a constaté que les universités avaient tendance à faire état d’une plus grande capacité que les collèges dans plusieurs catégories et que les établissements exprimaient le besoin d’un soutien plus qualifié dans toutes les catégories, avec un besoin particulier « en gestion des données sensibles, en curation de données, en développement de logiciels de recherche, en préservation des données, en gestion des données par les chercheurs et au regard des aspects techniques des infrastructures électroniques » (4). En termes d’infrastructure GDR, par rapport aux collèges, les universités ont signalé une plus grande connaissance et un soutien institutionnel pour le transfert de données (50 % ; 19 %), les données sensibles (40,4 % ; 33,3 %), le calcul haute performance (50 % ; 14,3 %) , logiciels commerciaux qualitatifs (55,8 % ; 28,6 %), logiciels quantitatifs (75 % ; 38,1 %) et outils de collaboration (26,9 % ; 9,5 %) (12–14). Dans de nombreux cas, cependant, les répondants ne savaient pas quels soutiens étaient disponibles.

En ce qui concerne les services de GDR, alors que plus de la moitié des répondants offrent une gamme complète de soutiens de GDR, l’étendue et le niveau de développement de ces services varient considérablement (16). Ces services sont généralement proposés au niveau institutionnel et dirigés par des bibliothèques, des départements informatiques ou des efforts conjoints (17–19). Les institutions avec des postes dédiés à la GDR et un soutien budgétaire dédié ont tendance à offrir davantage de soutiens institutionnels, tandis que celles dans lesquelles le soutien à la GDR est affecté à des postes existants ont tendance à faire appel à des ressources externes (20–21).

Le troisième rapport Insights, publié en février 2021 (Cooper et al. 2021b), examine quelles ressources GDR sont disponibles, comment elles sont allouées et comment elles pourraient mieux servir la communauté. Lorsqu’on leur a demandé de classer les ressources à privilégier pour soutenir la GDR, les répondants ont cité le plus souvent les ressources humaines (37,7 %), suivies des conseils sue les questions de politiques (22,1 %) et des ressources financières (16,9 %) et techniques (14,3 %) (5). En termes d’investissement, près de la moitié (46,8 %) des établissements n’avaient pas l’intention ou ne connaissaient pas de l’intention d’investir davantage dans les supports technologiques de GDR, et seulement 7,8 % prévoyaient de créer de nouveaux postes de GDR (6). Environ le quart des universités ont déclaré offrir du perfectionnement professionnel en GDR aux chercheurs (19,6 %) et au personnel (23,5 %), comparativement à seulement 5,3 % des collèges, qui ont déclaré offrir une formation aux chercheurs seulement (9). Interrogés sur les obstacles au soutien de la GDR, les répondants ont le plus souvent cité le manque de sensibilisation ou la résistance au partage des données, le manque de temps et le manque de financement et d’incitatifs (11). Lorsqu’on leur a demandé quels facteurs accéléreraient le plus efficacement le développement de la GDR, les répondants ont mentionné le plus souvent le financement, suivi des politiques, de la formation et de la collaboration (15).

Le troisième rapport Insights se termine par une liste de recommandations, certaines nouvelles et d’autres déjà mises en œuvre. De façon générale, cela comprend le développement de ressources pour soutenir la capacité de GDR, comme celles que Portage a créées pour soutenir le développement de stratégies institutionnelles de GDR. Ils comprennent également une collaboration accrue entre les organisations existantes, en particulier par l’intermédiaire de l’Alliance de recherche numérique du Canada (l’Alliance, anciennement NOIRN), et la mise en relation des chercheurs avec les ressources existantes. Le rapport note également que l’Alliance continuera de fournir un soutien à la GDR au niveau national, permettant aux établissements de concentrer leur financement et d’autres ressources sur les besoins locaux (Cooper et al. 2021b, 21).

Pris ensemble, ces trois rapports montrent que les services et soutiens de GDR –– y compris la stratégie institutionnelle et, dans une moindre mesure, la politique ––sont en développement dans de nombreuses institutions canadiennes, souvent dirigées par des bibliothèques. Les établissements s’engagent dans des réseaux et des collaborations régionaux et nationaux, mais les soutiens à la GDR sont disponibles de manière inégale, les universités déclarant plus de ressources que les collèges. Certaines des priorités pour le renforcement des capacités de GDR comprennent le PHQ et les ressources humaines, le financement, l’infrastructure technologique et la connaissance des politiques (Cooper et al 2021b, 19).

Renforcement des capacités de GDR et le Partenariat INKE

La GDR est une question d’intérêt pour de nombreux membres du Partenariat INKE, dont beaucoup sont depuis longtemps impliqués dans le développement des capacités de GDR. Avant de se joindre à l’Alliance, Portage était à l’origine une initiative de l’Association des bibliothèques de recherche du Canada (ABRC) et, sous le nom de l’ABRC Portage, elle a développé l’Assistant PGD (plans de gestion des données), un outil bilingue en ligne pour la planification de la gestion des données hébergé par l’Université d’Alberta. Il a également travaillé avec CANARIE pour soutenir une extension nationale du service Scholars Portal Dataverse, un dépôt de données de recherche soutenu par l’Ontario Council of University Libraries (OCUL) et hébergé par les bibliothèques de l’Université de Toronto. L’ABRC Portage et Calcul Canada se sont également associés à l’Alliance pour développer le Dépôt fédéré de données de recherche (DFDR), un dépôt pour les grands ensembles de données (> 1 To) et une plateforme de découverte qui fédère les données entre les dépôts canadiens.

Portage et un autre partenaire INKE, le Réseau canadien de documentation pour la recherche (RCDR), gèrent également le Consortium DataCite Canada, qui permet aux institutions canadiennes de créer et d’intégrer des DOI pour soutenir la GDR et améliorer la découvrabilité, l’accessibilité et la citabilité de la recherche.

En juin 2021, les bibliothèques de l’UVic ont organisé un événement virtuel intitulé Research Data Management for Digitally-Curious Humanists qui a exploré le concept de données de recherche dans les sciences humaines et les stratégies de renforcement des capacités en GDR. Un projet de rapport basé sur les discussions lors de l’événement a été partagé sur l’Open Scholarship Policy Observatory pour commentaires en novembre 2021.

Renforcement des capacités de GDR et communauté universitaire élargie

La série de rapports de la coopérative internationale de bibliothèques OCLC, intitulée The Realities of Research Data Management, présente des études de cas d’universités du Royaume-Uni, des États-Unis, d’Australie et des Pays-Bas. Les auteurs notent que l’augmentation exponentielle de l’échelle des données de recherche est un facteur important qui motive le besoin d’une plus grande capacité de GDR. L’avènement du Big Data et les techniques de recherche computationnelle dans les sciences humaines et sociales a changé le visage des données dans la recherche d’aujourd’hui, et les processus d’assemblage, de gestion et la conservation des données également (Bryant et al. 2017). Les données de recherche, en plus des publications qui en découlent, sont devenues une partie importante du dossier scientifique et un atout précieux, en particulier lorsqu’elles sont optimisées pour être réutilisées.

Au Canada, la politique de GDR des trois organismes à laquelle répondent le sondage et les rapports Insights de Portage fait partie des développements continus dans les écosystèmes nationaux de politiques et d’infrastructures qui visent à renforcer la capacité de GDR. Un article paru dans Affaires universitaires note que bien que la GDR soit de plus en plus importante dans toutes les disciplines à mesure que la recherche devient plus intensive en données, ce n’est pas toujours une priorité pour les chercheurs, de sorte que le changement culturel est un facteur important pour faire progresser la capacité de GDR. Comme le note Jeff Moon, directeur de Portage, « Nous devons changer cette culture afin que des données, métadonnées et codes bien documentés soient jugés aussi précieux qu’un bon article publié dans une revue scientifique » (Voinigescu 2021). L’article pointe vers les ressources offertes par Portage comme supports utiles pour les individus et les institutions.

Les efforts du Canada pour renforcer la capacité de GDR font partie de sa stratégie globale d’infrastructure de recherche numérique (IRN). L’Alliance a été créée dans le cadre de cette stratégie : une organisation nationale à but non lucratif pour soutenir le calcul informatique de recherche avancée et les logiciels de recherche en plus de la GDR et les intégrer dans un système national d’IRN (voir « NOIRN et la stratégie canadienne d’infrastructure de recherche numérique »).

L’Alliance a publié un rapport connexe en septembre 2021, sondant l’environnement de la GDR au Canada (Khair et al. 2020; voir « État actuel de la gestion des données de recherche au Canada : un rapport par l’Alliance de recherche numérique du Canada »). En décembre 2021, l’Alliance a annoncé de nouvelles ressources GDR pour soutenir les établissements :

Renforcement des capacités GDR et la science ouverte

Bien que la politique de GDR des trois organismes indique explicitement qu’il « n’est pas une politique sur les données ouvertes » (Gouvernement du Canada 2021), et que toutes les données de recherche ne peuvent ou ne doivent pas être ouvertes, les pratiques et la capacité de GDR sont fondamentales pour les données ouvertes et la science ouverte. Les chercheurs peuvent utiliser des infrastructures GDR telles que DFDR, par exemple, pour améliorer la découvrabilité et la réutilisation de leurs données de recherche, par exemple (Voinigescu 2021). S’appuyer sur les soutiens GDR existants identifiés dans les rapports Insights de Portage améliorera également la capacité de l’écosystème de recherche canadien en matière de la science ouverte.

Ouvrages citées

Abel, Jennifer, Alexandra Cooper, Dylanne Dearborn, Carol Perry, Andrea Szwajcer, et Minglu Wang. 2020. Sondage sur la capacité des services institutionnels de gestion des données de recherche, rapport INSIGHTS #1 Soutien à la GDR au sein des organisations: budget, structure et stratégies. Juin 2020, Réseau Portage, Association des bibliothèques de recherche du Canada. https://doi.org/10.5281/zenodo.3906470.

Bryant, Rebecca, Brian Lavoie, et Constance Malpas. 2017. The Realities of Research Data Management, Part One: A Tour of the Research Data Management (RDM) Service Space. OCLC. https://doi.org/10.25333/C3PG8J.

Cooper, Alexandra, Carol Perry, Andrea Szwajecer, Minglu Wang, et Shahira Khair. 2020. Sondage sur la capacité des services institutionnels de gestion des données de recherche: Sommaire. Réseau Portage, Association des bibliothèque de recherche du Canada. https://dx.doi.org/10.14288/1.0388723.

Cooper, Alexandra, Lucia Costanzo, Dylanne Dearborn, Shahira Khair, Carol Perry, Andrea Szwajcer, et Minglu Wang. 2021a. Sondage sur la capacité des services institutionnels de gestion des données de recherche, rapport INSIGHTS no2 : Capacité des établissements au chapiter du personnel hautement qualifié, de l’infrastructure et des services. https://doi.org/10.5281/zenodo.4559991.

Cooper, Alexandra, Lucia Costanzo, Dylanne Dearborn, Shahira Khair, Carol Perry, Andrea Szwajcer, et Minglu Wang. 2021b. Sondage sur la capacité des services institutionnels de gestion de données de recherche, rapports INSIGHTS no3 : Avenir de soutien à la GDR pour les établissements : ressources priorisées, investissements, défis et accélérateurs. https://doi.org/10.5281/zenodo.4892718.

Gouvernement du Canada. 2021. Politique des trois organismes sur la gestion des données de recherche. https://www.science.gc.ca/eic/site/063.nsf/fra/h_97610.html.

Groupe d’experts sur la recherche et l’intelligence du reseau Portage. 2019. Sondage sur la stratégie institutionelle de gestion des données de recherche (GDR) – Sommaire des résultats. Novembre 2019. https://doi.org/10.5281/zenodo.3962885.

Khair, Shahira, Rozita Dara, Susan Haigh, Mark Leggott, Ian Milligan, Jeff Moon, Karen Payne, Elodie Portales-Casamar, Ghilaine Roquet, et Lee Wilson. 2020. État actual de la gestion des données de recherche au Canada : Mise à jour de l’exposé de principe du CLIRN sur la gestion des données. Novembre 2020. https://alliancecan.ca/assets/uploads/documents/NDRIO_GDR_E%CC%81xpose%CC%81deprincipe-1.pdf.

Voinigescu, Eva. 2021. « Des organismes subventionnaires priorisent la gestion des données de recherche. » Affairs universitaires, 15 juin 2021, https://www.affairesuniversitaires.ca/actualites/actualites-article/des-organismes-subventionnaires-priorisent-la-gestion-des-donnees-de-recherche/.