-
Publié à
Mardi 15 décembre 2020
17 décembre 2020 – Si les données sont la matière première de tout scientifique, la connaissance de leur existence est d’autant plus importante pour l’avancement de la science.
Les équipes de recherche de par le monde collectent, analysent et génèrent des millions de données. Celles-ci sont alors réparties entre un grand nombre de services, de lieux, de systèmes et de plateformes (sur serveurs ou dans le Cloud). Il devient donc difficile d’avoir une vue d’ensemble sur les données au service de la recherche, données qui auraient tout intérêt à être réutilisées par diverses études.
Pour accélérer la découverte des connaissances sur la santé et le bien-être, PULSAR juge essentiel d’offrir une meilleure accessibilité aux données disponibles pour fins de recherche. Voilà pourquoi, dans le cadre de sa programmation de recherche en santé durable, PULSAR s’est récemment doté d’un catalogue de données.
Entièrement bilingue, le catalogue de données PULSAR permet à ses utilisateurs de regrouper et de faire connaître leurs données, tout en accédant aux jeux de données produits par les projets réalisés avec PULSAR et par d’autres projets de recherche.
Pour en savoir davantage sur le nouveau catalogue de données et ses fonctionnalités, PULSAR s’est entretenu avec Félix Desrosiers, analyste en évaluation de la santé durable et membre de l'équipe qui a mis en place le catalogue PULSAR.
---
PULSAR > D’abord, qu’est-ce qu’un catalogue de données ?
Félix Desrosiers > Un catalogue de données est un endroit centralisé où sont regroupées et mises en commun les informations à propos des données. On appelle ces informations des « métadonnées ». Le catalogue fournit ainsi aux utilisateurs des renseignements pour localiser et comprendre les données, mais aussi pour en favoriser une gestion automatisée et collaborative.
PULSAR > Est-ce que plusieurs organisations ont mis en place ce type de catalogue?
FD > Oui, et le phénomène est mondial. On retrouve des catalogues de données partout à travers le monde, qu’ils soient administrés par des gouvernements, des entreprises ou des organisations. Plus près de nous, on peut penser au catalogue de Données Québec, au répertoire Données ouvertes du gouvernement fédéral ou encore au catalogue Maelstrom mis en place par l'Institut de recherche du Centre universitaire de santé McGill.
PULSAR > Pourquoi PULSAR s’est-il doté d’un catalogue de données?
FD > PULSAR a à cœur de promouvoir une culture de partage et de collaboration en recherche. C’est d’ailleurs pour cette raison qu’il a mis en place la Banque de données en santé durable, qui est constituée de données colligées par différents projets de recherche réalisés avec PULSAR. Rappelons que cette banque favorise la découverte de nouvelles connaissances grâce à la réutilisation, par de futurs projets, des données qui y sont conservées.
Mais si personne ne sait quelles données contient cette banque, ni qui les a collectées et dans quels contextes, ça ne sert à rien! Le catalogue servira donc oui, à documenter et à faire connaître les jeux de données contenus dans la Banque de données en santé durable, mais aussi les jeux de données d’autres projets en santé durable réalisés avec ou sans PULSAR.
PULSAR > Quelles informations retrouve-t-on dans le catalogue de données PULSAR?
FD > Le catalogue PULSAR est très axé « santé ». Il contient des informations complètes sur des réseaux de recherche, des études épidémiologiques en santé et les variables évaluées dans le cadre de celles-ci.
Actuellement, le catalogue en est à sa première version. L'équipe vient de commencer à y colliger des informations, et cela prend un temps considérable! On y retrouve donc à ce jour les métadonnées du projet NutriQuébec (et celles d'autres projets prochainement) ainsi qu'un lien vers le catalogue de Données Québec. Et déjà, ces données peuvent être très intéressantes pour d’autres chercheurs en santé!
Par exemple, un chercheur australien qui réalise une étude sur l’alimentation de la population pourrait vouloir croiser ses données avec celles collectées par l’équipe NutriQuébec. En consultant le catalogue de PULSAR (aussi en version anglaise), il serait en mesure de savoir d’abord que ce type de données existe. Ensuite, il pourrait savoir de quelles façons les données ont été collectées, par qui, auprès de qui, quand, etc. Il aurait accès aux variables qui ont été étudiées, aussi nombreuses soient-elles! Il pourrait aussi entrer en contact avec les chercheurs qui les ont collectées puisque le catalogue fournit les coordonnées des équipes de recherche.
PULSAR > Quelles sont les principales fonctionnalités du catalogue PULSAR?
FD > Créé avec le logiciel Mica, le catalogue PULSAR possède un excellent moteur de recherche qui permet de consulter, de faire des requêtes et de comparer des études et leurs métadonnées. L’utilisateur peut ainsi connecter chacune des informations à une autre. Par exemple, s’il commence par cliquer sur une variable, il pourra voir à quelle étude celle-ci est liée, à quel ensemble de données, etc.
Diverses fonctionnalités permettent également de simplifier la vie des utilisateurs. Par exemple, il est possible de sélectionner des variables et de les exporter afin de les utiliser dans d’autres logiciels. Aussi, une fonction “Panier” permet de constituer des listes de variables afin de faciliter la recherche et la visualisation des variables d’intérêt pour une personne qui consulte le catalogue.
PULSAR > Est-ce que le catalogue PULSAR est facile d’utilisation?
FD > Le catalogue est intuitif et à la portée des gens qui s’intéressent à la recherche et aux données. Un utilisateur non-initié devrait explorer et y aller par essai-erreur au début, mais il serait à l’aise avec un peu d’expérience et de formation. PULSAR n’offre pas de soutien spécifique pour l’utilisation du catalogue, mais prend en main, pour les projets réalisés avec PULSAR qui le souhaitent, l'intégration des informations sur ces projets et de leurs jeux de données dans le catalogue. Aussi, l’équipe de PULSAR reste disponible pour répondre aux questions des équipe de recherche.
PULSAR > Qui peut accéder au catalogue de données mis en place par PULSAR?
FD > Tout le monde, le catalogue est 100% public! Pas besoin de compte ni de connexion. Pour l’instant, les gens ne peuvent ajouter eux-mêmes des informations, mais cela viendra avec les prochaines itérations du catalogue.
Pour en savoir plus et accéder au catalogue de données PULSAR, cliquez ici.