Rationaliser l’accès aux ensembles de données biomédicales

Rationaliser l’accès aux ensembles de données biomédicales

11 novembre 2021 1 Par Laura S.

L’ontologie d’utilisation des données GA4GH (DUO) prend en charge un cadre d’autorisation et d’accès aux données pour rationaliser le consentement à l’utilisation des données biomédicales

Un grand groupe d’experts internationaux au sein de l’Alliance mondiale pour la génomique et la santé (GA4GH), y compris des utilisateurs de l’Institut européen de bioinformatique de l’EMBL (EMBL-EBI) et du Broad Institute du MIT et de Harvard, ont développé la norme Data Use Ontology (DUO). Les annotations DUO permettent aux termes et définitions dans les formulaires de consentement de données et les politiques de partage de données d’être standardisés et lisibles par machine. Cela aide à rationaliser le consentement à l’utilisation d’ensembles de données biomédicales à accès contrôlé, écrit le Laboratoire européen de biologie moléculaire dans un communiqué de presse.

Les ensembles de données biomédicales humaines contiennent souvent des informations sensibles sur les individus. Par conséquent, le propriétaire des données doit être très prudent lorsque ces données sont mises à disposition pour une utilisation secondaire par d’autres chercheurs. L’accès et le partage de ces données doivent être conformes aux règles et réglementations légales, éthiques et de consentement éclairé. Naviguer dans ce paysage complexe peut ralentir la recherche, car les chercheurs ont besoin d’une autorisation pour accéder à des ensembles de données sensibles. 

S’éloigner des workflows manuels

Pour récupérer et réutiliser des ensembles de données biomédicales, les chercheurs doivent soumettre une demande d’accès aux données aux comités d’accès aux données. Cela peut être un long processus car un flux de travail typique implique un examen manuel des demandes par rapport à la lettre d’utilisation des données qui spécifie comment l’ensemble de données peut être utilisé, afin de déterminer si l’accès doit être accordé.

Voici une vidéo parlant de la gestion des données dans ce domaine en anglais :

Les formulaires de consentement à la recherche ne fournissent souvent pas d’informations claires sur le partage d’ensembles de données biomédicales. Ne pas disposer d’un moyen standard de représenter les conditions d’utilisation des données peut vraiment ralentir la recherche lorsque vous essayez de réutiliser ces ensembles de données. L’utilisation de la norme GA4GH DUO est une première étape pour aider les chercheurs du monde entier à accéder rapidement et facilement aux données biomédicales dont ils ont besoin. 

Un vocabulaire lisible par machine

DUO est un vocabulaire standard lisible par machine des termes d’utilisation des données, visant à décrire les conditions d’utilisation des données et à automatiser la correspondance d’ensembles de données spécifiques avec les demandes d’accès aux données. L’association de DUO avec le passeport GA4GH automatise davantage cette étape en fournissant les niveaux d’authentification et d’autorisation d’un chercheur.

Plus de 200 000 ensembles de données dans le monde ont déjà été annotés avec des termes DUO et il a été mis en œuvre avec succès dans diverses institutions telles que le Broad Institute et le Wellcome Sanger Institute. Il y a encore plus à faire ; ils veulent inclure différents types de données et l’outil Resource Entitlement Management System qu’ils développent et déploient avec EGA tirera parti à la fois de la mise en œuvre de DUO et de Passport.