Appariement SNDS

Bonjour,
Merci par avance à toute personne qui prendra le temps de répondre à notre demande.

Nous vous contactons dans le cadre d’un projet de recherche mené au sein d’un hôpital public disposant d’un accès permanent au SNDS. (Le projet relève du cadre de référence MR-003).

Nous travaillons sur une cohorte clinique dans le champ des maladies rares et souhaitons apparier nos données cliniques aux données du SNDS afin d’assurer un suivi plus complet des patients.

Le projet, disposant d’un avis favorable CPP, a été soumis à la CNIL pour avis (AIPD en cours) et nous sommes actuellement dans l’attente de leur retour.

Dans ce contexte, nous souhaiterions obtenir des précisions sur la démarche d’appariement.

Compte tenu du nombre limité de patients inclus dans la cohorte (moins de 500 patients), de la vulnérabilité de cette population et des délais parfois longs liés aux démarches auprès des représentants légaux, nous réfléchissons à une stratégie permettant de maximiser les chances d’appariement des données.

Ainsi, nous envisageons une stratégie mixte :

  • un appariement direct pour les patients disposant d’un NIR,
  • et, pour les autres patients, un appariement indirect basé sur les variables d’identification disponibles, avec l’objectif de permettre une identification ou une correspondance dans le SNDS.

Nous souhaiterions savoir si une telle approche est possible sur le plan réglementaire et technique dans le cadre du SNDS, et si elle nécessite une ou plusieurs procédures d’appariement distinctes.

Par ailleurs, nous aimerions également savoir :

  1. Une fois l’autorisation CNIL obtenue, quelles sont les étapes opérationnelles suivantes pour accéder aux données du SNDS et réaliser l’appariement dans le cadre d’une cohorte hospitalière ?
  2. Le recours à un tiers centralisateur (tel que le Health Data Hub) est-il obligatoire dans ce type de projet, ou un accès direct via un établissement hospitalier disposant déjà d’un accès SNDS peut-il suffire ?

Nous vous remercions par avance pour votre aide et vos éclairages sur ces aspects méthodologiques et réglementaires.

Bonjour,

Une approche mixte, combinant appariement direct et indirect, est tout à fait possible dès lors que ce processus est bien décrit dans le protocole soumis à la CNIL. La CNIL reprendra probablement cet élément dans son autorisation le moment venu.

Une approche mixe nécessite en effet deux procédures d’appariement distinctes : une pour le direct, et une pour l’indirect.

Concernant vos autres questions :

  1. Les étapes opérationnelles pour accéder aux données SNDS vont dépendre du support d’exploitation sur lequel vous allez traiter les données - pourriez-vous nous indiquer quel est le support envisagé (portail CNAM, plateforme HDH ou système-fils) afin que nous puissions vous fournir plus de détails à ce sujet ?
  2. Je ne suis pas sûr d’avoir bien compris la question. Dans votre cas, s’agissant d’une cohorte monocentrique, un tiers de centralisation des NIRs n’est pas nécessaire. Je crois comprendre que votre question porte plutôt sur le support d’exploitation sur lequel ces données appariées peuvent être traitées : il devra s’agir d’un support habilité et respectant le référentiel de sécurité du SNDS (portail CNAM, plateforme HDH, ou système-fils)

Bien cordialement,

Tim Vlaar - Health Data Hub

Bonjour M. Vlaar,

Merci pour votre réponse et pour ces précieuses informations.

En effet, notre projet s’inscrit dans le cadre d’une cohorte nationale multicentrique. D’après les guides pratiques de la CNIL relatifs à l’appariement avec les données du SNDS, nous avons compris qu’un tiers centralisateur des NIR est généralement requis dans ce contexte.

Pour la question 2: Effectivement, notre interrogation porte principalement sur l’organisation pratique de cet appariement. À ce stade du projet, nous ne savons pas encore quel support d’exploitation sera retenu pour le traitement des données appariées, ce qui représente pour nous une difficulté à anticiper les étapes opérationnelles à venir.

Auriez-vous des recommandations concernant le choix du support d’exploitation dans le cadre d’une cohorte multicentrique, ou des éléments à prendre en compte dès la phase de préparation du projet ?

Je vous remercie par avance pour votre aide.
Bien cordialement,

Bonjour,

Merci pour ces précisions.

Dans le cas d’une cohorte multicentrique, il faut en effet faire appel à un tiers de centralisation des NIRs (désolé je n’avais pas compris qu’on était dans ce cas à la lecture du premier message). L’outil “Mon interface d’appariement” mis en place par le HDH peut jouer ce rôle de tiers. Le recours à cette solution n’assujetti pas le support d’exploitation des données derrière.

Concernant le support d’exploitation recommandé, cela va plutôt dépendre des technologies que vous souhaitez mobiliser pour votre étude :

  • Si vous souhaitez utiliser le langage SAS => portail CNAM
  • Si vous souhaitez utiliser le langage R => plateforme HDH ou portail CNAM selon votre convenance
  • Si vous souhaitez utiliser le langage Python => plateforme HDH

A noter que le recours aux portail CNAM et la plateforme HDH sont tous les deux gratuits. Si vous envisagez de passer par la plateforme HDH, je vous invite à prendre contact avec nous via ce formulaire pour que nous puissions vous accompagner de manière plus rapprochée.

Bien cordialement,

Tim Vlaar - Health Data Hub