Extraction et stockage de données SNDS

Bonjour,

Si je comprends bien, lorsque l’étude est acceptée, l’extraction des données démarre. Les données extraites pour chaque etude doivent être stockées dans HDH et nous aurons un espace de travail dédié sur le serveur HDH pour faire la gestion et les analyses de données, est-ce correct?
Quand les données peuvent-elles quitter le serveur (des tableaux intermédiaires ou finales)?
Quel est le frais d’extraction de données, et de stoker a l’espace de travail dans HDH?
Existe-t-il une autre option pour stocker les données en dehors la France?
Quelle langue de programmation est disponible à HDH? Pouvons-nous utiliser notre licence SAS / R / Python?

Merci beaucoup pour votre réponse!

Cordialement,
Mai

1 J'aime

Bonjour,

Les étapes de l’accès aux données sont les suivantes :

  1. Le Responsable de Traitement dépose une demande d’autorisation auprès du Health Data Hub, qui valide la complétude du dossier et le transmets au Comité Éthique et Scientifique pour les Recherches, les Études et les Évaluations dans le domaine de la santé (CESREES)
  2. Le CESREES émet un avis sur la méthodologie scientifique du projet, et le recours à des données à caractère personnel
  3. Le dossier est soumis à la Commission Nationale de l’Informatique et des Libertés (CNIL) pour autorisation
  4. A l’issue de l’autorisation CNIL et après signature d’une convention, les données SNDS nécessaires à l’étude pourront être traitées dans un espace projet dédié

Concernant le lieu où seront traitées les données, différentes options s’offrent à vous : la plateforme technologique du Health Data Hub (HDH) ou de la Cnam. Les données peuvent également être traitées sur un autre système d’information, sous réserve que celui-ci soit conforme au référentiel de sécurité du SNDS. Cependant l’hébergement des données du SNDS doit être réalisé sur le territoire européen, avec 2 exceptions :
□ Dans des pays n’appartenant pas à la communauté européenne mais reconnus par la Commission européenne comme « offrant un niveau de protection des données suffisant »
□ Dans un autre pays, sous réserve d’un accord spécifique de la CNIL.

Concernant les frais d’extraction et d’hébergement des données, à ce jour l’utilisation des 2 plateformes (HDH / Cnam) est gratuite. A terme, un modèle économique devrait être mis en place.

Concernant les outils proposés :
□ sur la plateforme technologique du Health Data Hub, les outils seront Python, R, Spark, Java.
□ Sur la plateforme technologique de la CNAM, les outils sont SAS (R en prévision) ainsi que Word, Excel et Powerpoint.

Les données pouvant être exportées seront nécessairement des données à partir desquelles il est impossible de déduire une information personnelle sur un individu (bénéficiaire ou professionnel de santé).

Quelques bonnes pratiques :
1. ne pas restituer de petits effectifs,
2. une information de santé sur un individu ne doit pas pouvoir être déduite à partir d’autres attributs, en particulier les données médicales (ALD, CIM10, …)
3. ne pas sortir les variables dites identifiants potentiels (le croisement de ces variables présentent un risque de ré-identification)
4. ne pas sortir d’identifiants de personnes bénéficiaires ou professionnels de santé. Pour ces derniers, l’export n’est pas autorisé même avec un identifiant Professionnel de Santé crypté.

Un kit de démarrage est à votre disposition sur le site du Health Data Hub : https://www.health-data-hub.fr/starter-kit
Un site de documentation sur le SNDS est également accessible à cette adresse : https://documentation-snds.health-data-hub.fr/

Cordialement,

Anne Cuerq (HDH)

1 J'aime

Merci Anne pour les réponses très rapides et claires! Ils sont vraiment appréciés!
Cordialement,
Mai