Dossier autorisation CNIL: protocole scientifique pour une société privée (pas d'accès SNDS)

Bonjour,

Nous sommes une société privée de Deep Learning dans le domaine de l’imagerie medicale.

Je suis en cours de rédaction de la partie protocole scientifique de notre dossier CNIL.

Nous travaillons sur les données d’imagerie médicale (DICOM et compte-rendus).

Le pipeline de notre traitement de données:
Données de nos partenaires (PACS) => serveur local => anonymisation complète des données localement => récupération sur notre cloud => inference pour modèle de prédiction.

Ces données sont constitués:

  • d’un compte rendu anonymisé (sans nom patient, sans date de naissance, sans nom praticien, sans nom de la structure…).
  • d’un fichier DICOM dont les champs sensibles sont supprimés et les informations sensibles (nom patient etc…) sur les images le sont aussi.

Il est impossible de remonter jusqu’au patient (ou équipe soignante) avec nos données. En effet, même les numéros de liaison RIS-PACS sont hachés.
L’ensemble de ces données sortent du centre d’imagerie dans cet état d’anonymisation complet.

Nous ne souhaitons pas avoir accès au SNDS. Nous souhaitons récuperer les données d’imagerie médicales anonymisés de nos partenaires exclusivement.

Nous ne réalisons pas d’étude scientifique au sens propre. Nos recherches portent sur l’élaboration ou l’amélioraiton de nos algorithmes de prédiction de pathologie.

Questions:
Dans le protocole scientifique, le chapitre méthodologie ne correspond pas à nos recherches.

3.1 Design: Nous ne procédons pas à des études statistiques. Expliquer les principes de nos inférences?
3.2 Description et justification de la population d’étude: Nous n’avons pas de population.
3.3 Taille de la population: pas de population.
3.4 Sources de données: Pas de données du SNDS. Détailler le type de données?
3.5 Variables: Pas de variable type statistiques. Nous utilisons les images médicales.
3.6 Préparation de données: détaille de notre pipeline d’exportation ?
3.7: Méthodes, traitements et analyses des données: explication simple du principe de Deep Learning appliqué (les modèles sont protégés car c’est la valeur de notre société) ?
3.8 Limites de l’étude: Précision des modèles actuels ? (faux pos, faux neg etc )
3.9 Calendrier prévisionnel et faisabilité du projet: Les inférences sont opérationelles. C’est une démarche d’amlioration constante.

En vous remerciant par avance de vos retours,

Bonne journée,