Recrutement Data Manager - Health Data Hub

Pour postuler : Data Manager - Health Data Hub - CDI à Paris

Missions
● Opérer la plateforme technologique du HDH, tant pour la réception de bases au catalogue que pour la réalisation des extractions et appariements à destination des projets ayant accès à la plateforme. Cela inclut une forte composante opérationnelle, et notamment :

  • réalisation des extractions et des appariements entre différentes sources de données
  • implémentation, mise en production et exécution de programmes de contrôle de la qualité, de l’intégrité et de la sensibilité des données réceptionnées
  • appui, suivi et documentation des projets accédants ou contribuant au catalogue de bases

● Contribuer aux divers chantiers internes de l’équipe, entre autres :

  • implémentation d’un catalogue de métadonnées, à destination des producteurs et consommateurs des données du catalogue
  • implémentation d’un ETL de conversion des bases vers un format international (OMOP)
  • implémentation et travail de fond sur des problématiques de désidentification, d’anonymisation et de génération de données synthétiques
  • définition de l’offre de service en termes d’outils à déployer sur la plateforme technologique

● Supporter et appuyer les autres équipes sur des problématiques transverses : cadrage technique des projets accédant à plateforme, participation et restitution des travaux du HDH lors de meetups, soutien à l’organisation de data challenges, etc.

Profil recherché
● Maîtrise d’un langage adapté au traitement de données tel que R ou Python
● Bonne connaissance opérationnelle en SQL ou librairie de traitement de données (pandas, dask, dplyr, … )
● Expérience avec des outils de travail collaboratif comme GitHub ou GitLab
● Capacités rédactionnelles
● Capacité à travailler en équipe pluridisciplinaire
● Bon relationnel - apte à gérer une relation avec des partenaires du HDH (startup, institution publique,…)
● Bonne capacité d’autonomie et force de proposition - apte à évoluer dans un environnement en forte évolution et croissance
● Une expérience dans un framework de traitement distribué (e.g. Spark) est un plus
● Une expérience en recherche médicale est un plus