Quelles sont les différentes méthodes d’appariement possible avec les données du SNDS ?

snds
appariement
(Contributions d'utilisateurs externes) #1

Discussion autour des modalités d’appariement des données externes avec les données du SNDS

(Olivier de Fresnoye) #2

Il existe différentes techniques d’appariement. Elles peuvent être combinées de manière à améliorer le taux d’appariement.

Quand le producteur de données possède déjà le NIR dans ses bases, l’appariement déterministe, en utilisant le NIR, est plus adapté. Si ce n’est pas le cas, il y a deux possibilités ainsi qu’une troisième, celle de combiner les deux précédentes.

Si le producteur à plusieurs informations sur les consommations de soins des personnes (dates d’hospitalisation, diagnostics, actes effectués, …) un appariement probabiliste peut être réalisé. Le taux de réussite dépendra du type d’information et de la qualité de ces informations. Les informations sur un séjour hospitalier quand elles viennent d’un entrepôt hospitalier sont très fiables. Elles seront plus ou moins univoques en fonction des séjours : appariement plus difficile sur des hospitalisations de jour ou dans les maternités.

Si le producteur a les informations pour « reconstruire » le NIR (nom de naissance, prénom, date de naissance, sexe, lieu de naissance) un appariement dit « déterministe » peut être réalisé. Mais en fait, il s’agit d’un premier appariement probabiliste avec le SNGI (système national de gestion des identités) de la CNAV pour retrouver le NIR et ensuite, un vrai appariement déterministe. La qualité de ce processus va dépendre de la qualité des informations permettant de retrouver ou non le NIR. Cette méthode est sensible au nom de naissance (et non au nom marital), au lieu de naissance (attention aux personnes nées à l’étranger ou dans les anciennes colonies).

Il faut connaitre la population d’étude pour choisir la meilleure méthode d’appariement.