Bonjour,
On se rend compte que la variable RSA_NUM en fonction des tables n’a pas le même format, n’a pas toujours la même longueur alors qu’a priori c’est censé être une variable caractère de format 10 et parfois ca comment par une lettre.
Lorsqu’on merge par exemple MCO_B et MCO_D, on a des RSA qui nous pourraient nous sembler identique mais auxquels il manque des « 0000 » en debut de nombre.
Qu’en est-il : est-ce vraiment 2 RSA_NUM différents et est-ce les même RSA_NUM mais en fonction de la table et de l’année la présentation des RSA_NUM est différente;
Quid des RSA_NUM qui commencent par 1 lettre?
Pour une année donnée, l’ensemble des couples (ETA_NUM, RSA_NUM) de votre table T_MCOxxD devraient se trouver dans T_MCOxxB, cela peut être un moyen de vérifier ; il ne faut pas essayer de joindre des tables d’années différentes sur (ETA_NUM, RSA_NUM) car une même combinaison peut être utilisé pour des séjours différents d’une année à l’autre (on ne peut que faire des jointures entre des tables PMSI d’une même année).
Dans votre cas, il s’agirait vraisemblablement d’un problème de lecture / import de votre fichier T_MCOxxD : la colonne RSA_NUM est interprété comme un nombre au lieu d’une chaîne alphanumérique (et les 0000 en préfixe sont donc tronqués). Si vous utilisez le langage R, cela est un problème fréquent - il faudra paramétrer votre fonction d’import pour que la colonne soit bien interprété en alphanumérique. Par exemple, si vous utiliser la fonction read.csv, il faudrait compléter le paramètre colClasses.