Questions concernant Open Medic

Bonjour,

Dans la cadre de mon projet de master 2, je souhaite utiliser les bases de données Open Medic qui appartiennent aux bases en Open Data issues du SNDS.

Mon projet portant sur l’utilisation du médicament générique, je souhaite exploiter les variables TOP_GEN et GEN_NUM qui me permettent d’avoir accès, respectivement, à l’appartenance ou non au répertoire des médicaments génériques et au statut (princeps, générique ou quasi-générique) et au numéro du groupe de génériques (1242 groupes d’après le référentiel).

En manipulant ces variables, il m’a semblé avoir découvert des erreurs concernant :

  • Des médicaments appartenant au répertoire des génériques qui n’étaient pas référencés comme tels dans Open Medic ;
  • Des médicaments appartenant à des groupes de génériques (comme princeps ou générique) qui n’appartenaient à aucun groupe puisque le groupe n’était pas référencé dans Open Medic.

Après avoir découvert ces erreurs par « hasard », j’ai tiré au sort 51 médicaments à partir de leur CIP13 sur les 12 253 présents dans Open Medic 2019. J’ai regardé les variables TOP_GEN et GEN_NUM puis je les ai comparées avec les informations disponibles sur la base de données publique des médicaments de l’ANSM et le répertoire des génériques.

Sur cet échantillon 41 des 51 médicaments étaient bien classés. La plupart des erreurs (9/10) concernaient la première situation avec des médicaments génériques qui n’étaient pas classés comme tels dans Open Medic. La dixième erreur concernait un médicament princeps, dont la mise sur le marché de génériques précède 2019, pour lequel aucun groupe de générique n’est renseigné alors qu’il appartient au répertoire des médicaments génériques.

Je n’ai pas trouvé d’information concernant des erreurs potentielles et leurs estimations dans Open Medic notamment en recherchant sur ce forum. Ma question est donc de savoir si certains d’entre vous aviez déjà constatés ce type d’erreur et de savoir s’il existe des documents les recensant pour pouvoir les prendre en compte.

Pour information, pour essayer d’aller au-delà de ces variables, j’ai tenté d’utiliser les bases de données publiques des médicaments téléchargeables. Cependant j’ai pu constater que le fichier CIS_GENER_bdpm.txt relatif aux groupes génériques contenait des erreurs dans l’identification des médicaments par leur CIS. Cela rend l’association avec le fichier CIS_CIP_bdpm.txt puis Open Medic biaisée. Je n’ai pas encore évalué l’intensité de ces erreurs.

Par ailleurs, j’ai remarqué certaines valeurs négatives pour les variables BOITES, REM et BSE faisant référence respectivement au nombre de boîtes délivrées, au montant remboursé et à la base de remboursement. J’ai remarqué que cela concernait notamment les médicaments plus remboursés en 2019 (alors qu’ils l’étaient encore en 2018 pour certains). D’une part, je ne comprends pourquoi je retrouve des médicaments non remboursés dans Open Medic. D’autre part, je ne sais pas comment interpréter ces valeurs négatives.

Si ces sujets ont déjà été abordés et que je crée un doublon je m’en excuse.

Bonne journée,

Hugo F.

Open medic : http://open-data-assurance-maladie.ameli.fr/medicaments/index.php

Bases de données publiques des médicaments version téléchargeable : https://base-donnees-publique.medicaments.gouv.fr/telechargement.php

Bonjour,

Les données Open Medic sont constituées par la Cnam à partir des données SNDS. Je n’ai pour ma part pas d’informations détaillées sur la méthode de constitution de ces tables, je ne peux donc que faire des suppositions sur les éléments que vous constatez.

Concernant votre question sur les médicaments génériques : La Cnam s’appuie vraisemblablement sur son référentiel des médicaments (IR_PHA_R – dont une version peut-être un peu datée peut être téléchargé ici). Il est possible que ce référentiel ne soit pas à jour ou exhaustif pour les médicaments génériques.

Concernant votre question sur les valeurs négatives : Des erreurs dans le remboursement de soins par l’Assurance Maladie peuvent avoir lieu et se traduisent par des régularisations dans la base SNDS. Ces dernières consistent en l’ajout d’une nouvelle ligne annulant la prestation en erreur avec des montants de remboursement et des nombres de boîtes délivrées négatifs (logique de compensation entre les lignes). Je pense qu’il y a peut-être des choses à creuser de ce côté-là.

Cela reste néanmoins des hypothèses. Si ce n’est déjà fait, je vous invite à poser votre question sur le site data.gouv dédiée à ces données (vous pouvez laisser un commentaire en bas de la page). Il semblerait que vous avez également la possibilité de contacter le producteur de données sur ce site.

Bien cordialement,

Tim Vlaar
Health Data Hub

Merci beaucoup pour votre retour qui m’est d’une grande aide pour la suite de mon travail.
Bien cordialement,
Hugo F

Bonjour,

Pour information, suite à votre réponse j’ai posté un message sur le site dédié. Concernant les valeurs négatives la réponse que l’on m’a faite va dans le sens de votre proposition.

Cordialement,
Hugo F

Bonjour,

Merci pour votre retour. J’espère que cela a pu vous éclairer et vous permet d’avancer dans vos travaux.

Bien cordialement,

Tim Vlaar
Health Data Hub