Nouvelle ressource en open source dans la BOAS : EDS-PDF : Extraction d'informations textuelles à partir de documents PDF

Bonjour à toutes et tous,

Nous avons le plaisir d’annoncer l’ouverture du code source d’EDS-PDF : Extraction d’informations textuelles à partir de documents PDF, désormais référencée dans la Bibliothèque Ouverte d’Algorithmes en Santé (BOAS).

:wrench: Présentation rapide :

  • :pushpin: Nom : EDS-PDF : Extraction d’informations textuelles à partir de documents PDF
  • :office: Producteur : équipe Data Science de l’Entrepôt de Données de Santé (EDS) de l’AP-HP
  • :dart: Objectif : extraction d’informations textuelles à partir de documents PDF en fournissant des outils pour la visualisation et le traitement des PDF, ainsi que de multiples composants pour construire des modèles complexes
  • :package: Langage de programmation : Python

:link: Liens utiles :

Nous serions ravis de connaître vos suggestions d’amélioration ou retours d’usage.

Merci à l’équipe Data Science de l’EDS de l’AP-HP pour leur engagement en faveur de l’open source en santé !