Donc cela signifie qu’en santé, seules des données réelles peuvent être utilisées?

Ce dont l’IA a besoin, ce sont des données qui font office de « vérité de référence » (ground truth), c’est-à-dire des exemples fiables et représentatifs du phénomène à modéliser.
Par exemple, pour une IA chargée d’identifier des chats sur des images, on lui fournit des images annotées : certaines avec des chats, d’autres sans.
Dans le cas d’un modèle comme ChatGPT, ce sont des textes (articles, dialogues, etc.) qui servent de référence.