SPL/PHANIE

 Un big tour des big data et de l'intelligence artificielle en santé

SOMMAIRE


Big data : quelle application dans la santé ?

Les professionnels de santé face au tsunami numérique

Le potentiel d’utilisation des données du Système national des données de santé

Le rôle du Big data dans le prévention


Big data : quelle application dans la santé ?

L’Institut Droit et Santé de l’Université Paris Descartes a organisé en mars dernier le colloque « Big data en santé, du discours aux applications pratiques ». Pendant une journée, des experts ont expliqué l’implication des Big data et de l’intelligence artificielle (IA) dans la santé.

« Le Big data est apparu avec les grands groupes informatiques de la Silicon Valley, les GAFA (Google, Apple, Facebook et Amazon), qui ont été confrontés à une masse d’informations partagées et aux problèmes liés aux méthodes de stockage », a expliqué Marie-Christine Jaulent, ingénieure informaticienne et directrice de recherche à l’Institut national de la santé et de la recherche médicale (Inserm). Il n’y avait pas seulement le problème des volumes à stocker, mais aussi celui de l’hétérogénéité des données. Le concept du Big data s’explique en effet par quatre spécificités majeures regroupées sous la notion des quatre « v » : le volume, la variété, la vélocité et la véracité. Le volume est l’une des principales caractéristiques du Big data puisque le terme est lié à l’immense masse de données générées quotidiennement. La variété dépend de la diversification des données en raison des usages variés d’Internet et du numérique. La vélocité est liée au fait que les données sont collectées très rapidement. Enfin la véracité fait référence à l’exactitude des données, qui est le principal défi du Big data.

 

" Le Big data s'explique par la notion des 4 V :

volume, variété, vélocité, véracité "

L’importance de la recherche

Les données collectées ne sont pas toutes d’excellente qualité. « Avec le Programme de médicalisation des systèmes d'information (PMSI), les données sont collectées à des fins médico-économiques mais nous ne disposons pas de la description fine de la pathologie du patient », a rapporté Marie-Christine Jaulent. De fait, la donnée offre une qualité liée au contexte de sa collecte mais elle peut difficilement être exploitée pour autre chose.
« Dans le domaine de la santé, il est important de savoir de quelles données nous parlons, a-t-elle ajouté. Nous voulons qu’elles soient au service du soin mais aussi qu’elles permettent la prévention, l’organisation du parcours de soins. Ce sont des champs nouveaux. » Au-delà, il y a la recherche « qui a toute son importance car nous produisons des données, mais nous n’avons pas de référence, nous ne savons pas ce qu’elles disent. La recherche permet de nous apprendre leur sens. »  

Ouverture des données

Pour David Gruson, membre du comité de direction de la chaire santé de Sciences Po Paris et pilote de l’atelier IA et robotisation de l'Association pour le développement de l'informatique juridique (Adij), « l’absence d’ouverture des données de santé est plus coûteuse éthiquement qu’une réglementation trop ferme ». Néanmoins, un enjeu éthique demeure : toutes les données de santé n’ont pas la même valeur. À titre d’exemple, « la loi bioéthique a défini un cadre juridique particulier pour les données génétiques. L’enjeu réel est la protection contre le risque d’une captation de nos données génétiques. »

« La loi de modernisation de notre système de santé de janvier 2016 a permis une ouverture de l’accès aux données aux acteurs privés, a fait savoir Mylène Girard, cheffe de la mission Accès aux données de santé à la Direction de la recherche, des études, de l'évaluation et des statistiques (DREES). Auparavant, ils pouvaient utiliser les données du PMSI, qui rassemble les bases des séjours hospitaliers mais pas celles du Système national d'information inter-régimes de l'Assurance maladie (Sniiram) qui contient des données patients. « Aujourd’hui, il y a beaucoup de données en open data, a indiqué Dominique Polton, présidente de l’Institut national des données de santé (INDS). On considère qu’elles sont anonymes et qu’il n’y a pas de risque de réidentification des personnes. Elles sont accessibles à tous, même au grand public. » Pour les données comportant un risque de réidentification, un accès permanent existe pour les entreprises mentionnées dans le décret du 26 décembre 2016 relatif au traitement de données à caractère personnel dénommé système national des données de santé. Pour les autres, il y a une procédure classique à respecter avec une évaluation de la demande par le Comité d’expertise pour les recherches, les études et les évaluations dans le domaine de la Santé (Cerees) et la Cnil en bout de course.

Les principes du Big data

D’ailleurs, cinq grands principes figurent dans la protection des données appliquées au Big data. Tout d’abord, celui de la finalité et de la proportionnalité. « Lorsque des données sont collectées, il faut toujours se demander pourquoi elles le sont, a expliqué Hélène Guimiot-Bréaud, chef du service de la santé à la Commission nationale informatique et libertés (Cnil). C’est le premier point que va observer la Cnil. » Vient ensuite la pertinence des données traitées afin de savoir si elles vont vraiment servir. La conservation des données doit par ailleurs être limitée dans le temps. « Même si la durée peut-être longue, il faut prévoir la fin du traitement », a-t-elle signalé. Le respect du droit des personnes doit être garanti en les informant de la collecte de leurs données, du traitement qui va en être fait, du responsable, et du destinataire des données. Il s’agit du principe de loyauté. Enfin, « les personnes doivent pouvoir s’opposer à la prise de leurs données », a-t-elle précisé.

 

"5 grands principes dans la protection des données :
la finalité, la proportionnalité, la pertinence, la conservation, la loyauté"

 Laure Martin


Les professionnels de santé face au tsunami numérique

La télémédecine a mis dix ans à entrer dans le droit commun. Mais en matière de traitement des données, avec le Big data et l’Intelligence artificielle,tout va s’accélérer. Le Conseil national de l’Ordre des médecins (Cnom) a donc souhaité se positionner et émettre des observations sur le sujet dans le cadre d’un livre blanc.  

« Le regard des professionnels de santé oscille entre technophilie et technophobie, a rapporté le Dr Jacques Lucas, vice-président du Cnom et délégué général au numérique. Ils ne savent pas où ils se situent. » Néanmoins, d’après lui, le déterminisme technologique ne conduit pas à la passivité apparente de la société. Pour le Cnom, des appréhensions sociales et professionnelles qui n’auraient pas pu obtenir de réponses aux inquiétudes peuvent conduire à des rejets violents. « Nous appelons donc à l’organisation de débats publics sur le sujet », a fait savoir le Dr Lucas.

Abdiquer sa liberté

Dans le cadre de l’exploitation des données de santé, le Cnom rappelle l’importance de la préservation du secret au traitement des données massives. « L’exploitation de ces données ne doit pas conduire à l’identification des personnes », a souligné le Dr Lucas. Néanmoins, les citoyens se mettent dans des situations paradoxales puisqu’ils déciment leurs données personnelles par l’usage des objets connectés et des applications. « Les données sont alors collectées par des bases privées, et servent à d’autres fins que celles pour lesquelles le citoyen a donné son accord, a pointé du doigt le Dr Lucas en donnant l’exemple d’un podomètre connecté. Il est possible que les citoyens n’en aient pas conscience ou alors que la situation les laisse indifférents en raison de ce qu’ils en tirent. » Et de poursuivre : « Nous sociétés sont tellement fascinées par les technologies qu’elles en arrivent à abdiquer leur propre liberté. Les individus cliquent que ″j’accepte″ dans les conditions d’usage, avant même de les avoir lues. » Le Cnom appelle donc à un devoir majeur d’information publique sur ce sujet.

 

"Les citoyens se mettent dans des situations paradoxales
puisqu’ils déciment leurs données personnelles par l’usage des objets connectés et des applications"


Enfin, l’Ordre rappelle que les transformations numériques liées au big data ne sauront se réaliser sans les investissements nécessaires dans tous les territoires car la fracture numérique persiste. « Les déserts médicaux recouvrent des déserts de droits en raison de l’absence d’accès à Internet et au haut débit, a-t-il soutenu. L’ensemble du territoire doit être équipé. »

L’usage de la télémédecine

La couverture  numérique la plus large possible est indispensable pour que dans la pratique médicale, l'exploitation des données et l’usage des nouvelles technologies, qui se sont traduits par le déploiement de la télémédecine, puisse avoir lieu sur l’ensemble du territoire. « Le Big data est un concept que les médecins ont découvert depuis plusieurs années et mis à disposition de la télémédecine », a rapporté le Dr Pierre Simon, ancien président de la Société française de télémédecine. La télémédecine a pris naissance en 1920  avec l'usage de la radio pour fournir de l'assistance médicale aux personnes en mer Aujourd’hui, c’est la télésurveillance des maladies chroniques à domicile « qui va bouleverser notre vision actuelle de la santé notamment en France où nous étions très hospitalo-centré », a-t-il souligné.

 

"Aujourd’hui, l’intérêt d’organiser de la télésurveillance est
d’être synchrone dans l’exploitation des données"

La télésurveillance est définie dans le cadre du décret de 2010. Il s’agit de l’interprétation à distance, par un professionnel médical, des données nécessaires au suivi médical d’un patient. Pendant longtemps, cette télésurveillance était a-synchrone. « Aujourd’hui, l’intérêt d’organiser de la télésurveillance est d’être synchrone dans l’exploitation des données », a soutenu le Dr Simon avant d’ajouter : « Le médecin sera toujours le dernier à interpréter ces données car tout système peut générer des erreurs. » Aujourd’hui, les attentes des praticiens se situent en télécardiologie car ils ont besoin d’obtenir le traitement des data en temps réel afin d’effectuer des diagnostics prédictifs des complications et prévenir les hospitalisations. C’est le cas aussi en télé-pneumologie et en télé-diabétologie.

LM


Le potentiel d’utilisation des données du Système national des données de santé

L’ensemble des données collectées figurant au sein du Système national des données de santé (SNDS) peuvent être interprétées et analysées de différentes façons. Tour d’horizon.

Les données de santé peuvent être exploitées d’un point de vue médico-économique afin de mesurer le poids d’une maladie en analysant la consommation de soins. « On parle de burden of disease », a rapporté Alexandre Vainchtock de chez HEVA, société spécialisée dans le traitement des données de santé. L’idée est par exemple de chercher, dans les bases de données, l’ensemble des patients qui sont atteints d’un nouveau cancer. « Il y a eu 200 000 nouveaux patients hospitalisés en 2010 pour un cancer du sein ou de la prostate », a-t-il fait savoir. Nous pouvons ensuite les suivre dans les bases administratives afin de connaître le coût que cela génère et le nombre d’occurrence d’hospitalisation.

Mesurer les inégalités d’accès

Autre exploitation des données : l’épidémiologie et la pharmaco-vigilance. « Les données vont par exemple nous permettre de savoir si l’accès aux molécules innovantes est égale sur l’ensemble du territoire », a expliqué Alexandre Vainchtock. Pour le savoir, il faut prendre dans les bases de données, les informations sur les patients incidents et observer le taux d’utilisation des molécules. « L’indice de défaveur sociale et l’indice de ruralité prouvent l’inégalité d’accès aux traitements suivant des régions et les caractéristiques socio-démographiques des patients », a-t-il indiqué. Autre mesure : les risques ischémiques et hémorragiques liés aux gammes d’endoprothèses coronaires en France entre stents actifs ou non actifs. L’Agence nationale pour la sécurité du médicament (ANSM) a travaillé sur le sujet avec l’Assurance maladie, et aucune différence de caractéristiques socio-démographiques entre les patients en fonction des différents types de stents n’a été identifiée.

Une autre mesure possible : celle du parcours et de l’offre de soins avec l’analyse des séquences de traitement sur deux ans. Enfin, il est possible de mesurer les innovations méthodologiques avec le data mining et le machine learning qui consiste à apprendre de manière automatisée et supervisée les corrélations des données afin d’être capable de produire une réponse.

-------------------------------------------------------------------------------------------------

Qu’est ce que le Système national des données de santé (SNDS) ?

Unique en Europe, SNDS permet d’analyser et d’améliorer la santé de la population. Géré par la Caisse nationale de l’assurance maladie des travailleurs salariés (CNAMTS), le SNDS permet de chaîner :
-    les données de l’Assurance Maladie (base SNIIRAM) ;
-    les données des hôpitaux (base PMSI) ;
-    les causes médicales de décès (base du CépiDC de l’Inserm) ;
-    les données relatives au handicap (en provenance des MDPH - données de la CNSA) ;
-    un échantillon de données en provenance des organismes d’Assurance Maladie complémentaire.

-------------------------------------------------------------------------------------------------

LM


Le rôle du Big data dans le prévention

Si aux 18e et 19e siècles, la prévention était prépondérante avec la vaccination et l’hygiène, elle a laissé place à la médecine curative avec l’arrivée des médicaments. Pourtant, l’utilisation des données du Big data permettrait une évolution.

« Aujourd’hui, la place de la prévention est limitée, et ne représente que 2,2 % de nos dépenses de santé », a expliqué Judith Mehl, présidente d’«Ensemble concerné », qui organise des débats publics sur notre système de santé. L’utilisation des données de santé, dont les sources sont très larges (données médico-administratives, organismes complémentaires, données personnelles), permettraient d’agir directement dans le domaine de la prévention.

Anticiper les problèmes sanitaires

Pour que ces données puissent contribuer à une évolution de la santé publique et donc de la prévention, il faudrait en faire une utilisation plus large : génomique, médico-administrative, environnementale. « Cela permettrait de prendre en compte l’individu dans son ensemble tout en le comparant, de mener des études épidémiologiques plus précises et donc d’anticiper les risques sanitaires et les épidémies », a rapporté Judith Mehl. Et d’ajouter : « Nous pourrions identifier les facteurs de risques de survenue des maladies en fonction des caractéristiques intrinsèques des individus et de leur environnement ou encore développer des programmes de prévention ciblée ou de pharmaco-vigilance. »

Une crainte demeure concernant la protection de la vie privée des personnes vis-à-vis des complémentaires ou des assureurs. « Il faut aussi tenir compte de l’ambivalence de la population vis-à-vis de la prévention », a reconnu Judith Mehl. Malgré tout, il lui semble incontournable de répondre à des obligations liées aux enjeux de chronicisation des maladies et du vieillissement de la population. « D’où la nécessité d’une régulation positive des données de santé, soutient-elle. C’est le cas avec le projet Ethik-IA, une initiative citoyenne et académique de réflexion sur le sujet. »

Une régulation positive

Le projet Ethik-IA défend des clefs pour rendre la régulation positive :
-    l’information et le consentement du patient,
-    la graduation de la régulation en fonction du niveau de sensibilité des données de santé,
-    l’accompagnement de l’adaptation des métiers,
-    l’intervention d’une autorité de régulation indépendante.
L’objectif, à terme, vise l'amélioration de la prise en charge du patient, la facilitation de la recherche scientifique, le développement des mécanismes de vigilance sanitaire, le meilleur ciblage de la prévention et la maîtrise des dépenses, donc l'amélioration globale du système de santé.

par Laure Martin