Monitorer le web est utile dans de nombreux domaines, comme celui de la surveillance de l’état de santé des populations et la détection de nouvelles menaces sanitaires, c’est le domaine de l’épidémiologie.
Bien sûr l’épidémiologie existe depuis bien avant l’émergence du web, mais avec l’évolution de celui-ci, vers le 2.0 et le user generated content notamment, elle connaît de nouvelles perspectives intéressantes à décoder.
Du terrain aux données en ligne
A la base les outils épidémiologiques sont ceux de « la vrai vie », c’est à dire l’expérience du terrain, comme par exemple le Réseau Sentinelles en France, renommé pour sa surveillance de la grippe saisonnière, qui réunit plus de 1300 médecins généralistes, qui centralisent (via le web) de manière hebdomadaire les informations recueillies au cours de leurs consultations sur différentes pathologies infectieuses ou non.
D’autres outils scannent les sources d’information en ligne (fils d’actualité et sites web) et analysent les signaux relatifs à la santé des populations qui sont émis par ces sources. Ce sont notammant des outils développés spécifiquement par les institutions comme le Global Public Health Intelligence Network (GPIHN) de l’Agence de Santé Publique du Canada et de l’OMS ou le Medical Information System (MedISys) de la Commission européenne.
A signaler également, l’interface des sources d’information, en ligne ou issues du terrain, avec la localisation de ces sources qui permet de visualiser les tendances de manière géographique, c’est par exemple le concept de HealthMap, en illustration de ce billet.
Ces outils sont basés sur des applications spécifiques et demandent un travail quotidien de maintien et de vérification de la qualité des sources qui sont pas essence très variables, d’autant que parmi les sources suivies nombreuses sont dites « informelles » (comprendre « non médicales »).
Plus récemment des acteurs du web, a priori éloignés du monde de la santé (mais qui le sont de moins en moins…), se sont penchés sur les données échangées sur le web pour les mettre en perspective dans un objectif de recherche épidémiologique. Le cas le plus connu est celui des Google Flu Trends, développées par Google.org, la branche philanthropique du géant de la recherche, qui se base sur les termes de recherche des internautes et qui a montré la relation qui existe entre l’utilisation du moteur de recherche et l’évolution de la grippe saisonnière sur le terrain. Ces travaux ont abouti à une publication dans la revue Nature.
Vers l’épidémiologie « open source »
Là où Google exploite nos ses données tirées des recherches qu’il enregistre quotidiennement, des chercheurs se sont récemment penchés sur des données librement accessibles, échangées par les utilisateurs des réseaux sociaux, et en particulier de Twitter. Ces chercheurs ont ainsi pu s’affranchir du côté propriétaire des applications et des données sources, en accédant à des données informelles ici aussi car non officielles et encore moins validées médicalement.
Dans une étude présentée récemment au congrès européen de l’European Society of Clinical Microbiology and Infectious Diseases, P. Kostkova, E. de Quincey, G. Jawaheer, chercheurs au Centre de recherche en e-santé de la City University à Londres, ont montré l’intérêt de Twitter comme outil d’alerte précoce et de détection d’un événement sanitaire émergent, ici la pandémie de grippe A/H1N1.
Au cours de cette étude, conduite entre mai et août 2009 sur Twitter, ils ont extrait et collecté 1 millions de tweets se rapportant à la grippe A/H1N1, parmi lesquels un certain nombre étaient des annonces à ses followers qu’un utilisateur était atteint de cette fameuse grippe :
We searched and collected over 1 million tweets in the period from May until August 2009 and carry on collecting them on a minute bases to understand public concerns, keywords used and the profile of users who discuss these topics on the web.
Results: We found over 1 million tweets reporting flu related illnesses and symptoms via Twitter in this period. Most popular words in tweets were these (frequency in brackets): flu (138, 260), Swine (99, 179), Have (13, 534), Cases (13, 300), H1N1 (9, 134), Has (8, 010) etc. The actual sentence “I have swine flu” appeared 2, 888 times and “I have flu” 1,530 times. Further evaluation of the collected tweets, semantic relationship of keywords, geolocation of posters is underway and will be presented at the conference.
Source : The potential of Twitter for early warning and outbreak detection (Abstract).
Je vois dans cette information la confirmation de la théorie des signaux faibles (©), chère à mon ami Alain, qui dit qu’un faible volume d’échanges sur twitter correspond à des conversations intenses dans la vrai vie et qui témoigne de l’intérêt de twitter comme outil de veille des conversations on-line et off-line dans le monde, notamment dans la santé.
Des travaux à suivre en tout cas…
———————
[Billet inspiré de cet article repéré via @StephProd et @jeanlucr]