Las búsquedas en internet pueden ayudar a predecir brotes de covid
Un nuevo algoritmo es capaz de predecir el aumento de casos de covid-19 en un territorio con hasta seis semanas de antelación
Las búsquedas que hacemos en Google y nuestras redes sociales dan pistas a las grandes empresas sobre qué cosas vendernos. ¿Podrían servir también como sistema de alerta temprana sobre cuando se van a disparar los niveles de covid-19?
Un equipo de científicos liderado por el experto en inteligencia artificial (IA) Mauricio Santillana, de las universidades de Harvard y Northeastern (EE UU), ha demostrado en un estudio que los rastros digitales de los usuarios de internet pueden utilizarse para alertar de aumentos bruscos de infecciones de covid-19, a escala de condado, entre una y seis semanas antes de que se produzca un brote importante.
En el trabajo, publicado en Science Advances, los autores afirman que los datos digitales podrían ayudar a cubrir las lagunas de información que dejan los métodos de vigilancia actuales.
Según comenta Santillana a SINC, «los modelos de predicción de brotes de covid previos al nuestro y utilizados por el Centro de Control y Prevención de Enfermedades (CDC), en EE UU, se habían enfocado exclusivamente en predecir el número de casos que se registrarían en las próximas semanas. En función de estas predicciones numéricas, los sistemas interpretaban los resultados para determinar si habría un brote en un futuro cercano».
«Entrenamos al modelo para que identifique patrones de comportamiento humano —en búsquedas de Google, tuits, webs médicas, etc—. Estos datos nos indican con antelación incrementos exponenciales en el número de casos de covid»
Mauricio Santillana, experto en IA y líder del estudio
El investigador señala que ahora en su estudio se plantea una tarea simplificada: «Entrenamos a nuestro modelo directamente para que identifique patrones de comportamiento humano —registrados en búsquedas de Google, tuits, búsquedas técnicas de profesionales médicos, etc.—. Estos datos nos van a indicar con antelación el momento en el cual podemos esperar que se observe un incremento dramático (exponencial) en el número de casos de covid-19 en las semanas futuras, en una comunidad determinada».
Santillana dice que «cuando navegamos por internet en nuestro ordenador o teléfono dejamos huellas y, nos guste o no, la realidad es que la mayoría de las empresas utilizan esta información para aumentar sus beneficios».
«Aspiramos a utilizar la misma información de la que se sirven Google, Amazon o cualquiera de estas grandes compañías para enviarnos anuncios. Nosotros, en cambio, la usaríamos para alertar a los gestores de salud pública en las primeras fases de un brote», afirma.
Flujos digitales
Los flujos digitales relacionados con la covid-19 utilizados incluyen, por ejemplo, búsquedas en internet sobre fiebre, tratamientos y comentarios de usuarios de Twitter relacionados con estar demasiado enfermos para trabajar.
El equipo utilizó un sistema de aprendizaje automático con información histórica de brotes en 97 condados de EE UU desde 2020 a 2022 y los combinaron para crear un único indicador predictivo
Los autores emplearon además métodos de aprendizaje automático con información histórica de brotes en 97 condados de EE UU desde enero de 2020 al mismo mes de 2022 y los combinaron para crear un único indicador predictivo.
«El objetivo no es necesariamente cuantificar cuántas infecciones hay, sino cuándo se producirán aumentos bruscos de las mismas», aclara Santillana, que ha participado en la investigación con científicos del Hospital Infantil de Boston, la Facultad de Medicina de Harvard, la Universidad Estatal de Oklahoma y otras instituciones.
Capacidad de predicción
El equipo encontró que la capacidad de predicción a escala estatal y de condado era más o menos similar: el sistema de alerta temprana se activaba con una antelación de una a seis semanas a nivel de condado y de cuatro a seis semanas para los estados.
Los autores señalan que los datos procedentes de internet ayudarán a completar la información clave de la que carecen los los CDC, que «no han sido capaces de prever con fiabilidad los rápidos cambios en las tendencias de casos y hospitalizaciones notificados».
Según Santillana, «cuando se comunicaban al público las previsiones de la covid-19 de los CDC, con mucha frecuencia no coincidían con el momento en que se iniciaban los brotes».
Precisamente, el estudio forma parte de una nueva iniciativa puesta en marcha por el presidente Biden llamada Centro de Previsión y Análisis de Brotes dentro de los CDC.
El experto comenta a SINC que su modelo de inteligencia artificial basado en las búsquedas en internet «ya ha sido implementado y ha permitido identificar los brotes originados por la variante ómicron en tiempo real en EE UU».
«Nuestra aspiración es este modelo sea utilizado de manera rutinaria para detectar nuevos brotes por diversas agencias de salud pública en todo el mundo», concluye.
Referencia bibliográfica:
M. Santillana et al. Using digital traces to build a real-time county-level early warning systems to anticipate COVID-19 outbreaks in the United States. Science Advances (enero, 2023).