Enlaces para accesibilidad

Estudio concluye que las hospitalizaciones por COVID-19 podrían anticiparse usando datos de búsqueda de Google


ARCHIVO - La enfermera Rachel Chamberlin sale de una sala de aislamiento donde Fred Rutherford se recupera de COVID-19 en el Centro Médico Dartmouth-Hitchcock, en Lebanon, EEUU, el 3 de enero de 2022.
ARCHIVO - La enfermera Rachel Chamberlin sale de una sala de aislamiento donde Fred Rutherford se recupera de COVID-19 en el Centro Médico Dartmouth-Hitchcock, en Lebanon, EEUU, el 3 de enero de 2022.

Utilizando los datos de búsqueda proporcionados por Google Trends, científicos pudieron construir un modelo computacional para pronosticar futuras hospitalizaciones por covid.

Las futuras olas de COVID-19 podrían predecirse utilizando los datos de búsqueda en Internet, según un estudio publicado en la revista Scientific Reports.

En el estudio, los investigadores observaron la cantidad de búsquedas de Google relacionadas con el covid realizadas en todo el país y usaron esa información, junto con métricas convencionales de rastreo del nuevo coronavirus -como casos confirmados- para predecir las tasas de ingreso hospitalario con semanas de anticipación.

Utilizando los datos de búsqueda proporcionados por Google Trends, los científicos pudieron construir un modelo computacional para pronosticar las hospitalizaciones por COVID-19. Google Trends es un portal en línea que proporciona datos sobre los volúmenes de búsqueda de Google en tiempo real.

"Si hay un grupo de personas que buscan 'sitios de prueba de covid cerca de mí'... seguirán sintiendo los efectos de eso aguas abajo a nivel hospitalario en términos de admisiones", dijo el científico de datos Philip Turk, de la Universidad de Mississippi.

Medical Center, que no participó en el estudio, citó que “eso les ofrece a los responsables y gestores de la atención sanitaria una advertencia anticipada para prepararse para los aumentos repentinos, para abastecerse de equipo de protección personal y personal y anticipar un aumento repentino que se avecina”.

Para predicciones con una o dos semanas de anticipación, el nuevo modelo de computadora se compara bien con los existentes. Supera el pronóstico de "conjunto nacional" de los Centros para el Control y la Prevención de Enfermedades (CDC, por sus siglas en inglés), que combina modelos elaborados por muchos equipos de investigación, aunque hay algunos modelos únicos que lo superan.

Perspectiva diferente

Según el coautor del estudio, Shihao Yang, científico de datos del Instituto de Tecnología de Georgia, el valor del nuevo modelo es su perspectiva única: una fuente de datos que es independiente de las métricas convencionales.

Yang está trabajando para agregar el nuevo modelo al centro de pronóstico COVID-19 de los CDC .

Observar las tendencias sobre la frecuencia con la que las personas buscan en Google ciertos términos, como "tos" o "vacuna COVID-19", podría ayudar a llenar los vacíos en lugares con pruebas escasas o sistemas de atención médica débiles.

Yang también cree que su modelo será especialmente útil cuando surjan nuevas variantes. Hizo un buen trabajo al predecir picos en las hospitalizaciones que se pensaba que estaban asociadas con nuevas variantes como ómicron, sin los retrasos de tiempo típicos de muchos otros modelos.

"Es como un terremoto", aseguró Yang. "La búsqueda de Google me dirá unas horas antes que se avecina un tsunami... Unas pocas horas son suficientes para prepararme, asignar recursos e informar a mi personal".

El modelo considera los volúmenes de búsqueda de Google para 256 términos específicos de COVID-19, como "pérdida del gusto", "vacuna contra la COVID-19" y "tos", junto con estadísticas básicas como el recuento de casos y las tasas de vacunación.

También tiene componentes temporales y espaciales: términos que representan el retraso entre los datos de hoy y las hospitalizaciones futuras que predice, y cuán estrechamente conectados están los diferentes estados.


Cada semana, el modelo se vuelve a entrenar utilizando los datos de los últimos 56 días. Esto evita que el modelo se vea abrumado por datos más antiguos que no reflejan cómo actúa el virus actualmente.

Turk desarrolló previamente un modelo diferente para predecir las hospitalizaciones por COVID-19 a nivel local para el área metropolitana de Charlotte, Carolina del Norte.

El modelo desarrollado por Yang y sus colegas utiliza un método diferente y es el primero en hacer predicciones a nivel estatal y nacional utilizando datos de búsqueda.

Turk se sorprendió por "cuán armonioso" fue el resultado con su trabajo anterior.

“Quiero decir, básicamente están mirando dos modelos diferentes, dos caminos diferentes”, afirmó. "Es un gran ejemplo de cómo la ciencia se une".

El uso de datos de búsqueda de Google para hacer pronósticos de salud pública tiene sus desventajas. Por un lado, Google podría dejar de permitir que los investigadores usen los datos en cualquier momento, algo que Yang admite que preocupa a sus colegas.

"Ruido" en las búsquedas


Además, los datos de búsqueda son confusos, con muchos comportamientos aleatorios que los investigadores llaman "ruido" y la calidad varía según la región, por lo que la información debe suavizarse durante el análisis mediante métodos estadísticos.

Las peculiaridades lingüísticas locales pueden presentar problemas porque las personas de diferentes regiones a veces usan palabras diferentes para describir lo mismo, al igual que la cobertura de los medios cuando aumenta o calma los temores de una pandemia, dijo Yang.

Las protecciones de privacidad también presentan complicaciones: los datos de los usuarios se agregan y se les inyecta ruido adicional antes de publicarlos, una protección que hace que sea imposible extraer la información de los usuarios individuales del conjunto de datos públicos.

Ejecutar el modelo solo con datos de búsqueda no funcionó tan bien como el modelo con datos de búsqueda y métricas convencionales. Sacar datos de búsqueda y usar solo métricas COVID-19 convencionales para hacer predicciones también perjudicó el rendimiento del nuevo modelo.

Esto indica que, para este modelo, la magia está en la combinación: tanto las métricas convencionales de COVID-19 como los datos de Google Trends contienen información que es útil para predecir las hospitalizaciones.

"El hecho de que los datos sean valiosos y que los datos sean difíciles de procesar son dos cuestiones independientes. Hay información allí", aseguró Yang. "Puedo hablar con mi mamá sobre esto. Es muy simple, simplemente intuitivo... Si somos capaces de capturar esa intuición, creo que eso es lo que hace que las cosas funcionen".

¡Conéctate con la Voz de América! Suscríbete a nuestro canal de YouTube y activa las notificaciones, o bien, síguenos en las redes sociales: Facebook, Twitter e Instagram.

XS
SM
MD
LG