La influencia del día de la semana en el número de casos COVID. Un modelo basado en series temporales aplicado a Aragón-España.

Juan Arana Pérez

versión borrador previa 0.2
No válida 18/06/2021

Cómo varian los diagnosticos de COVID19 cada día de la semana.

Intuimos que ciertos días de la semana aumentan sobre la media los casos de COVID mientras que otros días, disminuyen. Por ejemplo, los martes suelen aumentar los casos respecto al lunes y los sábados suelen disminuir respecto al viernes.

De tal forma, el que haya habido un día 10 casos más que el día anterior no significa que los contagios vayan a peor o que vayan a mejor si hay 10 casos menos que el día anterior.

En este artículo expondremos un modelo muy simple para precisar cuál es la variación media, al alza o a la baja, de cada día de la semana de los “nuevos casos en Aragón” que se notifican cada día en la página transparencia.aragon.es [1]. Este modelo está basado en el concepto estadístico de “series temporales”. Para acabar, aplicaremos este modelo a otras series de datos.

  1. Número de casos COVID en Aragón y series temporales

Las autoridades sanitarias de Aragón ofrecen un número de “nuevos casos” registrados cada dia, que son publicados al día siguiente en https://transparencia.aragon.es/COVID19 [A]. De estos datos se puede obtener un histórico (CONSULTA LOS DATOS DE DÍAS ANTERIORES).

Por ejemplo, los “nuevos casos registrados” el lunes (por ejemplo, el 22/03/2021) se publican el martes (23/03/2021). Intuimos que una parte de las subidas y bajadas de estos nuevos casos tienen una periodicidad semanal y dependen de cada día de la semana (lunes, martes, etc.).

En este artículo hacemos siempre referencia al día en que se registran los casos, no al día en que se publican.

Siguiendo a Marín Diazaraque [2], cada caso de la serie de los “nuevos casos registrados” que depende de un día del calendario, se puede descomponer en tres componentes básicas:

1.1. Tendencia: Se puede definir como un cambio a largo plazo que se produce en relación al nivel medio, o el cambio a largo plazo de la media. La tendencia se identifica con un movimiento suave de la serie a largo plazo.

1.2. Efecto Estacional (Efecto del día de la semana): Muchas series temporales presentan cierta periodicidad o dicho de otro modo, variación de cierto periodo (anual, mensual …). En los nuevos casos de COVID proponemos considerar la periodicidad semanal.

1.3. Componente Aleatoria: Una vez identificados los componentes anteriores y después de haberlos eliminado, persisten unos valores que son aleatorios.

De modo que los casos de un día se pueden distribuir en tres sumandos:

Xt = Tt + Et + It

Donde Xt son los nuevos casos del día t, donde Tt es la tendencia, Et es el efecto del día de la semana, e It es la parte aleatoria e impredecible (al menos, no podemos predecirlo con la información con que contamos).

Los casos que se producen el día t se publican el día siguiente, t+1. Por ejemplo, los datos publicados el miércoles son los del martes previo. Hemos considerado el día en que se producen los casos, no el día en que se publican.

Hemos construido un modelo, sencillo, con estos objetivos:

a) Sea relativamente estable en el tiempo. En palabras de [1] “actualizar las hipótesis a lo largo del tiempo con nuevos datos y, como consecuencia, aprender de la evolución de la pandemia con el paso del tiempo”.

b) Que reduzca todo lo posible las variaciones del sumando aleatorio It con relación a las variaciones del número de casos Xt. En términos estadísticos se dice el la parte de varianza del sumando aleatorio sea la menor posible en relación con la varianza del número de casos.

c) Que sea muy fácil de aplicarlo a otras colecciones de datos dependientes de los dias. Que lo pueda hacer quien tenga una habilidad media en hojas de cálculo aunque no tenga conocimientos estadísticos.

  1. Cálculo de los componentes del modelo.

Hemos construido el modelo de evolución del número de casos (Casos) como una serie temporal, de esta manera

2.a. Tendencia: Hemos tomado como Tendencia la medía móvil de 7 días del número de casos (6 días anteriores más el actual). Estamos familiarizados con un concepto similar a éste, la IA7 (incidencia acumulada de los últimos 7 días por número de habitantes).

Tt = (CSt + CSt-1 + CSt-2 + CSt-3 + CSt-4 + CSt-5 + CSt-6)/7

CSt es el número de casos del dia t. t-1 el dia anterior etc.

Este valor está reflejado en la columna D del modelo de datos.

2.b. Efecto Estacional (Efecto del día de la semana):

Hacemos un cálculo un poco más complejo en varias etapas:

b.1 EDB (Efecto día en bruto): el número de casos de un día entre la tendencia

EDBt = CSt / Tt

Ejemplos:

si tomamos en martes 20 de abril de 2021,

CS=345
MV=257,571
EDB=345/257,571=1,339

El martes 20 de abril de 2021 ha habido un 33,9% de casos MÁS sobre la tendencia.

Si tomamos en lunes 19 de abril de 2021,

CS=194
MV=257,143
EDB=194/257,143=0,756

El lunes 19 de abril de 2021 ha habido un 24,4% (100-75,6) de casos MENOS sobre la tendencia.

Este valor está reflejado en la columna E del modelo de datos.

b.2 Para calcular los excesos o defecto sobre la tendencia de un día (por ejemplo un martes o un lunes) calculamos la media aritmética de los “Efecto dia en bruto” de los dias homónimos de las cuatro semanas anteriores (los cuatro martes o cuatro lunes precedentes). Es el “Efecto_dia_promediado”, EDP (por ejemplo, del 20 de abril)

EDPt = (EDBt-7 + EDBt-14 + EDBt-21 + EDBt-28)/4

Por ejemplo, el EDP de martes 20/04/2021 (martes)

Efecto_dia_Promediado = 1,49976

1,15889 = EDB del 23/03/2021
1,51007 = EDB del 30/03/2021
1,99092 = EDB del 06/04/2021
1,33916 = EDB del 13/04/2021

De este modo calculamos los incrementos (o decrementos) que pudiera haber, en determinado día de la semana, en las 4 últimas semanas.

Este valor está reflejado en la columna F del modelo de datos.

b.3 Finalmente, esperaríamos que los Efectos_Día_Promediado (EDP) de los últimos 7 días se equilibraran de modo que su suma fuera igual a 7. Los aumentos de algunos días se corresponden con las disminuciones de otros.

Esto no es así. Utilizamos el factor corrector de medias (CM)

CMt = 7/(EDPt + EDPt-1 + EDPt-2 + EDPt-3 + EDPt-4 + EDPt-5 + EDPt-6)

por ejemplo, el valor del Corrector de Medias del 28/04/2021 será

Corrector_medias_dia_28042021=
7/(Suma (Efectos_dia_media desde en 22/04/2021 al 28/04/2021))=0,92523

Este valor está reflejado en la columna G del modelo de datos.

De tal forma que EDMC (Efectos_dia_media_corregida)

Efectos_dia_media_corregida = Efectos_dia_media * Corrector_medias_dia

No se consigue del todo que la suma de medias de los últimos 7 días sea 7 pero nos aproximamos mucho más que sin aplicar este corrector.

Este valor está reflejado en la columna H del modelo de datos.

b.4 Tras las anteriores etapas, el efecto día semana Et

Et = EDMCt * Tt – Tt = (EDMCt – 1) * Tt

Este valor no está reflejado explícitamente en el modelo de datos. EDMCt * Tt está reflejado en la columna J del modelo de datos.

2.c. Componente Aleatoria: Una vez identificados los componentes anteriores y después de haberlos eliminado, persisten unos valores que son aleatorios.

It = Xt – Tt – Et

Este valor está reflejado en la columna I del modelo de datos.

  1. Representación en diagrama de barras

3.a En el diagrama de barras de las figuras “a” los componentes están representados por estos colores

Xt = Tt + Et + It

Xt = Número de casos
Tt = Tendencia (Media Móvil de 7 dias)
Et = Efecto dia de la semana (Efectos_dia_media_corregida – 1) * Tt
It = Parte aleatoria

3.b El diagrama de barras de la figura “b” representa los porcentajes del “Efecto dia de la semana” entre la “Tendencia”

Efecto día de la semana en % de la tendencia

Efecto dia de la semana * 100 / Tendencia

3.1 Figura 1. Casos de COVID en Aragón en número y en porcentaje sobre la Tendencia (semana 24/05/2021).

Fig. 1a Casos COVID Aragón 24/05/2021
Fig. 1b Casos COVID Aragón. Porcentaje del efecto día semana sobre la tendencia 24/05/2021

3.2 Figura 2. Casos de COVID en Aragón en número y en porcentaje sobre la Tendencia (semana 26/04/2021). Los dos viernes que se contabilizan en esas medias fueron festivos: Viernes Santo 09/04/2021 y San Jorge, festividad de Aragón, 23/04/2021. Seguramente ese es el motivo del efecto negativo del viernes.

Fig. 2a Casos COVID Aragón 26/04/2021
Fig. 2b Casos COVID Aragón. Porcentaje del efecto día sobre la tendencia 26/04/2021

3.3 Figura 3. Casos de COVID en Aragón en número y en porcentaje sobre la Tendencia (semana 15/03/2021). Corresponde a la fase valle tras la ola de enero-febrero de 2021 y antes de las turbulencias de semana santa 2021.

Fig. 3a Casos COVID Aragón 15/03/2021
Fig. 3b Casos COVID Aragón. Porcentaje del efecto día sobre la tendencia 15/03/2021

A continuación mostramos la representación del Efecto día de la semana en otras series de datos. Solamente deseamos ilustrar la aplicación pero sin sacar conclusiones, para las que no disponemos de datos suficientes.

3.4 Figura 4. Casos de COVID en Guipúzcoa en número y en porcentaje sobre la Tendencia (semana 24/05/2021). Se puede apreciar un perfil mas suavizado que en la misma semana en Aragón (en la Fig.1).

Fig. 4a Casos COVID Guipuzcoa 24/05/2021
Fig. 4b Casos COVID Guipuzcoa 24/05/2021. Porcentaje del efecto día sobre la tendencia

3.5 Figura 5. Número de test PCR + Antígenos notificados en Aragón y en porcentaje sobre la Tendencia (semana 24/05/2021). (PCR cargadas y Test de Antígenos realizados según la información diaria de https://transparencia.aragon.es/COVID19.

Fig. 5a Número de test PCR + Antígenos en Aragón 24/05/2021
Fig. 5b Número de test PCR + Antígenos en Aragón 24/05/2021. Porcentaje del efecto día sobre la tendencia

3.6 Figura 6. Positividad en Aragón y en porcentaje sobre la Tendencia (semana 24/05/2021).

Fig. 6a Positividad en Aragón 24/05/2021
Fig. 6b Positividad en Aragón 24/05/2021. Porcentaje del efecto día sobre la tendencia

3.7 Figura 7. Porcentaje de Antígenos sobre Antígenos+PCR en Aragón (semana 24/05/2021).

Fig. 7a Porcentaje de Antígenos sobre Antígenos + PCR en Aragón 24/05/2021.
Fig. 7b Porcentaje de Antígenos sobre Antígenos+PCR en Aragón 24/05/2021 Efecto día sobre la tendencia

3.8 Figura 8. Porcentaje de Asintomáticos en Aragón (semana 24/05/2021).

Fig. 8a Porcentaje de Antígenos sobre Antígenos + PCR en Aragón 24/05/2021
Fig. 8b Porcentaje de Antígenos sobre Antígenos+PCR en Aragón 24/05/2021 Efecto día sobre la tendencia

3.9 Figura 9. Contagio origen Desconocido en Aragón (semana 03/05/2021).

El número de casos de contagio Desconocido va revisándose en dias posteriores a aquel en que se observó. De modo que si un día hay 60 contagios de origen Desconocido, tres semanas después pudiera haber 40. Hemos identificado revisiones de este indicador hasta seis semanas después. Por ese motivo hemos tomado una semana bastante anterior.

El resto de los origenes de contagio son laboral, social, escolar, domicilio, centro sociosanitario, centro sanitario y otros.

Esta clasificación es la regulada por el documento ESTRATEGIA DE DETECCIÓN PRECOZ, VIGILANCIA Y CONTROL DE COVID-19 https://www.mscbs.gob.es/profesionales/saludPublica/ccayes/alertasActual/nCov/documentos/COVID19_Estrategia_vigilancia_y_control_e_indicadores.pdf pag. 22 (fecha del documento 26/02/2021)

Fig. 9a Contagio origen Desconocido en Aragón 03/05/2021
Fig. 9b Contagio origen Desconocido en Aragón 03/05/2021. Porcentaje del efecto día sobre la tendencia

Referencias:

[1] León, Manuel de; Gómez Corral Antonio. Series temporales. 1 junio 2020. Artículo en Blog. http://www.madrimasd.org/blogs/matematicas/2020/06/01/148025

[2] Marín Diazaraque, Juan Miguel. Series Temporales. Apuntes para estudios de la Universidad Carlos III. Madrid. 15 pags< http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/EDescrip/tema7.pdf

[3] Peña Sánchez de Rivera, Daniel. Análisis de series temporales. Madrid 2018. Alianza. 2.ª ed., 2ª reimp.

[4] Universidad Complutense. Madrid. Modelización con datos de series temporales. 2013. Apuntes. 41 pags. https://www.ucm.es/data/cont/docs/518-2013-10-25-Tema_6_EctrGrado.pdf

Fuentes de datos:

[A] Portal de transparencia del Gobierno de Aragón. COVID-19. Situación actual. https://transparencia.aragon.es/COVID19

[B] Mapa de casos de COVID-19 en Aragón. https://datacovid.salud.aragon.es/covid/

[C] Gobierno Vasco. Transparencia sobre el nuevo coronavirus (COVID-19)
Departamento de Salud. https://www.euskadi.eus/boletin-de-datos-sobre-la-evolucion-del-coronavirus/web01-a2korona/es/ > Información sobre la evolución del coronavirus en Euskadi: dd/mm/aaaa (por ejemplo: https://www.euskadi.eus/contenidos/informacion/boletin_coronavirus/es_def/adjuntos/2021/27_abril_2021_Boletin.pdf)

[D] Escovid19data: Capturando colaborativamente datos de COVID-19 por provincias en España. https://github.com/montera34/escovid19data

Publicado por Juan Arana

Informática, matemáticas, datos, administración electrónica

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Crea tu sitio web con WordPress.com
Empieza ahora
A %d blogueros les gusta esto: