COVID-19 en Puerto Rico, análisis 2020-06-17

Advertencia: Favor notar que esta página usa las fechas que aparecen a la cabeza de los boletines del Departamento de Salud, pero estos suelen publicarse la mañana del próximo día, y muchas bases de datos y fuentes periodísticas reportan los mismos datos a base de la fecha de publicación.

Tendencia de casos nuevos por fecha de evento (promedios 7 días)

¿Qué es esto?

La tendencia de los casos nuevos y las muertes, vista por medio de:

Las líneas sólidas representan los promedios de los 7 días que desembocan en esa fecha. Las entrecortadas representan los valores que se obtienen solo con datos de 7 días antes de la fecha de este informe.

ADVERTENCIA: Caídas súbitas al final de cada línea lo más probable no son reales, si no que más bien son artefactos de los rezagos—i.e., no han se han incorporado datos para esas fechas. Las líneas entrecortadas de hecho tienden a ilustrar esto.

Cambio entre boletín actual y anterior

¿Qué es esto?

Una gráfica que muestra, para los dos boletines más recientes, los resultados de tomar los números de sus gráficas como esta:

...y restarle sus contrapartes del boletín anterior:

Esto nos da un desglose aproximado, para el nuevo boletín, de a qué fecha se le atribuyeron los casos nuevos que reporta este.

Hay que notar que frecuentemente se ven fechas que salen números negativos. La información que brinda el Departamento de Salud de Puerto Rico no deja claro qué motiva esto en cada caso; algunas posibilidades podrían ser:

La existencia de números negativos también complica la interpretación de este modo: las fechas que dan positivos no sabemos si hubo resta de casos. Una fecha que diga que un boletín la subió por siete casos bien pudiera ser que se registraron 8 casos nuevos y se restó uno.

Cambios entre boletines recientes

¿Qué es esto?

El mismo análisis que la gráfica anterior, pero para los 14 boletines más recientes, cosa que require hacer los númeritos bien chiquititos.

Rezago de datos de cada boletín

¿Qué es esto?

Un estimado, para los boletines más recientes, de cuánto tiempo atrás en promedio se tomaron las muestras que añade y las muertes que reporta.

Este estimado se elabora a partir de los datos arriba de los cambios entre boletines consecutivos. Por el asunto de los números negativos en esos datos, no se puede esperar que estos rezagos estimados sean los valores exactos que calcularíamos si tuvieramos mejor datos.

Revisión 3 de julio del 2020

Para el cálculo del rezago de muertes, se adoptron dos cambios:

  1. El mismo cambio de procedimento descrito abajo para el 5 de junio respecto a los casos confirmados y probables, que consiste en ignorar las restas;
  2. Excluir del cálculo de rezago de muertes todas las fechas hasta el 18 de abril (incluído), por adolecer estas de repetidos errores por parte de Salud.

Revisión 5 de junio del 2020

El método de cálculo de esta gráfica se revisó el 5 de junio y se aplicó el cambio retroactivamente a fechas anteriores. Antes de esa revisión, las fechas con números negativos se incorporaban en los totales, cosa que tendía a rebajar el estimado. Esto se hacía por entenderse que:

  1. Muchas de las restas correspondían no a casos nuevos sino a revisiones de fecha de casos conocidos;
  2. Las fechas en que aparecen sumas o ceros probablemente son resultado también en muchos casos de una combinación de sumas y restas, así que excluir las fechas que esos totales dan negativo en realidad no excluye todas las restas.

Se abandonó este procedimiento porque hubo boletines que claramente violaron el primer supuesto de manera tan crasa que daban estimado de rezago negativo. Después de la revisión sólo las sumas se toman en cuenta para calcular los rezagos de pruebas. El rezago de muertes sin embargo aun se calcula mediante el criterio original.

Tendencia de rezago de datos

¿Qué es esto?

Un estimado de rezagos similar al anterior, pero en vez de evaluar los casos de cada boletín aparte, se agrupan en ventanas rodantes de siete días. O sea, la cifra que se reporta para cada fecha de boletín abarca no solo los casos nuevos reportados en ese boletín, sino también los seis días anteriores.

El ancho de ventana se fijó en siete días para eliminar los ciclos semanales que son evidentes en los datos de fuente, como se aprecia fácil en esta gráfica del boletín:

Las fechas como el 18, 19, 25 y 26 de abril, que reportan bien pocos casos, es que son fines de semana.

Vale añadir que de los ocho puntos que muestran estas líneas, solo el primero y el último son estadísticamente independientes. Por ejemplo la cifra más reciente y la anterior son calculadas a partir de ventanas de siete días que coinciden en seis de estos.

Revisiones 3 de julio y 5 de junio del 2020

Esta gráfica se revisó retroactivamente de las misma manera descritas arriba para la gráfica de rezagos diarios.

Pruebas per cápita (promedio 7 días)

¿Qué es esto?

Cuántas pruebas diarias (promedio de 7 días) se realizaron por fecha de toma de muestra, por millar de población. La línea sólida es con datos hasta la fecha de este boletín; la línea entrecortada es con datos solo hasta siete días antes de dicha fecha. Se presenta una gráfica de Our World in Data para comparación.

Advertencia

Como esta gráfica es por fecha de toma de muestra, las cifras que da no son finales porque pueden registrarse luego más resultados para las mismas fechas. Y especialmente, caídas súbitas al final de la curva muy probable no son reales. La línea entrecortada, que excluye los datos recibidos los 7 días más recientes, tiende a ilustrar este efecto.

Comparación internacional

Esta gráfica de Our World in Data puede ayudar a poner estas cifras en contexto internacional:

Positividad (promedio 7 días)

¿Qué es esto?

La tasa de positividad por fecha de toma de muestra, según datos del API de Bioportal del Departamento de Salud de Puerto Rico. Las líneas sólidas son con datos recibidos hasta la fecha de boletín de este dashboard; las líneas entrecortadas excluyen los datos recibidos durante las 7 fechas de boletín más recientes.

Se calcula aquí la tasa de positividad de dos maneras distintas:

  1. Número de pruebas positivas dividido entre número total de pruebas;
  2. Número de casos únicos confirmados (tomado de los informes regulares de Salud) dividido entre número total de pruebas.

La segunda de estas se entiende que es una división un tanto de "chinas con botellas" (i.e., cantidades que en realidad no deberían compararse), pero se ha optado por incluirla porque muchas colecciones de datos en EEUU (e.g., COVID Tracking Project) e internacionales (e.g., Our World In Data) así lo calculan para muchos locales. Lo cual quiere decir que a la hora de comparar el dato de Puerto Rico con el de otro país hay que tener cuidado cuál de las dos se habla.

Otra advertencia es que el cálculo dado aquí para Puerto Rico hace uso de datos por fecha de toma de muestra, y no de reporte de resultados como hacen muchas colecciones de datos o informes. Esto da números que reflejan la realidad más cercanamente, pero acarrea dos desventajas:

  1. Las cifras dadas para cualquier fecha no son finales, porque mañana pueden recibirse nuevos resultados de muestras tomadas en esas mismas fechas, y que llevarán a que se revisen los valores aquí calculados;
  2. Un caso especial muy importante de esto es que caídas o subidas repentinas al final de la curva no son fiables, porque para las fechas más recientes se espera que se incorpore una mayor proporción de nuevos resultados.

Las líneas entrecortadas, cuyo cálculo excluye los datos recibidos en los 7 días más recientes, tienden a ilustrar estos efectos.

Comparación internacional

Esta gráfica de Our World in Data puede ayudar a poner estas cifras en contexto internacional:

Pruebas vs. casos (acumulado)

¿Qué es esto?

Otra forma de visualizar la positividad: trazando el número de pruebas acumuladas en el eje vertical y los casos confirmados acumulados en el horizontal. Las líneas entrecortadas brindan una referencia de cómo se traduce a positividad acumulada (que vale advertir, no es lo mismo que positividad promedio de 7 días).

Curvas que se mueven hacia arriba son buenas; curvas que se mueven a la derecha son malas. Giros súbitos justo al final de la curva no son fiables porque probablemente representan fechas para las cuales solo hay datos parciales.

Ventaja de esta gráfica: te muestra las pruebas y casos per cápita acumulados actuales de manera bien compacta, y la evolución de la positividad acumulada. Desventaja: no tiene eje de tiempo como tal, aunque como son cifras acumuladas puntos más arriba o a la derecha son generalmente más tardíos.

Comparaciones internacionales

Estas gráficas de Our World in Data puede ayudar a poner estas cifras en contexto internacional:

Pruebas añadidas a Bioportal

¿Qué es esto?

Cuántos resultados nuevos de fecha se reportaron en el API de Bioportal (el sistema en línea de recibo de resultados de pruebas del Departamento de Salud de Puerto Rico), por combinación de fecha de toma de muestra y fecha de creación del récord en el API (campo createdAt).

El API de Bioportal de Salud presenta tres campos de fecha/tiempo para cada récord de prueba individual:

collectedDate
Fecha de colección de muestra de prueba.
reportedDate
Se entiende por el nombre que es fecha que el laboratorio reportó la prueba a Salud.
createdAt
Tiempo que el sistema computarizado graba como la fecha, hora y minuto que creó el récord de base de dato para esa prueba.

Examen de los datos ha dado al momento a entender que el campo reportedDate no es nada fiable, así que aquí se ha optado por usar el createdAt en vez. Este campo está en horario UTC en los datos de fuente, pero aquí se ajusta a horario de Puerto Rico (UTC-4).

Historial de pruebas en Bioportal

¿Qué es esto?

El mismo análisis que la gráfica anterior, pero en forma de historial para muchas fechas recientes. Se puede apuntar a cada celda de la gráfica para que aparezca un indicador con los valores de esta en tamaño legible.

Rezago de pruebas diario

¿Qué es esto?

Tardanza promedio entre fecha de toma de muestra (collectedDate) y fecha de récord (createdAt, ajustado a horario de Puerto Rico) en el API de Bioportal, agrupado por la segunda.

Tendencia de rezago de pruebas

¿Qué es esto?

El mismo análisis de rezago de datos de pruebas que la sección anterior, pero con promedios de 7 días.

Tendencias por día de semana

¿Qué es esto?

Casos de los 21 boletines anteriores al actual, reportados con no más de 14 días de rezago respecto a cada boletín, agrupados por la combinación de:

La intensidad del color de cada cuadro refleja cuántos casos se registraron para esa combinación. Los histogramas marginales muestran los datos agrupados por un sólo eje.

ADVERTENCIAS:

Casos por edad (per cápita, 7 días)

¿Qué es esto?

Casos confirmados reportados nuevos (por fecha de boletín), agrupados por edad, promedio de 7 días, ajustado al estimado poblacional en cada grupo de edades. Se usan datos del programa de estimados poblacionales del 2019 del Censo de los Estados Unidos para ajustar las cifras a la población de cada edad.

Historial de hospitalizaciones

¿Qué es esto?

Cuántos pacientes han estado hospitalizados por COVID-19, por fecha y región si disponible. Regiones se indican en colores, si no hay datos el total se indica en gris.

Advertencia

Estos datos regionales no sabemos si se publicarán regularmente, así que velar que esta gráfica pudiera volverse atrasada.

Mapas municipales de casos recientes

¿Qué es esto?

Casos nuevos confirmados reportados por municipio, visto de cuatro formas:

  1. Número de casos nuevos registrados en el boletín más reciente;
  2. Número de casos nuevos registrados en los siete boletines más recientes;
  3. Crecida del número de casos nuevos registrados en el boletín más reciente, respecto a los casos registrados en los siete anteriores a este;
  4. Crecida del número de casos nuevos registrados en los siete boletines más recientes, respecto a los casos registrados en los siete anteriores a estos.

La primera ayuda identificar dónde son los casos reportados en el nuevo boletín; las demás a identificar municipios que pudieran haber experimentado brotes recientemente.

Los tonos rojáceos indican valores positivos, y los grisáceos o negros valores negativos, porque sí, a veces boletines posteriores le restan casos confirmados a municipios. Cuando el denominador de las divisiones sería cero (porque no hay casos recientes en el municipio) se sustituye por uno.

Nótese que esto es por fecha de boletín, no de muestra, y que por lo tanto esta gráfica nos dice cuándo se detectaron los casos, no cuándo sucedieron.

Historial de casos confirmados por municipio (fecha de boletín)

Historial de números de casos nuevos para cada municipio para cada una de las 35 fechas más recientes, interpretándose estas como fecha de boletín. Nótese que esto último quiere decir que esta gráfica no nos dice cuándo sucedieron los casos, sino cuándo se añadieron al conteo.

Esto es una gráfica de horizonte, que hay que leer un poco al respecto para intepretar. Aquí se ha optado por:

Descuadre de encabezado de boletín

¿Qué es esto?

Cotejos de cifras reportadas en la primera página de cada boletín. Se compara:

Descuadres constatados en los datos de fuente

2020-04-23
La cifra de 849 casos únicos acumulados por prueba molecular hasta el 22 de abril se obtuvo de esta gráfica publicada por el Instituto de Estadísticas de Puerto Rico. De este boletín del 23 de abril se obtuvieron las cifras de 3 casos únicos nuevos y 871 casos únicos acumulados por pruebas moleculares. En conjunto dan un descuadre de 19 casos confirmados. Nótese sin embargo que estos datos antedatan el boletín regular más temprano disponible en las páginas del Departamento de Salud, fechado 25 de abril y con datos hasta el 24.

Cualquier otra fecha que no dé cero en esta gráfica hay que cotejar que se hayan copiado correctamente los datos.

Descuadre de boletín y gráficas

¿Qué es esto?

Comparación entre los totales de casos acumulados reportados en la primera página de cada boletín y las sumas de los datos por fecha de muestra en las gráficas de este mismo boletín. Esto es un cotejo de calidad de datos.

Descuadres constatados en los datos de fuente

2020-07-02, 2020-07-04, 2020-07-06 y 2020-07-12
En estas gráficas de muertes se omitió la barra una muerte del 17 de marzo, registrada en muchísimas otras gráficas anteriores. Sin embargo las mismas gráficas las cuentan hacia el total de muertes acumuladas; es decir, las gráficas mismas exhibe el descuadre.

Cualquier otra fecha que no dé cero en esta gráfica hay que cotejar que se hayan copiado correctamente los datos.

Terminología

Fecha de boletín

Las fechas que aparecen a la cabecera de los boletines que emite a diario el Departamento de Salud de Puerto Rico sobre los casos conocidos de COVID-19 en Puerto Rico. Estos boletines recopilan datos hasta la fecha anterior a cuando se publican; por ejemplo, el boletín que dice 2 de mayo se publicó el 3 de mayo.

ADVERTENCIA: Muchas bases de datos y reportajes usan la fecha que se publicó el boletín en vez de la fecha que dice este, y por eso atribuyen los mismos números aquí al próximo día.

Fecha de evento

La fecha en que en realidad sucedió un evento, según el boletín. Para las cifras de muertes, esta es la fecha en que sucedió la muerte. Para casos confirmados y probables, esto es la fecha en que se tomó muestra que se sometió a prueba. Los boletines no aclaran qué fecha se usa para pacientes a los cuales se les administró más de una prueba.

ADVERTENCIA: Muchas bases de datos y reportajes usan la fecha de boletín o anuncio en vez de la de evento, y por eso no coinciden con los resultados que da este análisis. Dar el análisis por fecha de evento en vez de boletín o anuncio es lo que motiva este proyecto.

Caso confirmado

Término que el Departamento de Salud de Puerto Rico usa para denominar a un paciente único que ha dado positivo a una prueba molecular (PCR) de SARS-CoV-2.

Caso probable

Término que el Departamento de Salud de Puerto Rico usa para denominar a un paciente único que ha dado positivo a una prueba serológica ("rápida").

Datos fuente para 2020-06-17

Estas son las imágenes de los boletines del Departamento de Salud que se usaron para elaborar este análisis.

Casos únicos confirmados 2020-06-17 (vs. 2020-06-16)

Casos únicos probables 2020-06-17 (vs. 2020-06-16)

Muertes 2020-06-17 (vs. 2020-06-16)

Historial de hospitalizaciones por región, 18 de abril hasta el 9 de julio del 2020

Estos los compartió el Departamento de Salud con periodistas el 9 de julio: