Advertencia de compatibilidad

Las visualizaciones de datos en esta página no son enteramente compatibles con su navegador de web. Como solución parcial, he sustituído imágenes pregeneradas en un navegador que sí es compatible, pero a costa de la experiencia óptima (e.g. mostrar más detalle cuando apunta con el ratón a los datos).

Conocidos incompatibles:

Conocidos compatibles:

La compatibilidad de otros navegadores se desconoce.

COVID-19 en Puerto Rico, análisis 2024-01-13

Pruebas, casos y muertes recientes

¿Qué es esto?

Una guía rápida de cuántas pruebas, casos, pacientes internados y muertes diarias se han dado las últimas 6 semanas mostrando tanto valores diarios crudos (barras) como promedio móvil de 7 días (línea).

Pruebas
Número de personas únicas que se tomó muestra para molecular o antígeno por cada fecha de muestra. Fuente de datos: API de Bioestadísticas del Departamento de Salud de Puerto Rico, al cual aplicamos nuestra propia depuración, limpieza y desduplicación de personas.
Casos
Por prueba molecular o de antígenos, usando la fecha de la muestra más temprana. Lo calculamos a partir de nuestro propio análisis de los datos de pruebas, y por esto suele diferir un poco del conteo oficial del Departamento de Salud.
Ocupación hospitalaria
Número de pacientes que ocupan camas en hospital por COVID-19 sospechado o confirmado. Fuente de datos: el tablero de estadísticas de COVID-19 del Departamento de Salud de Puerto Rico.
Muertes
Por fecha de deceso. Fuente de datos: el tablero de estadísticas de COVID-19 del Departamento de Salud de Puerto Rico

Advertencia de datos incompletos

Como esta gráfica usa datos por fecha de muestra o de deceso, las fechas más recientes normalmente adolecen de datos incompletos. Para ilustrar esto, trazamos líneas entrecortadas ilustrando cómo da el promedio móvil cuando excluimos los datos recibidos los últimos 7 días.

Método de conteo de pruebas

El conteo de pruebas en esta gráfica es, para cada fecha, el número de personas únicas que se le tomó una muestra de antígeno o molecular. Este número es menos que el número de "pruebas" que arroja inocentemente Bioestadísticas porque existen muchas ocasiones en que a una misma persona le toman más de una muestra el mismo día y se reportan como pruebas aparte. Y en adición a esto, si a la misma persona le hacen tanto prueba de antígeno como molecular el mismo día, lo contamos como una sola prueba.

Este método es una variante de lo que lo que recomienda el COVID Tracking Project bajo la rúbrica de "encuentros de prueba" ("test encounters"), contrario a lo que reporta Bioestadísticas que son "especímenes de prueba" ("test specimens") en la nomenclatura de COVID Tracking.

Y generalmente tiene más sentido, porque la mayor parte del tiempo lo que nos interesa es saber cuántas personas hemos evaluado si tienen COVID-19, no cuántos especímenes se tomaron.

Adjudicación de casos y fechas

Adjudicamos un caso cuando encontramos una combinación de paciente y fecha tal que a ese paciente se le tomó en esa fecha una muestra, igual sea de antígeno o molecular, que arrojó positivo, y que no exista en los 90 días anteriores otra tal prueba positiva. Este criterio lo adoptamos a partir de la definición interina de casos de COVID-19 del 5 de agosto del 2020 del Consejo de Epidemiólogos Estatales y Territoriales, que recomienda:

Una prueba positiva repetida para ARN de SARS-CoV-2 usando una prueba de detección de amplificación molecular dentro de tres meses del reporte inicial no debe ser enumerada como caso nuevo para propósitos de vigilancia.

Vale apuntar que históricamente informes diarios de Salud han publicado dos gráficas y tablas de datos aparte para casos confirmados por prueba molecular y casos probables por prueba de antígeno. Estas tablas, sin embargo, en muchas ocasiones han sufrido de un desperfecto, que es que los casos confirmados que cuentan también con una prueba de antígeno se adjudican a la fecha de la prueba molecular, a pesar de que esta suele ser más tardía. En esta gráfica usamos datos del API de Bioestadísticas para corregir esto y adjudicar esos casos a la fecha más temprana, que mejor refleja cuándo se contagió el paciente. También cuidamos en el proceso de desduplicación de contar aparte obvious casos de recontagio del mismo paciente.

Población de Puerto Rico

Para los cálculos per cápita (que aparecen cuando se apunta con el puntero a las barras o curvas) usamos la población de Puerto Rico según el censo del 2020, que arroja 3,285,874 al 1ero de abril del 2020. Esto puede arrojar discrepancias con otras páginas que usan por ejemplo el estimado poblacional del 2019 (3,193,694), o incluso con otras gráficas en esta misma página que usan estimados de población por edad del 2019 que todavía no se han actualizado para el censo del 2020.

Disponibilidad hospitalaria

¿Qué es esto?

Historial de ocupación hospitalaria de adultos y pediátricos, camas regulares y unidades de cuidado intensivo (UCI), según la página de estadísticas de COVID-19 del Departamento de Salud de Puerto Rico. Las líneas entrecortadas indican el nivel de 30% de disponibilidad, que algunos "semáforos" declaran como umbral para nivel "rojo" para las UCIs.

Advertencia

La capacidad hospitalaria no es solo número de camas o equipo, también es personal disponible para atender pacientes. En teoría el número de camas disponibles aquí refleja ese factor, según dice el Departamento de Salud de Puerto Rico en la página de donde tiramos estos datos:

El reporte de camas disponibles y ocupadas es basado en información provista por personal de los hospitales de Puerto Rico. Los datos visualizados no incluyen los hospitales de rehabilitación, correccionales, psiquiátricos, hospital de Veteranos ni los CDTs de Vieques y Culebra. La información de censo y disponibilidad de camas está basada en la cantidad de camas licenciadas por SARAFS activas y para las cuales la institución cuenta con el equipo y personal disponible para manejarlas. Estos números varían diariamente basados en los recursos disponibles y las decisiones operacionales tomadas por cada institución hospitalaria.

Por esto al leer esta gráfica hay que imaginar que una emergencia se podría sucitar no solo por un disparo de los renglones rojos (pacientes de COVID) o anaranjados (otros pacientes), sino también por un desplome en los renglones verdes (camas o UCIs disponibles). O peor, que los datos del renglón verde no reflejen bien la escasez de personal y que den una impresión engañosa de la verdadera situación.

Fuentes de datos

En esta página se usan tres fuentes de datos distintas respecto a hospitalizaciones, que arrojan números un tanto distintos:

  1. Datos de covid19datos.salud.gov.pr que capturamos diario y archivamos, pero no tenemos datos más temprano que el 26 de marzo del 2021.
  2. Datos que descargamos diario de HealthData.gov, la página de datos de COVID-19 del Departamento de Salud y Servicios Humanos del gobierno federal de los Estados Unidos ("Health and Human Services" o HHS). De esta fuente contamos con datos históricos desde agosto del 2020 pero los meses tempranos muestran aparentes errores.
  3. Datos archivados del COVID Tracking Project, que cesó operaciones el 7 de marzo del 2021. Este proyecto primero capturó datos del Departamento de Salud de Puerto Rico y luego cambió a usar los federales, y es el mejor archivo público para fechas más antiguas.

Esta gráfica usa la #1. Otras visualizaciones usan distintos, y no cuadran 100% entre sí.

Rezagos de datos recientes

¿Qué es esto?

Para las últimas seis semanas, cuán retrasados llegaron los resultados de pruebas y de casos al API de Bioestadísticas del Departamento de Salud de Puerto Rico. Los días de rezago son la diferencia entre la fecha de toma de muestra (campo sampleCollectedDate en Bíoestadísticas) y la fecha de recepción de resultado (campo orderTestCreatedAt). Los agrupamos por fecha de recepción, detalle importante porque quiere decir que esta gráfica contesta esta pregunta:

  1. ¿Cuán viejos fueron los resultados que se recibieron en tales fechas?

...pero no esta:

  1. ¿Cuánto tardaron en recibirse los resultados de las muestras tomadas en tales fechas?

Mucha gente ve estas gráficas y piensan que es la segunda, porque es la que a tantos en verdad nos gustaría saber, pero el problema es que esa no se puede contestar firme porque mañana pueden llegar resultados a destiempo para cualquier fecha pasada que cambien la respuesta.

Los niveles en esta gráfica no son los valores crudos diarios, sino promedios móviles de siete fechas consecutivas, para ilustrar las tendencias. El análisis además solo contempla resultados que se recibieron a no más de 20 días luego de la toma de muestra, por entenderse que los que tardan más reflejan procesos irregulares que no son relevantes a cuán bien está funcionando el sistema de detección al presente. Estos resultados super tardíos es mejor visualizarlos en otras gráficas de esta página.

Historial de casos, hospitales y muertes

¿Qué es esto?

Las curvas de los casos nuevos por prueba viral diagnóstica (= tanto molecular como antígeno) y las muertes, vista por medio de:

Las líneas sólidas representan los promedios de los 7 días que desembocan en esa fecha. Las entrecortadas representan los valores que se obtienen solo con datos de 7 días antes de la fecha de este informe.

También ilustramos datos hospitalarios en la misma gráfica. La ocupación hospitalaria y de UCIs es según datos del Departamento de Salud de Puerto Rico, excepto que para rellenar fechas viejas que Salud no tiene en su descarga, hemos usado el COVID Tracking Project que recogió esas fechas. Para los ingresos a hospital hemos usado los datos del Departamento de Salud y Servicios Humanos (HHS) de los Estados Unidos, excluyendo fechas más viejas cuyos valores muestran errores obvios.

Advertencia

Caídas súbitas al final de cada línea lo más probable no son reales, si no que más bien son artefactos de los rezagos—i.e., no han se han incorporado datos para esas fechas. Las líneas entrecortadas, que muestran cómo se veía la curva solo con datos recibidos hace una semana, de hecho tienden a ilustrar esto.

Informe oficial vs. Bioestadísticas

En esta gráfica hemos optado por ilustrar los casos a partir de datos públicos del API del Bioestadísticas del Departamento de Salud de Puerto Rico, en vez del informe oficial diario. Esta decisión requiere sopesar una serie de motivos a favor y en contra:

  1. En esta gráfica optamos por dar igual peso a pruebas positivas moleculares y de antígenos, por entender que resultados positivos en ambas apuntan a la presencia corriente del virus. Pero los datos del informe oficial no permiten trazar una curva correcta de casos confirmados y probables por fecha de la muestra más temprana, porque cuando un caso originalmente probable (= por antígeno) se confirma por prueba molecular posterior, el informe oficial lo resta a la fecha de la prueba de antígeno original y se lo suma a la fecha de la prueba molecular más tardía. Esto infla los casos recientes a costa de las fechas más tempranas.
  2. El reporte oficial suele dar números de casos un poco más pequeños que los que arroja Bioestadísticas. En el pasado hemos entendido se debe a que para el informe oficial se debe a una depuración más cuidadosa para eliminar casos duplicados, y aún así suponemos, pero ya ha llegado el punto que las diferencias atribuíbles a este factor quedan opacadas por la inflación de fechas recientes por los casos probables que posteriormente se confirman (#1).

Población de Puerto Rico

Para los cálculos per cápita (que aparecen cuando se apunta con el puntero a las curvas) usamos la población de Puerto Rico según el censo del 2020, que arroja 3,285,874 al 1ero de abril del 2020. Esto puede arrojar discrepancias con otras páginas que usan por ejemplo el estimado poblacional del 2019 (3,193,694), o incluso con otras gráficas en esta misma página que usan estimados de población por edad del 2019 que todavía no se han actualizado para el censo del 2020.

Vigilancia genómica reciente

¿Qué es esto?

Resumen de secuenciación genómica viral reciente. El panel superior muestra las proporciones de las variantes; el panel inferior muestra el volumen de secuencias genómicas para esa semana. Los datos de la semana más reciente suelen ser bien incompletos y menos fiables, así que para resaltar esto, los mostramos en tonos más transparentes.

Los datos son del tablero de estadísticas de COVID-19 del Departamento de Salud de Puerto Rico, pero los simplificamos aplicándoles un esquema sencillo de clasificación de variantes, tal que por ejemplo en vez de desglosar aparte una maraña de linajes jerárquicos tales como FE.1, FE.1.1 y FE.1.1.1, agrupamos todos estos bajo FE.1 que es el linaje "padre" de todos. No existe una única forma correcta de realizar tal agrupación, hay un elemento de juicio, así que los conteos y porcentajes presentados aquí pueden diferir de otras fuentes como el rastreador de variantes del CDC estadounidense) que simplifican también los datos mediante procedimientos semejantes pero distintos en el detalle.

Otro motivo de posibles discrepancias respecto a otras fuentes radica en que la adjudicación del linaje de una secuencia genómica del virus se hace con aplicaciones de software, pero existe más de una tal aplicación, estas a veces clasifican diferente la misma secuencia genómica, e inclusive versiones sucesivas de la una aplicación pueden producir resultados distintos para las mismas secuencias. En este análisis usamos la adjudicación de linajes que publica el Departamento de Salud de Puerto Rico, quienes históricamente han usado una sucesión de versiones de la aplicación Pangolin.

Pruebas y casos por edad

¿Qué es esto?

Pruebas, casos, muertes y positividad por edad, promedios de 7 días por fecha de muestra o deceso, ajustado al estimado poblacional en cada grupo de edades. Los casos son tanto por molecuares y antígenos, a partir de la curva que calculamos con datos de Bioestadísticas. Las pruebas se cuentan como encuentros de prueba. i.e., cuando los datos dicen dos especímenes de prueba a la misma persona en la misma fecha, lo contamos como una sola prueba.

Los casos por antígeno vs. molecular se adjudican por el tipo de la prueba positiva más temprana conocida para el episodio del paciente; esto es distinto a la clasificación de "probable" vs. "confirmado" del Departamento de Salud, que reclasifica a "confirmados" casos inicialmente detectados por antígeno que tuvieron una prueba molecular positiva posterior. Si hay tanto antígeno como molecular en la fecha inicial, adjudicamos a antígeno.

Población de Puerto Rico

Usamos datos del American Community Survey del 2019 del Negociado del Censo de los Estados Unidos para ajustar a la población de cada edad. Nótese que el censo del 2020 deja entrever que los estimados de la población de Puerto Rico producidos en la década del 2010 son más bajos que la realidad, y por ello esta gráfica tiende a inflar un tanto las tasas per cápita. La población de Puerto Rico es como 3% mayor que los datos usados aquí, pero cómo se distribuye ese error por rangos etarios aún no hay datos publicados.

Los análisis por población total y municipal en esta página usan datos del censo del 2020, así que esta gráfica discrepa de ellos.

Historial de casos por edad

¿Qué es esto?

El mismo análisis que la visualización de pruebas y casos por edad, pero solo los casos, e ilustrando la pandemia completa.

Especímenes de prueba diarios

¿Qué es esto?

Cuántos especímenes de pruebas (promedio de 7 días) se realizaron, tanto por fecha de toma de muestra como fecha de "reporte" (reportedDate, que se entiende la fecha en que el laboratorio obtuvo el resultado). Las líneas sólidas son con datos hasta la fecha de este boletín; las líneas entrecortadas son con datos solo hasta siete días antes de dicha fecha.

Esta gráfica, al mostrar los datos tanto por fecha de muestra como de reporte, permite en algunas ocasiones ver ataponamientos en el procesamiento de muestras de pruebas moleculares, que son especialmente evidentes en julio y agosto del 2020.

Trazamos las pruebas serológicas en gris claro para que no las miren tanto.

Advertencias

Las curvas no son finales porque pueden aún recibirse más datos para las fechas que representan. Y especialmente, caídas súbitas al final de la curva muy probable no son reales. La línea entrecortada, que excluye los datos recibidos los 7 días más recientes, tiende a ilustrar este efecto.

Los números son más o menos los crudos de Bioestadísticas, y no corrigen por ejemplo múltiples pruebas reportadas para la misma persona el mismo día. En la clasificación que propone el COVID Tracking Project, estos son "especímenes de prueba" ("test specimens") y no "encuentros de prueba" ("test encounters").

Población de Puerto Rico

Para los cálculos per cápita (que aparecen cuando se apunta con el puntero a las curvas) usamos la población de Puerto Rico según el censo del 2020, que arroja 3,285,874 al 1ero de abril del 2020. Esto puede arrojar discrepancias con otras páginas que usan por ejemplo el estimado poblacional del 2019 (3,193,694), o incluso con otras gráficas en esta misma página que usan estimados de población por edad o municipio del 2019 que todavía no se han actualizado para el censo del 2020.

Comparación internacional

Esta gráfica de Our World in Data puede ayudar a poner estas cifras en contexto internacional. Pero cuidado, distintos países reportan sus volumenes de pruebas en unidades distintas (e.g., especímenes vs. personas), o mezclan tipos de pruebas, o suman cifras inconsistentes de jurisdicciones domésticas, así que no vale fiarse demasiado de valores precisos.

Tasa de especímenes positivos

¿Qué es esto?

Porcentaje de especímenes de prueba positivos entre todos los especímenes de pruebas, promedios de 7 días por fecha de toma de muestra, según datos del API de Bioestadísticas del Departamento de Salud de Puerto Rico, con depuración mínima. Entendemos que no es la mejor forma de calcular positividad, pero la calculamos de todos modos como servicio al público ya que es un cálculo que por ejemplo usan los CDC de los Estados Unidos.

Las líneas sólidas son con datos recibidos hasta la fecha de boletín de este dashboard. Las líneas entrecortadas excluyen los datos recibidos durante las 7 fechas de boletín más recientes, a fin de ilustrar cómo los datos recibidos recientes revisan fechas más viejas.

Se calculan aquí también tasas aparte para pruebas moleculares y de antígenos. Hay que entender que la positividad de antígenos no puede compararse ingenuamente con la de moleculares. Las moleculares son más sensibles y tienen una ventana de detección más amplia, por lo tanto la expectativa de antemano y que se confirma en los datos es que:

positividad moleculares > positividad antígenos

Y encima de esto las moleculares vs. las de antígenos se administran a grupos de la población sesgados de manera distinta, que dificulta aún más la comparación.

Advertencias

Los cálculos de positividad son un campo minado en el cual no existen estándares verdaderos y distintas jurisdicciones, organizaciones y personas la calculan de maneras distintas, idiosincráticas y a veces francamente erróneas. Ningún cálculo de positividad hecho por dos partes distintas debe compararse ingenuamente sin analizar a fondo los métodos que usan, y vale más mirar la tendencia de una curva que los valores puntuales que arroja, que en realidad poco significan. Una excelente discusión de los problemas e inconsistencias que suelen sufrir estos cálculos se puede hallar en este artículo:

Este cálculo de positividad también hay que advertir que se realiza a partir de especímenes de prueba y no personas evaluadas ni de "encuentros de prueba" (concepto que explica en artículo citado). Esto quiere decir que:

Casos confirmados vs. descartados

¿Qué es esto?

Lo que el autor de esta página entiende es una mejor manera de medir la tan mentada "positividad de pruebas" a partir de los datos disponibles del Departamento de Salud de Puerto Rico. El concepto consiste de dos pasos. El primero es depurar los datos crudos de especímenes de prueba para identificar personas que los datos reportan que se les evaluó más de un especímen en la misma fecha, para contar este conjunto de especímenes tomados a la misma persona como un solo "encuentro de prueba" (según la clasificación propuesta por el COVID Tracking Project).

El segundo paso consiste en distinguir entre:

La idea es monitorear la razón de casos descartados a casos confirmados pero solo contando pruebas moleculares de evaluación inicial, porque las de seguimiento no aportan al propósito que se cita comunmente para las tasas de positividad: evaluar si el número de personas evaluadas se queda corto para detectar contagios nuevos. Como las pruebas de seguimiento no contribuyen a confirmar o descartar nuevos casos, incluirlas en el cálculo es (entiendo yo) un defecto común en los métodos más usuales para calcular positividad.

El valor para cada fecha en el eje horizontal es un promedio a partir de las muestras tomadas en los 7 días que desembocan en esa fecha.

Criterio para prueba inicial vs. seguimiento

Catalogamos una prueba (negativa o positiva) como seguimiento si el mismo paciente (según el campo patientId en Bioestadísticas) ha tenido una prueba molecular o de antígenos positiva en los 90 días anteriores. Este criterio lo adoptamos a partir de la definición interina de casos de COVID-19 del 5 de agosto del 2020 del Consejo de Epidemiólogos Estatales y Territoriales, que recomienda:

Una prueba positiva repetida para ARN de SARS-CoV-2 usando una prueba de detección de amplificación molecular dentro de tres meses del reporte inicial no debe ser enumerada como caso nuevo para propósitos de vigilancia.

ADVERTENCIA: Este estimado usa el campo patientId de Bioestadísticas para adjudicar si un par de pruebas se le hicieron al mismo paciente, y hay motivo para creer que este campo frecuentemente falla en lograr ese cometido y muestre IDs distintos en muchos casos que en verdad es la misma persona. El efecto de esto sería subestimar qué cantidad de pruebas son de seguimiento.

Prueba molecular vs. antígeno

Este cálculo usa las pruebas moleculares y de antígeno de una forma un tanto sutil:

Hacemos así por estos motivos:

Alternativas que hemos contemplado pero no adoptado:

Tasa de letalidad (CFR) rezagada

¿Qué es esto?

Aproximación de qué porcentaje de los casos detectados (que no son todos los contagios) resultaron en decesos, lo que en inglés se llama el "case fatality rate" (CFR). Esto sin embargo lo calculamos de una manera más cuidadosa que lo usual, comparando muertes (por fecha actual de deceso, ventanas móbiles de 14 días) con casos detectados por muestras 14 días atrás. Esto responde a los siguientes supuestos:

  1. Tiempo típico entre contagio y deceso es de 23 días;
  2. Tiempo típico entre contagio y síntomas es de 5 días;
  3. Tiempo típico entre síntomas y toma de muestra es de 4 días, según este informe del Departamento de Salud del 29 de noviembre del 2020.

Esta tasa no es la letalidad verdadera del virus, porque no toma en cuenta casos que no se detectaron. Esto quiere decir que si se contempla en conjunto con un estimado de la letalidad verdadera ("infection fatality rate" (IFR) en inglés), sirve para estimar qué porciento de los contagios verdaderos se detecta, según esta fórmula:

% detectados = IFR / CFR

Los estimados de los CDC de los EEUU (revisión 10 de septiembre), ajustados a la edad de la población de Puerto Rico, pondrían el IFR del país cerca del 1%, así que un CFR por ejemplo de 1.5% en esta gráfica implicaría entonces que para esas fechas se detectaba como el 67% de los contagios. Existen otros estudios con otros estimados que he consultado, que ajustados a la población de Puerto Rico predicen diversos IFRs entre 1% a 1.8%. Nótese que usar estimados más bajos de IFR produce estimados más altos de casos sin detectar; optimismo respecto a IFR = pesimismo respecto a detección.

Pruebas añadidas a Bioestadísticas

¿Qué es esto?

Cuántos resultados nuevos de pruebas moleculares se añadieron en el API de Bioestadísticas (el sistema en línea de recibo de resultados de pruebas del Departamento de Salud de Puerto Rico), por combinación de fecha de toma de muestra y fecha que Bioestadísticas reporta recepción del resultado de la prueba.

El API de Bioestadísticas de Salud que usa esta página presenta tres campos de fecha/tiempo para cada récord de prueba individual:

sampleCollectedDate
Fecha de colección de muestra de prueba.
resultReportDate
Se entiende a partir de conversaciones con fuentes que es la fecha en que el laboratorio advino en conocimiento del resultado de la prueba.
orderTestCreatedAt
Tiempo que el sistema computarizado graba como la fecha y hora que se recibió el resultado de la prueba.

Historial de pruebas en Bioestadísticas

¿Qué es esto?

El mismo análisis que la gráfica anterior, pero en forma de historial para muchas fechas recientes. Se puede apuntar a cada celda de la gráfica para que aparezca un indicador con los valores de esta en tamaño legible.

Cambio entre boletín actual y anterior

¿Qué es esto?

Sumas y restas efectuadas a conteos de casos por fecha de muestra, según datos diarios publicados por el Departamento de Salud de Puerto Rico. Hasta el 21 de julio del 2021 usamos nuestra captura a mano del boletín diario impreso (PDF) de casos; del 22 de julio del 2021 en adelante los datos son de la página covid19datos.salud.gov.pr

.

Cambios entre boletines recientes

¿Qué es esto?

El mismo análisis que la gráfica anterior, pero para los 14 boletines más recientes, cosa que require hacer los númeritos bien chiquititos.

Rezago de casos por renglones

¿Qué es esto?

Una gráfica de dos paneles que muestra promedios de siete días de casos confirmados nuevos, por fecha de boletín (¡no de muestra!), divididos en renglones de rezago (tiempo entre toma de muestra e incorporación en el conteo). El panel superior muestra los volúmenes absolutos; el panel inferior es los mismos datos, pero en porcentajes.

La forma de la curva superior se parece una gráfica de casos nuevos por fecha que se incorporan al conteo, pero alerta, no cuenta muchas restas de casos al conteo (porque las restas dañan los estimados de rezagos, hacen que den negativo). Por esto la curva es en realidad más alta que los números verdaderos de casos confirmados.

Tendencias por día de semana

¿Qué es esto?

Casos de los 21 boletines anteriores al actual, reportados con no más de 14 días de rezago respecto a cada boletín, agrupados por la combinación de:

La intensidad del color de cada cuadro refleja cuántos casos se registraron para esa combinación. Los histogramas marginales muestran los datos agrupados por un sólo eje.

ADVERTENCIAS:

Mapas municipales de casos recientes

¿Qué es esto?

Casos confirmados y probables nuevos reportados por municipio, según descargas diarias del portal covid19datos.salud.gov.pr del Departamento de Salud de Puerto Rico, visto de dos formas:

  1. Promedio de casos de muestras recientes reportadas en las siete fechas más recientes, ajustados per cápita a la población de cada municipio (según el Censo del 2020);
  2. Comparación de esa cifra con la correspondiente a los siete informes diarios anteriores, expresado como aumento o disminución porcentual, i.e., (nuevo - previo) / previo. Cuando el denominador es cero se substituye por uno.

Manejo de fechas de reporte vs. muestra

Este mapa usa un manejo de fechas distinto a las otras visualizaciones en esta página; en vez de clasificar los casos por fecha de muestra (que desinflaría los números porque las fechas de muestra recientes siempre están incompletas), se usa un esquema híbrido en que a cada fecha se le atribuyen casos que cumplan con estas dos condiciones a la vez:

  1. Cada caso debe haber sido añadido al conteo oficial del Departamento de Salud en la fecha que reporta este informe;
  2. La muestra del caso tiene que haberse tomado dentro de un periodo reciente de 14 días (anclado a la fecha del reporte).

Las cifras diarias obtenidas mediante este método luego las sometemos a promedios de siete días consecutivos para el promedio reciente y la comparación con la semana anterior a la corriente.

Población de Puerto Rico

Para los cálculos per cápita usamos los valores del censo del 2020, que arroja una población de 3,285,874 en Puerto Rico al 1ero de abril del 2020. Esto da resultados más certeros que muchas páginas que usan estimados del 2019 o 2020, elaborados a partir del censo del 2010, que subestiman bastante la población de Puerto Rico (e.g., 3,193,694 personas el 1ero de julio del 2019).

Advertencias

Se observa en muchas ocasiones que las cifras en este mapa excedan las que obtienen otras fuentes que hace uso de un manejo de fechas más sencillo que no incluye los cambios reportados recientemente a destiempo como se explica arriba. El motivo es que muchas veces los "casos viejos" que excluye el método de este mapa resultan ser casos restados, no sumados. No intentamos corregir este error porque entendemos por experiencia que es una mezcla de (a) mal manejo de fechas por parte del Departamento de Salud (casos "probables" que reclasifican a "confirmados" por molecular posterior, y les cambian la fecha a la más reciente), y (b) mal manejo de recontagios (casos "probables" de hace muchos meses atrás que reclasifican a "confirmados" por molecular reciente que en verdad deberían contar como dos casos distintos en una misma persona). Los primeros en verdad deberían excluirse pero no nos molestamos, y para los segundos incluirlos produce cifras menos erróneas.

Historial de casos por municipio

Promedios móviles de 7 días casos confirmados y probables nuevos para cada municipio por millón de habitantes en cada una de las 84 fechas más recientes, interpretándose estas como fecha de muestra. Los municipios se agrupan por región, y se ordenan por el volumen de casos en los 21 días más recientes.

Como esta gráfica es por fecha de muestra, caídas súbitas al final suelen ser falsas, más bien debidas a datos incompletos para fechas recientes. Además, como usan los datos del portal covid19datos.salud.gov.pr que adjudican mal las fechas de casos descubiertos por prueba de antígeno (originalmente "probables," según la mala designación) que luego se reclasifican a "confirmados" por prueba molecular posterior.

Pruebas per cápita y por tipo, por municipio

¿Qué es esto?

Volumen diario de pruebas per cápita en cada municipio, por muestra en los 21 días más recientes, vs. qué porcentaje son moleculares. Esto es para visualizar:

Las líneas entrecortadas marcan los promedio a nivel Puerto Rico. La entrecortada vertical es el promedio nacional de pruebas per cápita; la horizontal es porcentaje nacional de moleculares. Esto permite visualizar fácil si un municipio hace menos o más pruebas que el promedio, y si son desproporcionadamente muchas o pocas las pruebas moleculares.

Cabe señalar que las pruebas de antígeno gozan de fuertes ventajas prácticas en conveniencia, rapidez y costo, y que por lo tanto se debe entender que un volumen alto de tales pruebas es bueno. Sin embargo como las moleculares son más costosas y prestigiosas, sí se puede entender que el que algunos municipos reciban un volumen desproporcionado de estas refleja inequidades en servicios de salud. O sea:

Descuadre de encabezado de boletín

¿Qué es esto?

Antes del 22 de julio del 2021, los datos detallados de COVID-19 en Puerto Rico se publicaban como un reporte PDF diario cuyos datos capturábamos a mano para elaborar esta página. Este gráfica cotejaba las cifras reportadas en la primera página de cada boletín. Ya no hay boletines diarios así que descontinuamos la gráfica pero retenemos la lista de descuadres constatados.

Descuadres constatados en los datos de fuente

2021-07-16
No cuadran los casos sospechosos en la portada y las notas al calce. El total reportado en la portada es 136,664, pero la suma llega a 136,671.
2021-06-22
No cuadran los casos probables en la portada y las notas al calce. El total reportado en la portada es 16,993, pero la suma llega a 16,996. Tampoco cuadran los casos sospechosos; el total reportad en la portada es 133,173, pero la suma llega a 133,177.
2021-06-22

El 23 de junio del 2021, el Departamento de Salud no publicó en sus páginas el informe diario de casos que acostumbra publicar todos los días (con fecha de actualización de datos del día anterior, 22/junio). En ocasiones pasadas cuando Salud ha hecho esto lo ha corregido el día siguiente, pero en esta ocasión no lo hicieron, sino que simplemente se saltaron un día.

Los valores de casos recientes adicionales y casos acumulados los pude obtener de otras fuentes, pero sin el informe diario no tengo los acostumbrados ajustes que se hacen en las notas al calce. Como son ajustes pequeños, he optado simplemente por no corregir y dejar que consten los descuadres.

2021-06-21
Los casos confirmados informados en la portada y la nota al calce cuadran, pero la tabla de datos por fecha de muestra tiene un valor obviamente errado de casos para el 19 de junio, que obliga a advertir que el total de 122,822 casos confirmados reportados en la portada bien puede que esté incompleto por omitir casos por muestras del 19 de junio. Estas probablemente se reporten en informes posteriores.
2021-06-10
No cuadran los casos sospechosos en la portada y las notas al calce. El total reportado en la portada es 130,449, pero la suma llega a 130,457.
2021-06-01
No cuadran los casos sospechosos en la portada y las notas al calce. El total reportado en la portada es 128,219, pero la suma llega a 128,220.
2021-05-25
Los casos confirmados informados en la portada y la nota al calce cuadran, pero la tabla de datos por fecha de muestra tiene un valor obviamente errado de casos para el 23 de mayo, que obliga a advertir que el total de 121,581 casos confirmados reportados para esta fecha bien puede que esté incompleto. Estas probablemente se reporten en informes posteriores.
2021-05-16
La nota al calce #6, sobre los ajustes a los casos sospechosos, dice que "se sumaron ciento veinticuatro (24) casos previos al 1 de mayo de 2021." El valor de 124 hace que cuadre el ajuste, así que ese adoptamos.
2021-05-04
Los casos confirmados informados en la portada y la nota al calce cuadran, pero la tabla de datos por fecha de muestra tiene un descuadre de 397 casos que obliga a advertir que el total de 117,881 casos confirmados reportados para esta fecha bien puede que esté incompleto.
2021-05-02
Hay un error en la nota al calce #6 sobre los ajustes al total acumulado de casos sospechosos. Dice que se restaron 4 duplicados pero lo acompaña con una gráfica documentando las fechas de cuatro casos sospechosos adicionales. Haciendo las sumas para cotejar se constata que se sumaron 4 casos viejos como implica la gráfica, y en vez de restarse 4 duplicados como dice el texto de la nota. Hemos entonces optado por ignorar el texto y hacerle caso a la gráfica, opción que hace que cuadren los datos.
2021-04-30
No cuadran los casos confirmados en la portada y las notas al calce. El total reportado en la portada es 116,180, pero la suma llega a 116,181.
2021-04-10
No cuadran los casos sospechosos en la portada y las notas al calce. El total reportado en la portada es 102,481, pero la suma llega a 102,484.
2021-03-20
No cuadran los casos sospechosos en la portada y las notas al calce. El total reportado en la portada es 92,009, pero la suma llega a 91,998.
2021-03-16
No cuadran los casos sospechosos en la portada y las notas al calce. El total reportado en la portada es 90,057, pero la suma llega a 90,058.
2021-02-22
No cuadran ni los casos confirmados ni los probables en la portada con las notas al calce. La portada es reporta 91,816 confirmados, pero la suma llega hasta 91,827. También reporta la portada 7,660 probables, pero la suma llega hasta 7,657. Las tablas de casos por fecha de muestra coinciden con la portada.
2021-02-14
No cuadran los casos sospechosos en la portada y las notas al calce. El total reportado en la portada es 75,515, pero la suma llega a 75,519.
2021-02-08
La nota al calce #6 dice que "se restaron [...] tres (5) casos [sospechosos] que tuvieron una prueba probable (antígeno) positiva posteriormente". Usamos el valor de tres (3) porque es el que cuadra.
2021-01-13
No cuadran los casos confirmados en la portada y las notas al calce. El total reportado en la portada es 79,114, pero la suma llega a 79,112.
2021-01-11
Hoy de nuevo no cuadran los casos sospechosos en la portada y las notas al calce. El total reportado en la portada es 60,006, pero la suma llega a 59,006. La gráfica de casos sospechosos (que generalmente es lo más fiable) dice 60,006, como dice también la tabla que la acompaña. Esto puede en gran parte explicarse si apuntamos al descuadre de ayer y suponemos que es que el total reportado ayer estaba mal por 100.
2021-01-10
Los casos sospechosos en la portada y las notas al calce no cuadran con el boletín anterior. El total reportado en la portada hoy es 58,872, pero la suma llega a 58,988. La gráfica de casos sospechosos (que generalmente es lo más fiable) dice 58,972. La tabla que la acompaña esta gráfica (que frecuentemente está mal) dice que suma a 55,381, pero los números diarios en esta en verdad suman 58,725. Esto es un desastre.
2021-01-01
Los casos sospechosos en la portada y las notas al calce no cuadran con el boletín anterior. El total reportado en la portada y la gráfica hoy es 57,484, pero la suma llega a 57,481. Las notas al calce hablan de dos duplicados que se restaron y otro más que se restó por "fecha equivocada," y no sé si tengan que ver.
2021-01-04
Tanto los casos probables y los sospechosos en la portada y las notas al calce no cuadran con el boletín anterior. Los totales reportados en la portada y la gráfica hoy son 4,861 y 57,221 respectivamente, pero las sumas de cuadre dan 4,862 y 57,220. Las notas al calce mencionan un caso sospechoso que pasó a probable, y podemos conjeturar que en los totales reportados se les olvidó traspasar este.
2021-01-01
Los casos sospechosos en la portada y las notas al calce no cuadran con el boletín anterior. El total reportado en la portada y la gráfica hoy es 56,546, pero la suma llega a 56,547. Posiblemente eliminaron un duplicado que no mencionaron en la nota al calce.
2020-12-19
Los casos sospechosos en la portada y las notas al calce no cuadran con el boletín anterior. El total reportado hoy es 50,177, pero la suma solo llega a 50,139.
2020-12-16
Los casos confirmados en la portada y las notas al calce no cuadran con el boletín anterior. El total reportado hoy es 64,182, pero la suma solo llega a 64,184.
2020-12-16
Los casos probables en la portada y las notas al calce no cuadran con el boletín anterior. El total reportado hoy es 2,968, pero la suma solo alcanza a 2,967. La tabla de casos probables por fecha de muestra, como se reporta abajo, también tiene errores, que tras corregirlos también suman a 2,967.
2020-12-16
Los casos sospechosos en la portada y las notas al calce no cuadran con el boletín anterior. El total reportado hoy es 47,546, pero la suma solo alcanza a 47,545. Una nota al calce le resta un caso "reclasificado" a los confirmados sin más explicación; conjeturo que este caso pasó a sospechoso y no lo desglosaron entre estos.
2020-12-11
La tabla de los casos probables por fecha de muestra la corrigieron después de cuatro días que estuvo mal, pero hoy la portada y las notas al calce descuadran por dos (2) casos probables.
2020-12-09
Otro boletín desastroso. La portada y las gráficas dicen 57,096 casos confirmados y 44,667 sospechosos, pero los números de casos adicionales en la portada y las notas al calce, aplicados a los totales acumulados hasta el boletín anterior, dan 57,102 y 44,670 respectivamente. Además de eso se da el tercer día consecutivo que la tabla de casos probables está mal (ver el análisis de cuadre de gráficas abajo).
2020-11-29
Este boletín es un desastre. Dice en la portada que se sumaron 732 casos confirmados adicionales recientes, se sumaron otros 5 más viejos y se restaron 23 duplicados. Esto aplicado al total anterior de 50,197 casos confirmados daría 50,911, pero el bendito boletín dice 50,988, igual que la gráfica. Y los casos sospechosos tienen un descuadre de 3.
2020-11-25 (confirmados)
El boletín dice en la portada que se sumaron 392 casos confirmados adicionales, y la nota al calce #2 que se sumaron 118 casos confirmados por muestras anteriores al 10 de noviembre. Aplicando esto a los 47,345 acumulados hasta el boletín anterior (24/nov) daría 47,345 + 392 + 118 = 47,855, pero el boletín nuevo (25/nov) dice en su portada que son 47,854 casos confirmados. La gráfica de casos confirmados por fecha de muestra también dice 47,854.
2020-11-25 (sospechosos)
El boletín dice en la portada que se sumaron 211 casos sospechosos adicionales, y la nota al calce #2 que se restaron 65 casos confirmados por muestras anteriores al 10 de noviembre, se restó 1 por muestra de antígeno anterior al 10 de noviembre, y se sumó uno por muestra del 8/nov. Aplicando esto a los 39,266 acumulados hasta el boletín anterior (24/nov) daría 39,266 + 211 - 61 - 1 + 1 = 39,416, pero el boletín nuevo (25/nov) dice en su portada que son 39,409 casos confirmados. La gráfica de casos confirmados por fecha de muestra también dice 39,409.
2020-11-21 (confirmados)
El boletín dice en la portada que se sumaron 957 casos confirmados adicionales, y la nota al calce #2 que se sumaron 11 casos confirmados por muestras anteriores al 6 de noviembre. Aplicando esto a los 45,268 acumulados hasta el boletín anterior (20/nov) daría 45,268 + 957 + 11 = 46,236, pero el boletín nuevo (21/nov) dice en su portada que son 46,235 casos confirmados. La gráfica de casos confirmados por fecha de muestra también dice 46,235.
2020-11-18 (probables)
El boletín dice en la portada que se sumaron 153 casos probables adicionales por antígeno, y la nota al calce #4 que se restaron 5 que pasaron a confirmados por prueba molecular posterior. Aplicando esto a los 879 acumulados hasta el boletín anterior (17/nov) daría 879 + 153 - 5 = 1,027, pero el boletín nuevo (18/nov) dice en su portada que son 1,028 casos probables. La gráfica de casos probables por fecha de muestra también dice 1,028.
2020-11-13 (confirmados)
La nota al calce #1 dice que los casos confirmados adicionales para esta fecha comienzan por muestras del 29 de octubre del 2020, y la gráfica en la nota dice que se suma un caso por muestra de esa fecha. Pero la nota al calce #2 dice también que se ajusta el total acumulado sumando un caso al 29 de octubre. Esto parece ser un error y se refleja como descuadre de un caso en los totales.
2020-04-23
La cifra de 849 casos únicos acumulados por prueba molecular hasta el 22 de abril se obtuvo de esta gráfica publicada por el Instituto de Estadísticas de Puerto Rico. De este boletín del 23 de abril se obtuvieron las cifras de 3 casos únicos nuevos y 871 casos únicos acumulados por pruebas moleculares. En conjunto dan un descuadre de 19 casos confirmados. Nótese sin embargo que estos datos antedatan el boletín regular más temprano disponible en las páginas del Departamento de Salud, fechado 25 de abril y con datos hasta el 24.

Cualquier otra fecha que no dé cero en esta gráfica hay que cotejar que se hayan copiado correctamente los datos.

Descuadre de boletín y gráficas

¿Qué es esto?

Antes del 22 de julio del 2021, los datos detallados de COVID-19 en Puerto Rico se publicaban como un reporte PDF diario cuyos datos capturábamos a mano para elaborar esta página. Aquí había una gráfica que comparaba los totales de casos acumulados reportados en la primera página de cada boletín y las sumas de los datos por fecha de muestra en las gráficas de este mismo boletín. Ya no hay boletines diarios así que descontinuamos la gráfica pero retenemos la lista de descuadres constatados.

Descuadres constatados en los datos de fuente

2021-07-01
El informe con esta fecha de actualización de datos no publica, al parecer por error, la gráfica de decesos por fecha de defunción, y aparece en vez en la p. 35 la gráfica de decesos adicionales del reporte. La tabla de datos sí aparece y se ve correcta.
2021-06-22

El 23 de junio del 2021, el Departamento de Salud no publicó en sus páginas el informe diario de casos que acostumbra publicar todos los días (con fecha de actualización de datos del día anterior, 22/junio). En ocasiones pasadas cuando Salud ha hecho esto lo ha corregido el día siguiente, pero en esta ocasión no lo hicieron, sino que simplemente se saltaron un día.

Debido a que muchas de las visualizaciones de estas páginas dependen de los valores de las tablas desglosando los casos confirmados y los casos probables por fecha de muestra, he optado por reconstruir parcial, conjetural e inexactamente esas dos tablas para la fecha de actualización del 22 de junio del 2021, a partir de los datos que salen en:

  1. Las tablas correspondientes del día próximo (boletín publicado 24 de junio, con fecha de actualización del 23 de junio);
  2. Las notas al calce #1 y #3 de ese mismo boletín, que detallan los casos sumados por fecha de muestra.

La reconstrucción consiste en restarle a esas tablas los casos adicionales desglosados en esas notas al calce. Pero como las notas al calce, que recogen tanto la suma de casos adicionales como la resta de duplicados y reclasificados, no detallan las fechas de muestra de estos últimos, no puedo efectuar las sumas correspondientes sin adivinar fechas ciegamente. Como la diferencia es pequeña he optado por dejar que conste el descuadre.

En adición a esto, vale apuntar que en el caso de las tablas de casos acumulados por municipio, para subsanar la falta del informe diario que Salud saltó, copié los valores de la fecha anterior.

2021-06-21

La tabla de casos confirmados por fecha de muestra publicada hoy está mal, con un error análogo a los del 4 y 25 de mayo del 2021. La última hilera (p. 15) dice que para el 19 de junio son 125 casos nuevos para un total acumulado de 121,823, pero ese valor acumulado está obviamente mal (la hilera anterior dice 122,822) y ambos valores son idénticos al los del 24 de mayo al tope de la página. Si descartamos la hilera del 19 de junio todo cuadra y el total acumulado de 122,822 al 18 de junio coincide con la portada del informe.

Por este motivo descartamos la hilera del 19 de junio y así todo cuadra. Pero esto quiere decir que posiblemente hay casos de muestras del 19 de junio y se quedaron sin reportar. (Probablemente se reportan en posteriores.)

2021-06-03, 2021-06-04

La tabla de muertes por fecha de deceso está mal en el boletín diario del 3 de junio del 2021. Para el 26 de mayo del 2021 reporta 4 muertes, cuando la del boletín anterior reportaba 5 en la misma fecha. La columna de muertes nuevas por fecha suma a 2,514 que es uno menos que el total de 2,515 que reporta la portada. Y la columna de muertes nuevas también descuadra con la columna de muertes acumuladas por fecha a partir de la hilera del 26 de mayo, cuyos valores parecen estar correctos. Optamos en nuestra captura de datos entonces imputar el valor de 5 muertes el 2021-05-26, que hace que todo cuadre.

El mismo error se repite en el boletin del 4 de junio del 2021. La portada dice 2,516 muertes pero la tabla por fecha de defunción suma a 2,515, y tiene el mismo problema el 26 de mayo. Optamode de nuevo en imputar 5 muertes en vez de 4 para esa fecha.

El descuadre cesó en el boletin del 5 de junio del 2021, que reporta 4 muertes el 26 de mayo, pero suma una el 25 de mayo, subiendo el total de esa fecha de 2 a 3. Esta muerte sumada no se desglosa en la nota a calce #7 al principio del boletín.

2021-05-25

La tabla de casos confirmados por fecha de muestra publicada hoy está mal, con un error análogo al de 4 de mayo. La última hilera dice que para el 23 de mayo son 400 casos nuevos para un total acumulado de 105,981, pero ese valor acumulado está obviamente mal (la hilera anterior dice 121,581) y ambos valores son idénticos al los del 10 de abril al tope de la tabla. Si descartamos la hilera del 23 de mayo todo cuadra y el total acumulado de 121,581 al 22 de mayo coincide con la portada del informe.

Por este motivo descartamos la hilera del 23 de mayo y así todo cuadra. Pero esto quiere decir que posiblemente hay casos de muestras del 23 de mayo y se quedaron sin reportar en este boletín. (Probablemente se reportan en posteriores.)

2021-05-04

La tabla de casos confirmados por fecha de muestra publicada hoy está mal. La penúltima hilera dice que el 1ero de mayo se detectaron 29 casos para un total acumulado de 117,881. Sumando por mi cuenta la columna de casos nuevos diarios me constato que las cifras acumuladas publicadas en la tabla hasta el 1ero de mayo están correctas. Y ese total acumulado de 117,881 al 1ero de mayo coincide con el total de casos confirmados acumulados en la portada del informe.

Pero la próxima hilera dice que el 2 de mayo se detectaron 397 casos y que el total acumulado es de 105,974. Estas dos cifras ambas son las mismas que se reportan para el 10 de abril, que es la primera hilera de la columna del formato de página en que aparecen los valores entre el 10 de abril al 2 de mayo. O sea, esto tiene el aspecto de un error de "copia y pega."

La portada del informe, sin embargo, cuadra con el total acumulado que la tabla de datos reporta para el 1ero de mayo. La nota al calce #1 detallando los casos adicionales dice 0 para el 2 de mayo. La gráfica por fecha de muestra es difícil de leer pero parece también detenerse el 1ero de mayo. La conclusión entonces es que la tabla está mal el 2 de mayo pero la portada y la gráfica no están incluyendo sus valores erróneos.

Por esto he optado omitir en mi archivo de datos los casos por muestras del 2 de mayo según datos hasta el 4 de mayo. Pero conjeturo que existió un valor verdadero que no se incluyó en el reporte.

2021-04-28, 2021-04-29 y 2021-04-30

En el informe diario con fecha de actualización del 29 de abril, la portada, la gráfica de muertes y la columna de muertes acumuladas por fecha de muestras todas dicen 2,296 muertes, pero la columna de muertes nuevas por fecha de muestra suma a 2,297. El error es que la hilera del 17 de abril del 2021 dice (correctamente) que son 2,220 muertes adicionales, pero la del 18 de abril dice 9 adicionales pero solo 2,228 acumuladas.

El informe diario del 29 de abril repite el mismo error, con un total reportado de 2,303 muertes pero la tabla suma a 2,304. El del 30 de abril lo repite una tercera vez, con total reportado de 2,310 muertes pero la tabla suma a 2,311.

2021-03-29
El boletín para esta fecha publicó las mismas tablas de casos por fecha de muestra que el del día anterior, con los mismos totales de casos que la portada del boletín anterior. Error garrafal.
2021-01-05
La tabla de casos probable por fecha de muestra, de nuevo, está completamente mal y no cuadra con nada. Semejante a lo que ocurrió entre el 28 y el 31 de diciembre.
2020-12-28 a 2020-12-31
La tabla de casos probable por fecha de muestra está completamente mal y no cuadra con nada. Suma cientos menos que el total que reporta, le faltan fechas, asigna el valor equivocado a la mayoría de las fechas, etc. Metí las gráficas a WebPlotDigitizer e hice cálculos para lograr obtener los datos correctos.
2020-12-17
La tabla de casos probable por fecha de muestra hoy está completamente mal y no cuadra con nada, suma a 4,373 cuando la portada y la gráfica dicen 4,528. Metí la gráfica a WebPlotDigitizer e hice cálculos y logré obtener los datos correctos.
2020-12-17
La tabla de casos confirmados por fecha de muestra hoy omite el 14 de diciembre. Estos se pueden leer en las notas al calce al principio del boletín, que en una gráfica reporta 33 casos confirmados adicionales por muestras de esa fecha. Con esta corrección cuadra todo.
2020-12-16
Las tablas de casos por fecha de muestra hoy omiten los casos confirmados, los probables y los sospechosos para el 14 de diciembre. Estos se pueden leer en las notas al calce al principio del boletín, que los reportan en sus gráficas correspondientes de casos adicionales por fecha de muestra. Estos son 47 confirmados, 52 probables, y 74 sospechosos. Aún así la gráfica de casos probables suma a 2,967, y esto descuadra con el total de 2,968 que reporta el boletín.
2020-12-09
La tabla de casos probables publicada hoy tiene el mismo tipo de error que las del 7 y 8 de diciembre, así que se aplica la misma corrección para hacerla cuadrar: quitar el caso que la tabla de datos recoge para el 24/jul pero que en la gráfica no aparece.
2020-12-08
La tabla de casos probables publicada hoy tiene el mismo tipo de error que la del 7 y, semejantemente, la suma de los casos diarios después de corregir las fechas da 2,289 que no cuadra la de casos acumulados que reportan la misma tabla, la portada del informe y la gráfica: 2,288. Luego (11/dic) aplicamos la corrección que logra el cuadre: la tabla de datos tiene un caso para el 24/jul que la gráfica eliminó.
2020-12-07
La tabla de casos probables publicada hoy está mal. La columna de acumulada dice 2,074 para el 5 de diciembre, pero los valores de la columna de frecuencia suman a 2,075. Además, comparando los valores de cada fecha con los del boletín anterior, se aprecia que hay una especie de error "off by one" entre las fechas y los valores, en que a todas las hileras del 28/may al 25/nov tienen el valor que en verdad debería corresponderle a la fecha de la hilera próxima, y la del 26/oct (última en la primera columna de la tabla) tiene el valor que debería tener la del 28 de mayo. Esta corrección se le aplicó a los datos que copiamos, pero aún así quedó el descuadre de un caso, que el 11 de diciembre logré diagnosticar: la gráfica borra un caso que las anteriores reportaban para el 2020-07-24, pero la tabla de datos aún recoge. Borrar este arregla el descuadre.
2020-11-29
La gráfica dice 50,988 casos confirmados, pero por más que intente no logro copiar números que cuadren, porque (a) la Parte I no tienen números, (b) las notas al calce que desglosan cambios no dicen bien las fechas que se restaron duplicados, (c) los totales de estas notas al calce no cuadran con los 50,988 casos de todos modos, y (d) la gráfica Parte II de casos confirmados es una imagen ráster y sus números muchos no son legibles. Así que lo llamo una victoria que mis datos copiados a manos sumen a 50,989, solo uno más que este desastre de informe.
2020-07-02, 2020-07-04, 2020-07-06 y 2020-07-12
En estas gráficas de muertes se omitió la barra una muerte del 17 de marzo, registrada en muchísimas otras gráficas anteriores. Sin embargo las mismas gráficas las cuentan hacia el total de muertes acumuladas; es decir, las gráficas mismas exhibe el descuadre.
2020-09-28
En estas gráficas de muertes se omitió la barra una muerte del 28 de septiembre, que sí se detalla en la nota al calce 5 al principio del informe. Sin embargo la misma gráfica la cuentan hacia el total de 654 muertes acumuladas; es decir, la gráfica misma exhibe el descuadre.

Cualquier otra fecha que no dé cero en esta gráfica hay que cotejar que se hayan copiado correctamente los datos.

Revisiones

9 de julio del 2023

Remplazamos los usos del viejo API del Bioportal del Departmento de Salud está por su sucesor, el API de Bioestadísticas.

17 de agosto del 2022

El mapa de vacunaciones lleva algunos días produciendo resultados claramente erróneos, así que lo hemos desactivado. No nos urge restaurarlo por el momento, ya que nunca ha sido tan útil como el informe de vacunas de COVID-19 en Puerto Rico que elaboran Rafael Irizarry y Mónica Robles Fontán.

25 de julio del 2021

El Departamento de Salud comenzó a ofrecer, a partir del 22 de julio del 2021, descargas de datos en su mejorado portal covid19datos.salud.gov.pr, y descontinuó los informes impresos (PDF) que publicaba antes. Esta página ahora empata lo mejor que puede los datos de estas dos fuentes.

3 de diciembre del 2020

Para el boletín con datos hasta el 30 de noviembre el Departamento de Salud de Puerto Rico rehizo sus gráficas de casos por fecha de muestra, tal que comenzaron a omitir las etiquetas con el valor numérico de cada barra. Tras quejas de periodistas, para el boletín del 2 de diciembre añadieron tablas aparte con estos datos. Las notas al calce detallando los casos adicionales y la tabla del boletín del 2 de diciembre bastaron para reconstruir los casos confirmados por fecha de muestra y las muertes por fecha de deceso, pero no para reconstruir los casos probables por fecha de muestra.

Por este motivo, me fue necesario estimar los números de casos probables por fecha de muestra para el 2020-11-30 y 2020-12-01 usando un programa de escáner de gráficos (WebPlotDigitizer) cotejando los resultados de este manualmente contra las sumas que sí se podían calcular a partir de los boletines, calculando el error promedio por barra del escáner y aplicando una corrección correspondiente.

Con todo el cuidado que tomé, entiendo que no se puede reconstruir con mayor precisión los valores de casos probables por fecha de muestra para los boletines del 2020-11-30 y 2020-12-01, pero algún pequeño error puede haberse colado.

Revisión 14 de noviembre del 2020

Desde esta fecha se adoptó el API /api/administration/reports/orders/basic de Bioportal, que provee un campo resultCreatedAt que dice precisamente cuándo se recibió en Bioportal el resultado de cada prueba. Anterior a esto, como detallan las notas sobre revisiones anteriores, no existía campo que dijera esta información de manera fiable y nos veíamos forzados a estimar esta fecha a partir de la fecha y hora de las descargas diarias que realizo yo.

Este cambio lo aplico retroactivamente a todas las páginas, por lo cual todas las cifras que dependan de Bioportal se ven ligeramente cambiadas, pero los valores nuevos deben ser más precisos y más reproducibles por otras partes que descarguen de Bioportal indepedientemente.

Revisión 30 de agosto del 2020

Desde esta fecha esta página adoptó un nuevo, mejorado método de reproducibilidad de datos y adjudicación de fecha de datos a Bioportal. El método consiste de:

  1. Registrar la fecha y hora (en UTC) de cada descarga que hacemos del API de Bioportal, en un campo downloadedAt que le añadimos a cada récord;
  2. Hacer "check-in" de cada tal archivo (en formato CSV) al repositorio de Github;
  3. Generar un campo de bulletin_date sintético a partir de (a) convertir el valor de downloadedAt a horario de Puerto Rico, (b) truncarle los campos de hora para quedarnos solo con la fecha, y (c) restarle un día;
  4. Usar este campo bulletin_date para calcular los cambios de dato de día a día.

La desventaja de este método es que cuáles récords terminan adjudicándose a cúal bulletin_date resulta ser un artefactor de cuándo el autor de esta página realiza su descarga matutina de Bioportal.

La ventaja del método es que las alternativas son mucho más peores. Ninguno de los campos disponibles en las descargas en realidad permite ordenar los récords de manera fiable respecto a cuándo se marcó el resultado. Tras conversaciones con fuentes de entero crédito:

Revisión 8 de agosto del 2020

Antes de esta fecha se usaba el campo createdAt como la fecha de reporte de los resultados de pruebas descargados del API de Bioportal, porque el autor de este análisis inicialmente juzgó poco fiable el campo reportedDate dado a que para muchísimas pruebas exhibe valores más tempranos tanto que collectedDate que como createdAt. En "arroz y habichuelas":

Análisis más a fondo ha llevado al autor a revisar este supuesto y asignarle más fiabilidad al campo reportedDate que al createdAt, aunque aún queda claro por qué este segundo sería tan poco fiable. Por eso se ha cambiado a usar reportedDate como el campo de fecha de datos.

Este dashboard recalcula todos los datos retroactivamente para cada fecha de boletín, así que este cambio quiere decir que los cambios diarios entre fechas anteriores a esta revisión se han recalculado para reflejar esto, y así mismo los rezagos de pruebas, que bajo la nueva definición que aquí se adopta dan cifras mucho menores que bajo la definición anterior.

Del análisis de los datos se espera que este cambio mejore bastante el que reportes en fechas más tardías logren reproducir los valores calculados con datos de pruebas dispoibles solo hasta fechas pasadas, pero el autor ha logrado constatarse que esta reproducibilidad no se puede lograr 100% usando los datos de una sola descarga del API de Salud, porque no se provee ni un identificador único para cada prueba que permita detectar revisiones a su récord (que sí parecen haber), ni un campo de tiempo que aumente monotónicamente que permita segregar los récords respecto al tiempo de descarga de manera reproducible. Caveat emptor.

Cabe mencionar que el autor de esta página guarda un historial completo de todas las descargas que se han usado en esta página que como último recurso se pueden usar para lograr tal reproducibilidad, pero a costa de multiplicar enormemente el volumen de datos usado para generar este análisis. Al momento el autor juzga que esta vía no amerita el costo.

Revisión 3 de julio del 2020

Para el cálculo del rezago de muertes, se adoptron dos cambios:

  1. El mismo cambio de procedimento descrito abajo para el 5 de junio respecto a los casos confirmados y probables, que consiste en ignorar las restas;
  2. Excluir del cálculo de rezago de muertes todas las fechas hasta el 18 de abril (incluído), por adolecer estas de repetidos errores por parte de Salud.

Revisión 5 de junio del 2020

El método de cálculo de esta gráfica se revisó el 5 de junio y se aplicó el cambio retroactivamente a fechas anteriores. Antes de esa revisión, las fechas con números negativos se incorporaban en los totales, cosa que tendía a rebajar el estimado. Esto se hacía por entenderse que:

  1. Muchas de las restas correspondían no a casos nuevos sino a revisiones de fecha de casos conocidos;
  2. Las fechas en que aparecen sumas o ceros probablemente son resultado también en muchos casos de una combinación de sumas y restas, así que excluir las fechas que esos totales dan negativo en realidad no excluye todas las restas.

Se abandonó este procedimiento porque hubo boletines que claramente violaron el primer supuesto de manera tan crasa que daban estimado de rezago negativo. Después de la revisión sólo las sumas se toman en cuenta para calcular los rezagos de pruebas. El rezago de muertes sin embargo aun se calcula mediante el criterio original.

Terminología

Fecha de boletín

Las fechas que aparecen a la cabecera de los boletines que emite a diario el Departamento de Salud de Puerto Rico sobre los casos conocidos de COVID-19 en Puerto Rico. Estos boletines recopilan datos hasta la fecha anterior a cuando se publican; por ejemplo, el boletín que dice 2 de mayo se publicó el 3 de mayo.

ADVERTENCIA: Muchas bases de datos y reportajes usan la fecha que se publicó el boletín en vez de la fecha que dice este, y por eso atribuyen los mismos números aquí al próximo día.

Fecha de evento

La fecha en que en realidad sucedió un evento, según el boletín. Para las cifras de muertes, esta es la fecha en que sucedió la muerte. Para casos confirmados y probables, esto es la fecha en que se tomó muestra que se sometió a prueba. Los boletines no aclaran qué fecha se usa para pacientes a los cuales se les administró más de una prueba.

ADVERTENCIA: Muchas bases de datos y reportajes usan la fecha de boletín o anuncio en vez de la de evento, y por eso no coinciden con los resultados que da este análisis. Dar el análisis por fecha de evento en vez de boletín o anuncio es lo que motiva este proyecto.

Caso confirmado

Término que el Departamento de Salud de Puerto Rico usa para denominar a un paciente único que ha dado positivo a una prueba molecular (PCR) de SARS-CoV-2.

Caso probable

Este término ha tenido una historia problemática de uso por el Departamento de Salud de Puerto Rico. Del 10 de junio hasta el 4 de noviembre del 2020, Salud denominó "caso probable" a un paciente no duplicado que ha diera positivo a una prueba serológica. En esto el Departamento reclamaba cumplir con la guía del 5 de abril del 2020 del Consejo de Epidemiólogos Estatales y Territoriales (CSTE) de los EEUU, pero esta guía no de hecho no recomendaba la adjudicación de casos probable sólo con una prueba serológica positiva, sino que requería evidencia clínica o epidemiológica adicional a esta prueba. Por este motivo las cifras de casos "probables" que se reportaban eran artificialmente infladas.

El 5 de noviembre del 2020 el Departamento de Salud adoptó la segunda versión (5 de agosto del 2020) de la guía del Consejo de Epidemiólogos Estatales y Territoriales, que usa el término "caso probable" para denominar casos únicos con una prueba de antígenos positiva.

Esta página en su momento usó el término "caso probable" en el primer, mal sentido que hizo el Departamento de Salud de Puerto Rico, pero luego revisó todo retroactivamente para adaptarse a la nueva definición.