[Availability of open data related to COVID-19 in the web portals of the Spanish regions and the Ministry of Health]

Rev Esp Salud Publica. 2021 Dec 2:95:e202112190.
[Article in Spanish]

Abstract

Objective: Having certain open data means that this data is accessible and available to everyone, without legal or technical restrictions. The public sector produces a wide variety of information (social, economic, health, statistical) that is attractive, complete and reliable, coming directly from official sources. The aim of this study was to show the open data related to COVID-19 published by the regions of Spain and the Ministry of Health, and compare these data.

Methods: Each of the open portals was accessed and an observation of the published data was made, analyzing since when they were published and their periodicity in the update. The Tim Berners-Lee tool was used to classify the degree of reuse of the data. Regarding the statistical treatment, a frequency analysis was carried out, to analyze which data are given in a greater number of times.

Results: 15 regions publish open data related to COVID-19, as well as the Ministry of Health. The contents shown in the open data portals varied from one autonomous community to another, but the regions provided data confirmed by PCR. The data collection start date and the updating of the data varied.

Conclusions: There is an enormous diversity among de regions in terms of the publication of COVID data, in relation to indicators, dates. It shows a great existence of data and in reusable format, but you have to go to many sources to obtain information of the epidemiological situation at a national level.

Objetivo: Disponer de determinados datos abiertos supone que estos datos sean accesibles y estén disponibles para todo el mundo, sin restricciones legales ni técnicas. El sector público produce una gran variedad de información (social, económica, sanitaria, estadística) que es atractiva, completa y fiable al proceder directamente de fuentes oficiales. El objetivo de este estudio fue mostrar los datos abiertos relacionados con la COVID-19 publicados por las comunidades autónomas (en adelante CC. AA.) y el Ministerio de Sanidad, y comparar estos datos.

Metodos: Se accedió a cada uno de los portales abiertos y se realizó una observación de los datos publicados, analizando desde cuándo se publican y su periodicidad en la actualización. Se utilizó la herramienta de Tim Berners-Lee para la clasificación del grado de reutilización de los datos. En cuanto al tratamiento estadístico, se realizó un análisis de frecuencia, para analizar qué datos se dan en un mayor número de veces.

Resultados: 15 comunidades autónomas (CC. AA.) publicaron datos abiertos relacionados con la COVID-19 en diferentes formatos, así como el Ministerio de Sanidad. Los contenidos que se mostraron en los portales de datos abiertos variaron de una comunidad autónoma a otra, pero todas las CC.AA ofrecieron datos confirmados por PCR. Lo que variaba era la fecha de inicio de recogida de datos y la actualización de los mismos.

Conclusiones: Existe gran heterogeneidad entre las CC. AA., en cuanto a la publicación de la información de casos de COVID-19, en relación a indicadores, fechas, etc. Se pone de manifiesto una gran existencia de datos y en formatos reutilizables, pero hay que ir a muchas fuentes para obtener información sobre la situación epidemiológica a nivel nacional.

Keywords: COVID-19; Open data; Publication; Spain.

MeSH terms

  • COVID-19*
  • Humans
  • SARS-CoV-2
  • Spain