Extended Bayesian endemic-epidemic models to incorporate mobility data into COVID-19 forecasting

Can J Stat. 2022 Sep;50(3):713-733. doi: 10.1002/cjs.11723. Epub 2022 Jul 27.

Abstract

Forecasting the number of daily COVID-19 cases is critical in the short-term planning of hospital and other public resources. One potentially important piece of information for forecasting COVID-19 cases is mobile device location data that measure the amount of time an individual spends at home. Endemic-epidemic (EE) time series models are recently proposed autoregressive models where the current mean case count is modelled as a weighted average of past case counts multiplied by an autoregressive rate, plus an endemic component. We extend EE models to include a distributed-lag model in order to investigate the association between mobility and the number of reported COVID-19 cases; we additionally include a weekly first-order random walk to capture additional temporal variation. Further, we introduce a shifted negative binomial weighting scheme for the past counts that is more flexible than previously proposed weighting schemes. We perform inference under a Bayesian framework to incorporate parameter uncertainty into model forecasts. We illustrate our methods using data from four US counties.

La prévision du nombre de cas quotidiens de COVID‐19 est cruciale pour la planification à court terme de ressources hospitalières et d'autres ressources publiques. Les données de localisation des téléphones mobiles qui mesurent le temps passé à la maison peuvent constituer un élément d'information important pour prédire les cas de COVID‐19. Les modèles de séries chronologiques endémiques‐épidémiques sont des modèles auto‐régressifs récents où le nombre moyen de cas en cours est modélisé comme une moyenne pondérée du nombre de cas antérieurs multipliée par un taux auto‐régressif (reproductif), plus une composante endémique. Les auteurs de ce travail généralisent les modèles endémiques‐épidémiques pour y inclure un modèle à décalage distribué, et ce, dans le but de tenir compte du lien entre la mobilité et le nombre de cas de COVID‐19 enregistrés. Pour saisir les variations de temps supplémentaires, ils y incorporent une marche hebdomadaire aléatoire d'ordre supérieur. De plus, ils proposent un schéma de pondération binomiale négative décalée pour les dénombrements passés, qui est plus flexible que les schémas de pondération existants. Ils utilisent l'inférence bayésienne afin d'intégrer l'incertitude des paramètres aux prédictions du modèle et ils illustrent les méthodes proposées avec des données provenant de quatre comtés américains.

Keywords: Autoregressive model; Bayesian prediction; distributed‐lag model; time series.