Using tweets to understand changes in the spatial crime distribution for hockey events in Vancouver

Can Geogr. 2018 Fall;62(3):338-351. doi: 10.1111/cag.12463. Epub 2018 Apr 25.

Abstract

The use of social media data for the spatial analysis of crime patterns during social events has proven to be instructive. This study analyzes the geography of crime considering hockey game days, criminal behaviour, and Twitter activity. Specifically, we consider the relationship between geolocated crime-related Twitter activity and crime. We analyze six property crime types that are aggregated to the dissemination area base unit in Vancouver, for two hockey seasons through a game and non-game temporal resolution. Using the same method, geolocated Twitter messages and environmental variables are aggregated to dissemination areas. We employ spatial clustering, dictionary-based mining for tweets, spatial autocorrelation, and global and local regression models (spatial lag and geographically weighted regression). Findings show an important influence of Twitter data for theft-from-vehicle and mischief, mostly on hockey game days. Relationships from the geographically weighted regression models indicate that tweets are a valuable independent variable that can be used in explaining and understanding crime patterns.

L'utilisation des données des médias sociaux pour l'analyse spatiale des tendances de la criminalité durant des activités sociales s'est avérée très instructive. Cette étude analyse la géographie de la criminalité compte tenu des journées où il y a une partie de hockey, le comportement criminel et l'activité sur Twitter. Plus précisément, nous examinons les relations entre la criminalité et l'activité sur Twitter reliée à la criminalité géolocalisée. Nous analysons six types de crimes contre les biens qui sont agrégés par aire de diffusion à Vancouver pour deux saisons de hockey au moyen d'une résolution temporelle avec et sans partie. Utilisant la même méthode, les messages géolocalisés sur Twitter et les variables environnementales sont agrégés aux aires de diffusion. Nous utilisons le regroupement spatial, l'extraction basée sur le dictionnaire pour les gazouillis, l'autocorrélation spatiale ainsi que les modèles locaux et globaux de régression (décalage spatial et régression pondérée géographiquement). Les conclusions indiquent une influence importante des données de Twitter pour les méfaits et les vols dans les véhicules, principalement lors des journées où il y a une partie de hockey. Les relations des modèles de régression pondérée géographiquement indiquent que les gazouillis sont une variable indépendante utile qui peut être utilisée pour expliquer et comprendre les tendances de la criminalité.

Keywords: Twitter; geographically weighted regression; hockey; spatial crime analysis.