Spatial heterogeneity of type I error for local cluster detection tests

Aline Guttmann; Xinran Li; Jean Gaudart; Yan Gérard; Jacques Demongeot; Jean-Yves Boire; Lemlih Ouchchane

doi:10.1186/1476-072X-13-15

Spatial heterogeneity of type I error for local cluster detection tests

Int J Health Geogr. 2014 May 27:13:15. doi: 10.1186/1476-072X-13-15.

Authors

Aline Guttmann¹, Xinran Li, Jean Gaudart, Yan Gérard, Jacques Demongeot, Jean-Yves Boire, Lemlih Ouchchane

Affiliation

¹ Department of Biostatistics, Medical Informatics and Communication Technologies, Clermont University Hospital, Clermont-Ferrand F-63000, France. aline.guttmann@udamail.fr.

Abstract
in English, French

Background: Just as power, type I error of cluster detection tests (CDTs) should be spatially assessed. Indeed, CDTs' type I error and power have both a spatial component as CDTs both detect and locate clusters. In the case of type I error, the spatial distribution of wrongly detected clusters (WDCs) can be particularly affected by edge effect. This simulation study aims to describe the spatial distribution of WDCs and to confirm and quantify the presence of edge effect.

Methods: A simulation of 40 000 datasets has been performed under the null hypothesis of risk homogeneity. The simulation design used realistic parameters from survey data on birth defects, and in particular, two baseline risks. The simulated datasets were analyzed using the Kulldorff's spatial scan as a commonly used test whose behavior is otherwise well known. To describe the spatial distribution of type I error, we defined the participation rate for each spatial unit of the region. We used this indicator in a new statistical test proposed to confirm, as well as quantify, the edge effect.

Results: The predefined type I error of 5% was respected for both baseline risks. Results showed strong edge effect in participation rates, with a descending gradient from center to edge, and WDCs more often centrally situated.

Conclusions: In routine analysis of real data, clusters on the edge of the region should be carefully considered as they rarely occur when there is no cluster. Further work is needed to combine results from power studies with this work in order to optimize CDTs performance.

Contexte: Les tests de détection de clusters (CDT) permettent à la fois de détecter et de localiser les clusters. Au même titre que pour la puissance, il est donc nécessaire d’étudier la répartition spatiale de l’erreur de type I de ces CDT. Dans le cas de l’erreur de type I, la répartition spatiale des clusters détectés à tort (WDC) peut être particulièrement concernée par un effet de bord. Cette étude de simulation a pour objectif de décrire la distribution spatiale des WDCs et de confirmer et quantifier la présence de cet effet de bord.

Méthodes: Ce travail s’appuie sur la synthèse de 40 000 jeux de données simulant l’hypothèse nulle d’homogénéité spatiale des risques. Les simulations étaient fondées sur les paramètres réels de données d’un registre de malformations congénitales, et notamment sur deux risques de base réels. La description de la distribution spatiale de l’erreur de type I nous a conduits à définir le concept de taux de participation de chaque unité spatiale de la région. Cet indicateur a ensuite été intégré pour la construction d’un nouveau test statistique destiné à confirmer et quantifier l’effet de bord.

Résultats: La valeur globale de l’erreur de type I à 5% a bien été retrouvée. Les résultats montraient un très net effet de bord avec un gradient décroissant du taux de participation depuis le centre vers le bord, les WDC étant plus souvent situés en zone centrale.

Conclusions: Lors de la mise en œuvre des CDT sur données réelles, les détections de clusters près du bord d’une région d’étude doivent être examinées avec la plus grande attention, ces dernières étant très rares en l’absence de cluster réel. Il est maintenant nécessaire d’orienter de futurs développements vers la combinaison de ces résultats à ceux des études de puissance, et ce dans le but d’optimiser les performances des CDT.

MeSH terms

Cluster Analysis*
Congenital Abnormalities / diagnosis
Congenital Abnormalities / epidemiology*
Databases, Factual / standards
France / epidemiology
Humans
Research Design* / standards
Risk Factors
Spatial Analysis*

Abstract in English, French

MeSH terms

Abstract
in English, French