Les effets spatiaux permettent de reconnaître que les phénomènes observés dans le temps peuvent également être liés dans l’espace. Autrement dit, ce qui se passe dans une région donnée peut dépendre de ce qui se passe dans les régions voisines. Ce concept est crucial en santé publique, où la proximité géographique joue souvent un rôle déterminant dans la propagation de maladies.

Par exemple, lors d’une épidémie de dengue ou de COVID-19, une augmentation du nombre de cas dans une région urbaine densément peuplée peut entraîner, après un certain délai, une hausse dans les localités voisines.

Le modèle autorégressif spatio-temporel ou STAR

Le modèle STAR (Spatio-Temporal AutoRegressive) est un prolongement naturel des modèles de séries chronologiques. Il permet d’analyser comment les conditions observées dans un lieu donné influencent non seulement ce même lieu au fil du temps, mais aussi les régions voisines.

Concrètement, ce modèle tient compte à la fois :

  • de la dépendance temporelle, c’est-à-dire de l’influence des valeurs passées sur la valeur actuelle dans une même région ;
  • de la dépendance spatiale, c’est-à-dire l’influence exercée par les régions adjacentes.

Cette double perspective est particulièrement utile en épidémiologie, où les phénomènes de diffusion spatiale (déplacement de personnes, zones d’exposition communes, échanges entre municipalités) jouent un rôle clé.

Mathématiquement, une version simple de ce modèle se traduit par l’équation : Information

$$y_{it} = \alpha_i + \sum_{k=1}^{p} \beta_{ik} y_{i,t-k} + \gamma_i \sum_{j=1}^{m} M_{ij} y_{j,t-1} + \varepsilon_{it}$$

où :

  • \(i = 1, …, m\) désigne les unités spatiales (p. ex. régions, districts, comtés) ;
  • \(t = 1, …, T\) représente le temps (p ex. semaines, mois, années) ;
  • \(y_{i,t}\) est la valeur observée dans la région \(i\) au temps \(t\) (p. ex. le nombre de nouveaux cas hebdomadaires d’une maladie) ;
  • \(\alpha_i\) est une constante spécifique à la région \(\boldsymbol{i}\), qui capture ses particularités structurelles (p. ex. des différences de densité de population ou d’accès aux soins) ;
  • \(\beta_{ik}\) mesure la dépendance temporelle interne : il indique dans quelle mesure la valeur actuelle dépend des valeurs passées de la même région (comme dans un modèle AR(p)) ;
  • \(M_{ij}\) est un élément de la matrice de proximité spatiale, qui indique si deux régions sont voisines ou liées par une interaction (p. ex. \(M_{ij} = 1\) lorsque les régions \(i\) et \(j\) partagent une frontière, \(M_{ij} = 0\) dans les autres cas) ;
  • \(\gamma_i\) quantifie la force de l’influence spatiale : plus sa valeur est grande, plus les valeurs observées dans les régions voisines affectent la région \(i\) ;
  • \(\varepsilon_{i,t}\) représente la composante aléatoire résiduelle, supposée centrée (moyenne nulle) et indépendante entre les régions.

Une interprétation intuitive

Cette équation exprime que la valeur observée dans une région donnée \((y_{i,t})\) dépend de trois sources d’information :

  1. Son propre passé, donc les valeurs \(y_{i,t-k}\) qui traduisent une mémoire temporelle locale ;
  2. Les valeurs observées dans les régions voisines \((y_{j,t-1})\), pondérées par la matrice de proximité \(M_{ij}\) ;
  3. Une erreur aléatoire locale \((\varepsilon_{i,t})\), qui représente les fluctuations non expliquées par le modèle.

À retenir

Le modèle STAR combine le comportement d’un modèle autorégressif classique (AR) avec une interaction spatiale pondérée.

Un exemple pratique

Pour illustrer l’intégration des covariables et des effets spatiaux dans la modélisation temporelle, voici un exemple d’application à la surveillance de la COVID-19 aux États-Unis. Cet exemple est issu de l’article de Nasri et coll. Information

Graphique incidences hebdomadaires de COVID-19 prévues pour 100 000 habitants
Incidences hebdomadaires de COVID-19 prévues pour 100 000 habitants dans
5 comtés de l’état de New York, du 14 au 20 mai 2022

Ces prédictions ont été obtenues en utilisant un modèle AR-HMM avec covariables, appliqué à chacun des 58 comtés de l’État, \(i \in \{1, …, 58\}\).

Ce type de modèle permet de mieux capturer les changements de régimes épidémiques et les interactions spatiales entre régions voisines, tout en intégrant des variables explicatives contextuelles.

Le modèle combine :

  • une dépendance temporelle avec le modèle AR-HMM, avec une composante autorégressive d’ordre 2 \((p = 2)\) et 2 régimes, pour tenir compte de l’évolution des cas dans chaque comté ;
  • une dépendance spatiale, à travers une covariable \(Z_{it}\), qui capture l’influence des comtés voisins.

Cette covariable se définit comme suit :

$$Z_{it} = \sum_{j=1}^{58} M_{ij} y_{j,t-1}$$

où :

  • \(M_{ij}\) indique si deux comtés sont voisins (prend la valeur 1 s’ils partagent une frontière, 0 sinon) ;
  • \(y_{j,t-1}\) correspond au nombre de cas pour 1000 habitants dans le comté \(j\) à la semaine précédente.

Ainsi, \(Z_{i,t}\) correspond à la somme pondérée des incidences observées dans les comtés voisins, selon leur proximité. Autrement dit, cette covariable représente la pression épidémique externe exercée sur le comté \(i\) à la semaine précédente immédiat.

À retenir

Le modèle spatio-temporel de cet exemple est un peu plus complexe. Il s’agit d’un modèle AR-HMM avec covariables qui permet de prendre en compte deux types de dépendances :

  • les dynamiques locales internes, où chaque comté conserve une mémoire de sa propre situation épidémiologique récente ;
  • les influences spatiales, où la propagation des cas entre comtés voisins introduit une corrélation géographique, reflétant la diffusion régionale du virus.

En limitant volontairement le modèle à deux régimes (p. ex. phase calme et phase épidémique), cette approche illustre comment la combinaison des covariables spatio-temporelles et des modèles à changement de régimes permet d’obtenir des prévisions plus réalistes et adaptatives.

Ce type de modèle est particulièrement utile pour la planification des interventions régionales, car il permet de détecter non seulement les hausses locales de cas, mais aussi les risques de propagation vers les zones voisines.