Les modèles ARIMA permettent de capturer la dépendance temporelle d’une série rendue stationnaire. Cependant, dans de nombreux phénomènes de santé publique, la dynamique des cas n’est pas seulement influencée par le passé récent, mais également par des cycles saisonniers. Par exemple, les épidémies de grippe reviennent chaque hiver, les cas de dengue augmentent chaque saison des pluies, et certaines mortalités peuvent suivre des variations saisonnières de température.

Pour modéliser ces motifs périodiques, on utilise une extension du modèle ARIMA : le modèle SARIMA (Seasonal AutoRegressive Integrated Moving Average), noté SARIMA(p, d, q)(P, D, Q)s.

Les principes du modèle SARIMA

Le modèle SARIMA combine la structure d’un modèle ARIMA(p,d,q) avec des composantes saisonnières. Trois nouveaux termes sont ajoutés, représentant la dépendance saisonnière :

  • : ordre de la composante autorégressive saisonnière ;
  • : ordre de la différenciation saisonnière ;
  • : ordre de la composante de moyenne mobile saisonnière ;
  • s : longueur du cycle saisonnier (par exemple, \(s = 12\) pour une série mensuelle, \(s = 52\) pour une série hebdomadaire annuelle).

Ce type de modèle est particulièrement adapté aux maladies cycliques (p. ex. grippe, bronchiolite, dengue, COVID-19), où les effets saisonniers se répètent à intervalles réguliers.

L’équation générale du modèle s’écrit :

$$\Phi_P(B^s) \phi_p(B) (1 – B)^d (1 – B^s)^D y_t = \Theta_Q(B^s) \theta_q(B) \varepsilon_t$$

où :

  • \(B\) est l’opérateur de retard \((By_t = y_{t-1})\) ;
  • \((1 – B)^d\) assure la différenciation classique pour supprimer les tendances ;
  • \((1 – B^s)^D\) effectue la différenciation saisonnière pour éliminer les cycles récurrents ;
  • \(\phi_p(B)\) et \(\theta_q(B)\) représentent les composantes AR et MA non saisonnières ;
  • \(\Phi_P(B^s)\) et \(\Theta_Q(B^s)\) représentent les composantes saisonnières.

Prenons une série mensuelle présentant des fluctuations récurrentes chaque année. Si la série suit un modèle SARIMA(1,1,1)(1,1,1)\(_{12}\) :

  • (1,1,1) correspond aux paramètres p, d et q d’un modèle ARIMA classique, qui capture donc la dépendance à court terme d’un mois à un autre ;
  • (1,1,1)\(_{12}\) correspond aux paramètres autorégressifs, de différenciation et de moyenne mobile, mais par rapport à la saisonnalité, soit ici un cycle annuel de 12 mois.

Le modèle combine :

  • une mémoire temporelle courte, entre mois consécutifs ;
  • une mémoire saisonnière longue, entre les mois d’une année à l’autre.