Les tests de stationnarité permettent de déterminer si les fluctuations observées dans une série chronologique proviennent d’un comportement stable dans le temps ou d’une évolution structurelle (tendance, rupture ou saisonnalité). En d’autres mots, ils aident à savoir si la série « revient naturellement » vers un certain niveau moyen ou si elle dérive de manière imprévisible.

Dans le contexte épidémiologique, cette distinction est essentielle : une hausse du nombre de cas peut traduire une simple fluctuation aléatoire (série stationnaire) ou annoncer une transformation durable du système de transmission (non-stationnarité). Identifier correctement ce comportement permet d’adapter les modèles de prévision et de mieux planifier les interventions de santé publique.

Le test ADF (Augmented Dickey–Fuller)

Le test de Dickey–Fuller Information augmenté est l’un des outils les plus utilisés pour détecter la présence d’une racine unitaire, c’est-à-dire un processus qui ne tend pas à revenir naturellement vers une moyenne stable, autrement dit, une série non stationnaire.

Le principe derrière ce test est de supposer que la série différenciée \(\Delta y_t = y_t – y_{t-1}\) est un modèle de type autorégressif d’ordre \(p\). Il repose sur la régression suivante :

$$\Delta y_t = \mu + \gamma y_{t-1} + \phi_1\Delta y_{t-1} + \cdots + \phi_p\Delta y_{t-p} + \varepsilon_t$$

où :

  • \(\Delta y_t = y_t – y_{t-1}\) est la différence première, utilisée pour stabiliser la série ;
  • \(\mu\) est une constante liée à la moyenne,
  • \(\gamma\) mesure la tendance au retour vers l’équilibre, ou « force de rappel » ;
  • les \(\phi_i\) représentent les composantes autorégressives (AR) d’ordre \(p\), c’est-à-dire l’influence des variations passées sur la variation actuelle ;
  • \(\varepsilon_t\) est le terme d’erreur aléatoire.

Rappel : exemple de non-stationnarité par non-respect des conditions sur les coefficients

Dans un modèle AR(1) stationnaire, la série revient graduellement vers sa moyenne si le coefficient \(\phi_1 < 1\). Lorsqu’une racine unitaire est présente \((\phi_1 = 1)\), la série devient une marche aléatoire : les chocs passés s’accumulent sans retour à l’équilibre.

Dans le test ADF, l’hypothèse nulle à tester est \(H_0 : \gamma = 0\), ce qui signifie que la série contient une racine unitaire (non stationnaire). L’hypothèse alternative \(H_1 : \gamma < 0\) indique que la série est stationnaire.

En pratique :

  • Si la p-valeur est inférieure au seuil de significativité (généralement < 0,05), on rejette \(H_0\) et on conclut que la série est stationnaire.
  • Si la p-valeur est élevée, on ne rejette pas \(H_0\), la série est alors probablement non stationnaire.

Cependant, ce test peut manquer de puissance dans le cas de petites séries ou lorsque la tendance est très lente. De plus, même si l’hypothèse de racine unitaire est rejetée, cela ne garantit pas que toutes les conditions de stationnarité sont remplies, les coefficients autorégressifs doivent encore satisfaire les contraintes vues précédemment (p. ex. \(-1 < \phi_1 < 1\)).

Le test KPSS (Kwiatkowski-Phillips-Schmidt-Shin)

Le test KPSS Information adopte une logique inverse : il considère la stationnarité comme une hypothèse nulle. Il sert à vérifier si la série oscille autour d’une moyenne constante ou d’une tendance déterministe stable.

Ce test examine principalement la stabilité de la variance autour d’un niveau moyen. Il est donc utile pour détecter des structures de tendance lente, des ruptures ou des modèles cycliques. Par exemple, dans le cas de la dengue, il permet de vérifier si le nombre moyen de cas demeure relativement constant au fil des années, malgré des fluctuations saisonnières.

En pratique :

  • Si la p-valeur est élevée, cela suggère que la série est stationnaire. 
  • Si la p-valeur est faible et inférieure au seuil de significativité, cela indique qu’elle présente une dérive temporelle ou une variance instable.

Le test KPSS est souvent plus sensible que le test ADF aux dérives progressives ou aux changements structurels, ce qui en fait un bon complément à ce dernier.

Complémentarité entre les deux tests

L’utilisation conjointe des tests ADF et KPSS permet d’obtenir une évaluation plus robuste de la stationnarité.

Résultat ADF Résultat KPSS Interprétation
Significatif
(stationnaire)
Non significatif
(stationnaire)
Série stationnaire
Non significatif
(non stationnaire)
Significatif
(non stationnaire)
Série non stationnaire
Résultats contradictoires Résultats contradictoires Examiner les graphiques ACF/PACF ; différencier la série ; utiliser d’autres tests.

En utilisant ces deux tests conjointement, on peut obtenir une image plus complète de la nature de la stationnarité d’une série chronologique, en distinguant les séries qui sont simplement stables autour d’une tendance des séries où les chocs ont des effets permanents. Cela aide à choisir les méthodes appropriées de transformation pour avoir des analyses prédictives fiables.

Cette complémentarité est particulièrement utile en santé publique, où les séries temporelles (par exemple les cas de dengue ou les hospitalisations) présentent souvent une combinaison de saisonnalité, de tendance structurelle et de bruit aléatoire.

D’autres tests Information peuvent être utiles pour détecter des changements subtils avec des structures de données complexes ; ces tests sont plus performants, mais également plus difficiles à implémenter.

Remarque

Dans les analyses sur données réelles, on ne connaît pas le mécanisme générateur des données. Les graphiques d’autocorrélation (ACF) et d’autocorrélation partielle (PACF) servent donc souvent de première évaluation visuelle.

Les tests ADF et KPSS viennent ensuite confirmer ces observations pour guider le choix et les spécificités du modèle, ainsi que les transformations à appliquer si nécessaire.