1. Exploration de la série
- Visualiser la série sur plusieurs années pour identifier des motifs récurrents.
- Observer les graphiques ACF et PACF : la présence de pics réguliers aux multiples du lag suggère une composante saisonnière.
- Effectuer les tests de stationnarité (ADF, KPSS), même après différenciation si nécessaire.
Les graphiques suivants illustrent une série simulée selon un modèle SARIMA(1,1,1) (1,1,1)12.


Comme dans le modèle ARIMA, l’ACF décroît lentement. On peut donc être tenté d’appliquer une première différenciation.


On voit qu’avec une seule différenciation, on obtient l’ACF typique d’un modèle à saisonnalité 12, avec des pics à 12 et 24.
En faisant une dérivée saisonnière d’ordre 12, on obtient finalement l’ACF d’une série qui semble saisonnière.
2. Estimation des paramètres
- Ajuster plusieurs modèles candidats, comme SARIMA(0,1,1)(0,1,1)\(_{12}\), SARIMA(1,0,1)(1,1,0)\(_{12}\), etc.
- Estimer les coefficients saisonniers \((\Phi_p, \Theta_q)\) et non saisonniers \((\phi_p, \theta_q)\).
3. Validation
- Examiner les résidus : ils doivent présenter un comportement de bruit blanc (absence d’autocorrélation résiduelle).
- Comparer les modèles selon les critères AIC et BIC, les valeurs les plus faibles indiquant le meilleur compromis.
- Vérifier la capacité prédictive du modèle sur une période de validation (prévision sur valeurs actuelles et valeurs futures).
Remarque
Un exemple pratique
L’application Shiny
suivante vous permet d’explorer de manière interactive les différences entre les modèles ARMA, ARIMA et SARIMA, à partir d’une série simulée représentant les cas bihebdomadaires de dengue entre 2015 et 2022.
L’application permet :
- de visualiser la série, sa décomposition en tendance et en saisonnalité, l’ajustement du modèle et les prévisions futures ;
- de sélectionner différents modèles (ARMA, ARIMA ou SARIMA) et de comparer leurs performances de prédiction ;
- d’interpréter les résultats à l’aide des messages de diagnostic : stationnarité, autocorrélation résiduelle et adéquation du modèle (AIC).
Voici les manipulations que vous pouvez faire dans l’application :
Quatre onglets présentent les principales étapes de l’analyse de séries temporelles :
- Série et diagnostic initial : visualisation de la série originale et des fonctions ACF/PACF.
- Décomposition de la série : séparation en tendance, saisonnalité et bruit aléatoire.
- Modélisation : ajustement du modèle choisi et analyse des résidus.
- Prévisions : extrapolation sur la période 2023-2024.
Le menu déroulant « Choisir un modèle » permet de sélectionner un modèle parmi six options possibles :
- ARMA(1,1) ou ARMA(2,2) : modèles de base pour séries stationnaires ;
- ARIMA(1,1,1) ou ARIMA(2,1,2) : modèles avec différenciation pour supprimer la tendance ;
- SARIMA(0,1,1)(0,1,1)26 ou SARIMA(2,1,2)(1,1,1)26 : modèles saisonniers adaptés aux séries présentant des cycles réguliers.
Lorsqu’on clique sur le bouton « Appliquer le modèle », les caractéristiques et les indicateurs de diagnostic du modèle choisi apparaissent dans l’ordre suivant :
- le nombre de paramètres estimés (encadré bleu) ;
- les valeurs des critères AIC/BIC (encadré vert) ;
- le résultat du test d’autocorrélation des résidus :
- un encadré rouge s’affiche lorsque des autocorrélations résiduelles persistent (modèle inadéquat) ;
- un encadré vert confirme un modèle bien ajusté.
Quelques commentaires sur les résultats obtenus
Les modèles ARMA échouent à prendre en compte les tendances et à reproduire la saisonnalité, laissant une non-stationnarité et une autocorrélation résiduelle importantes.
Les modèles ARIMA corrigent la tendance, mais pas les cycles saisonniers : leurs prévisions demeurent imprécises à long terme, ce qui se traduit par une ligne droite, sans variations saisonnières.
Les modèles SARIMA, en revanche, captent à la fois la dépendance temporelle et la périodicité annuelle des cas de dengue, produisant des ajustements et des prévisions plus réalistes.
À noter que le modèle SARIMA(2,1,2)(1,1,1)26 peut prendre légèrement plus de temps à s’exécuter, car il comporte davantage de paramètres à estimer.
Remarque à propos de l’onglet « Prévisions »
Un exemple pratique
Dai et coll. (2024)
ont utilisé un modèle SARIMA(2,1,1)(1,1,1)12 pour analyser et prévoir la mortalité mensuelle toutes causes confondues en Chine entre 2013 et 2022.
Les chercheurs ont observé :
- une tendance à la hausse à long terme, associée au vieillissement démographique ;
- une saisonnalité marquée, avec des pics de mortalité récurrents en hiver ;
- une forte corrélation entre années successives, reflétant un effet saisonnier persistant.
Le modèle SARIMA a permis :
- de capturer ces variations cycliques tout en tenant compte de la tendance ;
- de produire des prévisions fiables de mortalité future.
Dans une autre étude dans la province de Jiangsu (Chine), Wang et coll. (2024)
ont appliqué un modèle SARIMA(4,1,0)(4,1,0)12 pour prédire les nouvelles infections mensuelles de syphilis entre 2014 et 2022.
Les principales observations étaient :
- une hausse progressive du nombre de cas jusqu’en 2019, suivie d’une baisse pendant la pandémie de COVID-19 ;
- une forte composante saisonnière, avec des pics au printemps et à l’automne.
Le modèle SARIMA, bien que déjà complexe, performait bien sur les données observées, mais avait de faibles performances prédictives sur des valeurs futures. Les auteurs ont proposé d’autres approches plus robustes, telles qu’une combinaison de modèles SARIMA et d’outils d’apprentissage automatique, comme les réseaux de neurones.
Ces travaux montrent que le modèle SARIMA peut être un outil flexible et performant pour la surveillance et la planification en santé publique, notamment lorsqu’il s’agit d’anticiper les cycles saisonniers des maladies infectieuses.
À retenir
- Les modèles ARIMA traitent les dépendances temporelles en tenant compte des tendances, avec une correction de la non-stationnarité.
- Les modèles SARIMA vont plus loin en intégrant les cycles saisonniers récurrents. En combinant les deux dimensions (temps court et saisonnalité), ils offrent une description plus réaliste des dynamiques observées en santé publique.
- En pratique, les modèles peuvent être facilement ajustés et comparés, notamment à l’aide du logiciel R et de la fonction arima().