Sur les tests lisses d'ajustement dans le context des series chronologiques
Thèse ou mémoire
Résumé·s
La plupart des modèles en statistique classique repose sur une hypothèse sur
la distribution des données ou sur une distribution sous-jacente aux données. La
validité de cette hypothèse permet de faire de l’inférence, de construire des intervalles
de confiance ou encore de tester la fiabilité du modèle. La problématique
des tests d’ajustement vise à s’assurer de la conformité ou de la cohérence de
l’hypothèse avec les données disponibles. Dans la présente thèse, nous proposons
des tests d’ajustement à la loi normale dans le cadre des séries chronologiques
univariées et vectorielles. Nous nous sommes limités à une classe de séries chronologiques
linéaires, à savoir les modèles autorégressifs à moyenne mobile (ARMA
ou VARMA dans le cas vectoriel).
Dans un premier temps, au cas univarié, nous proposons une généralisation du
travail de Ducharme et Lafaye de Micheaux (2004) dans le cas où la moyenne est
inconnue et estimée. Nous avons estimé les paramètres par une méthode rarement
utilisée dans la littérature et pourtant asymptotiquement efficace. En effet, nous
avons rigoureusement montré que l’estimateur proposé par Brockwell et Davis
(1991, section 10.8) converge presque sûrement vers la vraie valeur inconnue du
paramètre. De plus, nous fournissons une preuve rigoureuse de l’inversibilité de
la matrice des variances et des covariances de la statistique de test à partir de
certaines propriétés d’algèbre linéaire. Le résultat s’applique aussi au cas où la
moyenne est supposée connue et égale à zéro. Enfin, nous proposons une méthode
de sélection de la dimension de la famille d’alternatives de type AIC, et nous
étudions les propriétés asymptotiques de cette méthode. L’outil proposé ici est
basé sur une famille spécifique de polynômes orthogonaux, à savoir les polynômes
de Legendre.
Dans un second temps, dans le cas vectoriel, nous proposons un test d’ajustement
pour les modèles autorégressifs à moyenne mobile avec une paramétrisation
structurée. La paramétrisation structurée permet de réduire le nombre élevé de paramètres dans ces modèles ou encore de tenir compte de certaines contraintes
particulières. Ce projet inclut le cas standard d’absence de paramétrisation. Le
test que nous proposons s’applique à une famille quelconque de fonctions orthogonales.
Nous illustrons cela dans le cas particulier des polynômes de Legendre
et d’Hermite. Dans le cas particulier des polynômes d’Hermite, nous montrons
que le test obtenu est invariant aux transformations affines et qu’il est en fait
une généralisation de nombreux tests existants dans la littérature. Ce projet peut
être vu comme une généralisation du premier dans trois directions, notamment le
passage de l’univarié au multivarié ; le choix d’une famille quelconque de fonctions
orthogonales ; et enfin la possibilité de spécifier des relations ou des contraintes
dans la formulation VARMA.
Nous avons procédé dans chacun des projets à une étude de simulation afin
d’évaluer le niveau et la puissance des tests proposés ainsi que de les comparer
aux tests existants. De plus des applications aux données réelles sont fournies.
Nous avons appliqué les tests à la prévision de la température moyenne annuelle
du globe terrestre (univarié), ainsi qu’aux données relatives au marché du travail
canadien (bivarié).
Ces travaux ont été exposés à plusieurs congrès (voir par exemple Tagne,
Duchesne et Lafaye de Micheaux (2013a, 2013b, 2014) pour plus de détails). Un
article basé sur le premier projet est également soumis dans une revue avec comité
de lecture (Voir Duchesne, Lafaye de Micheaux et Tagne (2016)). Several phenomena from natural and social sciences rely on distribution’s assumption
among which the normal distribution is the most popular. The validity
of that assumption is useful to setting up forecast intervals or for checking model
adequacy of the underlying model. The goodness-of-fit procedures are tools to
assess the adequacy of the data’s underlying assumptions. Autoregressive and moving
average time series models are often used to find the mathematical behavior
of these phenomena from natural and social sciences, and especially in the finance
area. These models are based on some assumptions including normality distribution
for the innovations. Normality assumption may be helpful for some testing
procedures. Furthermore, stronger conclusions can be drawn from the adjusted
model if the white noise can be assumed Gaussian. In this work, goodness-of-fit
tests for checking normality for the innovations from autoregressive moving average
time series models are proposed for both univariate and multivariate cases
(ARMA and VARMA models).
In our first project, a smooth test of normality for ARMA time series models
with unknown mean based on a least square type estimator is proposed.
We derive the asymptotic null distribution of the test statistic. The result here
is an extension of the paper of Ducharme et Lafaye de Micheaux (2004), where
they supposed the mean known and equal to zero. We use the least square type
estimator proposed by Brockwell et Davis (1991, section 10.8) and we provide a
rigorous proof that it is almost surely convergent. We show that the covariance
matrix of the test is nonsingular regardless if the mean is known. We have also
studied a data driven approach for the choice of the dimension of the family and
we gave a finite sample approximation of the null distribution. Finally, the finite
and asymptotic sample properties of the proposed test statistic are studied via a
small simulation study.
In the second project, goodness-of-fit tests for checking multivariate normality
for the innovations from vector autoregressive moving average time series
models are proposed. Since these time series models may rely on a large number
of parameters, structured parameterization of the functional form is allowed. The
methodology also relies on the smooth test paradigm and on families of orthonormal
functions with respect to the multivariate normal density. It is shown that
the smooth tests converge to convenient chi-square distributions asymptotically.
An important special case makes use of Hermite polynomials, and in that situation
we demonstrate that the tests are invariant under linear transformations.
We observed that the test is not invariant under linear transformations with Legendre
polynomials. A consistent data driven method is discussed to choose the
family order from the data. In a simulation study, exact levels are studied and
the empirical powers of the smooth tests are compared to those of other methods.
Finally, an application to real data is provided, specifically on Canadian labour
market data and annual global temperature.
These works were exposed at several meeting (see for example Tagne, Duchesne
and Lafaye de Micheaux (2013a, 2013b, 2014) for more details). A paper
based on the first project is submitted in a refereed journal (see Duchesne, Lafaye
de Micheaux et Tagne (2016)).
Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Il peut être utilisé dans le cadre d'une utilisation équitable et non commerciale, à des fins d'étude privée ou de recherche, de critique ou de compte-rendu comme le prévoit la Loi. Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.