Imputation en présence de données contenant des zéros
Thèse ou mémoire
2010-12 (octroi du grade: 2011-02-03)
Auteur·e·s
Directeur·trice·s de recherche
Cycle d'études
MaîtriseProgramme
StatistiqueMots-clés
- Imputation par la régression
- Imputation aléatoire
- Imputation déterministe
- Imputation aléatoire équilibrée
- Non-réponse partielle
- Jackknife
- Estimation de la Variance
- Regression imputation
- Random imputation
- Deterministic imputation
- Balanced random imputation
- Item nonresponse
- Jackknife
- Variance estimation
- Physical Sciences - Statistics / Sciences physiques - Statistiques (UMI : 0463)
Résumé·s
L’imputation simple est très souvent utilisée dans les enquêtes pour compenser
pour la non-réponse partielle. Dans certaines situations, la variable nécessitant
l’imputation prend des valeurs nulles un très grand nombre de fois. Ceci est très
fréquent dans les enquêtes entreprises qui collectent les variables économiques.
Dans ce mémoire, nous étudions les propriétés de deux méthodes d’imputation
souvent utilisées en pratique et nous montrons qu’elles produisent des estimateurs
imputés biaisés en général. Motivé par un modèle de mélange, nous proposons
trois méthodes d’imputation et étudions leurs propriétés en termes de biais.
Pour ces méthodes d’imputation, nous considérons un estimateur jackknife de la
variance convergent vers la vraie variance, sous l’hypothèse que la fraction de
sondage est négligeable. Finalement, nous effectuons une étude par simulation
pour étudier la performance des estimateurs ponctuels et de variance en termes
de biais et d’erreur quadratique moyenne. Single imputation is often used in surveys to compensate for item nonresponse.
In some cases, the variable requiring imputation contains a large amount
of zeroes. This is especially frequent in business surveys that collect economic
variables. In this thesis, we study the properties of two imputation procedures
frequently used in practice and show that they lead to biased estimators, in general.
Motivated by a mixture regression model, we then propose three imputation
procedures and study their properties in terms of bias. For the proposed imputation
procedures, we consider a jackknife variance estimator that is consistent
for the true variance, provided the overall sampling fraction is negligible. Finally,
we perform a simulation study to evaluate the performance of point and variance
estimators in terms of relative bias and mean square error.
Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Il peut être utilisé dans le cadre d'une utilisation équitable et non commerciale, à des fins d'étude privée ou de recherche, de critique ou de compte-rendu comme le prévoit la Loi. Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.