Régression de Cox avec partitions latentes issues du modèle de Potts
Thèse ou mémoire
2019-07 (octroi du grade: 2019-10-30)
Auteur·e·s
Directeur·trice·s de recherche
Cycle d'études
MaîtriseProgramme
StatistiqueMots-clés
- analyse de survie
- modèle de Cox
- classification
- inférence bayésienne non paramétrique
- modèles de partition aléatoire
- modèle de Potts
- Cox model
- Clustering
- non parametric Bayesian inference
- Random Partition Models
- Potts model
- Proportional hazards models
- Cox regression model
- survival analysis
- Applied Sciences - Artificial Intelligence / Sciences appliqués et technologie - Intelligence artificielle (UMI : 0800)
Résumé·s
The goal of this research project is to develop a non-parametric Bayesian regression
model derived from random partitions in a survival analysis context. Our final objective is
to build a forecasting system that initially consists of grouping observations with similar
characteristics. Once subgroups are formed, survival within each subgroup is assessed using
a non-parametric Bayesian model.
The number of subgroups in the population is random. We propose the use of the Potts
classification model (Murua, Stanberry et Stuetzle) applied to the covariate space to generate the formation of random
partitions of individuals.
For any given partition, the model proposed in this project assumes a interval-wise Weibull
distribution for the baseline hazard rate inpired from the model first proposed by Ibrahim (Ibrahim 2001).
Estimates and inference are made using MCMC methods. We also use the Laplace
approximation method (Shun et McCullagh) to estimate some constants and propose parameter updates in
the application of the MCMC algorithm.
Finally, we compare the performance of our model with that of a classical Cox regression
and the non-parametric Bayesian model of product partition indexed by covariates, PPMx,
all this with the help of numerous simulations. In general, our model has delivered results
comparable to those of its competitors and has in some cases proven to be the best choice. Le but de ce projet de recherche est de développer un modèle de régression bayésien
non paramétrique issu de partitions aléatoires dans un contexte d’analyse de survie. Notre
objectif final est de construire un système de prévision qui dans un premier temps consiste
à regrouper les observations ayant des caractéristiques semblables. Une fois les sous-groupes
formés, la survie au sein de chaque sous-groupe est évaluée à l’aide d’un modèle bayésien
non paramétrique.
Le nombre de sous-groupes dans la population est aléatoire. Nous proposons l’utilisation
du modèle de classification de Potts (Murua, Stanberry et Stuetzle [29]) appliqué à
l’espace des covariables afin de générer la formation des partitions aléatoires d’individus.
Pour toute partition donnée, le modèle proposé dans ce projet suppose une régression de
Cox par intervalles avec taux de risque de base Weibull au sein de chaque grappe. Cette
méthodologie a été inspiré du travail de Ibrahim [18].
Les estimations et l’inférence sont effectuées à l’aide de méthodes MCMC. Nous utilisons
également la méthode d’approximation de Laplace (Shun et McCullagh [36]) pour estimer
certaines constantes et proposer des mises à jour de paramètres dans l’application de
l’algorithme MCMC.
Finalement, nous comparons les performances de notre modèle à celles d’une régression
de Cox classique et au modèle bayésien non paramétrique de partition-produit indexé par des
covariables, PPMx tout ceci à l’aide de nombreuses simulations. En général, notre modèle a
offert des résultats comparables à ceux de ses compétiteurs et s’est avéré dans certains cas
le meilleur choix.
Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Il peut être utilisé dans le cadre d'une utilisation équitable et non commerciale, à des fins d'étude privée ou de recherche, de critique ou de compte-rendu comme le prévoit la Loi. Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.