À compter du 6 février, nous devrons procéder à une interruption temporaire du dépôt de documents dans Papyrus, y compris les thèses et mémoires, le temps d’effectuer une migration de la plateforme vers le service de dépôt institutionnel canadien Scholaris. Le jeudi 6 février, le site sera inaccessible à partir de 7h00 et il sera de retour en fin d’après-midi. Par la suite, tout le contenu de Papyrus sera accessible durant les travaux qui devraient durer environ deux semaines. Pour toute question, contactez depot@bib.umontreal.ca -------- As of February 6, we will be temporarily suspending the deposit of documents in Papyrus, including theses and dissertations, while we migrate the platform to the Canadian institutional deposit service Scholaris. On Thursday February 6, the site will be inaccessible from 7:00 a.m. until late afternoon. Afterwards, all Papyrus content will be accessible during the work, which is expected to last around two weeks. If you have any questions, please contact depot@bib.umontreal.ca

Afficher la notice

dc.contributor.advisorGagnon, Philippe
dc.contributor.authorWang, Yuxi
dc.date.accessioned2023-05-16T18:54:04Z
dc.date.availableNO_RESTRICTIONfr
dc.date.available2023-05-16T18:54:04Z
dc.date.issued2023-02-22
dc.date.submitted2022-09
dc.identifier.urihttp://hdl.handle.net/1866/27966
dc.subjectBayesian statisticsfr
dc.subjectheavy-tailed distributionsfr
dc.subjectoutlier detectionfr
dc.subjectoutliersfr
dc.subjectPearson residualsfr
dc.subjectstatistiques bayésiennesfr
dc.subjectdistributions à ailes relevéesfr
dc.subjectdétection des valeurs aberrantesfr
dc.subjectvaleurs aberrantesfr
dc.subjectrésidus de Pearsonfr
dc.subject.otherStatistics / Statistiques (UMI : 0463)fr
dc.titleRobust gamma generalized linear models with applications in actuarial sciencefr
dc.typeThèse ou mémoire / Thesis or Dissertation
etd.degree.disciplineStatistiquefr
etd.degree.grantorUniversité de Montréalfr
etd.degree.levelMaîtrise / Master'sfr
etd.degree.nameM. Sc.fr
dcterms.abstractLes modèles linéaires généralisés (GLMs) constituent l’une des classes de modèles les plus populaires en statistique. Cette classe contient une grande variété de modèles de régression fréquemment utilisés, tels que la régression linéaire normale, la régression logistique et les gamma GLMs. Dans les GLMs, la distribution de la variable de réponse définit une famille exponentielle. Un désavantage de ces modèles est qu’ils ne sont pas robustes par rapport aux valeurs aberrantes. Pour les modèles comme la régression linéaire normale et les gamma GLMs, la non-robustesse est une conséquence des ailes exponentielles des densités. La différence entre les tendances de l’ensemble des données et celles des valeurs aberrantes donne lieu à des inférences et des prédictions biaisées. A notre connaissance, il n’existe pas d’approche bayésienne robuste spécifique pour les GLMs. La méthode la plus populaire est fréquentiste ; c’est celle de Cantoni and Ronchetti (2001). Leur approche consiste à adapter les M-estimateurs robustes pour la régression linéaire au contexte des GLMs. Cependant, leur estimateur est dérivé d’une modification de la dérivée de la log-vraisemblance, au lieu d’une modification de la vraisemblance (comme avec les M-estimateurs robustes pour la régression linéaire). Par conséquent, il n’est pas possible d’établir une correspondance claire entre la fonction modifiée à optimiser et un modèle. Le fait de proposer un modèle robuste présente deux avantages. Premièrement, il permet de comprendre et d’interpréter la modélisation. Deuxièmement, il permet l’analyse fréquentiste et bayésienne. La méthode que nous proposons s’inspire des idées de la régression linéaire robuste bayésienne. Nous adaptons l’approche proposée par Gagnon et al. (2020), qui consiste à utiliser une distribution normale modifiée avec des ailes plus relevées pour le terme d’erreur. Dans notre contexte, la distribution de la variable de réponse est une version modifiée où la partie centrale de la densité est conservée telle quelle, tandis que les extrémités sont remplacées par des ailes log-Pareto, se comportant comme (1/|x|)(1/ log |x|)λ. Ce mémoire se concentre sur les gamma GLMs. La performance est mesurée à la fois théoriquement et empiriquement, avec une analyse des données sur les coûts hospitaliers.fr
dcterms.abstractGeneralized linear models (GLMs) form one of the most popular classes of models in statistics. This class contains a large variety of commonly used regression models, such as normal linear regression, logistic regression and gamma GLMs. In GLMs, the response variable distribution defines an exponential family. A drawback of these models is that they are non-robust against outliers. For models like the normal linear regression and gamma GLMs, the non-robustness is a consequence of the exponential tails of the densities. The difference in trends in the bulk of the data and the outliers yields skewed inference and prediction. To our knowledge, there is no Bayesian robust approach specifically for GLMs. The most popular method is frequentist; it is that of Cantoni and Ronchetti (2001). Their approach is to adapt the robust M-estimators for linear regression to the context of GLMs. However, their estimator is derived from a modification of the derivative of the log-likelihood, instead of from a modification of the likelihood (as with robust M-estimators for linear regression). As a consequence, it is not possible to establish a clear correspondence between the modified function to optimize and a model. Having a robust model has two advantages. First, it allows for an understanding and an interpretation of the modelling. Second, it allows for both frequentist and Bayesian analysis. The method we propose is based on ideas from Bayesian robust linear regression. We adapt the approach proposed by Gagnon et al. (2020), which consists of using a modified normal distribution with heavier tails for the error term. In our context, the distribution of the response variable is a modified version where the central part of the density is kept as is, while the extremities are replaced by log-Pareto tails, behaving like (1/|x|)(1/ log |x|)λ. The focus of this thesis is on gamma GLMs. The performance is measured both theoretically and empirically, with an analysis of hospital costs data.fr
dcterms.languageengfr


Fichier·s constituant ce document

Vignette

Ce document figure dans la ou les collections suivantes

Afficher la notice

Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Il peut être utilisé dans le cadre d'une utilisation équitable et non commerciale, à des fins d'étude privée ou de recherche, de critique ou de compte-rendu comme le prévoit la Loi. Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.