Analyse bayésienne et classification pour modèles continus modifiés à zéro

Labrecque-Synnott, Félix

dc.contributor.advisor	Angers, Jean-François
dc.contributor.author	Labrecque-Synnott, Félix
dc.date.accessioned	2010-11-15T19:28:40Z
dc.date.available	NO_RESTRICTION	en
dc.date.available	2010-11-15T19:28:40Z
dc.date.issued	2010-10-07
dc.date.submitted	2010-08
dc.identifier.uri	http://hdl.handle.net/1866/4291
dc.subject	Sous-représentation à zéro	en
dc.subject	Zero-deflation	en
dc.subject	Agrégation bayésienne	en
dc.subject	Bayesian aggregation	en
dc.subject	Précipitations agrégées	en
dc.subject	Aggregated rainfall	en
dc.subject	Distribution de Laplace tronquée	en
dc.subject	Truncated Laplace distribution	en
dc.subject	Algorithme EM	en
dc.subject	EM algorithm	en
dc.subject	Modèles de mélanges	en
dc.subject	Mixture models	en
dc.subject.other	Physical Sciences - Statistics / Sciences physiques - Statistiques (UMI : 0463)	en
dc.title	Analyse bayésienne et classification pour modèles continus modifiés à zéro	en
dc.type	Thèse ou mémoire / Thesis or Dissertation
etd.degree.discipline	Statistique	en
etd.degree.grantor	Université de Montréal	fr
etd.degree.level	Doctorat / Doctoral	en
etd.degree.name	Ph. D.	en
dcterms.abstract	Les modèles à sur-représentation de zéros discrets et continus ont une large gamme d'applications et leurs propriétés sont bien connues. Bien qu'il existe des travaux portant sur les modèles discrets à sous-représentation de zéro et modifiés à zéro, la formulation usuelle des modèles continus à sur-représentation -- un mélange entre une densité continue et une masse de Dirac -- empêche de les généraliser afin de couvrir le cas de la sous-représentation de zéros. Une formulation alternative des modèles continus à sur-représentation de zéros, pouvant aisément être généralisée au cas de la sous-représentation, est présentée ici. L'estimation est d'abord abordée sous le paradigme classique, et plusieurs méthodes d'obtention des estimateurs du maximum de vraisemblance sont proposées. Le problème de l'estimation ponctuelle est également considéré du point de vue bayésien. Des tests d'hypothèses classiques et bayésiens visant à déterminer si des données sont à sur- ou sous-représentation de zéros sont présentées. Les méthodes d'estimation et de tests sont aussi évaluées au moyen d'études de simulation et appliquées à des données de précipitation agrégées. Les diverses méthodes s'accordent sur la sous-représentation de zéros des données, démontrant la pertinence du modèle proposé. Nous considérons ensuite la classification d'échantillons de données à sous-représentation de zéros. De telles données étant fortement non normales, il est possible de croire que les méthodes courantes de détermination du nombre de grappes s'avèrent peu performantes. Nous affirmons que la classification bayésienne, basée sur la distribution marginale des observations, tiendrait compte des particularités du modèle, ce qui se traduirait par une meilleure performance. Plusieurs méthodes de classification sont comparées au moyen d'une étude de simulation, et la méthode proposée est appliquée à des données de précipitation agrégées provenant de 28 stations de mesure en Colombie-Britannique.	en
dcterms.abstract	Zero-inflated models, both discrete and continuous, have a large variety of applications and fairly well-known properties. Some work has been done on zero-deflated and zero-modified discrete models. The usual formulation of continuous zero-inflated models -- a mixture between a continuous density and a Dirac mass at zero -- precludes their extension to cover the zero-deflated case. We introduce an alternative formulation of zero-inflated continuous models, along with a natural extension to the zero-deflated case. Parameter estimation is first studied within the classical frequentist framework. Several methods for obtaining the maximum likelihood estimators are proposed. The problem of point estimation is considered from a Bayesian point of view. Hypothesis testing, aiming at determining whether data are zero-inflated, zero-deflated or not zero-modified, is also considered under both the classical and Bayesian paradigms. The proposed estimation and testing methods are assessed through simulation studies and applied to aggregated rainfall data. The data is shown to be zero-deflated, demonstrating the relevance of the proposed model. We next consider the clustering of samples of zero-deflated data. Such data present strong non-normality. Therefore, the usual methods for determining the number of clusters are expected to perform poorly. We argue that Bayesian clustering based on the marginal distribution of the observations would take into account the particularities of the model and exhibit better performance. Several clustering methods are compared using a simulation study. The proposed method is applied to aggregated rainfall data sampled from 28 measuring stations in British Columbia.	en
dcterms.language	fra	en

Files in this item

Name:: Labrecque-Synnott_Felix_2010_t ...
Size:: 844.9Kb
Format:: PDF
Description:: Thèse

This item appears in the following Collection(s)

Thèses et mémoires électroniques de l’Université de Montréal [23686]
Faculté des arts et des sciences – Département de mathématiques et de statistique – Thèses et mémoires [508]

Show item record

This document disseminated on Papyrus is the exclusive property of the copyright holders and is protected by the Copyright Act (R.S.C. 1985, c. C-42). It may be used for fair dealing and non-commercial purposes, for private study or research, criticism and review as provided by law. For any other use, written authorization from the copyright holders is required.