Show item record

dc.contributor.advisorMajor, François
dc.contributor.authorMalric, Philippe
dc.date.accessioned2019-07-09T16:38:04Z
dc.date.availableNO_RESTRICTIONfr
dc.date.available2019-07-09T16:38:04Z
dc.date.issued2019-03-07
dc.date.submitted2018-10
dc.identifier.urihttp://hdl.handle.net/1866/22275
dc.subjectARNfr
dc.subjectSous-structurefr
dc.subjectStructure secondairefr
dc.subjectSHAPEfr
dc.subjectEternafr
dc.subjectRMDBfr
dc.subjectRNAfr
dc.subjectSub-structurefr
dc.subjectSecondary structurefr
dc.subject.otherChemistry - Biochemistry / Chimie - Biochimie (UMI : 0487)fr
dc.titlePrédiction et visualisation de la réactivité chimique des ARN. Proposition d’un modèle basé sur la réactivité : des cycles minimaux et des sous-structures composées de ces cyclesfr
dc.typeThèse ou mémoire / Thesis or Dissertation
etd.degree.disciplineBio-informatiquefr
etd.degree.grantorUniversité de Montréalfr
etd.degree.levelMaîtrise / Master'sfr
etd.degree.nameM. Sc.fr
dcterms.abstractMesurer la réactivité chimique d’un nucléotide d’une séquence d’ARN permet d’inférer sa conformation locale. L’interprétation la plus simple de la conformation locale d’un nucléotide est de le qualifier par le terme pairé ou non pairé. Bien qu’ils soient reliés à la réactivité chimique des nucléotides, ces deux états ne l’expliquent pas entièrement. Actuellement, la « RNA mapping database » (RMDB) contient 136 892 séquences sondées dans différentes conditions, ce qui donne un bon jeu de données pour étudier la structure des ARN en utilisant des algorithmes d’apprentissages machines. Dans mon projet de recherche, j’ai tenté de prédire et de comprendre la réactivité ou la non-réactivité des nucléotides à partir de plusieurs ensembles de données obtenues de la RMDB. Pour cela, j’ai utilisé deux algorithmes de repliement des ARN en structures secondaires : MCFlashFold du laboratoire de Dr François Major et RNAsubopt de la collection Vienna package. L’originalité de mon projet de recherche est qu’il se base sur une abstraction des composants de la structure secondaire, les cycles et les sous-structures, pour caractériser les nucléotides. Dans ce mémoire, je démontre que la majorité des valeurs de réactivités discrètes (hautes/basses) des nucléotides peuvent être prédites, bien que certaines valeurs soient surprenantes. En effet, dans l’ensemble de donnés testé, il y a plus de nucléotides peu réactifs non pairés que de nucléotides réactifs non pairés. Il est donc légitime de se poser la question suivante : peut-on améliorer ces résultats? La réponse est oui et le modèle que j’ai utilisé pour le démontrer utilise des cycles minimaux au lieu des paires de bases. En titre d’illustration suivez : http://majsrv1.iric.ca:3000/RDV .fr
dcterms.abstractMeasuring the chemical reactivity of a nucleotide within a sequence allows to infer the local conformation of a nucleotide most of the time. The simplest interpretation of the local conformation of a nucleotide is by the terms paired or non-paired. However, these two states do not fully explain the reactivity of nucleotides in chemical probing experiments. Currently, the RNA mapping database (RMDB) contains 136,892 sequences probed under different conditions, which provides us a relatively good data set to learn using machine learning algorithms. In my research project, I attempted to predict and understand the reactivity or non-reactivity of nucleotides of thousands of RNA obtained from RMDB. For this, I used two secondary structure RNA folding algorithms: MCFlashFold from Dr. François Major's laboratory and RNAsubopt from the Vienna package collection. The originality of my project is that it is based on two abstractions of the secondary structure called cycle and substructure. In this thesis, I demonstrate that the majority of the discretized (high / low) reactivity values of nucleotides can be predicted, but not all. In fact, in the tested dataset, there are more predicted paired than predicted non-paired nucleotides that are reactive to 1m7. As I show here, this result can be improved by using minimum cycle instead of base pair. The newly developed interface, named RDV, allows to quickly and easily compare homolog nucleotides between RNA. (See: http://majsrv1.iric.ca:3000/RDV ).fr
dcterms.languagefrafr
UdeM.ORCIDAuteurThese0000-0002-4335-7881fr


Files in this item

Thumbnail
File
File

This item appears in the following Collection(s)

Show item record