Séquençage d’exomes d’une cohorte de familles caucasiennes simplex dont les patients sont atteints du syndrome d’interruption de la tige hypophysaire
Thesis or Dissertation
2017-04 (degree granted: 2019-03-07)
Author(s)
Advisor(s)
Level
Master'sDiscipline
Bio-informatiqueKeywords
- Tige hypophysaire
- PSIS
- WES
- CNV
- NGS
- GATK
- Bowtie2
- Freebayes
- SAMtools
- BWA
- CoNIFER
- fishingCNV
- xHmm
- IRM
- GH, SNP,
- SNP
- Séquençage
- Exome
- Génomique
- Pipeline
- Syndrome
- Désordre
- Rare
- Pituitary stalk
- Disorder
- Endocrine
- MRI
- Magnetic
- Resonance
- Growth
- Hormone
- Genomic
- Mutation
- Biology - Bioinformatics / Biologie - Bio-informatique (UMI : 0715)
Abstract(s)
Le syndrome d’interruption de la tige hypophysaire (PSIS) est un désordre rare qui affecte la
fonction du système endocrinien. Jusqu’à nos jours, l’imagerie par la résonance magnétique (IRM)
demeure la méthode la plus entreprise afin d’évaluer in vivo l’anomalie d’organogenèse de la tige
hypophysaire chez les patients. L’absence de la tige caractérise une déficience permanente en
hormone de croissance (GH) pendant que l’étiologie du syndrome demeure inconnue. PSIS se
définit comme l’hypopituitarisme congénital et il se caractérise soit par une ectopique post-
hypophysaire, soit par une hypoplasie antéhypophysaire, ou encore par une hypoplasie de la tige
hypophysaire. Notre objectif consiste à déterminer les mutations génétiques partagées entre les
sujets affectés de l’étude et qui pourraient expliquer les causes du syndrome. Pour y parvenir, nous
avons analysé les données de séquençage d’exomes (WES) provenant de sept familles
caucasiennes simplex, une famille d’origine arabique et cinq autres dont la généalogie est
incomplète. Ces données ont été précédemment analysées, pour le même but, par d’autres
membres de l’équipe en utilisant le pipeline bio-informatique standard basé sur l’utilisation du
logiciel GATK. Nous avons préférentiellement opté pour une nouvelle analyse en utilisant deux
différents pipelines bio-informatiques indépendants, pour ensuite comparer conjointement les
résultats obtenus. Notre protocole consiste à assembler : d’abord, deux pipelines alternatifs de
détection de mutations génétiques ponctuelles (SNV). Ils sont composés d’un logiciel
d’alignement de séquence (Bowtie2) et deux logiciels d’appel de variantes (Freebayes et
SAMtools). Ensuite, nous avons assemblé trois pipelines de détection de variations du nombre de
copies (CNV) génomiques composés communément d’un logiciel d’alignement de séquence
(BWA) et trois logiciels d’appel de CNV (CoNIFER, fishingCNV, xHmm). Nos résultats nous ont
permis d’identifier des mutations candidates additionnelles qui n’ont jamais été identifiées. De
plus, notre méthodologie nous a permis de caractériser certains résultats faux positifs, par
conséquent elle pourra nous aider à améliorer la performance des pipelines de détection de
variations génomiques existantes. Pituitary stalk interruption syndrome (PSIS) is a rare disorder that affects the function of the
endocrine system of the affected individuals. The absence of the pituitary stalk, assessed by MRI,
characterizes patients with permanent growth hormone deficiency while the etiology of the
syndrome remains unknown. PSIS is defined by clinical hypopituitarism together with anatomical
findings including a hypoplastic anterior pituitary, ectopic posterior pituitary and reduced or
hypoplastic pituitary stalk. We aim to find shared variations (SNP, CNV) among affected patients
in coding regions which could explain the origin of the syndrome. We analyzed the exome NGS
data from 8 affected French Canadian trio families, with one additional consanguineous Arabic
trio family and 5 families with incomplete pedigree. These data were previously analyzed, for the
same objective, by other members of the team using a standardize GATK based bioinformatics
pipeline. It was desired to reanalyze the complete data set with two other independent pipelines,
followed by a comparison of the SNP discovery results. In the present aspect of the study, we built
two SNP discovery pipelines, both composed of a different NGS data aligners (Bowtie2) and each
composed a different variant caller (Freebayes, SAMtools), then a CNV discovery pipeline which
is composed of three different CNV callers (CoNIFER, fishingCNV, xHmm). In addition to the
candidate mutations identified in the previous analysis, we identified additional candidate
mutations which had not been detected and never been reported. Furthermore, our method helps
to discover the sources of variation false discovery which could help to improve existing genomic
mutation discovery pipelines.
Collections
This document disseminated on Papyrus is the exclusive property of the copyright holders and is protected by the Copyright Act (R.S.C. 1985, c. C-42). It may be used for fair dealing and non-commercial purposes, for private study or research, criticism and review as provided by law. For any other use, written authorization from the copyright holders is required.