Extraction of UML class diagrams from natural language specifications
Thesis or Dissertation
Abstract(s)
Dans l’ingénierie dirigée par modèle, les diagrammes de classes UML servent à la planification
et à la communication entre les différents acteurs d’un projet logiciel. Dans ce mémoire,
nous proposons une méthode automatique pour l’extraction des diagrammes de classes UML
à partir de spécifications en langues naturelles. Pour développer notre méthode, nous créons
un dépôt de diagrammes de classes UML et de leurs spécifications en anglais fournies par
des bénévoles. Notre processus d’extraction se fait en plusieurs étapes: la segmentation
des spécifications en phrases, la classification de ces phrases, la génération des fragments de
diagrammes de classes UML à partir de chaque phrase, et la composition de ces fragments en
un diagramme de classes UML. Nous avons validé notre approche d’extraction en utilisant
le dépôt de paires diagramme-spécification. Même si les résultats obtenus montrent une
précision et un rappel bas, notre travail a permis d’identifier les éléments qui peuvent être
améliorés pour une meilleure extraction. In model-driven engineering, UML class diagrams serve as a way to plan and communicate
between developers. In this thesis, we propose an automated approach for the extraction of
UML class diagrams from natural language software specifications. To develop our approach,
we create a dataset of UML class diagrams and their English specifications with the help of
volunteers. Our approach is a pipeline of steps consisting of the segmentation of the input into
sentences, the classification of the sentences, the generation of UML class diagram fragments
from sentences, and the composition of these fragments into one UML class diagram. We
develop a quantitative testing framework specific to UML class diagram extraction. Our
approach yields low precision and recall but serves as a benchmark for future research.
This document disseminated on Papyrus is the exclusive property of the copyright holders and is protected by the Copyright Act (R.S.C. 1985, c. C-42). It may be used for fair dealing and non-commercial purposes, for private study or research, criticism and review as provided by law. For any other use, written authorization from the copyright holders is required.