Contributions to Hypernym Patterns Representation and Learning based on Dependency Parsing and Sequential Pattern Mining - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2020

Contributions to Hypernym Patterns Representation and Learning based on Dependency Parsing and Sequential Pattern Mining

Contributions à la représentation et à l'apprentissage de patrons d’hyperonymie basées sur les dépendances syntaxiques et la fouille de motifs séquentiels

Résumé

Hypernym relation is a semantic relationship between a specific term and a generic term of it. Approaches to extract such relations from texts have gained a large interest due to the huge availability of textual resources and their key role in ontology building. These approaches are commonly divided into two types: pattern-based and distributional. Patterns seem quite more interesting than distributional for building ontology due to their ability in extracting explicit relations from texts and their good precision. Thus, we focus on patterns and we describe an approach for systematically improving pattern performances. The approach is based on the coupled usage of sequential pattern mining and a specific pattern representation using grammatical dependencies to learn hypernym and anti-hypernym patterns. The results confirm that our approach can learn patterns that outperform unsupervised approaches and a supervised pattern-based approach. However, while the best performances are achieved by some supervised distributional approaches using word embedding, patterns can extract distinct hypernym relationships. This confirms that both types of approaches are complementary. Additionally, further experiments also confirm that the proposed approach tends to learn generically valid patterns across various corpora.
L’hyperonymie est une relation sémantique entre un terme général et un terme spécifique. Les approches pour extraire de telles relations à partir des textes ont connu un regain d'intérêt en raison de la disponibilité d'une gamme de ressources textuelles ainsi que de leur rôle clé dans la construction de l'ontologie. Généralement, il existe deux types de ces approches : celles basées sur des patrons et celles distributionnelles. L'approche basée sur des patrons s'avère être plus intéressante que l’approche distributionnelle pour la construction de l’ontologie, ce qui est dû au fait que la première permet d'extraire de relations explicites à partir des textes avec une grande précision. Dans cette thèse, nous nous intéressons sur les patrons et nous introduisons une approche pour améliorer systématiquement les performances des patrons. Notre approche est basée sur le couplage d'une fouille des patrons séquentiels avec une représentation de patrons spécifique en utilisant les dépendances grammaticales pour l'apprentissage des patrons d'hyperonymie et d'anti-hyperonymie. Les résultats confirment que notre approche peut apprendre les patrons qui surpassent les approches non supervisées et une approche supervisée basée sur des patrons. Cependant, bien que les meilleures performances soient obtenues par certaines approches distributionnelles supervisées utilisant l'incorporation de mots, les patrons peuvent extraire de relations d'hyperonymie distinctes. Cela confirme que les deux types d'approches sont complémentaires. De plus, d'autres expériences confirment également que l'approche proposée tend à apprendre des patrons génériquement valides à travers divers corpora.
Fichier principal
Vignette du fichier
2020theseIssa_Alaa_Aldine_A.pdf (2.58 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03260151 , version 1 (14-06-2021)

Identifiants

  • HAL Id : tel-03260151 , version 1

Citer

Hamad Issa Alaa Aldine. Contributions to Hypernym Patterns Representation and Learning based on Dependency Parsing and Sequential Pattern Mining. Artificial Intelligence [cs.AI]. Université de Bretagne Sud, 2020. English. ⟨NNT : 2020LORIS575⟩. ⟨tel-03260151⟩
406 Consultations
296 Téléchargements

Partager

Gmail Facebook X LinkedIn More