Validations informationnelles pour l'organisation des connaissances sur le Community Manager : contexte d'étude en nano-sciences et -technologies - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2013

Validations informationnelles pour l'organisation des connaissances sur le Community Manager : contexte d'étude en nano-sciences et -technologies

Sahbi Sidhom
Philippe Lambert

Résumé

The diversity of applications met today under the term "language industry" covers a number of avenues. This research paper is to achieve conditions between "automatic processing of natural language" (NLP) and knowledge organization (KO): contribution of social re-indexing in the field of study. As a result, the digital context with the current web usage shows that interest and mark its importance for re-indexing in social networks. This is a new area of ​​research in an updated area for reflection. Thus, the objective of this research is to provide an adaptive model to a morpho-syntactic analyzer for open resources and for social re-indexing.
La diversité des applications réunies de nos jours sous le terme " industrie de la langue " recouvre plusieurs pistes de réflexion. Cet article de recherche consiste à réaliser une conjoncture entre les " traitements automatiques de la langue naturelle " (NLP) et l'organisation des connaissances (KO) : apport de la ré-indexation sociale dans le domaine d'étude. En conséquent, le contexte du numérique avec le web des usages actuel montre cet intérêt et marque son importance pour la ré-indexation dans les réseaux sociaux. Il s'agit d'un nouvel axe de recherche dans un domaine actualisé pour la réflexion. L'individu plongé dans une activité d'écriture et sans contraintes de style cognitif, comme le cas sur les réseaux sociaux actuels, préconise au moins l'existence d'une idée mentale dans le contexte. Ce type d'énoncé nous offre la réflexion première à l'étude des structures syntaxiques nouvelles comme objet d'étude dans la linguistique computationnelle. Ainsi, le texte est vu comme un ensemble cohérent d'unités plus ou moins complexes. Chaque unité s'articule avec les autres et contribue à la réalisation d'un équilibre structurel. Egalement, l'écriture sans contraintes cognitives préconise le relâchement des règles et styles sur la réalisation des contenus et intrinsèquement sur les structures syntaxiques employées. C'est la réflexion seconde à l'étude pour examiner les corpus d'analyse et procéder à la découverte dans l'ordre des nouvelles observations sur la syntaxique et la sémantique véhiculée. Dans cette perspective, le choix porté à un modèle morpho-syntaxique particulier ne doit pas, d'une part, perdre de vue que la qualité des résultats d'un analyseur (parseur) placé dans un système ouvert à l'usage. Et d'autre part, la qualité de conception (formalisme d'implémentation) de l'analyseur doit rapprocher les concepts théoriques et pratiques en accord avec la nature de l'objet d'étude : les enquêtes d'opinion et les ressources ouvertes au web usages. Le corpus utilisé pour l'observation et la manipulation est constitué de textes de la langue française issus d'une enquête d'opinion associant des questions fermées et ouvertes dans le domaine des nano-sciences et technologies (LNE, C'NANO, Club nanométrologie) en France. Une hypothèse faite sur la nature du texte libre véhiculé dans les questions ouvertes qu'il ne s'agit pas de contraintes de style ou de rédaction proposées ou imposées. La variété de son contenu décrit sa représentativité comme document qui valide des choix sur des questions fermées : pour nous, il s'agit d'un texte libre à préparer pour l'analyse automatique et l'extraction des connaissances. De manière explicite, la démarche scientifique que nous suivions pour étayer les hypothèses de notre travail, consiste à corréler nos choix théoriques (modèle syntaxique) avec nos observations pratiques (texte libre des usages), par (i) l'élaboration d'hypothèses sur les structures syntaxiques (par l'étude linguistique sur le corpus) ; (ii) la transcription des observations faites sur corpus en système stable (de règles de réécriture) ; (iii) la matérialisation du système de réécriture par l'implémentation de l'analyseur et (iv) l'évaluation de l'analyseur par application directe sur corpus : sa comparaison avec les ressources des usages, aux observations retenues dans les hypothèses de l'étape (i) et la couverture grammaticale de l'étape (ii). L'objectif de ce travail de recherche est d'apporter un modèle adaptatif d'un analyseur morpho-syntaxique aux ressources ouvertes pour la ré-indexation sociale. Au terme de ce travail de recherche, nous prendrons appui sur l'analyse de L. Bloomfield (1933) qui soulignait particulièrement que : " Ce qui concerne le sens est le point faible des études sur le langage, et le restera jusqu'à ce que nos connaissances aient avancé bien loin de leur état actuel ".
Fichier principal
Vignette du fichier
IDEKI_2013_P_Lambert_et_S_Sidhom_v1F.pdf (303.29 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00927176 , version 1 (11-01-2014)

Identifiants

  • HAL Id : hal-00927176 , version 1

Citer

Sahbi Sidhom, Philippe Lambert. Validations informationnelles pour l'organisation des connaissances sur le Community Manager : contexte d'étude en nano-sciences et -technologies. IDEKI - Didactiques et métiers de l'humain, IUFM - Université de Lorraine, Oct 2013, Nancy, France. ⟨hal-00927176⟩
245 Consultations
136 Téléchargements

Partager

Gmail Facebook X LinkedIn More