Validations informationnelles pour l'organisation des connaissances sur le Community Manager : contexte d'étude en nano-sciences et -technologies

Sahbi Sidhom 1 Philippe Lambert 2
1 KIWI - Knowledge Information and Web Intelligence
LORIA - AIS - Department of Complex Systems, Artificial Intelligence & Robotics
2 Veille Technologique et ASIEs
Inalco - Institut National des Langues et Civilisations Orientales
Résumé : La diversité des applications réunies de nos jours sous le terme " industrie de la langue " recouvre plusieurs pistes de réflexion. Cet article de recherche consiste à réaliser une conjoncture entre les " traitements automatiques de la langue naturelle " (NLP) et l'organisation des connaissances (KO) : apport de la ré-indexation sociale dans le domaine d'étude. En conséquent, le contexte du numérique avec le web des usages actuel montre cet intérêt et marque son importance pour la ré-indexation dans les réseaux sociaux. Il s'agit d'un nouvel axe de recherche dans un domaine actualisé pour la réflexion. L'individu plongé dans une activité d'écriture et sans contraintes de style cognitif, comme le cas sur les réseaux sociaux actuels, préconise au moins l'existence d'une idée mentale dans le contexte. Ce type d'énoncé nous offre la réflexion première à l'étude des structures syntaxiques nouvelles comme objet d'étude dans la linguistique computationnelle. Ainsi, le texte est vu comme un ensemble cohérent d'unités plus ou moins complexes. Chaque unité s'articule avec les autres et contribue à la réalisation d'un équilibre structurel. Egalement, l'écriture sans contraintes cognitives préconise le relâchement des règles et styles sur la réalisation des contenus et intrinsèquement sur les structures syntaxiques employées. C'est la réflexion seconde à l'étude pour examiner les corpus d'analyse et procéder à la découverte dans l'ordre des nouvelles observations sur la syntaxique et la sémantique véhiculée. Dans cette perspective, le choix porté à un modèle morpho-syntaxique particulier ne doit pas, d'une part, perdre de vue que la qualité des résultats d'un analyseur (parseur) placé dans un système ouvert à l'usage. Et d'autre part, la qualité de conception (formalisme d'implémentation) de l'analyseur doit rapprocher les concepts théoriques et pratiques en accord avec la nature de l'objet d'étude : les enquêtes d'opinion et les ressources ouvertes au web usages. Le corpus utilisé pour l'observation et la manipulation est constitué de textes de la langue française issus d'une enquête d'opinion associant des questions fermées et ouvertes dans le domaine des nano-sciences et technologies (LNE, C'NANO, Club nanométrologie) en France. Une hypothèse faite sur la nature du texte libre véhiculé dans les questions ouvertes qu'il ne s'agit pas de contraintes de style ou de rédaction proposées ou imposées. La variété de son contenu décrit sa représentativité comme document qui valide des choix sur des questions fermées : pour nous, il s'agit d'un texte libre à préparer pour l'analyse automatique et l'extraction des connaissances. De manière explicite, la démarche scientifique que nous suivions pour étayer les hypothèses de notre travail, consiste à corréler nos choix théoriques (modèle syntaxique) avec nos observations pratiques (texte libre des usages), par (i) l'élaboration d'hypothèses sur les structures syntaxiques (par l'étude linguistique sur le corpus) ; (ii) la transcription des observations faites sur corpus en système stable (de règles de réécriture) ; (iii) la matérialisation du système de réécriture par l'implémentation de l'analyseur et (iv) l'évaluation de l'analyseur par application directe sur corpus : sa comparaison avec les ressources des usages, aux observations retenues dans les hypothèses de l'étape (i) et la couverture grammaticale de l'étape (ii). L'objectif de ce travail de recherche est d'apporter un modèle adaptatif d'un analyseur morpho-syntaxique aux ressources ouvertes pour la ré-indexation sociale. Au terme de ce travail de recherche, nous prendrons appui sur l'analyse de L. Bloomfield (1933) qui soulignait particulièrement que : " Ce qui concerne le sens est le point faible des études sur le langage, et le restera jusqu'à ce que nos connaissances aient avancé bien loin de leur état actuel ".
Type de document :
Communication dans un congrès
IUFM - Université de Lorraine. IDEKI - Didactiques et métiers de l'humain, Oct 2013, Nancy, France. 1, 2013, IDEKI - Didactiques et Métiers de l'Humain
Liste complète des métadonnées

Littérature citée [26 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00927176
Contributeur : Sahbi Sidhom <>
Soumis le : samedi 11 janvier 2014 - 17:19:16
Dernière modification le : mardi 24 avril 2018 - 13:30:00

Fichier

IDEKI_2013_P_Lambert_et_S_Sidh...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00927176, version 1

Collections

Citation

Sahbi Sidhom, Philippe Lambert. Validations informationnelles pour l'organisation des connaissances sur le Community Manager : contexte d'étude en nano-sciences et -technologies. IUFM - Université de Lorraine. IDEKI - Didactiques et métiers de l'humain, Oct 2013, Nancy, France. 1, 2013, IDEKI - Didactiques et Métiers de l'Humain. 〈hal-00927176〉

Partager

Métriques

Consultations de la notice

365

Téléchargements de fichiers

157