M. Le and . Rosa, Lagen est correctement prédit comme étant localisé en Norvège car c'est l'estuaire d'une rivière localisée en Norvège

, Parmi ces 10 inférences, le nombre de concepts générés par CNN-1s est remarquablement stable et petit, entre 22 et 37. Les intensions de ces concepts (les explications) sont des requêtes à 2 ou 3 éléments, et les extensions ont 2 à 29 entités (les entités similaires servant d'exemples). Les meilleures explications disent que la nationalité des personnes peut être inféré soit par le lieu d'habitation (ex., Tokyo ? Japan), le lieu du décès, la langue parlée, un film dans lequel la personne a joué ou un prix gagné. Notre approche à base d'instances est capable de trouver des explications très spécifiques, comme illustré ci-dessus, que des approches à base de règles auraientt peu de chance de produire vu leur nombre gigantesque sur l'ensemble du jeu de données. Cependant, une limite de notre méthode d'inférence est qu'elle ne fournit pas encore d'explications généralisées telles que "si une personne X habite dans une ville située dans un pays Y, alors X a pour nationalité Y, De façon plus systématique, nous avons examiné toutes les inférences correctes et non-triviales de la nationalité des personnes dans FB15k-237, c-à-d. les inférences où l'entité correcte n'est pas une des trois nationalités les plus fréquentes (MRR F req < 0.333)

, Comparé aux approches à traits latents, nous sommes capable de fournir des explications intelligibles à chaque inférence sous forme de motifs de graphe. Comparé aux approches à base de règles, nous avons un meilleur contrôle du temps de calcul, et donc une meilleure capacité à passer à l'échelle, en évitant la phase d'apprentissage (fouille des règles) et en utilisant un algorithme any-time contrôlé par un timeout à l'inférence. Notre approche est analogue à la classification par les k-plus proches voisins mais nos distances, Conclusion Nous avons montré des résultats expérimentaux positifs et encourageants pour une approche symbolique au problème de la prédiction de liens dans les graphes de connaissances, en particulier pour les mesures à grain fin (MRR, Hits@1)

, Étendre les motifs de graphe avec des filtres plus riches sur les nombres, dates, etc. Optimiser le calcul des CNN en trouvant de bonnes stratégies pour guider le processus de partitionnement ou en le parallélisant. Étendre la procédure d'inférence pour imiter les règles non-instanciées d'AMIE (ex, De nombreuses pistes de recherche restent ouvertes

, Évaluer notre approche sur d'autres jeux de données et d'autres tâches d'inférence

R. Bordes, A. , N. Usunier, A. Garcia-duran, J. Weston et al., Translating embeddings for modeling multi-relational data, Advances in neural information processing systems, pp.2787-2795, 2013.
URL : https://hal.archives-ouvertes.fr/hal-00920777

T. Denoeux, A k-nearest neighbor classification rule based on Dempster-Shafer theory, IEEE Trans. Systems, Man, and Cybernetics, vol.25, issue.5, pp.804-813, 1995.

S. Ferré, A proposal for extending formal concept analysis to knowledge graphs, Int. Conf. Formal Concept Analysis (ICFCA), vol.9113, pp.271-286, 2015.

S. Ferré, Concepts de plus proches voisins dans des graphes de connaissances, 28es Journées francophones d'Ingénierie des Connaissances (IC), pp.163-174, 2017.

S. Ferré, Answers partitioning and lazy joins for efficient query relaxation and application to similarity search, Int. Conf. The Semantic Web (ESWC), vol.10843, pp.209-224, 2018.

L. Galárraga, C. Teflioudi, K. Hose, and F. Suchanek, Fast rule mining in ontological knowledge bases with amie+, Int. Journal Very Large Data Bases, vol.24, issue.6, pp.707-730, 2015.

A. Hermann, S. Ferré, and M. Ducassé, An interactive guidance process supporting consistent updates of RDFS graphs, Int. Conf. Knowledge Engineering and Knowledge Management, pp.185-199, 2012.
URL : https://hal.archives-ouvertes.fr/hal-00757083

N. Lao, T. Mitchell, and W. W. Cohen, Random walk inference and learning in a large scale knowledge base, Conf. Empirical Methods in Natural Language Processing, pp.529-539, 2011.

D. Liben-nowell and J. Kleinberg, The link-prediction problem for social networks, Journal of the American society for information science and technology, vol.58, issue.7, pp.1019-1031, 2007.

W. May, Information extraction and integration with FLORID : The MONDIAL case study, 1999.

S. Muggleton, Inverse entailment and progol, New Generation Computation, vol.13, pp.245-286, 1995.

M. Nickel, K. Murphy, V. Tresp, and E. E. Gabrilovich, A review of relational machine learning for knowledge graphs, Proc. IEEE, vol.104, issue.1, pp.11-33, 2016.

G. Plotkin, Automatic Methods of Inductive Inference, 1971.

M. Schlichtkrull, T. N. Kipf, P. Bloem, R. Van-den, I. Berg et al., Modeling relational data with graph convolutional networks, The Semantic Web Conf. (ESWC), pp.593-607, 2018.

K. Toutanova and D. Chen, Observed versus latent features for knowledge base and text inference, Work. Continuous Vector Space Models and their Compositionality, pp.57-66, 2015.

, We propose a new approach that does not need a training phase, and that can provide interpretable explanations for each inference. It relies on the computation of Concepts of Nearest Neighbours (CNN) to identify similar entities based on common graph patterns. Dempster-Shafer theory is then used to draw inferences from CNNs. We evaluate our approach on FB15k-237, Summary The open nature of Knowledge Graphs (KG) often implies that they are incomplete. Link prediction consists in infering new links between entities based on existing links