Prediction Performance and Problem Difficulty in Genetic Programming - Archive ouverte HAL Access content directly
Theses Year : 2016

Prediction Performance and Problem Difficulty in Genetic Programming

Predicción de rendimiento y dificultad de problemas en programación genetica

(1)
1

Abstract

La estimación de la dificultad de problemas es un tema abierto en Programación Genética (GP). El objetivo de este trabajo es generar modelos que puedan predecir el desempeño esperado de un clasificador basado en GP cuando este es aplicado a tareas de prueba. Los problemas de clasificación son descritos usando características de un dominio específico, algunas de las cuales son propuestas en nuestro trabajo y estas características son dadas como entrada a los modelos predictivos. Nos referimos a estos modelos como predictores de desempeño esperado (PEPs, por sus siglas en inglés). Extendimos este enfoque usando un ensemble de predictores especializados (SPEPs, por sus siglas en inglés), dividiendo problemas de clasificación en grupos específicos y elegimos su correspondiente SPEP. Los predictores propuestos son entrenados usando problemas de clasificación sintéticos de 2D con conjunto de datos balanceados. Los modelos son entonces usados para predecir el desempeño de un clasificador de GP en problemas del mundo real antes no vistos los cuales son multidimensionales y desbalanceados. Ademas, este trabajo es el primero en proveer una predicción de rendimiento para un clasificador de GP sobre datos de prueba, mientras en trabajos previos se han enfocado en predecir el rendimiento para datos de entrenamiento. Por lo tanto, planteados como un problema de regresión simbólica son generados modelos predictivos exactos los cuales son resueltos con GP. Estos resultados son alcanzados usando características altamente descriptivas e incluyendo un paso de reducción de dimensiones el cual simplifica el proceso de aprendizaje y prueba. El enfoque propuesto podría ser extendido a otros algoritmos de clasificación y usarlo como base de un sistema experto de selección de algoritmos.
The estimation of problem difficulty is an open issue in Genetic Programming (GP). The goal of this work is to generate models that predict the expected performance of a GP-based classifier when it is applied to an unseen task. Classification problems are described using domainspecific features, some of which are proposed in this work, and these features are given as input to the predictive models. These models are referred to as predictors of expected performance (PEPs). We extend this approach by using an ensemble of specialized predictors (SPEP), dividing classification problems into groups and choosing the corresponding SPEP. The proposed predictors are trained using 2D synthetic classification problems with balanced datasets. The models are then used to predict the performance of the GP classifier on unseen realworld datasets that are multidimensional and imbalanced. This work is the first to provide a performance prediction of a GP system on test data, while previous works focused on predicting training performance. Accurate predictive models are generated by posing a symbolic regression task and solving it with GP. These results are achieved by using highly descriptive features and including a dimensionality reduction stage that simplifies the learning and testing process. The proposed approach could be extended to other classification algorithms and used as the basis of an expert system for algorithm selection.
Fichier principal
Vignette du fichier
tesis_Yuliana.pdf (3.32 Mo) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

tel-01668769 , version 1 (20-12-2017)

Identifiers

  • HAL Id : tel-01668769 , version 1

Cite

Yuliana Martinez. Prediction Performance and Problem Difficulty in Genetic Programming. Artificial Intelligence [cs.AI]. ITT, Instituto tecnologico de Tijuana, 2016. English. ⟨NNT : ⟩. ⟨tel-01668769⟩

Collections

CNRS INRIA INRIA2
103 View
126 Download

Share

Gmail Facebook Twitter LinkedIn More