Su objetivo es optimizar el proceso de descubrir la información que se desprende de la relación entre datos
El doctorando del Departamento de Ingeniería Civil, Jesús Manuel Maudes Raedo, de la Universidad de Burgos defendió hoy su tesis doctoral titulada Combinación de clasificadores: construcción de características e incremento de la diversidad. La tesis ha sido dirigida por los profesores Juan José Rodríguez Díez y César Ignacio García Osorio y trata del desarrollo de nuevos métodos clasificadores. Esta investigación se basa en la denominada Minería de Datos, una ciencia que intenta descubrir relaciones entre los datos, las cuales en principio están ocultas, o enterradas en un sentido figurado, en los propios datos. Para ello, desarrolla métodos o algoritmos que procesan información permitiendo así descubrir ese conocimiento a priori oculto.
Las aplicaciones de los métodos clasificadores son múltiples y están en nuestro día a día, según informó Maudes. Un clasificador puede diagnosticar o predecir si tenemos una enfermedad a partir de datos clínicos, reconocer los números de la matrícula de nuestro coche a partir de una foto, decidir si somos buenos candidatos o no a recibir un crédito de nuestro banco a partir de los datos que tienen sobre nosotros, si somos un tipo de consumidor objetivo de un determinado producto, si nos vamos a cambiar o no de compañía telefónica y qué oferta lo evitará, si el ADN de un determinado individuo tiene o no ciertas propiedades etc.
Hay numerosos métodos clasificadores, y no hay ninguno que pueda decirse que es el mejor. Según cada problema puede interesar más uno u otro. Un área de interés que actualmente acapara bastante atención son los llamados multiclasificadores o ensembles. Los multiclasificadores son esquemas de combinación de otros clasificadores más simples. Por ejemplo, un multiclasificador extremadamente sencillo podría obtenerse de formar una especie de comité de expertos a modo de jurado, en el que cada miembro fuese a su vez un clasificador. La predicción que haría el comité podría ser por ejemplo, una votación de las predicciones de los clasificadores miembros.
Los métodos clasificadores desarrollados en esta tesis son todos métodos multiclasificadores. En esencia se han desarrollado tres métodos. El primero sirve para adaptar métodos clasificadores que necesitan que los datos de entrada sean numéricos a problemas en los que la mayoría de los datos no son números. Los otros dos métodos sirven para aumentar la diversidad de los clasificadores miembro, es decir que estos hagan predicciones distintas.
La tesis ha dado lugar a publicaciones en congresos internacionales especializados en la materia como Multiclassifier Systems (MCS), y Supervised and Unsupervised Ensemble Methods and their Applications(SUEMA).
Fuente: ERM/DICYT