Investigación de posgrado sobre modelos gráficos probabilistas
1. Presentación
Esta página está destinada a:
- alumnos del Máster en Investigación en Inteligencia Artificial, del Máster en Ingeniería Informática o del Máster de Física Médica de la UNED que desean realizar el trabajo de fin de máster (tesina) y aún no han encontrado un tema;
- quienes desean entrar en el Máster de Investigación en I.A.; éstos deben rellenar el formulario de admisión; si están especialmente interesados en los temas descritos en esta página, conviene que envíen además la solicitud que se indica más adelante;
- quienes ya
tienen un máster universitario y están interesados en realizar el doctorado sobre
estos temas en el Dpto. de Inteligencia Artificial de la UNED.
Los proyectos que proponemos en esta página están vinculados a la investigación sobre modelos gráficos probabilistas (MGPs) que se lleva a cabo en el Dpto. de Inteligencia Artificial de la UNED y en el CISIAD. Dentro de estos másteres los MGPs —principalmente las redes bayesianas y los diagramas de influencia— se estudian en las asignaturas Métodos Probabilistas (Máster de Investigación en I.A.), Análisis de Decisiones para Ingeniería y Gestión (Máster de Informática), y Análisis de Decisiones en Medicina (Máster de Física Médica).
2. Contenido
Los MGPs surgieron en la década de los 1980. Desde entonces, están teniendo una gran expansión, tanto en el mundo académico (todos los libros modernos de inteligencia artificial dedican varios capítulos a este tema) como en el mundo empresarial: actualmente hay un buen número de empresas de varios países dedicadas única o principalmente a los MGPs.
Los proyectos relacionados con esta línea de investigación giran en torno a los MGPs, como ya se ha dicho, y la mayor parte de ellos se basan en la herramienta OpenMarkov, un programa desarrollado en el CISIAD para la edición y evaluación de MGPs, que ya ha sido utilizado en más de 30 países.
Algunos de los temas que proponemos son los siguientes. Tenga en cuenta que algunos tienen más labor de investigación, mientras que otros están más orientados a la programación de algoritmos ya conocidos y otros se orientan a aplicaciones concretas. Cada uno de ellos es más adecuado para uno de los tres másteres o para el doctorado.
- Aprendizaje de redes bayesianas. En la actualidad se han implementado ya en OpenMarkov los algoritmos más conocidos para la construcción de redes bayesianas a partir de bases de datos. Es deseable ampliar y optimizar los algoritmos existentes, añadir otros nuevos y aplicarlos a distintos conjuntos de datos.
- Modelos de decisión de Markov, incluidos los POMDPs y los DLIMIDs. Hay que implementar en OpenMarkov los algoritmos más modernos y medir su rendimiento para algunos de los problemas más típicos propuestos en la literatura.
- Análisis de sensibilidad. Consiste en estudiar cómo cambian los resultados de la inferencia cuando varían los parámetros que definen la red bayesiana o el diagrama de influencia. Algunos tipos de análisis de sensibilidad ya están implementados en OpenMarkov. Sería interesante investigar e implementar nuevas técnicas.
- Valor esperado de la información perfecta (EVPI). En muchos problemas de análisis, especialmente en medicina, es importante conocer qué beneficio aportaría conocer con precisión absoluta (o al menos, con mayor precisión) algunos de los parámetros del modelo. Sería interesante implentar estos cálculos en OpenMarkov.
- Simulación estocástica. Consiste en la implementación en OpenMarkov de métodos de Monte Carlo para la evaluación de MGPs.
- Computación en GPUs. Consiste en permitir que las operaciones de evaluación de MGPs se ejecuten en GPUs, utilizando la herramienta ND4J, que fue diseñada originalmente para aprendizaje profundo.
- Aplicaciones de los MGPs.
Utilizando la herramienta OpenMarkov,
se pueden construir MGPs
para distintas aplicaciones, como las que se muestran en
esta página.
La experiencia del CISIAD se centra sobre
todo en aplicaciones sanitarias, pero algunos de los alumnos que
han trabajado con nosotros han estudiado también problemas de
visión artificial, seguridad informática, gestión
de proyectos, economía, etc. En el caso de que Vd. esté
interesado/a en construir alguna aplicación de este tipo, debe
indicarlo en su solicitud, para ver si, con su propia experiencia y con
los medios de que dispone (bases de datos, personas que puedan
ayudarle, etc.) es razonable abordar un proyecto de este tipo.
3. Profesores que proponen el trabajo
4. Perfil del alumno/a
Requisitos comunes
Las condiciones que debe cumplir para trabajar en cualquiera de las líneas
mencionadas son:
- buen expediente académico,
- nivel alto de inglés escrito y hablado,
- disponibilidad de tiempo.
La disponibilidad de tiempo se tendrá muy en cuenta en la selección de candidatos, pues una persona que se compromete a trabajar en un tema y lo abandona unos meses más tarde perjudica al desarrollo del proyecto global, consume el tiempo de los profesores, e impide, mientras tanto, que otra persona pueda trabajar en ese tema.
a) Trabajo sobre algoritmos para MGPs
Para investigar en esta línea necesita además conocimientos de
Java; será muy útil la experiencia en UML,
JUnit y Swing y el haber utilizado algún
entorno de desarrollo en Java, especialmente Eclipse.
En general los proyectos de esta línea incluyen una parte de implementación en Java de algoritmos ya existentes y una parte de desarrollo de nuevos algoritmos. En este sentido, deseamos que la implementación se realice con la máxima calidad, siguiendo los principios de la ingeniería del software, tomando como modelo la tesis de M. Arias: hay que realizar un análisis de requisitos, de arquitectura y de diseño muy cuidadoso y bien documentado, con diagramas en UML. La interfaz debe estar internacionalizada; de momento, debe funcionar en español y en inglés. Hay que elaborar pruebas exhaustivas con JUnit. El código en Java debe ser fácilmente mantenible; para ello, ha de ser claro, limpio, elegante, robusto y bien documentado (en inglés). Además, hay que redactar documentación (en inglés) que facilite el trabajo de futuros programadores. La memoria de investigación puede presentarse en castellano o, preferiblemente, en inglés. La defensa oral del proyecto puede hacerse en castellano.
Precisamente éste es uno de los puntos interesantes de este proyecto: trabajar con tecnologías muy actuales que, aparte de estar en la frontera de la investigación sobre MGPs, tienen gran demanda en el mercado laboral: UML, JUnit, Eclipse, git, maven, nexus, etc. (vea esta página). De hecho, una de las profesiones más demandadas de la actualidad es la de desarrollador Java, como se indica, por ejemplo, en este artículo. Por ello, al terminar el proyecto los profesores emitirán un certificado en que harán constar el trabajo realizado por el alumno/a, detallando la metodología empleada y el hecho de haber colaborado con un equipo amplio de programadores en un proyecto de ámbito internacional.
El alumno/a deberá firmar un documento en que acepte que su trabajo estará disponible públicamente con licencia EUPL o similar, dejando constancia de su autoría, naturalmente.
b) Aplicaciones de los MGPs
Para trabajar en esta línea necesita además conocimientos del campo de aplicación. Por ejemplo, si va a realizar un análisis de coste-efectividad para un problema médico, necesita conocer a fondo esa rama de la medicina. Si Vd. no es especialista en ese tema, deberá contar con la ayuda de un experto; pero tenga en cuenta que si el experto no le presta la ayuda que habían acordado, no podrá concluir el proyecto.
c) Doctorado
Quienes han obtenido un título de máster oficial o el antiguo Diploma de Estudios Avanzados pueden solicitar la admisión en el programa de doctorado Sistemas Inteligentes de la UNED. Para ello debe contactar previamente con un profesor de este programa que se comprometa a ser el director de su tesis. Si desea realizar el doctorado sobre modelos gráficos probabilistas, debe enviar la solicitud que se indica más adelante. Sin embargo, dada la carga de trabajo de los profesores que investigan en esta línea, los requisitos de admisión para el doctorado son aún más estrictos que para el máster.
En cuanto a la dedicación, tenga en cuenta que la realización de un doctorado requiere al menos cuatro años de investigación a tiempo completo. Si Vd. no tiene conocimientos en el campo de los modelos gráficos probabilistas, deberá cursar las asignaturas del Máster de Investigación en I.A. de la UNED que determinará la Comisión de Doctorado al aceptar su solicitud, tras escuchar al futuro director de la tesis.
Observe que hemos dicho "cuatro años de dedicación a tiempo completo". Si Vd. lo realiza a tiempo parcial, necesitará más tiempo. Por ejemplo, si dedica 20 horas a la semana, necesitará al menos seis años. Si dedica menos de 20 horas semanales, no acabará el doctorado. Por eso debe estimar de forma realista cuántas horas le van a poder dedicar cada día; lo que importa es el promedio del año en su conjunto, no el máximo que pueda dedicar los fines de semana o en período de vacaciones. Tenga en cuenta también que frecuentemente surgen imprevistos por temas laborales, familiares, etc., que hacen que la dedicación real sea menor que la prevista. En nuestra experiencia como profesores hemos encontrado muchos alumnos que pensaban que era posible hacer un doctorado en la UNED dedicando unas cuantas horas cada semana, como quien estudiara un máster no oficial o una segunda carrera, y posteriormente han descubierto que un doctorado requiere mucho más tiempo del que ellos podían dedicar realmente.
Por otro lado, aunque la UNED sea una universidad a distancia, la realización de un doctorado requiere el mismo grado de interacción entre el director y el doctorando que en cualquier otra universidad, especialmente al inicio de la tesis, cuando hay que acotar el tema de la investigación, y al final, cuando hay que elaborar la memoria. Hoy en día hay aplicaciones de internet que permiten compartir voz e imágenes, pero aun así en algunos momentos la investigación encuentra escollos que sólo pueden resolverse mediante una entrevista personal. Por todo ello, antes de solicitar su admisión al doctorado plantéese si va a poder viajar a Madrid cuando sea necesario.
Les rogamos que entiendan que si comentamos estas dificultades no es para poner obstáculos, sino por su bien, para evitar que por un exceso de optimismo se embarquen en un proyecto que va a requerir mucho esfuerzo y que quizá no sean capaces de culminar.
5. Presentación de la solicitud
Solicitud. Dirección de envío: marias,fjdiez,mluque@dia.uned.es.
Como hemos dicho, si desea solicitar la admisión en el Máster de Investigación en I.A. y le interesan los MGPs, conviene que envíe esta solicitud además de rellenar el formulario de admisión.
6. Bibliografía
6.1. Bibliografía sobre el proyecto OpenMarkov
- Página web del proyecto OpenMarkov (originalmente llamado "proyecto Carmen")
- M. Arias Calleja. Carmen: una herramienta de software libre para modelos gráficos probabilistas. Tesis doctoral. Dpto. Inteligencia Artificial. UNED, Madrid, 2009.
- ProbModelXML. El formato que OpenMarkov utiliza para guardar las redes, desarrollado también por el CISIAD. Las estructura de clases de OpenMarkov reproduce en gran medida las propiedades definidas en este formato.
6.2. Bibliografía sobre modelos gráficos probabilistas
- F. J. Díez. Introducción a los Modelos Gráficos Probabilistas. Dpto. Inteligencia Artificial, UNED, Madrid, 2007.
- E. Castillo, J. M. Gutiérrez y A. S. Hadi. Sistemas Expertos y Modelos de Redes Probabilísticas. Academia de Ingeniería, Madrid, 1997.
- S. Ríos, C. Bielza y A. Mateos. Fundamentos de los Sistemas de Ayuda a la Decisión. Ra-Ma, Madrid, 2002.
- R. T. Clemen y T. Reilly. Making Hard Decisions. Duxbury, Pacific Grove, CA, 2001.
- F. V. Jensen and T. D. Nielsen. Bayesian Networks and Decision Graphs. Springer-Verlag, Nueva York, 2ª edición, 2007.
6.3. Bibliografía sobre programación
- M. Fowler.
UML Distilled: A Brief Guide to the Standard Object Modeling Language. Addison-Wesley, 2003, 3ª edición.
- E. Gamma, R. Helm, R. Johnson y J. Vlissides.
Design Patterns: Elements of Reusable Object-Oriented Software . Addison-Wesley, 2005. (Traducción española:Patrones de Diseño . Addison-Wesley, 2003.) - B. Schneiderman y C. Plaisant.
Designing the User Interface: Strategies for Effective Human-Computer Interaction . Addison-Wesley, 2004, 4ª edición. (Traducción española:Diseño de Interfaces de Usuario . Pearson Addison Wesley, 2006.) - A. Shalloway y J. R. Trott.
Design Patterns Explained: A New Perspective on Object-Oriented Design. Addison-Wesley, Boston, MA, 2004. 2ª edición. - Oracle.
Creating a GUI with JFC/Swing (The Swing Tutorial) . En Internet.
6.4. Bibliografía sobre elaboración del TFM
-
Biblioteca de la UNED.
Cómo hacer un trabajo académico . 2020.