Reconocimiento Estadístico de Patrones
enero-junio 11
Profesor: JJJohan Van Horebeek
Oficina: H-6, Ext: 49564
Horario: martes y jueves, 9:30hrs-11:00hrs.
Descripción: Este curso se enfoca al análisis y la exploración de datos multivariados. Se discuten los métodos más importantes de visualización, clasificación y agrupamiento de datos. Se pone mucho énfasis en la comparación y la evaluación de los diferentes enfoques. Tomamos los ejemplos de diferentes áreas (según interés de los estudiantes). Un compomente importante será la discusión
y la experimentación con los métodos a través de su implementación.
El curso se situa en el area fronteriza entre inteligencia artificial, aprendizaje máquina, análisis multivariado y cómputo estadístico.
Evaluación: Tareas, presentación de un artículo y 2 examenes
Material:
Notas parte 1, kernel.r,demo1.r,
Notas parte 2, pca.r,
Notas parte 3, kernelregresion.r,
Notas parte 4
Notas parte 5,
Notas parte 6,
Notas parte 7
,
logistictodo.r
,
Notas parte 8, demonn0.r,demonn.r
Contenido:
- Métodos exploratorios para datos multivariados
- Gráficas bi- y multi-dimensionales; visualización de la dependencia entre variables
- Métodos de proyección, PCA y Kernel PCA
- Multidimensional scaling
- Algunos algoritmos de exploración de mineria de datos.
- Métodos de agrupamiento
- Agrupamiento jerárquico
- K-medias y extensiones
- Métodos de clasificación
- Métodos geométricos vs métodos probabilísticos
- Clasificador Bayesiano óptimo
- El enfoque basado en márgenes.
- Análisis discriminante lineal
- Regresión logística y algunas extensiones
- Máquinas de soporte vectorial
- Redes neuronales tipo feedforward
- Métodos de asemblaje: random forests y boosting.
- Extensiones usando transformaciones implicitas (kernel trick)
- Métodos lineales con regularizacion (LASSO, LARS, PLS, etc.)
Bibliografía
- The Elements of Statistical Learning, Trevor Hastie, Robert Tihshirani, Jerome Friedman, Springer, 2009.
- Pattern Classification, Richard Duda, Peter Hart, David Stork, Wiley, 2001.
- Modern applied statistics with S, Venables, W. y Ripley, B., Springe, 2002.
- Pattern Recognition and Machine Learning, Bishop, C. Springer, 2006.
- Data Mining, Brian Ripley, Notas de curso, 2002.
- Modern multivariate Statistical techniques, Alan Izenman, Springer, 2009,
- Applied multivariate statistical analysis, Johnson, R.A. y Wichern, D.W., Prentice - Hall, 1992.
- Interactive and dynamics graphics for data analysis; with examples using R and Ggobi, Swayne, Cook, Buja et al. al, Springer, 2007.