Código del Curso: CC66P
Créditos: 3
Duración: 24 horas
Valor Individual: 30 UF
Profesor: José Manuel Saavedra Rondo
Objetivo
Capacitar a los estudiantes en el área de Visión por Computadora de modo que al finalizar del curso ellos puedan ser capaces de resolver una variedad de problemas asociada con esta área.
Capacitar a los estudiantes en temas fundamentales de procesamiento de imágenes basados en operaciones de bajo nivel.
Capacitar a los estudiantes en temas de Visión por Computadora aplicando modelos de deep-learning.
Contenidos
Introducción. Procesamiento de Imágenes: La imagen y sus propiedades, binarización, mejoramiento de contraste, filtros lineales, convolución y sus propiedades.
Detectores de Bordes. Morfología Digital. Transformaciones Geométricas.
Visión por Computadora y problemas clásicos. Descriptores locales y agregación de descriptores (BoW, VLAD, FisherVector).
Redes Neuronales Convolucionales y clasificación de imágenes: AlexNet, VGG, ResNet, DenseNet.
Modelos de redes convolucionales para búsqueda por similitud. Redes Siamesas, Redes entrenadas en tripletas. Aplicación en reconocimiento de caras.
Introducción a la detección de objetos en imágenes: Modelos de 2 etapas [Faster-RCNN]
Detección de objetos en imágenes: Modelo de 1 etapa [YOLO y sus variantes]
Detección de objetos en imágenes: Cómo tratar la diversidad de escalas y el no balanceo de las clases. Feature Pyramid Network y Focal Loss.
Modelos generativos en visión por computadora.
Bibliografía
[1] R. González, R. Woods, “Digital Image Processing”, 3rd Ed, Prentice Hall, 2008.
[2] M. Sonka, V. Hlavac, R. Boyle, “Image Processing, Analysis and Machine Vision”, 3rd. Ed., Thomson, 2008.
[3] R. Szeliski, “Computer Vision, Algorithms and Applications”, Springer, 2011.
[4] Deep Learning. Ian Goodfellow, Yoshua Bengio, Aaron Courville. 2016. ISBN: 9780262035613. http://www.deeplearningbook.org/
[5] Deep Learning:
Artículos de Conferencias tipo CVPR, ICCV, ICML, ECCV, NIPS, ICLR, EMNLP.
Artículos de Revistas tipo IJCV, PAMI.