Percepción y Visión por Computador #0

ComputerVisionPerception
English Version
Resulta que utilizamos aplicaciones que usan herramientas y técnicas de “vision por computador” practicamente todos los días y no nos percatamos de ello. Le “precepción” como concepto general y la “visión por computador” como concepto concreto son altamente usados en la actualidad y me gustaría comenzar una serie de posts analizando aplicaciones de este campo. Apoyadas en estos conceptos podemos encontrar desde aplicaciones tan cotidianas como el lector de matrículas a la entrada de un aparcamiento hasta otras más sofisticadas como la detección asistida por visión por computador de células cancerosas.

La idea principal en este tipo de posts será presentar y analizar problemas que son resueltos actualmente aplicando visión por computador y, si la solución está disponible presentarla (y sino intentaremos discutir posibles soluciones). Sinceramente estoy ansioso por empezar a describir “casos de estudio” pero creo que sería conveniente presentar en primer lugar los conceptos fundamentales, por si hay alguien al otro lado que no esté familiarizado con la materia.

Qué es una imagen?

Una imagen es básicamente un montón de números! Números?? SÍ!. La imagen que vemos en la pantalla del pc se compone de cientos, miles o millones de diminutos cuadros (pixeles) con un número (o conjunto de números) asociado, donde cada número tiene asignada una intensidad. La forma más simple entender lo expuesto es usando una imagen en blanco y negro. En este caso, un valor de 255 (máximo valor permitido) corresponde a un pixel blanco puro, mientras que el valor de 0 corresponde a un pixel negro.

Mario

El caso de imágenes en color es un pelín más complicado (pero no mucho más, tranquilo). Antes de nada, es necesarios especificar el modelo que utilizaremos para describir los colores. Hay varios modelos de color: RGB, CMYK, HSV o HSL entre otros. Personalmente estoy más familiarizado con el modeo RGB por lo que seguramente será el sistema que utilizaré de aquí en adelanta. RGB en particular aplica la misma estrategia que la explicada anteriormente con la imagen en blanco y negro con la única salcedad de que, en este caso hay tres capas en lugar de una única, y cada una corresponde con la intensidad de un color elemental: Rojo (Red), Verde (Green) y Azul (Blue). Diferentes combinaciones de intensidades de colores elementales resultan en colores diferentes (hay bastantes recursos online para poder ver colores y sus códigos, por ejemplo ColorPicker ).

Color

 

Motivación

Algo que realmente me gusta de la robótica es el hecho de que la información que extraemos de sensores varios no signfica nada hasta que los interpretamos y les damos un sentido. Exactamente lo mismo ocurre con las imágenes (información recogida de un sensor a fin de cuentas) con la salvedad de que en este caso hablamos de información visual, la cual somos capaces de procesar con absoluta facilidad. Esto puede hacer pensar que el problema de visión por computador no es tal, pero nada más lejos de la realidad, incluso problemas aparentemente directos pueden tornarse imposibles para un computador si las condiciones de luz no acompañan.

No hay nadie en Facebook dibujando cuadritos alrededor de las caras en las fotos, ni leyendo tu matrícula cuando entras en un aparcamiento, y por supuesto no hay nadie dentro de tu movil esperando a que actives el autodisparador por detección de sonrisas de la aplicación de la camara para tomar la foto en el instante preciso. Espero que a medida que avancen los posts, este tipo de cosas dejen de suceder “por arte de magia” y puedas llegar a valorar lo “asombroso” de que Facebook consiga “enjaular” las caras.

Proximamente, el caso de estudio más típico. Reconocimiento de matrículas.

Cuidate!.

PD: Estoy deseando acabar con las presentaciones y poder entrar en materia, pero cada cosa a su tiempo.

Tagged , ,

2 thoughts on “Percepción y Visión por Computador #0

  1. […] como comenté en visión por computador #0, cada pixel tiene un valor entre 0 y 255. Un histograma es básicamente un gráfico con 255 puntos […]

    Like

  2. […] Spanish Version Turns out that there are more computer vision applications around us that we actually realise. Perception as a global concept and computer vision as a specific one, are ideas really used in the real world. Behind such reality there are “simple” things like computers reading your plate number, or more “advanced” uses like computer vision aided cancer detection. […]

    Like

Leave a comment