Seminario de Investigación: Marco de referencia

En este trabajo se integran conceptos de computer vision y de robótica con el objetivo de que NAO realice las tres tareas mencionadas previamente: localización, acercamiento y pateo de una pelota. Los conceptos de computer vision se aplican en la parte de localización de una pelota, mientras que la teoría sobre robótica es aplicada para las tareas de acercamiento y pateo de una pelota.

Una imagen en el área de computer vision es tratada como una matriz de pixeles, los cuales tienen diferentes valores de color. Este valor de color varía dependiendo del modelo que se use para representar la gama de colores. Entre los modelos más conocidos se encuentran el RGB (Red, Green, Blue), y HSV (Hue, Saturation, Value). En este trabajo los colores se representaran usando el modelo HSV, ya que este permite distinguir mejor que el modelo RGB un color de otro, debido a que en el modelo RGB no los valores del vector RGB se relacionan con la iluminación del medio ambiente, y por tanto se relacionan entre ellos (Cheng, Jiang, Sun & Wang, 2001). Por eso, el modelo HSV ofrece una descripción del color mucho más precisa.

Con el objetivo de localizar una pelota dentro de una imagen, se usaran dos tipos de filtros: de color y de figura. Para el filtro por color, basta con describir los valores de color de cada uno de los pixeles pertenecientes a la imagen en formato HSV, y establecer el rango de valores en este mismo formato que se quieren extraer de la imagen. Luego de que una imagen es filtrada por color, será filtrada por figura. Este último filtro se hace usando una técnica llamada transformada de Hough. Para aplicar esta técnica sobre una imagen, es necesario primero extraer de dicha imagen los píxeles que tienen sus características más notables, o bordes, usando una técnica llamada filtro de Canny. Esta extracción de bordes se hace para crear una imagen basada en la original cuyo procesamiento es más ligero, por lo que funciona como un parámetro de entrada adecuado para la transformada de Hough.

El filtro de Canny detecta los píxeles en los que haya un cambio significativo de color, de iluminación, de superficie o de profundidad, calculando las derivadas parciales para los ejes x e y de la imagen en función de su intensidad, con lo que se obtiene la magnitud y dirección del gradiente para cada pixel. Luego, se seleccionan los píxeles cuya magnitud de gradiente es más grande, y después dichos píxeles se unen para reconstruir la imagen original. Esos píxeles son los llamados “bordes” (Canny, 1986).

Por su parte, la transformada de Hough usa la muestra de píxeles dada por el filtro de Canny, y usa un sistema de votación para determinar cuáles corresponden a un círculo. Este método recorre la imagen píxel por píxel, y en una matriz de tres dimensiones, que corresponden al centro de un círculo y a las coordenadas x e y de su centro, almacena los valores de todos los círculos que podrían pasar por ese punto. Si dos píxeles pertenecen al mismo círculo, entonces cuando la transformada de Hough analice y almacene los valores de todos los círculos que pasen por este punto, habrá unos parámetros de círculo que estén repetidos, por lo que dichos parámetros recibirán un voto. Si hay parámetros de círculo cuyos votos superan cierto umbral, entonces la transformada determinará que en la imagen hay un círculo con dichos parámetros (Duda & Hart, 1972).

El robot NAO tiene un módulo de cinemática inversa que facilita las tareas de acercamiento a la pelota y pateo. La cinemática inversa es la técnica que permite determinar la rotación o movimiento de una cadena de motores que pertenecen a un objeto para lograr que este se ubique en una posición concreta (Paul, 1981).

Seminario de Investigación

martes, 11 de noviembre de 2014

Marco de referencia

No hay comentarios:

Publicar un comentario