En este trabajo se integran conceptos de computer
vision y de robótica con el objetivo de que NAO realice las tres tareas
mencionadas previamente: localización, acercamiento y pateo de una pelota. Los
conceptos de computer vision se aplican en la parte de localización de una
pelota, mientras que la teoría sobre robótica es aplicada para las tareas de
acercamiento y pateo de una pelota.
Una imagen en el área de computer vision es tratada
como una matriz de pixeles, los cuales tienen diferentes valores de color. Este
valor de color varía dependiendo del modelo que se use para representar la gama
de colores. Entre los modelos más conocidos se encuentran el RGB (Red, Green,
Blue), y HSV (Hue, Saturation, Value).
En este trabajo los colores se representaran usando el modelo HSV, ya
que este permite distinguir mejor que el modelo RGB un color de otro, debido a
que en el modelo RGB no los valores del vector RGB se relacionan con la
iluminación del medio ambiente, y por tanto se relacionan entre ellos (Cheng,
Jiang, Sun & Wang, 2001). Por eso, el modelo HSV ofrece una descripción del
color mucho más precisa.
Con el objetivo de localizar una pelota dentro de una
imagen, se usaran dos tipos de filtros: de color y de figura. Para el filtro
por color, basta con describir los valores de color de cada uno de los pixeles
pertenecientes a la imagen en formato HSV, y establecer el rango de valores en
este mismo formato que se quieren extraer de la imagen. Luego de que una imagen
es filtrada por color, será filtrada por figura. Este último filtro se hace
usando una técnica llamada transformada de Hough. Para aplicar esta técnica
sobre una imagen, es necesario primero extraer de dicha imagen los píxeles que
tienen sus características más notables, o bordes, usando una técnica llamada
filtro de Canny. Esta extracción de bordes se hace para crear una imagen basada
en la original cuyo procesamiento es más ligero, por lo que funciona como un
parámetro de entrada adecuado para la transformada de Hough.
El filtro de Canny detecta los píxeles en los que haya
un cambio significativo de color, de iluminación, de superficie o de
profundidad, calculando las derivadas parciales para los ejes x e y de la
imagen en función de su intensidad, con lo que se obtiene la magnitud y
dirección del gradiente para cada pixel. Luego, se seleccionan los píxeles cuya
magnitud de gradiente es más grande, y después dichos píxeles se unen para
reconstruir la imagen original. Esos píxeles son los llamados “bordes” (Canny,
1986).
Por su parte, la transformada de Hough usa la muestra
de píxeles dada por el filtro de Canny, y usa un sistema de votación para
determinar cuáles corresponden a un círculo. Este método recorre la imagen
píxel por píxel, y en una matriz de tres dimensiones, que corresponden al
centro de un círculo y a las coordenadas x e y de su centro, almacena los
valores de todos los círculos que podrían pasar por ese punto. Si dos píxeles
pertenecen al mismo círculo, entonces cuando la transformada de Hough analice y
almacene los valores de todos los círculos que pasen por este punto, habrá unos
parámetros de círculo que estén repetidos, por lo que dichos parámetros
recibirán un voto. Si hay parámetros de círculo cuyos votos superan cierto
umbral, entonces la transformada determinará que en la imagen hay un círculo
con dichos parámetros (Duda & Hart, 1972).
El robot NAO tiene un módulo de cinemática inversa que
facilita las tareas de acercamiento a la pelota y pateo. La cinemática inversa
es la técnica que permite determinar la rotación o movimiento de una cadena de
motores que pertenecen a un objeto para lograr que este se ubique en una
posición concreta (Paul, 1981).
No hay comentarios:
Publicar un comentario