La máquina que ve

Images rebult with few pixels Conseguir que las máquinas puedan ver, o mejor dicho, identificar y procesar lo que ven, es algo que vendría muy bien para muchas cuestiones. Pero si el obtener imágenes es ya una cuestión trivial en la red de hoy, el identificarlas y procesarlas para poder pedir a una máquina que recupere fotografías de paisajes, de edificios o hasta de una persona determinada no lo es en absoluto.

Para ello, un investigador español del MIT, Antonio Torralba, trabaja con enormes bancos de más de ochenta millones de imágenes diminutas, y degrada la resolución de las mismas progresivamente para ver hasta qué punto mantienen patrones que las identifiquen o caractericen. Llego al tema desde Slashdot pasando por Roland Piquepaille, me ha parecido muy interesante, y me he encontrado con esta conferencia del propio Antonio explicando el tema que, para aquellos a los que os interese ampliar información, está la mar de interesante. La versión más desarrollada del tema aparece en MIT News.

El tema se basa en la identificación de patrones en imágenes de baja resolución, algo que me recuerda a mis intentos por arreglármelas sin mis gafas de diez dioptrías cuando estaba en plena edad del pavo y me negaba a ponérmelas incluso cuando las incipientes lentillas (de aquella época) me provocaban inflamaciones. Se trata de encontrar la mínima representación numérica derivada de una imagen, capaz de proporcionar información relevante sobre su contenido. Si se puede conseguir que dicha información caracterice a la imagen, y que dos imágenes con informaciones parecidas tengan sujetos o temáticas parecidas, la búsqueda de imágenes pasaría a ser indudablemente mucho más relevante. Cuando menos, el sistema debería funcionar para identificar las imágenes más comunes, aunque fuese más problemática para imágenes menos habituales, como ocurre con el lenguaje y las palabras que se usan poco. Los resultados de la línea de investigación son aún preliminares, pero el tema parece sumamente prometedor.

#001
Pablo - 25 mayo 2008 - 12:08
Identificar una imagen a partir de patrones es muy relativo. Nosotros podemos identificarlas a partir de «recuerdos». Por ejemplo, si vemos desde lejos un objeto grande con cuatro ruedas, sabemos que es un coche, ya que estamos muy acostumbrados a verlos. En cambio, si pones a alguien que no está acostumbrado a verlos (pero ojo, que si ha visto a alguno), por ejemplo, un habitante de un pueblo apartado, le costará mas distinguirlo.
En cambio, si ese hombre está acostumbrado, por ejemplo, a cazar, y salimos con el de cacería, el distinguirá muchísimo mejor que nosotros las presas, ya que el está mas habituado que nosotros.a verlas.
Con los ordenadores pasa lo mismo. De funcionar ese sistema, tendría que tener algun tipo de «memoria» adaptada a cada tipo de situación, y costaría bastante tiempo de procesamiento y memoria adaptarla.
Saludos.
#002
Gorki - 25 mayo 2008 - 13:28
Lo que dice Pablo es cierto,los cazadores y gente de campo, son capaces de distinguir una perdiz o una libre donde los de ciudad no vemos mas que piedras y matas.
Por otra parte es un trabajo intelectual identificar una imagen de algo que parece cada vez de una forma difernte, vista de frente, de lado, al reves, o como sea.
#003
Prognatis - 25 mayo 2008 - 13:47
Parece ciencia ficción. Es como la máquina de detectar los recuerdos de los replicantes de Blade Runner.
#004
frikosal - 25 mayo 2008 - 13:52
Si pero eso va a permitir identificar con nombre y apellidos a todos los que participen en una manisfestación o entren en un supermercado y compren un producto en concreto, por ejemplo. A mi personalmente, de todos los avances en computación este es uno de los que menos gracia me hacen. Va a ser el fin de la poca intimidad que teníamos.
#005
Valentín Pedrosa - 25 mayo 2008 - 15:58
Yo con mis ocho dioptrías, que aún tengo, he conseguido encontrar patrones para ir desde la cama al baño sin tropezar con la mesilla; pero poco más.:)
#006
Jose - 25 mayo 2008 - 22:41
El trabajo que citas es interesante. Gran parte de lo que describes (por ejemplo, la 2da mitad del párrafo final), es básicamente el fundamento de la visión por computador. Me parece algo ingenua la frase «Conseguir que las máquinas puedan ver, o mejor dicho, identificar y procesar lo que ven, es algo que vendría muy bien para muchas cuestiones». En visión por computador ha habido grandes avances y hoy en día se usan cotidianamente sistemas de visión: desde el lector de matrículas del aeropuerto hasta cámaras para detectar defectos en productos fabricados en cadena y muchos otros ejemplos. Es cierto que se sigue investigando y que Torralba es un conocido científico en el campo, pero en la «blogosfera tecnológica» he podido comprobar el desconocimiento o desinterés por el tema. Felicidades por el blog.
#007
CyberGus - 26 mayo 2008 - 10:50
Hablando de reconocimiento de imagen… Conoces Evernote?
Creo que te va a interesar bastante:
http://www.youtube.com/watch?v=i_ncr1Ee9e8