Una de esas nuevas prestaciones presentadas por Google que me llaman especialmente la atención: YouTube Automatic Captions permite, utilizando tecnología de reconocimiento del habla, insertar subtítulos generados automáticamente a partir del sonido de un vídeo. Lógicamente, no son perfectos, pero pueden servir de guía aproximada para personas con problemas de audición o para quienes no dominan el idioma del vídeo. Además, los subtítulos pueden insertarse directamente traducidos a otros idiomas, lo que convierte en accesibles una gran cantidad de vídeos del inmenso repositorio de la herramienta.
La otra herramienta, YouTube Automatic Timing, permite subir un archivo de subtítulos en un vídeo, y que la herramienta inserte, también utilizando tecnología de reconocimiento del habla, cada frase en su lugar correspondiente, evitando tener que hacerlo manualmente.
Las dos tecnologías aparecen presentadas en este vídeo. La reconstrucción de la torre de Babel, un poquito más cerca, y como bien han visto en los primeros comentarios a la entrada, no solo para las personas: las dos tecnologías permiten, por un lado, hacer accesible a los anunciantes la contextualización de sus anuncios al texto de los vídeos y, por otro, la ubicación de dichos anuncios en los momentos adecuados, cuando una palabra determinada es mencionada en los mismos. El vídeo es un formato de contenido que está cambiando la fisionomía de la red, y su principal exponente, YouTube, es una empresa que, de acuerdo con uno de sus principales inversores históricos, podría haber alcanzado ya la rentabilidad.
Y de aquí, a incluir la posibilidad de hacer búsquedas sobre videos por palabras incluidas en su contenido hay un paso…
Los anuncios contextualizados en Youtube a la vuelta de la esquina…
#1 y #2: muy buen punto, lo incorporo a la entrada.
#2: Hay que monetizar el producto… llegará el día que en un vídeo, cuando se diga «refresco» o «tengo sed», aparezca el anuncio de alguna de las marcas más conocidas. El proceso creativo que siguió Google para conseguir ingresos para sí, vuelve a dar sus frutos.
Cuando tuviste el brazo derecho chungo, creo que sugeri que en vez de darle al teclado con la mano izquierda probaras algun hable-escribe: programa que traduce la voz a texto.
El subtitulado automatico de los tubes tiene que indicar que se han producido avances significativos en la conversion de voz a texto.
Quizas el recurso a un laringofono incremente la tasa de acierto e incluso reduzca los problemas derivados de la distorsion por ruido ambiental, interferencias emocionales, ronquera u obturacion de las vias respiratorias por acatarramiento.
Supuesto que se hayan dado tales avances decisivos, cabe esperar que el escribir en un movil, via un laringofono capaz de capturar las minimas vibraciones derivadas de la intravocalizacion en silencio resulte mucho mas practico y discreto o incluso devenga en la forma mas popular de escribir. Entre el teclado y el laringofono, la escritura manuscrita va a quedar para los carrozas.
La subtitulacion de los tubes tiene un alcance que va mas allá del servicio que pueda prestar a sordos y desconocedores del idioma, ya que permite marcar, asociar y recuperar la informacion con mucha mayor precision y detalle. Ademas al ser tambien automatica la sincronizacion de los subtitulos se añade un aliciente para el eventual traductor ya que podra centrarse en pulir el texto .
Mi opinión que tras lo que anda Google conseguir la traducción automática on-line, bien entre un contenido, sea texto o vídeo y el usuario, o entre entre dos usuarios de distinta lengua..
Manejo con cierta frecuencia el traductor de Google, sin ser aun perfecto, la calidad que ha alcanzado en los últimos tiempos es espectacular, De forma que ya la traducción es absolutamente que devuelve es muy comprensible y diría que correcta en más de un 855 de las frases, Esto que presentan hoy, me parece un paso más en la misma dirección.
Piensen lo que sería poder leer un libro de arquitectura en polaco, o ver una película de Bolywood traducida automáticamente a tu idiomaa. Piensen lo que sería una videoconferencia, entre un español y un coreano, cada uno hablando en su lengua y enviándose documentos, en su idioma y que los dos se entendieran sin problemas.
Pues bueno, ese inmenso mercado, lo tiene Google para el solo, pues en este momento, ha sacado tal distancia a los demás sistemas traductores, que no existe enemigo, no es que dea lider, es que esta absolutamente solo, no es un monopolio, es que no existe la competencia.
Dicen que el perfeccionamiento de la traducción, la ha conseguido comparando los mismos títulos de libros traducidos a en diferentes idiomas, de forma que hoy no tiene un diccionario de palabras, sino de frases completas.
También he leído por ahí, que sul motor de traducción traslada las frases del idioma a un «esperanto digital» basado en el sistema oriental de transformar frases en ideogramas y pasar esos ideogramas a cualquier idioma, de forma que estableciendo la correlación entre un nuevo idioma con los «ideogramas digitales» y viceversa, estomáticamente queda conectado con todos los demás idiomas que ya lo estén. ..
Estoy empezando a coger vértigo con lo que este avance puede traer consigo. ¿Será el precursor de el «Traductor Universal» de StarTrek?
#7, lo que hoy es ciencia ficción, mañana es ciencia a secas…..
A alguien le suena la cifra 2012…El mundo no volvera a ser como es…nos lo habían advertido. Un montón de debates externos sin hacer caso de avances que en cualquier momento romperan los sistemas de sociedad actual. Luego todos a correr. No hace falta ser Julio Verne…tu me entiendes.
Continuando con el comentario #1 y #2 en el Techcrunch50 de este año se presentó AnyClip (vídeo demo) que permite la búsqueda de palabras en fragmentos de películas.
Ya lo veíamos en la presentación del Google Wave: un chat bilingüe traducido ontime! Las posibilidades de una tecnología así, aplicada a texto, audio, vídeo… revolucionará el mundo de la comunicación internacional.
Y cuando sea un implante cerebral, ya te cagarás… ;-)
La búsqueda de palabras en fragmentos de videos abre todo un mundo de posibilidades a nivel de marketinh y publicidad, esperemos que se desarrolle mejor esta tecnología porque será un gran campo a explotar.
Si windows compra una empresa es monopolista. SI Google lo hace es que es un ‘apoyatalentos’
¿Ayudar a las personas que no oyen, acercar los contenidos a los discapacitados? ¿¿pero què dice ?? eso es eufemismo. Steve Ballmer se apersonó de Youtube para hacerlo rentable (lo cual no està mal) pero estos discursos pseudosociales son engañosos. Le estamos entregando el sentido del lenguaje y de la comunicaciòn a Google. En un futuro las cosas se llamaràn y significaràn como lo diga Google. Yo me aparto de estar compartièndoles toda mi info.
Es muy interesante y he hecho una entrada en mi blog tratando de explicarlo con imágenes.
De cualquier forma la calidad de las traducciones de Google dejan mucho que desear. No se acercan, ni de lejos a las traducciones del traductor gratuito online «Promt».
De lo que estoy seguro es que al final conseguirán hacerlo bien y será un gran logro para las comunicaciones entre personas con idiomas diferentes.
Será toda una revolución social, económica, educativa, etc.