Una entrada en el blog de YouTube, «Five stars dominate rankings«, aporta evidencias que demuestran que el sistema de puntuaciones de una a cinco estrellas utilizado en el repositorio de vídeos no está funcionando demasiado bien: la mayoría de las personas que se molestan en puntuar los vídeos que ven, lo hacen otorgando únicamente la puntuación de cinco estrellas, que se convierte en prácticamente la única de la que se hace un uso regular (la de una estrella, usada para puntuar negativamente, es la única que obtiene un uso significativo, pero aún así con una frecuencia alrededor de diez veces inferior a las cinco estrellas). Además, el porcentaje de usuarios que realmente utilizan el sistema de puntuación es sumamente bajo con respecto al total de los que visualizan los vídeos.
Los datos son una clara demostración de que el sistema empleado para puntuar los contenidos en YouTube está siendo claramente ineficiente, y debería ser sustituido. Lo interesante, por supuesto, son las posibilidades de sustitución. Por un lado, nos encontraríamos sistemas del tipo «todo o nada»: dado que los usuarios únicamente se sienten tentados a puntuar aquellos vídeos que les encantan, un único clic para poder marcar el vídeo como «Muy bueno» o «Recomendable» podría ser una posibilidad. Sin embargo, también se podría optar por un sistema que permitiese expresar negatividad, cuando algo realmente no te gusta, convirtiendo el sistema de evaluación en un «pulgar arriba, pulgar abajo» al más genuino estilo romano. Cualquier complicación adicional, como una escala de tres del tipo «no gusta, neutro, sí gusta» acabaría seguramente teniendo el mismo problema de desuso: lo neutro tiende a no ser utilizado, sustituido simplemente por la inacción.
Pero cabe una posibilidad más: los sistemas descritos recurren a un método de calificación explícito, es decir, una puntuación que depende de una acción del usuario, de la decisión de puntuar. Pero cabe la posibilidad de utilizar un sistema implícito, es decir, en el que el usuario no tenga que hacer nada, y la puntuación se extraiga de matices derivados de su comportamiento. Por ejemplo, ver el vídeo en su totalidad puntuaría más que verlo parcialmente, y acciones como reenviarlo, embeberlo, descargarlo o comentarlo en sitios sociales podrían dar lugar a puntuaciones elevadas, porque implican un trabajo adicional por parte del usuario. Existen una amplia variedad de sistemas que utilizan este tipo de datos, o que introducen otros como la secuencia con la que las puntuaciones son recibidas, el tiempo de permanencia en la página, los movimientos del ratón, etc., o incluso una combinación de sistemas explícitos e implícitos.
La discusión permite reflexionar sobre el valor de este tipo de sistemas, o del análisis de los datos proporcionados por los usuarios: habitualmente, los usuarios consideran invasiva la petición de datos explícitos, pero toleran perfectamente la recolección de datos implícitos de su comportamiento, que sin embargo en ocasiones pueden generar información mucho más sutil y valiosa que, además, no suele estar sujeta a una especial protección. Las recomendaciones de Amazon, que incluyen comportamiento de compra, pero también visualizaciones de página, búsquedas y puntuaciones en un sistema de cinco estrellas, son un ejemplo de sistema de entrada múltiple que termina, al cabo de un cierto nivel de uso, siendo muy útil y generando recomendaciones de gran calidad. En cualquier caso, resulta interesante comprobar como algo tan descomunal como YouTube es, en realidad, un sistema «nacido ayer» que todavía está perfeccionando el funcionamiento de algunas de sus partes…
No hay duda de que obtener retroalimentación relevante por parte de los clientes es una de las dificultades a las que se enfrenta cualquier organización. Un ejemplo evidente son las típicas «encuestas de satisfacción», que suelen conseguir escasa efectividad.
Otra opción para conseguir la participación es el uso de incentivos selectivos (positivos normalmente). «Dame algún motivo para invertir mi tiempo y esfuerzo en proporcionarte información y quizás lo haga», en pocas palabras.
Un problema de la parte implícita es el cómo valorar determinadas acciones, que siempre tendrá críticas de su efectividad. Por ejemplo, en si un video ha sido o no reproducido en su totalidad darle mayor o menor valor, eso puede ser crítico cuando ese mismo vídeo resulta ser muy interesante y valorado por los usuarios 10 segundos determinados del mismo, mientras que el sistema de valoración implícito le daría poco valor.
Como ya he indicado en otros mensajes, es necesario un sistema de recomendación universal y “fiable” para la Red. Cuando esto suceda los fundamentos del “Long Tail” se encontrarán con un importantísimo empujón.
Con un sistema universal y fiable me refiero a que los criterios e implementación sean transparentes, es decir, que en ellos intervenga cierta estandarización, y si es posible, la utilización de código abierto que impida introducir manipulaciones en el sistema.
El otro pilar necesario para un buen sistema de recomendación es que esté sustentado por la mayor participación posible y en este caso la clave está en la frase que ha escrito JFA en su primer comentario: “Dame algún motivo para invertir mi tiempo y esfuerzo en proporcionarte información y quizás lo haga”.
Ahora, lo que vemos en la mayor parte de los sistemas de recomendación son desordenadas montañas virales de mensajes aportando opiniones, útiles o no, sobre el vídeo, producto, blog, noticia con mayor visibilidad. Y es que es el último factor, la visibilidad, el que sin duda tiene mayor impacto sobre la participación.
El gran problema es que dar tanta importancia a la visibilidad tiene el pernicioso efecto de la polarización, con lo que las opiniones se ven arrastradas por un efecto dominó que desequilibra la participación y deja a una inmensa cantidad de vídeos, productos, blogs y noticias condenados al ostracismo.
Lo que está claro es que un buen sistema de recomendación en cuanto a fiabilidad y participación nos proporcionaría un filón en cuanto a la búsqueda de negocios, oportunidades y talento; que se traduciría en un empujón socio-económico a nivel mundial bastante importante.
Hablé profusamente del tema en el blog de Mirotele: http://mirotele.wordpress.com/2009/09/23/las-limitaciones-de-tu-red/
En otro orden de cosas, estoy al 100% de acuerdo con la opinión de Overflow y ese es el propósito de los recomendadores balanceados.
Estoy seguro que más de la mitad de las cinco estrellas marcadas proceden del entorno de las mismas personas que subieron los videos, el propio autor o su mamá. No valoro en mucho esa recomendación.
Aun pudiendo ser engañado con practicas SEO, considero mas eficaz el sistema indirecto de valoración que indicas, basado en si se llega o no a ver el 90% del vídeo, se reenvia, se hace algún comentario o si se realiza alguna otra acción. Un sencillo algoritmo y unos cuantos contadores podría evaluar con más probabilidad de acierto la importancia de los vídeos de esa forma.
Con todo el problema fundamental del manejo de los vídeos está en que los buscadores no funcionan bien en ellos y no son cpaces de seleccionar los vídeos relevantes, por ejemplo si buscas » leones», no te da los vídeos con leones rotulados como fauna» «áfrica» que tiene leones aunque tengan escrito «Lion» en una tag.
Para mi esto ya es problema en Flickr pero lo es aun más en Youtube, pues en un vídeo hay mucha más información que en una foto fija y habría que llenar de tags las referencias del video.
No creo que las puntuaciones negativas sean una buena idea en YouTube (una estrella no es una puntuación negativa en mi opinión), dado que depende de las subidas de vídeos hechas por voluntarios. Si un vídeo llega a tener más votos negativos que positivos ello puede desincentivar que ese usuarios suba más vídeos en el futuro.
Posiblemente lo mejor para YouTube sería una puntuación con una sola posibilidad, estilo «¿Recomendarías este vídeo?», y que se pueda marcar «Sí». Además, claro, de las valoraciones implícitas. La categoría de «Los más vistos», o que la web diga «Visto tantas veces» se usa en muchos sitios, incluido YouTube, y es de las implícitas.
Lo que a mi me cabe preguntarme es hasta qué punto merece la pena invertir dinero en solucionar una funcionalidad de un servicio tan deficitario como youtube.
Imagiono que google anda más preocupado con encontrar la forma de monetizarlo razonablemente…
Ah, pero… ¿No estamos ya usando la valoracion implicita? Creo que hace tiempo que miramos cuanta gente le ha dado a «like» en Google Reader antes incluso de mirar el contenido de un post.. Incluso nos hace mas gracia (subconscientemente percibida) si ya hemos visto que a mucha gente le ha gustado el Dilbert/xkcd/geek&poke/LOLcat etc. del dia.
Si mucha gente nos comparte el mismo post en GRedader, lo mismo, le damos mas valor y atencion que si simplemente nos lo encontraramos en nuestro feed a secas. Nos gusta saber que pertenecemos al grupo, al conjunto, y que nos gustan las mismas cosas. Nos hace sentir unidos, participante, influenciadores, etc.
Si vemos que en twitter todo el mundo habla de las fotos retocadas de las hijas de ZP y la mayoria apuntan al mismo sitio, vamos ahi a verlas antes que a otro link.
Si hay un trendingtopic esta claro que algo anda caliente por ahi.
Si una cancion esta en varias listas de Spotify compartidas via cualquier red socual, aunque sea sin darnos cuenta, vamos a valorarla mas. Y lo mismo, si todos estamos de acuerdo en que «Loba» de Shakira es la peor cancion del mundo, mas gente se unira al carro (y algun valiente con el gusto en el **** se atrevera a defenderla)
Ser incluido en StumbleUpon, Diggeado, compartido en Forocoches en un hilo con muchas respuestas…
Bueno, tendria muchos mas ejemplos de valoracion implicita que ya funciona perfectamente bien. Seguro que en este mismo blog, mas comentarios llaman a mas visitas y a mas comentarios como un circulo vicioso. (y sus extensiones ‘meneadas’)
PD: perdon por la faltas de acentos.
Llevo un par de años en el mundo de los sistemas de recomendación, y este asunto de las votaciones siempre es un problema recurrente del que no existe una solución mágica. Hay ciertos servicios de recomendación en los que te piden una valoración del 1 al 10, o 1 a 5 estrelllas… El problema está en que no se utilizan los valores intermedios, solamente 1, 10 o 5. O los usuarios tienen vicios y siempre usan el 4 y el 6… Y además es poco usable, por lo que a la larga el usuario deja de votar.
En www.dooplan.com también usamos los votos a eventos para alimentar el recomendador. La solución que hemos adoptado en dooplan es la siguiente, 3 botones: «No me gusta» vale 2, «Me gusta» vale 8 y «Voy!» vale 9. Además cuando votas un evento pasado (se supone que fuiste), se valora como 0 o 10. Luego hay otras variaciones para votaciones implícitas, pero ya es profundizar demasiado. Por qué este sistema? Por que los botones de «Me gusta/No me gusta» son muy intuitivos y «usables», y el botón de Voy además supone una funcionalidad para añadirlo a tu agenda. El usuario «no es consciente» de que está votando, pero la propia naturaleza de la web hace que vaya usando los botones.
Por qué valores intermedios en eventos futuros y extremos en eventos pasados? Porque opinar es gratis y a veces tenemos el gatillo muy flojo, así que los votos a eventos futuros no tienen un valor tan decisivo como cuando votas a uno que ya ha pasado. Si votas algo que ya ha pasado es que realmente te interesa dar tu opinión, y si te gustó, te gustó de verdad (y viceversa).
La solución para youtube… podría pasar por votaciones implícitas (dependiendo del tiempo de visualización del vídeo, comentarios, si lo reenvías, si buscas más parecidos…)
Como siempre datos interesantes en tu blog. Es interesante ver como dices que despues de tantos años de estar en el negocio y con el trafico con el que youtube cuenta aun esten tratando de mejorar algunos puntos de su estructura, sin embargo es bueno ver que estan preocupados por hacerlo, porque muchas otras páginas no le podrian especial interes a este tipo de datos si cuentan con el trafico que youtube tiene, bien por ellos y esperemos a ver cuales seran los cambios.
Podrían hacer como en Blippr, teniendo en cuenta además que cuando ves un vídeo puede, efectivamente, ocurrir 3 cosas:
·que de verdad resulte interesante la información, te rías, te sorprendas al ver el vídeo, incluso lo comentes, lo añadas como favorito, te suscribas…
·que pase sin pena ni gloria, esto es, que no termines de verlo o que directamente ni puntúes (algo que añadiría, aunque se calcule fácilmente: los que «ya lo han visto pero no han votado»)
·que pases hacia adelante porque estés buscando una parte más interesante o porque sabes que en el minuto X ocurrirá «esto»
Supongo que aún no existe un criterio perfecto para conocer la opinión de los usuarios, por que muchas acciones son difíciles de procesar (poner el vídeo pero no verlo, escuchar música, dejar cargando varios sin sonido y luego ver sólo uno…).
En cualquier caso, si se tienen en cuenta esos aspectos implícitos, los explícitos deben ser los más sencillos y animantes posibles para puntuar.
No creo que las puntuaciones negativas sean una buena idea en YouTube (una estrella no es una puntuación negativa en mi opinión), dado que depende de las subidas de vídeos hechas por voluntarios. Si un vídeo llega a tener más votos negativos que positivos ello puede desincentivar que ese usuarios suba más vídeos en el futuro.
Posiblemente lo mejor para YouTube sería una puntuación con una sola posibilidad, estilo “¿Recomendarías este vídeo?”, y que se pueda marcar “Sí”. Además, claro, de las valoraciones implícitas. La categoría de “Los más vistos”, o que la web diga “Visto tantas veces” se usa en muchos sitios, incluido YouTube, y es de las implícitas.