La paranoia sobre el espionaje

IMAGE: Alexa spy

Supongo que esta entrada será polémica, que me acusarán de estar pagado por las empresas tecnológicas y no sé cuántas tonterías más (el día que encuentre dónde diablos me ingresan todo eso que supuestamente me pagan, seré millonario), pero es que hay cosas con las que no puedo. Llevo varios días escuchando en las noticias avisos de todo tipo sobre cómo asistentes domésticos como Amazon Echo o Google Home supuestamente «espían» a sus usuarios, que si almacenan grabaciones de todo tipo, que si no las borran jamás, y que si las venden a todo tipo de socios, y cada día más impresiona más la ignorancia sobre este tipo de temas, en un entorno en el que, aunque sea por puro rozamiento, deberíamos entenderlos cada vez mejor.

Todo se origina en un par de noticias: la primera, en los Estados Unidos, corresponde a una carta escrita el pasado mayo por un senador demócrata norteamericano, Chris Coons, a Jeff Bezos, demandando información sobre el tratamiento de las grabaciones efectuadas por Amazon Echo, a la que la compañía respondió que esas grabaciones permaneces almacenadas y son utilizadas por la compañía sin fecha de caducidad, salvo que sean expresamente eliminadas por el usuario. La segunda es una noticia de un medio belga que tuvo acceso a un archivo de grabaciones almacenadas de Google Home, y que se escandaliza con el hecho de que Google las tenga almacenadas y las utilice.

Primera cuestión: estas noticias no son «descubrimientos», ni «escándalos», ni nada que se le parezca, por mucho que periodísticamente pueda resultar interesante presentarlas como tales. Cualquiera con un mínimo conocimiento de cómo funcionan estas cosas sabe perfectamente que las grabaciones, intencionadas (cuando el usuario invoca el comando que activa el asistente) o fallidas (cuando el asistente cree haber escuchado ese comando) son utilizadas no solo para llevar a cabo el comando en cuestión, sino también almacenadas, salvo que se especifique expresamente lo contrario, para mejorar la tecnología de reconocimiento de voz. ¿Puedes oponerte a ello? Sí, tanto en Amazon Echo como en Google Home puedes desactivar la casilla correspondiente, y con ello, impedirás que las grabaciones que recogen tus dispositivos sean utilizadas para entrenarlos.

Si no quieres tener uno de esos dispositivos, también puedes decidir no tenerlo, nadie te obliga a ello. Pero si decides tenerlo, es importante que entiendas que entrenar dispositivos supone, por lo general, que una persona escuche una grabación, que la etiquete y categorice lo mejor posible, y que la incorpore a una base de datos convenientemente anonimizada, base de datos que no tiene ningún sentido perder, porque es valiosa para precisamente esa tarea, entrenar algoritmos de reconocimiento de voz. Por supuesto, por muy anonimizada que esté, sigue siendo tu voz, y posiblemente serías capaz de reconocerte: simplemente, la grabación ha sido desasociada de la información personal de tu cuenta. Si todos hacemos eso, si todos renunciamos expresamente a la posibilidad de que las grabaciones que generamos con nuestro uso diario sean utilizadas para mejorar los algoritmos de reconocimiento de voz, será más complicado para las compañías tecnológicas obtener materiales para entrenar sus algoritmos, y nuestros dispositivos serán más torpes durante más tiempo. Si te sientes mejor así, puedes libremente hacerlo. Eso es todo. ¿Es lo que queremos?

Escandalizarse porque un dispositivo diseñado para escucharnos cuando hablamos, vaya y nos escuche cuando hablamos, es tremendamente absurdo. Si no quieres que te escuche, dale al botoncito que tiene, y desconectarás sus micrófonos. Puedes hacerlo en cualquier momento, aunque tener un asistente de voz para tenerlo todo el tiempo con sus micrófonos desconectados raya el absurdo existencial. Pero publicar noticias afirmando que nos espía, o que almacena nuestras grabaciones y no las borra nunca, es puro sensacionalismo: no nos espía, simplemente nos escucha como se espera que haga, aunque en algunas ocasiones – la tecnología no es perfecta – se active cuando no hemos pretendido utilizarlo. Creer que esos fallos son indicativos de que el dispositivo o la compañía nos está espiando es, sencillamente, una estupidez. Montar un lío mediático porque las grabaciones son almacenadas por las compañías es otra tontería: ¿por qué razón van las compañías a eliminar materiales valiosos que pueden ser utilizados para entrenar algoritmos de reconocimiento de voz? ¿Cómo esperamos que se entrene a un algoritmo de reconocimiento de voz, si no es mediante una muestra muy grande de grabaciones de voces? En las voces hay mucha información, y para entrenar algoritmos son completamente necesarias: acentos, modismos, formas variadísimas de pedir o preguntar algo… el entrenamiento de este tipo de algoritmos es algo complejo, y únicamente puede hacerse si podemos alimentarlos con enormes colecciones de grabaciones. Simplemente, no hay otra manera adecuada de hacerlo.

Por supuesto, esto no quiere decir que las compañías tecnológicas hagan las cosas siempre bien, ni que sean angelitos. Si una compañía tecnológica permite que esas grabaciones sean filtradas y vayan, además, vinculadas a la identidad de los usuarios – que no ha sido el caso, al menos por el momento – debería ser convenientemente castigada. Si incumple las preferencias expresadas por esos usuarios y almacena las grabaciones de aquellas personas que habían reclamado expresamente su exclusión, también. Pero en caso contrario, escandalizarnos porque nuestras grabaciones sean incorporadas a un archivo de entrenamiento es, sencillamente, absurdo. No, nadie nos está espiando. No, no están circulando nuestras grabaciones entre los empleados. Simplemente, son escuchadas y etiquetadas para tratar de entender de qué se trataba cada una, y mejorar la forma en la que el asistente las interpreta. ¡Oh, dios mío, empleados de Amazon o de Google escuchan lo que digo cuando estoy en mi casa!! Pues claro, es la única manera de etiquetarlo. De eso, no de otra cosa, se trata el machine learning. Es así como funciona.

Cuanto antes nos dejemos de falsos escándalos y de supuestas revelaciones, antes empezaremos a entender conceptos ya tan básicos como el de recolección de datos, etiquetado o entrenamiento de algoritmos. No, a nadie le interesa guardarse tu voz como su fuera un preciado tesoro, ni para filtrarla a la prensa más adelante, ni para avergonzarte publicándola en ningún sitio. No es eso. Desengáñate: nadie tiene el menor interés en espiarte, simplemente en entender qué diablos querías cuando le dijiste a tu asistente lo que le dijiste, o cuando creyó entender que le estabas pidiendo algo. Eso es todo.

Con el tiempo, los asistentes tendrán suficiente capacidad de proceso como para procesar la mayoría de las órdenes que les damos en el propio dispositivo, sin enviarlas a ningún sitio, y funcionarán, además, mejor, con menos confusiones e intentos fallidos. Pero eso solo lo alcanzaremos si nos dejamos de paranoias absurdas y de supuestos escándalos, y entendemos lo que las compañías hacen con esos datos que generamos. Nadie dice que no haya que castigar a las compañías cuando hacen las cosas mal, pero en este caso, no han hecho las cosas mal, han hecho lo que era lógico hacer. Más cultura, por favor, y menos alborotos injustificados.


This article was also published in English on Forbes, «No, your home assistant isn’t spying on you«


24 comentarios

  • #001
    Sergio - 14 julio 2019 - 12:03

    Una reflexión, propiamente dicha, que se sale de la corriente abundante y loca de «información» que recibimos todos los días siempre es bienvenida. No obstante, cuando hay intereses comerciales, siempre hay que desconfiar aunque sin entrar en paranoias y entendiendo bien como dices la finalidad con la que (supuestamente) se hacen las cosas.

  • #002
    Senpai - 14 julio 2019 - 12:42

    Hola:
    Completamente de acuerdo en tu planteamiento si no fuera porque, es utópico… Esta muy demostrado que estas empresas aunque desmarques las casillas de que no te «Geolocalicen» ¡lo hacen¡, aunque desmarques la casilla de que no te escuchen ¡lo hacen¡, yo no uso ni he usado jamas el asistente de Google en mi tfn. y siempre desmarco «todo» lo que tiene que ver con mi privacidad y aun así, el asistente se queda a la escucha y si oye la palabrita salta…
    Un saludo

    • Ángel "el bueno" - 14 julio 2019 - 18:06

      Desde luego eres el auténtico «alumno aventajado».
      Básicamente porque tienes razón aunque lo amigo Enrique ha negado todas estas cosas durante mucho mucho tiempo pero bueno qué vamos a hacer…

  • #004
    Javier Cuchí - 14 julio 2019 - 13:20

    Bueno, por el sueldo que te pagan las tecnológicas en boca de otros no te preocupes demasiado. El día menos pensado meteré en Magistratura a Telefónica et alter por el sueldo que, según el viejo Teddy, nos pagaban las telecos a los de la Asociación de Internautas y del que yo no he visto nunca ni un céntimo.
    :-D

    • Enrique Dans - 14 julio 2019 - 13:27

      ¿El mismo viejo Teddy que ahora va a volver a la misma junta directiva de la misma vieja SGAE?

      • Javier Cuchí - 14 julio 2019 - 13:39

        :'(

  • #007
    Gorki - 14 julio 2019 - 13:33

    Primera cosa

    ¿Tienes teléfono móvil o fijo? ¿Tienes conexión a Internet? ¿Tienes portátil? ¿Tu contador de luz , agua, o gas se lee a distancia? ¿Tienes portero automático o video portero?
    – No te preocupes, si alguien, sea un organismo estatal o privado. desea tenerte controlado, le sobran vías para hacerlo. Los Asistentes Personales, son sólo un posible camino mas para espiarte.

    Segundo y muy importante,

    Antes de asesinar a tu socio, no te olvide de desconectar los teléfonos móviles, la alarma de la puerta. el flibit, la sonda de la calefacción y por si acaso Internet y quitar los plomo. Seras el principal sospechoso por haber hecho todo eso, pero al menos no tendrán pruebas que presentar al tribunal.

    Ahora en serio.

    No hay que ser conspiranoico, es materialmente imposible que Amazon grabe en cada hogar 24 horas de ruido, porque eso pese a todo tipo de compresores que queramos inventar, ocuparía tal espacio en la «nube», que Amazon se caracterizaría por hacer y hacer edificios de hosting sin parar y porque eso, tiene un coste que supera con mucho lo que podría obtener de analizar el contenido.

    No obstante, es seguro porque así lo han dicho, que graban y conservan las peticiones a Alexa.

    Bien, y ¿Por qué no los trozos de conversación que contienen alguna palabra contenida en un lista o «keyword», que pueda ser que indique que estás hablando sobre algún tema, que por lo que sea, a Amazon le interesa controlar?

    Como siempre la mejor defensa es «si quieres taza, taza y media». Colocar junto al micrófono una radio de las que hablan sin parar, y casi no ponen música, para hacerle perder el tiempo con pistas falsas.

    Segundo, retrasa la adquisición de un Servidor Personal, hasta que tengas necesidad de un uso que sea razonable práctico, porque sinceramente, encender una luz y subir una persiana no merece la pena.

  • #008
    Javier Cuchí - 14 julio 2019 - 13:38

    Y dicho lo anterior, has dado en el clavo por lo menos en una cosa: la anonimización; has dado en el clavo pero, a mi entender, en sentido inverso a como lo veo yo. A mí me preocupa relativamente poco el uso individual que vayan a hacer de mis datos: en primer lugar, porque soy un mindundi cualquiera que, como tal individuo, aporto poco valor; en segundo lugar porque voy con cuidado -hasta donde es posible sin recluirse en una isla desierta y desconectada- de qué datos doy y a quien se los doy. Pero esa anonimización a la que te refieres como una especie de atenuante del problema es, a mi modo de ver las cosas, precisamente el problema.

    Porque, efectivamente, los datos individuales de centenares o miles de millones de mindundis no les sirven, como tales datos individuales, para apenas nada: lo útil es, precisamente, esa masa como tal masa, porque el big data asociado a la inteligencia artificial puede llevar, sin más dificultad que la tecnológica (es decir, cada vez con menor dificultad), a un control de los comportamientos de masa que mete miedo. Si ya existen en la actualidad sistemas de predicción de comportamientos colectivos (psicología de masas, que le dicen) y sistemas de gestión del consentimiento colectivo (básicamente los media) y funcionan razonablemente bien, dentro de un factor de imprevisibilidad aún amplio, imagínate lo que puede pasar (lo que, de hecho, me temo que pasará) cuando ese factor de imprevisibilidad se reduzca a proporciones microscópicas.

    Nada nuevo, en términos teóricos: es la predicción orwelliana.

  • #009
    Pedro Aguayo - 14 julio 2019 - 13:48

    Hola Enrique,
    lo comenté en un post anterior: si no lo has hecho ya, lée el libro «The age of surveillance capitalism» de Shosana Zuboff, que no es una conspiranoica y tiene solvencia demostrada. En dicho libro, saca sus argumentos de entrevistas con empleados y altos cargos de Google, Facebook, Amazon, etc. El tipo de «hipotética» vigilancia que se describe en este post es una travesura infantil en comparación con lo que se decribe en el libro, el estado en que están las cosas a nivel de vigilancia y privacidad. Te recomiendo que lo leas.

    Saludos

  • #010
    Xaquín - 14 julio 2019 - 15:39

    Pienso que ya el Gorki y el Cuchi pusieron las guindas necesarias al pastel de la entrada.

    Y repetir que tenemos más enemigos en la misma escalera (o chalet adosado), y no digamos en la política local (y autonómica y estatal), que en la apropiación tecnológica de datos.

  • #011
    Matt - 14 julio 2019 - 17:30

    «Si no quieres tener uno de esos dispositivos, también puedes decidir no tenerlo, nadie te obliga a ello».

    Toda la razón, por eso en mi casa no entrará nunca uno de estos. Vale que te espien (sí, esa es la palabra) pero al menos trataré de ponerselo difícil y no comprar e instalar yo mismo el aparato que sirve para ello.

  • #012
    Julio - 14 julio 2019 - 18:34

    En los comentarios de un vídeo que comentaban un altavoz inteligente, aparte de los clásicos te espían, eso se puede hacer con un smartphone, uno decía que si tiene uno de estos y unas bombillas controladas por voz, eras un Tony Stark cutre, que tenías envidia de el. Con lo cómodo que es preguntar y que te conteste, que antes de entrar a una habitación decir que te encienda la luz, o si te la has dejado encendida apagarla a distancia

  • #013
    Los Panchos - 14 julio 2019 - 19:55

    El primer párrafo es toda una provocación a que te paqueemos. Pues lo siento no me gusta la caza de los bambis que van al bosque con liguero. Que te habías creido aún tenemos nuestra ética, y si pretendias eso no seré yo…disfruta de tu pretendida pureza virginal.

    Sin embargo si me parece interesante, sacar el tema de la indecencia de estos gadgets, su funcionalidad si se podría haber implementado al 100% en los smartphones y sin embargo no lo hacen… ¿No sería más ecológico prescindir de ellos y venderlos en forma de app?. Eso no toca porqueva en contra de los intereses empresariales, si de esos que no te pagan.

    Veremos tu grado de respuesta con el ecologismo, como de no vendido está tu forma de pensar, etc, etc. Tu mismo te defines con tus actos y tus discursos. Para que echar leña al árbol caído, ¿verdad?

  • #014
    Emilio José - 14 julio 2019 - 20:21

    No es que ser paranoico, pero si la tecnología ya está, quien nos dice que no la van a utilizar con fines que no son el desarrollo del aparato. ¿Quien controla esto?

    Quis custodiet ipsos custodes?

  • #015
    Julio - 15 julio 2019 - 00:56

    «Puedes hacerlo en cualquier momento, aunque tener un asistente de voz para tenerlo todo el tiempo con sus micrófonos desconectados raya el absurdo existencial.»
    Como suelo verme muchos vídeos de estos aparatos, para al final tener los de las 3 casas :-), en un vídeo uno comentaba y hacía lo que dices, tenía un Amazon Echo, con el micrófono silenciado y cuando quería mandarle algo se acercaba, activaba el micrófono, cuando terminaba, volvía a silenciar el micrófono, le preguntamos el porque y decía que así no le espiaban, le dijimos que lo que hacía era ilógico, que para eso que no lo tenga. Otro sólo lo quería usar usando el botón acción como si estubiera usando un interfono con el ayudante

  • #016
    Enrique - 15 julio 2019 - 09:38

    Estamos en verano, si no fuera por estas tonterías los periódicos estarían vacíos.

    Estoy contigo Enrique. Luego me pasas parte de la minuta de Amazon.

  • #017
    LOS PANCHOS - 15 julio 2019 - 12:48

    La pregunta que queda por responder es porque algunas personas son más susceptibles a lo que consideran un ambiente hostil (espionaje de su privacidad) y otras son más dóciles a la domesticación de estas empresas y sus prácticas.

    Si partimos de una base de conciencia similar y un razonamiento más o menos crítico ante el mundo. con un bagaje mínimo de estudiante de ciencias preuniversitario, creo que tantos unos como otros reaccionamos de forma similar. Pero si leemos los comentarios en este blog(y otros artículos) tampoco es así hay variedad de opiniones.

    https://noticiasdelaciencia.com/art/33533/describen-los-cambios-epigeneticos-que-explican-el-sindrome-de-domesticacion-de-los-animales

    En este enlace se explica como los animales que conviven con humanos tienen cambios epigenéticos que explican un «síndrome de domesticación» . El artículo explica el motivo por el que hasta ahora no se conocía el «como» se produce este fenómeno, por otro lado de sobra conocido.

    La domesticación es en esencia el control de un ser vivo por un ser humano, nada obsta a extender este proceso a los mismos seres humanos y aunque el estudio antes citado es muy reciente, nada impide asumir que el ser humano no es ajeno a ese proceso de selección artificial para obtener beneficios de esos individuos dominantes/dominados. Parto de la base que el «ser humano domesticado» es en una gran parte voluntario y saca un beneficio de esa simbiosis, o eso cree el dominado. El que saca beneficio seguro es el dominante.

    En este escenario si parece interesante, conocer a los dominados mediante técnicas poco invasivas para que sus acciones parezcan, pero que no sean voluntarias al 100%. No es una novedad por ejemplo para la publicidad este tipo de sometimientos de la vluntad ajena. Si AHORA observan lo que buscas en internet o en un gadget con voz, tendrán un acceso directo a ti, a tus intereses, a tu yo interno.

    Y se lo pones muy fácil: tú has comprado el micro, tú pagas el acceso, tú das la información de tu vida y como el propio google dice lo hacen para mejorar tu experiencia de usuario. ¡YA!

    El proceso parece como una bola de nieve que va creciendo, cuanto más acostumbrado(domesticado) estás más de acuerdo estás al fenómeno, y disfrutas del heno cual buey manso paciendo en el prado, como el propio Enrique nos cuenta en este artículo, ¿qué hay de malo?, en estar domesticado deberíamos añadir:

    Si esa la esencia de tu propio «yo» es esa no hay nada de malo. Al fin y al cabo «el buey es de donde pace, no de dónde nace».

    Si y si es poco cómodo apagar el micro, es más cómodo tirarlo a la basura, que es de donde nunca debió salir.

  • #018
    Michel Henric-Coll - 15 julio 2019 - 17:24

    No importa cual sea la intención inicial de las escuchas y del almacenamiento, lo que importa, es que podrían (¿podrán? ser utilizadas para un control de los ciudadanos.
    Negqarlo rotundamente o tacharlo de absurdo es negar la Historia y de los Gobernantes.
    Que los datos almacenados no van a ser utilizados «personalmente» (con nombre y apellidos), tal vez no, pero globalmente, son una mina de oro para poner un termómetro en el culo de cualquier pueblo y gobernar o manipular en consecuencia.
    Si una tecnología puede ser utilizada para controlar, lo será. Tarde o temprano.
    El mejor consejo: no aceptes un caballo de Tropya en tu vida.
    «Desconfío de los griegos aunque traigan regalos». Virgilio. Eneida.

  • #019
    Mezo - 15 julio 2019 - 17:59

    Yo siempre he defendido el espionaje masivo solo tiene sentido cuando se trata de obtener victoria política sobre otros políticos de cualquier forma el 99% de la población mundial son gente común y décadas de espionaje sobre ellos no tiene nada útil solo un malgasto de recursos y dinero. El caso del espionaje via electrónico se utiliza para desmentir los argumentos de tu rival como el caso del periodista Jamal Khashoggi cuya muerte fue resuelta en horas gracias al espionaje en su Smartwatch destruyendo el argumento de Arabia Saudi causando más tensiones entre esta y occidente.

    Y no olvidemos el caso de Zuckerberg llamado a declarar al congreso de los estado unidos al conocerse sus intenciones de obtener cargos públicos y cómo se relaciona con el espionaje masivo realizado por FB a los actuales congresistas, no sorprende que Jeff Bezos se le cuestiona por el tema por el mismo político

  • #020
    Gerardo - 15 julio 2019 - 22:11

    Esos dispositivos estan diseñados para espiar al igual que facebook todo se almacena sin importar que desmaques todas las casillas. Si no quieres que te espien no uses esas mugres.

  • #021
    Rosa Eube - 15 julio 2019 - 23:23

    ¡No seas tan genuflexo! https://www.xataka.com/privacidad/he-mirado-todos-los-datos-que-google-tiene-sobre-mi-y-confirmo-que-es-el-gran-hermano-definitivo

  • #022
    acerswap - 16 julio 2019 - 00:05

    No solo se trata del uso que le den, sino de la falta de ética de estas compañías. Si a mi me dicen que se va a usar la información exclusivamente para entrenar al algoritmo, de manera anonimizada y solo se almacenará esa información por tiempo limitado estoy de acuerdo, pero la experiencia nos ha dicho que se están ignorando las instrucciones expresas de borrar esa información.

    También se ha comprobado que a partir de esa información es posible obtener los datos de quienes han sido grabados (con lo que la anonimización es relativa) y que está llegando a manos de terceros de los que no se sabe quienes son ni que intenciones pueden tener (lo mismo no cumplen los mismos estándares éticos que la compañía que los contrata).

    Esto hace que debamos dudar siempre antes de dar nuestro consentimiento y ponernos en lo peor. Por otra parte, ¿quien nos garantiza que esa información vaya a seguir siendo secreta? ¿Y si un gobierno totalitario aprueba una ley en la que puede requisar esas grabaciones y usarlas para obtener información sobre tu ideología?

  • #023
    Pedro - 19 julio 2019 - 06:07

    ¿Y qué decimos de esto?

    https://www.trecebits.com/2019/07/12/google-admite-que-escucha-las-conversaciones-de-los-usuarios/

    • Enrique Dans - 19 julio 2019 - 11:50

      Decimos exactamente lo mismo: que por supuesto que hay humanos que escuchan las grabaciones. Las escuchan, las etiquetan y las usan para mejorar el entrenamiento de los algoritmos. No las usan para descojonarse de risa, ni para enviarlas a sus amigos, ni para comentarlas en la cafetería. Es lo que hay que hacer para tener algoritmos de reconocimiento de voz razonablemente buenos. Es exactamente lo mismo que he dicho en el artículo: no existe otra forma de hacerlo.

Dejar un Comentario

Los comentarios están cerrados