Bloomberg Businessweek ha publicado esta semana una investigación que detalla cómo gigantes tecnológicos como Amazon, Apple, Google, Microsoft y Facebook manejan las transcripciones de los asistentes de voz, confiando en gran medida en contratistas y poniendo en duda la privacidad de los usuarios.
Bajo el título 'Silicon Valley está escuchando sus momentos más íntimos', la publicación recuerda que a día de hoy se está librando una guerra entre las compañías más grandes del mundo, que buscan incorporar sus dispositivos inteligentes en la vida de las personas. Aunque estas empresas aseguran que sus aparatos solo graban audios al ser activados, sus micrófonos en cocinas y dormitorios pueden captar inadvertidamente sonidos que los usuarios nunca tuvieron la intención de compartir. Además, los llamados dispositivos inteligentes dependen, en realidad, de miles de personas contratadas que anotan fragmentos de sonido para que las compañías tecnológicas puedan actualizar sus 'oídos electrónicos'.
"Ninguna grabación es demasiado privada"
Apple fue una de las primeras en utilizar a los contratistas para analizar la "montaña incalculable de datos de voz naturales y gratuitos" que obtuvo tras lanzar en 2011 el iPhone 4S con Siri y vender más de cuatro millones de dispositivos en cuestión de días.
Excontratistas consultados por Bloomberg recuerdan que tenían que transcribir 1.300 clips al día con un programa que no permitía eliminar un audio ofensivo o inapropiado, como los de usuarios borrachos o personas que dictaban mensajes sexuales. A los contratistas que preguntaron a los jefes si podían saltar clips demasiado privados se les dijo que "ningún clip era demasiado privado", afirma el artículo, agregando que los empleados a menudo duraban solo un par de meses, y la capacitación en temas de privacidad era mínima.
Para 2015, una función permitía a los usuarios activar el asistente de voz sin presionar un botón en el iPhone. Apple admitía en el acuerdo del usuario que los datos de voz podrían grabarse y analizarse para mejorar Siri, pero en ninguna parte mencionaba que otras personas podrían escucharlos. "Me sentía extremadamente incómodo escuchando a las personas", confiesa uno de los excontratistas, especialmente dada la frecuencia con la que las grabaciones eran de niños.
Los contratistas actuales y antiguos relatan que la mayoría de las solicitudes de Siri son banales, como "poner una canción de Justin Bieber" o decir "dónde está el McDonald's más cercano", pero también recuerdan haber escuchado mensajes extremadamente gráficos o bien largas diatribas racistas u homofóbicas. Un exanalista de datos que trabajó con transcripciones de Siri durante varios años recuerda que los empleados intercambiaban algunas historias durante los descansos.
"Secretos y temores íntimos"
El artículo recoge también testimonios de excontratistas de Amazon, que revelan cómo, a razón de 12 dólares la hora, transcribían archivos de audio grabados dentro de hogares con el altavoz Echo con Alexa, con el objetivo de entrenar el sistema. Las grabaciones que tenían que escuchar eran a menudo incómodas, como aquellas que incluían a personas solitarias confesando "secretos y temores íntimos", niños compartiendo la dirección y el número de teléfono de su casa, o un hombre que intentaba pedir juguetes sexuales.
La letra pequeña le otorga a Amazon el derecho de retener y experimentar con las grabaciones mucho más allá de lo que Apple hace con Siri, indica Bloomberg. De hecho, la compañía retiene grabaciones indefinidamente por defecto, y revela pocos detalles sobre cómo se utilizan estos datos, más allá de argumentar que sus transcripciones humanas han demostrado una enorme ventaja al traducir Alexa a nuevos idiomas en todo el mundo y expandir sus capacidades de respuesta.
Una portavoz de Amazon aseguró a Bloomberg que "la privacidad es fundamental para la forma en que cada equipo y empleado diseña y desarrolla las funciones de Alexa y los dispositivos Echo", y que "todos los empleados de Alexa están capacitados en el manejo de datos de clientes". En la misma línea, algunos ejecutivos e ingenieros subrayan que, para ellos, vastas redes de oyentes humanos eran y son simplemente una forma natural de mejorar sus productos. Sin embargo, los contratistas y excontratistas, dejan claro que las desventajas de la vigilancia de audio generalizada eran obvias para aquellos con mucho menos potencial financiero en juego.
La filtración de Google
En la misma línea, el Asistente de Google alimenta su motor de búsqueda homónimo con consultas de mil millones de dispositivos en los que está disponible, incluidos teléfonos inteligentes y tabletas con Android, termostatos Nest y televisores Sony. Google, que también ha contratado trabajadores temporales en el extranjero para transcribir clips y mejorar la precisión del sistema, ha prometido que las grabaciones de voz revisadas no están vinculadas a ninguna información personal.
Sin embargo, este verano, un contratista compartió más de 1.000 grabaciones de usuarios con la emisora belga VRT NWS, que pudo averiguar quiénes eran algunas de las personas en las grabaciones basándose en lo que dijeron. Aproximadamente el 10 % de los clips filtrados también se grabaron sin el consentimiento de estos usuarios, debido a que los dispositivos detectaron erróneamente la frase de activación "OK, Google". Una portavoz de la empresa aseguró que, desde entonces, han "pausado esta transcripción humana del audio del Asistente" mientras mejoran sus controles de privacidad. La compañía no aclaró si los humanos transcriben datos de voz recopilados de otros servicios de Google.
Facebook y Microsoft
Facebook también ha analizado grabaciones transcritas para entrenar su inteligencia artificial, en particular, con su aplicación de chat Messenger, que permite a los usuarios intercambiar clips de audio en lugar de enviar mensajes de texto. La compañía indicó a los usuarios una opción para que su IA transcribiera automáticamente estos mensajes de voz, pero no explicitó que estos clips también fueron enviados al contratista TaskUs Inc. para su revisión manual.
Por su parte, Microsoft reconoció en agosto que personas ayudan a revisar los datos de audio generados a través de su tecnología de reconocimiento de voz, en productos que incluyen su asistente Cortana y la aplicación de mensajería Skype.
Al mismo tiempo, varios gigantes tecnológicos ajustaron sus programas de asistente virtual este año después de artículos similares en medios de comunicación. Más allá de la decisión de Google de pausar las transcripciones humanas del audio del Asistente, Apple ha comenzado a permitir que los usuarios eliminen su historial de Siri y opten por no compartir más, haciendo, además, que compartir grabaciones sea opcional y empleando a muchos excontratistas directamente para aumentar su control sobre las escuchas humanas. Facebook y Microsoft han agregado descargos de responsabilidad más claros a sus políticas de privacidad, mientras que Amazon introdujo una divulgación similar y ha permitido que los usuarios de Alexa opten por descartar revisiones manuales.
Algunos investigadores pronostican que, en un futuro, las máquinas se volverán lo suficientemente inteligentes para resolver las cosas sin la ayuda de los contratistas. Sin embargo, por ahora, sin leyes más estrictas o reacciones negativas de los consumidores, las filas de revisores de audio humanos seguramente seguirán creciendo a medida que proliferen los dispositivos de escucha, advierte Bloomberg.
En este sentido, el analista político Eladio José Armesto sostiene en declaraciones a RT que mientras las personas no tengan protección legal, estas compañías podrían seguir con las escuchas "con total impunidad", a lo que se une el "peligro real" de que esa tecnología se use para robar datos privados. Según el experto, aunque las empresas afirman que se trata de un uso anónimo de las conversaciones, "el hecho es que existe ya tecnología para poder precisar quiénes son las personas que ellos están espiando".
Entretanto, la consultora Juniper Research Ltd. estima que para 2023, habrá alrededor de 7.400 millones de dispositivos controlados por voz en todo el mundo, es decir, aproximadamente uno por cada persona en la Tierra.
Si te ha gustado, ¡compártelo con tus amigos!