El verano pasado, mientras se dirigían a una cita con el médico cerca de su casa en Manhattan, Paul Skye Lehrman y Linnea Sage escucharon un podcast sobre el auge de la inteligencia artificial y la amenaza que representa para los medios de vida de escritores, actores y otros profesionales del entretenimiento. .
El tema era especialmente importante para el joven matrimonio. Se ganaban la vida como actores de doblaje y las tecnologías de inteligencia artificial comenzaron a generar voces que sonaban como voces reales.
Pero el podcast tuvo un giro inesperado. Para resaltar la amenaza de la IA, el presentador realizó una larga entrevista con un chatbot parlante llamado Poe. Parecía el señor Lehrman.
“Me estaba preguntando sobre los peligros de la IA y el daño que podría tener en la industria del entretenimiento”, dijo Lehrman. “Detuvimos el auto y nos sentamos allí, completamente incrédulos, tratando de descubrir qué acababa de suceder y qué debíamos hacer”.
Lehrman y Sage ahora están demandando a la compañía que creó la voz del robot. Afirman que Lovo, una startup de Berkeley, California, utilizó ilegalmente grabaciones de sus voces para crear tecnología que podría rivalizar con su trabajo de voz. Después de escuchar un clon de la voz del Sr. Lehrman en el podcast, la pareja descubrió que Lovo también había creado un clon de la voz de la Sra. Sage.
La pareja se suma a un número cada vez mayor de artistas, editores, programadores informáticos y otros creadores que han demandado a los fabricantes de tecnología de inteligencia artificial, argumentando que las empresas estaban utilizando sus obras sin permiso para crear herramientas que, en última instancia, podrían reemplazarlas en el mercado laboral. (El New York Times demandó a dos de estas empresas, OpenAI y su socio Microsoft, en diciembre, acusándolas de utilizar sus artículos de noticias protegidos por derechos de autor para crear sus chatbots en línea).
En su denuncia presentada el jueves en el tribunal federal de Manhattan, la pareja dijo que empleados anónimos de Lovo les pagaron por algunos clips de voz en 2019 y 2020, sin revelar cómo se usarían esos clips.
Afirman que Lovo, fundada en 2019, viola la ley federal de marcas registradas y varias leyes estatales de privacidad al promover clones de sus voces. La demanda busca el estatus de acción colectiva, y el Sr. Lehrman y la Sra. Sage invitan a otros actores de doblaje a unirse.
“No sabemos cuántas personas más se vieron afectadas”, dijo su abogado, Steve Cohen.
Lovo niega las acusaciones formuladas en la demanda, dijo David Case, abogado que representa a la empresa. Añadió que si todos los que proporcionaron grabaciones de voz a Lovo dieron su consentimiento, “entonces no hay problema”.
Tom Lee, director ejecutivo de la compañía, dijo en un episodio de podcast el año pasado que Lovo ahora ofrecía un programa de reparto de ingresos que permitía a los actores de doblaje ayudar a la compañía a crear clones de voz de ellos mismos y recibir una parte del dinero ganado por estos clones.
La demanda parece ser la primera de su tipo, dijo Jeffrey Bennett, abogado general de SAG-AFTRA, el sindicato que representa a 160.000 trabajadores de los medios de comunicación en todo el mundo.
“Esta demanda mostrará a la gente –especialmente a las empresas de tecnología– que existen derechos sobre tu voz, que hay todo un grupo de personas que se ganan la vida usando su voz”, afirmó.
En 2019, Lehrman y Sage se anunciaron como actores de doblaje en Fiverr, un sitio web donde los profesionales independientes pueden anunciar su trabajo. A través de este mercado en línea, a menudo se les pedía que brindaran trabajo de voz para comerciales, comerciales de radio, videos en línea, videojuegos y otros medios.
Ese año, una persona anónima se puso en contacto con la Sra. Sage y le pagó 400 dólares para grabar varios guiones de radio y le explicó que las grabaciones no se utilizarían para fines públicos, según la correspondencia citada en la demanda.
“Estos son guiones de prueba para anuncios de radio”, dijo la persona anónima, según la denuncia. “No se divulgarán externamente y sólo se consumirán internamente y, por lo tanto, no requerirán ningún tipo de pago”.
Siete meses después, otra persona no identificada se comunicó con el Sr. Lehrman sobre un trabajo similar. Lehrman, que también trabaja como actor en televisión y cine, preguntó cómo se utilizarían los clips. La persona afirmó repetidamente que solo se utilizarían con fines académicos y de investigación, según la correspondencia citada en la denuncia. El Sr. Lehrman recibió 1.200 dólares. (Proporcionó grabaciones más largas que la Sra. Sage).
En abril de 2022, Lehrman descubrió un vídeo de YouTube sobre la guerra en Ucrania narrado con una voz que sonaba como la suya.
“Es mi voz la que habla de las armas en el conflicto ruso-ucraniano”, afirmó. “Me estoy poniendo blanco como un fantasma y se me pone la piel de gallina en los brazos. Sabía que nunca había dicho esas palabras en ese orden.
Durante meses, él y Sage lucharon por comprender qué había sucedido. Contrataron a un abogado para que los ayudara a localizar quién hizo el video de YouTube y cómo se recreó la voz del Sr. Lehrman. Pero el propietario del canal de YouTube parecía tener su sede en Indonesia y no tenían forma de localizar a la persona.
Luego escucharon el podcast de camino al médico. Gracias al podcast “Deadline Strike Talk”, pudieron identificar la fuente del clon de voz del Sr. Lehrman. Un profesor del Instituto Tecnológico de Massachusetts reconstruyó el chatbot utilizando la tecnología de conversión de texto a voz de Lovo.
Sage también encontró un video en línea en el que la compañía demostró su tecnología de voz a inversionistas en un evento en Berkeley a principios de 2020. En el video, un ejecutivo de Lovo mostró una versión sintética de la voz de Sage y la comparó con una grabación de su verdadera voz. Ambos jugaban junto a una foto de una mujer que no era ella.
“Yo estaba en su video de presentación de recaudación de fondos”, dijo la Sra. Sage. Desde entonces, la empresa ha recaudado más de 7 millones de dólares y cuenta con más de dos millones de clientes en todo el mundo.
Lehrman y Sage también descubrieron que Lovo estaba promocionando clones de voz de ella y de Lehrman en su sitio web. Después de enviar a la empresa una carta de cese y desistimiento, la empresa dijo que eliminó sus clones de voz del sitio. Pero Lehrman y Sage argumentaron que el software detrás de estos clones de voz ya había sido descargado por innumerables clientes de la compañía y aún podía usarse.
Lehrman también cuestionó si la empresa utilizó las voces de la pareja junto con muchas otras para construir la tecnología central que impulsa su sistema de clonación de voces. Los sintetizadores de voz a menudo aprenden sus habilidades analizando miles de horas de voz, de la misma manera que ChatGPT de OpenAI y otros chatbots aprenden sus habilidades analizando grandes cantidades de texto extraído de Internet.
Lovo admitió haber entrenado su tecnología utilizando miles de horas de grabaciones de miles de voces, según la correspondencia de la demanda.
Case, el abogado que representa a Lovo, dijo que la compañía entrenó su sistema de inteligencia artificial utilizando audio de una base de datos de grabaciones en inglés disponible gratuitamente llamada Openslr.org. No respondió cuando se le preguntó si las grabaciones de voz de Lehrman y Sage se utilizaron para entrenar la tecnología.
“Esperamos recuperar el control de nuestras voces, de quiénes somos, de nuestras carreras”, dijo Lehrman. “Queremos representar a otras personas a quienes les ha sucedido esto y a quienes les sucederá si nada cambia”.