Michael Caine y la revolución de las voces artificiales: ¿se puede vender el alma de un actor en el mercado de la inteligencia artificial? | un doctor

Michael Caine y la revolución de las voces artificiales: ¿se puede vender el alma de un actor en el mercado de la inteligencia artificial? | un doctor

Imagínese escuchar un audiolibro narrado por Michael Caine. Su tono tranquilo y británico es el mismo que en las películas clásicas, con las mismas pausas y respiraciones naturales. Pero de repente recuerdas que él nunca ha leído este libro; En cambio, la inteligencia artificial de la empresa “ElevenLabs” (ElevenLabs) ha reconstruido su voz. Este es el punto donde la línea entre realidad y simulación se desdibuja.

ElevenLabs, la startup estadounidense líder en tecnología de generación de voz mediante IA, lanzó recientemente un proyecto llamado Iconic Voice Marketplace. En este mercado, las voces de actores famosos, desde Michael Caine hasta Liza Minnelli e incluso artistas fallecidos, están disponibles con permiso oficial para su uso en proyectos comerciales y culturales. Esto significa que si eres cineasta, editor o usuario normal, puedes utilizar su voz digital para tu narración, publicidad o podcast pagando una tarifa.

Esto podría conducir a un futuro en el que cualquiera pueda escuchar su libro favorito con la voz de su actor favorito o producir un podcast con calidad de estudio en minutos. No es necesario pagar elevadas tarifas de suscripción a estudios y actores de doblaje. Pero, por otro lado, surgen nuevas cuestiones éticas y legales: ¿reproducir la voz de un artista sin control total no es una forma de explotación? ¿Es posible que nuestra voz también quede registrada en la lista de activos negociables en el futuro?

Es esta dicotomía entre oportunidad y amenaza la que hace que la historia de Michael Caine y ElevenLabs sea más que una noticia tecnológica, en una cuestión sobre la naturaleza de “ser humano en la era de la reproducción digital”.

1- De la imitación de voz a la ingeniería de identidad

La reproducción del sonido por las máquinas ya no es una imitación superficial. La tecnología “Neural Text-to-Speech” ahora puede recrear no sólo el tono, sino también los matices emocionales e incluso el patrón de respiración de las personas. En una muestra reciente de ElevenLabs, la voz de Michael Caine fue recreada con tanta precisión que en las pruebas de escucha, muchos oyentes no pudieron distinguir entre la versión real y la sintética. Pero más allá de la calidad técnica, ha surgido una cuestión más profunda: ¿puede el sonido considerarse un activo?

En la era analógica, la voz de un artista sólo se grababa en cinta o película, pero en la era de las licencias de audio con inteligencia artificial, la voz en sí se ha convertido en un “activo digital”. Esta evolución cambia el concepto de propiedad individual. Así como las NFT crearon un mercado para las obras visuales, el audio ahora se suma al mercado libre, pero con una mayor carga emocional y moral.

2- ElevenLabs y el sueño de democratizar el sonido

ElevenLabs fue fundada en 2022 por dos ex empleados de Google y Palantir, y su objetivo inicial era simple: crear una herramienta para convertir texto en voz natural. Pero con la introducción del modelo “Prime Voice AI” y luego la creación del “mercado de voz simbólica”, esta startup cruzó la frontera tecnológica y entró en el ámbito cultural.

La idea principal del mercado es que cualquier propietario de sonido -un actor, locutor o incluso su heredero- pueda ofrecer una versión digital certificada de su sonido para uso legal y ganar dinero con cada uso. Este enfoque, si se implementa correctamente, puede conducir a una distribución justa de las ganancias entre artistas y productores de contenidos. Por ejemplo, la voz de Liza Minnelli podría aparecer en un nuevo audiolibro y generar una determinada parte de los ingresos para sus herederos.

Al mismo tiempo, ElevenLabs se ha comprometido a que todos los sonidos publicados en la plataforma serán registrados con el pleno consentimiento de sus propietarios o de sus representantes legales para evitar su uso indebido.

3- La nueva economía sana y su impacto en la industria de contenidos

Está surgiendo un mercado multimillonario a medida que las licencias de voz se expanden con la inteligencia artificial. Las productoras de podcasts, los editores de audiolibros, los estudios de juegos e incluso las empresas de publicidad pueden utilizar voces de celebridades para promocionar sus productos. Imagine la versión persa o árabe de un libro famoso narrada por la voz digital de Morgan Freeman o Nicole Kidman, sin necesidad de su presencia física en el estudio.

Este modelo puede reducir costos y aumentar el tiempo de producción de semanas a unas pocas horas. Sin embargo, existe el riesgo de asimilación cultural. Si todas las marcas utilizan algunas voces familiares, las diferencias y la diversidad cultural en la expresión desaparecerán. La misma voz que se supone debe dar una sensación de confianza y autenticidad puede eventualmente convertirse en un cliché sin alma.

4- Dimensión jurídica: ¿Quién es el propietario del sonido digital?

En la mayoría de los sistemas jurídicos, el sonido por sí solo no se define como propiedad intelectual. Pero con la llegada de las tecnologías de reproducción de sonido, los países se ven obligados a llenar este vacío legal. En Estados Unidos, en varios casos recientes, los tribunales han considerado la voz como parte del “derecho de publicidad”, es decir, el derecho a utilizar la cara y la voz con fines comerciales.

ElevenLabs y empresas similares se ven obligadas a diseñar contratos que permitan la concesión de licencias y prevengan el abuso. El desafío es que la tecnología de reconstrucción de voz se ha vuelto tan precisa que la frontera entre imitación y falsificación (Deepfake Voice) casi ha desaparecido. ¿Se puede considerar delito que un productor utilice un modelo de lenguaje público para reproducir la voz de un individuo sin su consentimiento? Todavía no hay una respuesta única.

5- Ética y psicología de la escucha de sonidos recreados.

Los seres humanos tenemos naturalmente un vínculo emocional con el sonido. Escuchar la voz de una persona conocida despierta un recuerdo vívido en la mente. Cuando la IA reproduce la voz de Michael Caine, en realidad crea una experiencia de realidad virtual que es a la vez reconfortante e inquietante. Las investigaciones muestran que los oyentes tienen reacciones emocionales similares cuando escuchan voces artificiales de personajes famosos que cuando escuchan la versión real.

Pero se puede abusar de esta cercanía emocional. Imagínese usar la voz recreada de un actor fallecido para promocionar un producto que nunca apoyó. Aquí no sólo están en juego las emociones, sino también la confianza del público. A nivel social, existe el peligro de un mundo en el que la distinción entre verdad y reproducción se pierda por completo.

6- Punto de vista de los artistas vivos: ¿oportunidad o amenaza?

Michael Caine, uno de la última generación de estrellas clásicas británicas hasta que se jubile en 2023, dijo en su reacción inicial que acogía con agrado la idea de preservar su voz para las generaciones futuras. Pero a muchos actores jóvenes les preocupa que su voz digital reemplace su trabajo real. Si el director puede utilizar la voz de un actor sin su presencia, el papel físico y humano del actor se desvanecerá gradualmente.

De hecho, la industria del doblaje, la locución y la actuación de voz son los primeros sectores que probablemente experimenten una profunda transformación. Incluso en Irán, si dichas plataformas se localizan, podemos esperar que una nueva generación de productores independientes ingrese al mercado, mientras que el trabajo de locutores profesionales tendrá menos demanda.

7- La tecnología al servicio de la cultura del aprendizaje: ¿audiodemocracia o caos digital?

Desde un ángulo positivo, las licencias de audio con IA pueden mejorar la justicia cultural. Imaginemos que un editor iraní o un estudiante con un presupuesto limitado pueden publicar un libro con la voz de un orador mundial pagando una pequeña cantidad. Además, las personas con problemas del habla pueden utilizar esta tecnología para hacer una voz similar a la de ellos pero más clara para comunicarse.

Pero, por otro lado, si el control de este mercado queda en manos de unas pocas grandes empresas, el resultado será la misma centralización de plataformas que ocurrió en las redes sociales. Significa que los usuarios son aparentemente libres, pero todo, incluida su voz, es propiedad de una única empresa.

8- La inversión de Matthew McConaughey y una señal de futuro

La inversión de Matthew McConaughey en ElevenLabs es una señal de que las estrellas de cine no son sólo el sujeto, sino los actores principales de esta transformación. La presencia de un ganador del Oscar entre los inversores muestra que los artistas están redefiniendo su lugar en la economía de los datos. En un comunicado, McConaughey indicó que su objetivo es conservar el control creativo sobre sus lanzamientos digitales, no sólo obtener ganancias financieras.

Este cambio de actitud puede crear un nuevo modelo de contratación cinematográfica; Donde el artista determina desde el principio la licencia de uso de su audio digital. De esta forma, en lugar de eliminar a los humanos, la inteligencia artificial se convierte en una extensión de su creación.

9- La cuestión de la muerte y el patrimonio digital

Uno de los aspectos más fascinantes y al mismo tiempo más aterrador de este proyecto es la posibilidad de “inmortalizar el sonido”. Ahora se pueden revivir las voces de artistas que murieron hace años. Para las familias, esta puede ser una oportunidad para preservar la memoria de los seres queridos, pero para la sociedad surge una pregunta filosófica: ¿tenemos derecho a hacer hablar las voces de los muertos?

En el futuro, los archivos de audio pueden convertirse en museos de recreación. Así como hoy las fotos y los vídeos digitales están disponibles para todos, quizá mañana cualquiera pueda tener una conversación con la voz de Michael Caine o Robin Williams en un programa online. La línea entre conmemoración y explotación es muy delgada aquí.

10- Irán y la posibilidad de localización de este modelo

En Irán hay mucho interés por los audiolibros y los podcasts. Si se desarrolla una tecnología similar a nivel local, los editores pueden crear archivos de audio digitales con el permiso oficial de los oradores. Pero su requisito previo es el desarrollo de normas jurídicas claras sobre la propiedad de la voz y el consentimiento informado.

En ausencia de tal marco, es posible que se utilicen versiones falsas de las voces de las celebridades con fines políticos o propagandísticos, ya que los videos deepfake se han vuelto problemáticos en los últimos años. Irán podría tomar la iniciativa con una definición estándar de “Firma de Voz Digital” antes de que la cuestión se salga de control.

resumen

La entrada de Michael Caine y otras figuras del cine en el mercado de la voz con inteligencia artificial supone un punto de inflexión en la historia de la tecnología y el arte. Las licencias de audio con inteligencia artificial en la superficie ayudan a democratizar la producción de contenidos, pero en el interior plantean cuestiones fundamentales sobre la propiedad, la autenticidad y la ética. ElevenLabs está intentando evitar el caos de las imitaciones no autorizadas mediante la creación de un mecanismo formal de concesión de licencias, pero el éxito de este plan depende de la transparencia legal y la confianza del público. El audio digital puede revolucionar la educación, el entretenimiento y la comunicación, siempre y cuando el ser humano siga siendo el que toma las decisiones en última instancia. Este fenómeno demuestra que el futuro del sonido no es sólo técnico, sino también cultural y filosófico. Estamos en el umbral de una era en la que tal vez sea posible decir por primera vez: “Cada voz tiene dos vidas; una en el mundo real y la otra en el mundo artificial.

❓ Preguntas frecuentes (FAQ)

1. ¿Qué es el mercado de sonido icónico de ElevenLabs?
Es una plataforma que ofrece sonidos digitales certificados de artistas para su uso en proyectos comerciales o culturales, y sus ingresos se dividen entre la empresa y el propietario del sonido.

2. ¿Puede esta tecnología sustituir a los locutores y actores de doblaje?
Es complementario a corto plazo, pero a largo plazo es probable que haya menos oportunidades laborales para los actores de voz humanos a menos que encuentren roles más creativos.

3. ¿Cómo se define legalmente la licencia de voz de inteligencia artificial?
Por ahora, está regulado en forma de derechos de publicidad y contratos exclusivos, pero las leyes globales aún no son las mismas.

4. ¿Está permitido utilizar las voces de actores anteriores?
Sólo con el consentimiento por escrito de los herederos y registro oficial en la plataforma, de lo contrario es un ejemplo de falsificación y violación de derechos personales.

5. ¿Puede Irán utilizar este modelo?
Sí, pero requiere una infraestructura legal transparente y un seguimiento estricto para evitar la producción de sonido falso.

Michael Caine y la revolución de las voces artificiales: ¿se puede vender el alma de un actor en el mercado de la inteligencia artificial? | un doctor

Dr. Alireza Majidi

Médico, autor y fundador del blog “Un Doctor”

Dr. Alireza Majidi, autor y fundador del blog “Un Doctor”.
Con más de 20 años de escritura continua “mixta” en el campo de la medicina, la tecnología, el cine, el libro y la cultura.
¡Que juntos pensemos diferente!