La Industria Musical Desarrolla Tecnología para Detectar Canciones de IA

La industria musical está desarrollando la tecnología para cazar canciones de IA
Con ninguna forma de detener el embate de la música generada por IA, la industria está tomando un enfoque diferente: figuring out how to make money off of it.
La pesadilla de la industria musical se hizo realidad en 2023, y sonaba mucho a Drake. “Heart on My Sleeve”, un convincente dúo falso entre Drake y The Weeknd, acumuló millones de reproducciones antes de que alguien pudiera explicar quién lo hizo o de dónde vino. La pista no solo se volvió viral, sino que rompió la ilusión de que alguien estaba al control.
En la desesperada carrera por responder, se está formando silenciosamente una nueva categoría de infraestructura que no tiene como objetivo detener la música generativa por completo, sino hacerla rastreable. Se están incorporando sistemas de detección a toda la pipeline musical: en las herramientas utilizadas para entrenar modelos, las plataformas donde se suben las canciones, las bases de datos que otorgan licencias, y los algoritmos que moldean el descubrimiento. El objetivo no es solo captar contenido sintético después del hecho; es identificarlo temprano, etiquetarlo con metadatos y gobernar cómo se mueve a través del sistema.
“Si no construyes estas cosas en la infraestructura, solo estarás persiguiendo tu propia cola”, dice Matt Adell, cofundador de Musical AI. “No puedes seguir reaccionando a cada nueva pista o modelo, eso no escala. Necesitas una infraestructura que funcione desde el entrenamiento hasta la distribución.”
Las startups ahora están surgiendo para integrar la detección en los flujos de trabajo de licencias. Plataformas como YouTube y Deezer han desarrollado sistemas internos para marcar audio sintético a medida que se carga y moldear cómo aparece en las búsquedas y recomendaciones. Otras compañías musicales, incluyendo Audible Magic, Pex, Rightsify y SoundCloud, están expandiendo características de detección, moderación y atribución a todo, desde conjuntos de datos de entrenamiento hasta distribución.
El resultado es un ecosistema fragmentado pero de rápido crecimiento de empresas que tratan la detección de contenido generado por IA no como una herramienta de aplicación, sino como infraestructura básica para rastrear medios sintéticos.
Más que detectar música de IA una vez que se difunde, algunas empresas están construyendo herramientas para etiquetarla desde el momento en que se produce. Vermillio y Musical AI están desarrollando sistemas para escanear pistas terminadas en busca de elementos sintéticos y etiquetarlos automáticamente en los metadatos.
El marco TraceID de Vermillio va más allá al dividir las canciones en stems — como tono vocal, fraseo melódico y patrones líricos — y marcar los segmentos generados por IA específicos, lo que permite a los titulares de derechos detectar imitaciones a nivel de stem, incluso si una nueva pista solo toma partes de un original.
La compañía dice que su enfoque no son las eliminaciones, sino la licencia proactiva y el lanzamiento autenticado. TraceID está posicionado como un reemplazo para sistemas como el Content ID de YouTube, que a menudo pasan por alto imitación sutil o parcial. Vermillio estima que la licencia autenticada impulsada por herramientas como TraceID podría crecer de $75 millones en 2023 a $10 mil millones en 2025. En la práctica, eso significa que un titular de derechos o plataforma puede ejecutar una pista terminada a través de TraceID para ver si contiene elementos protegidos, y si es así, hacer que el sistema la marque para licencia antes de su lanzamiento.
Algunas empresas están yendo aún más arriba al análisis de los datos de entrenamiento en sí. Al analizar qué se incluye en un modelo, su objetivo es estimar cuánto toma una pista generada de artistas o canciones específicas. Ese tipo de atribución podría permitir licencias más precisas, con regalías basadas en influencia creativa en lugar de disputas post-lanzamiento. La idea evoca viejos debates sobre influencia musical — como la demanda de “Blurred Lines” — pero las aplica a la generación algorítmica. La diferencia ahora es que la licencia puede ocurrir antes del lanzamiento, no a través de litigios después del hecho.
Musical AI también está trabajando en un sistema de detección. La compañía describe su sistema como estratificado a lo largo de la ingestión, generación y distribución. En lugar de filtrar salidas, rastrea la procedencia de principio a fin.
“La atribución no debería empezar cuando la canción está lista — debería empezar cuando el modelo comienza a aprender”, dice Sean Power, cofundador de la compañía. “Estamos tratando de cuantificar la influencia creativa, no solo atrapar copias.”
Deezer ha desarrollado herramientas internas para marcar pistas completamente generadas por IA al ser cargadas y reducir su visibilidad tanto en recomendaciones algorítmicas como editoriales, especialmente cuando el contenido parece spam. El director de innovación Aurélien Hérault dice que, a partir de abril, esas herramientas estaban detectando aproximadamente el 20% de las nuevas cargas cada día como completamente generadas por IA, más del doble de lo que se vio en enero. Las pistas identificadas por el sistema permanecen accesibles en la plataforma pero no son promovidas. Hérault menciona que Deezer planea comenzar a etiquetar estas pistas directamente para los usuarios “en unas pocas semanas o meses”.
“No estamos en contra de la IA en absoluto”, dice Hérault. “Pero mucho de este contenido se está utilizando de mala fe — no para crear, sino para explotar la plataforma. Por eso estamos prestando tanta atención.”
El DNTP (Protocolo de No Entrenamiento) de Spawning AI está llevando la detección incluso más temprano — a nivel del conjunto de datos. El protocolo de exclusión permite a los artistas y titulares de derechos etiquetar su trabajo como fuera de límites para el entrenamiento de modelos. Si bien los artistas visuales ya tienen acceso a herramientas similares, el mundo del audio aún está en deuda. Hasta ahora, hay poco consenso en cómo estandarizar el consentimiento, la transparencia o la licencia a gran escala. La regulación podría eventualmente forzar el tema, pero por ahora, el enfoque sigue siendo fragmentado. El apoyo de las principales empresas de entrenamiento de IA también ha sido inconsistente, y los críticos dicen que el protocolo no ganará impulso a menos que sea gobernado de manera independiente y ampliamente adoptado.
“El protocolo de exclusión necesita ser sin fines de lucro, supervisado por varios actores, para ser confiable”, dice Dryhurst. “Nadie debería confiar el futuro del consentimiento a una empresa centralizada opaca que podría quebrar — o mucho peor.”
Para más contenido especializado, suscríbete a nuestro newsletter.
La industria musical está desarrollando la tecnología para cazar canciones de IA | The Verge
Comments ()