Siete vendedores de licencias de contenidos de música, imágenes, vídeos y otros conjuntos de datos para su uso en el entrenamiento de sistemas de IA han formado el primer grupo comercial del sector, dijeron el miércoles.
La Dataset Providers Alliance (DPA) abogará por una “obtención ética de datos” en el entrenamiento de sistemas de IA, incluidos los derechos de las personas representadas en los conjuntos de datos y la protección de los derechos de propiedad intelectual de los propietarios de contenidos, dijeron las compañías en un comunicado.
Los miembros fundadores incluyen la empresa estadounidense de conjuntos de datos musicales Rightsify, el servicio de licencias de imágenes vAIsual, el proveedor japonés de fotografías de archivo Pixta y el mercado de datos con sede en Alemania Datarade.
El surgimiento de tecnologías de IA generativa que pueden imitar la creatividad humana en los últimos años ha provocado una protesta de los creadores de contenido y una serie de demandas por derechos de autor contra empresas tecnológicas como Google, Meta y el fabricante de ChatGPT, OpenAI, que cuenta con el respaldo de Microsoft.
Los desarrolladores han estado entrenando modelos alimentándoles con grandes cantidades de contenido, gran parte de él extraído de Internet de forma gratuita sin el consentimiento de quienes crearon las obras o poseen los derechos sobre ellas.
Las empresas tecnológicas, que afirman que su uso es legal, también están pagando silenciosamente por el acceso a colecciones privadas de contenido, tanto para satisfacer necesidades de tipos particulares de datos como para protegerse contra riesgos legales y regulatorios.
Te puede interesar: Impacto de la IA en empleos serán menor en países como México: FMI
Empresas que otorgan licencias de conjuntos de datos de IA forman un grupo comercial
La perspectiva de que la demanda de datos con licencia crezca si los propietarios de los derechos de autor prevalecen en sus luchas legales ha provocado el surgimiento de una industria incipiente de empresas que empaquetan contenidos y venden acceso a ellos para su uso en sistemas de IA.
Como resultado, se han formado grupos para establecer estándares éticos para ese comercio, como Fairly Trained, una organización sin fines de lucro fundada este año que certifica modelos que no han utilizado materiales con derechos de autor sin licencia.
La DPA se centra en el contenido de esas transacciones y exige, por ejemplo, que sus miembros se comprometan a no vender datos de texto obtenidos al rastrear la web o audio que incluya voces de personas sin su consentimiento explícito.
Un gran enfoque será impulsar legislación como la Ley NO FAKES, un proyecto de ley estadounidense presentado el año pasado para crear sanciones por generar réplicas digitales no autorizadas de voces o imágenes de personas, dijo Alex Bestall, director ejecutivo de Rightsify y su filial de licencias GCX, quien dirigió la fundación del grupo.
“La defensa de los derechos será una parte importante de esto porque todos han tomado sus posiciones sobre la IA y los derechos de autor, pero muchas de estas batallas aún están por resolverse y llevará un tiempo que lo hagan”, dijo Bestall.
La DPA también presionará para que se establezcan más requisitos de transparencia de los datos de capacitación, como los de la Ley de IA de la Unión Europea y un proyecto de ley similar de Estados Unidos presentado en abril, la Ley de Divulgación de Derechos de Autor de la IA Generativa, añadió.
El grupo planea publicar un libro blanco que describa sus posiciones en julio, dijo.
Con información de Reuters.
¿Te gustan las fotos y las noticias?, síguenos en nuestro Instagram









