Inteligencia artificial, propiedad intelectual y minería de datos

Por Carles Vendrell y Álvaro Seijo

…

Notas a la Sentencia LG Hamburgo de 27 de septiembre de 2024 y al Proyecto de Real Decreto sobre concesión de licencias colectivas ampliadas para la explotación masiva de obras y prestaciones para el desarrollo de modelos de inteligencia artificial

…

Entre las distintas cuestiones jurídicas que plantean los sistemas de inteligencia artificial (IA) generativa se encuentra la relativa a la propiedad intelectual y, en particular, a si la legislación europea y española permiten las actividades de rastreo o raspado (web scraping) y de entrenamiento de modelos de aprendizaje automático con datos basados en textos e imágenes protegidos por derechos de autor u otros derechos de propiedad intelectual.

Es sabido, en efecto, que el éxito o la calidad de la IA generativa pasan por un uso masivo de datos, que permite el aprendizaje automático, es decir, aprender y mejorar con la experiencia, de manera que el sistema pueda crear o componer de forma autónoma contenidos de diverso tipo (como texto e imagen). No se trata de generar una inmensa base de datos para luego componer un contenido uniendo textos o imágenes de esa colección a modo de collage, sino de generar contenidos realmente nuevos, basados en esa experiencia y conocimientos previos (p. ej., sobre la base del análisis de millones de secuencias de palabras en contextos específicos, que permite predecir con rapidez lo que diría un humano con conocimientos avanzados). Cuantos más datos y de más calidad se usen para ese entrenamiento, mejores serán los resultados de la IA generativa. Pero si esos datos son obras o prestaciones protegidas por la propiedad intelectual (en esencia, porque son textos e imágenes que no están en el dominio público por el transcurso del plazo de protección), surge la cuestión de si ese uso supone una infracción de los derechos de propiedad intelectual de los titulares que no han autorizado este entrenamiento con sus obras o prestaciones.

El mero estudio o disfrute (aunque sea masivo) de obras no es un acto infractor de los derechos de propiedad intelectual (Casas Vallés, 2017, p. 29; Schulze, 2022, p. 331): la estudiante de doctorado que lee todas las obras preexistentes sobre una determinada temática para aprender y crear una obra nueva y original que bebe de todas esas fuentes se aprovecha legítimamente de esas obras; el laboratorio cuyo equipo de investigadores estudia todas las publicaciones preexistentes para desarrollar un medicamento también se aprovecha legítimamente de esas obras, aunque lo haga con una finalidad comercial. Pero, como se verá, los sistemas de aprendizaje automático no se limitan a estudiar o analizar como un humano, sino que, para ello, deben realizar determinadas copias técnicas de esas obras o prestaciones. De este modo, las dudas no se dirigen tanto a si existen en estos casos unos actos de explotación de derechos de propiedad intelectual, sino más bien a si la actividad de entrenamiento estaría amparada por un límite o excepción a la propiedad intelectual.

Así, las preguntas concretas que suscita la cuestión ahora considerada son: las personas responsables de estas actividades de entrenamiento de datos ¿deben recabar (o deberían haber recabado) autorización de los titulares de los derechos de propiedad intelectual? Si no han recabado autorización o no deben hacerlo, ¿deben en todo caso remunerar a los titulares con una compensación económica por esa utilización de sus obras o prestaciones?

Una repuesta rápida y sencilla a estas cuestiones la ofrece la aproximación ortodoxa al Derecho de autor: si bajo esas actividades de rastreo y entrenamiento que son claves para el desarrollo de la IA generativa hay evidentes intereses comerciales (directos o indirectos) y si esas actividades implican usos no autorizados de obras o prestaciones protegidas por derechos de propiedad intelectual, es lógico, se dirá bajo esa aproximación, que, como mínimo, deba pasarse necesariamente por caja y remunerar esos usos a los autores y titulares de derechos. No sorprende que las entidades de gestión de derechos de propiedad intelectual y determinadas asociaciones de titulares de derechos promuevan activamente tal interpretación

V., p. ej., el manifiesto conjunto de CISAC y otras organizaciones de creadores y titulares de derechos, o el informe de la organización Fair Trade Music International en colaboración con el Consejo Internacional de Creadores de Música (CIAM), titulado The Remuneration of Music Creators for the Use of Their Works by Generative AI).

Y todavía sorprende menos que el Ministerio de Cultura —usualmente receptivo a los intereses de esas entidades y titulares de derechos— haya aprobado un Proyecto de Real Decreto dirigido a facilitar, por medio de un régimen de licencias colectivas administrado por las entidades de gestión, que los titulares de derechos puedan “participar en los ingresos económicos obtenidos por los proveedores de sistemas o modelos de inteligencia artificial […] y, en general, en los beneficios económicos generados por esta nueva vertiente del progreso tecnológico que, además, plantea serios desafíos para el sector cultural en términos laborales y competitivos [sic], entre otros”. El mensaje del Ministerio no puede ser más claro: puede que el progreso tecnológico que implica la IA esté muy bien, pero si detrás de ese desarrollo hay compañías que obtienen “beneficios económicos” habrá que permitir que todos los titulares de derechos sobre todas las obras y prestaciones utilizadas en su entrenamiento participen de esos beneficios (máxime si ese progreso tecnológico determinará la reducción o eliminación de trabajos tradicionales de la industria cultural); como esa participación individual sería difícil o directamente imposible de gestionar (¿cuánto y cómo deberíamos cobrar los autores de esta entrada si es usada para el entrenamiento de la IA?), que sean las entidades de gestión las que participen de esos beneficios económicos para que, en su caso, repartan posteriormente esas cantidades.

Ocurre, sin embargo, que la cuestión no es tan sencilla. El Derecho de autor o de la propiedad intelectual no es (solo) la parte del ordenamiento privado que protege a los autores y titulares de derechos. Ante todo, busca un equilibrio razonable entre esta protección y los intereses generales entre los que sobresalen los de evitar restricciones innecesarias a la competencia y obstáculos al desarrollo de la tecnología

En la literatura europea, es esencial Ohly, 2014, p. 19; en nuestra literatura, esta aproximación no es la predominante, salvo Casas Vallés, 2017, pp. 28-29, pero, en cambio, los tribunales y, en concreto, la Sección Especializada de la Audiencia Provincial de Madrid tiene pronunciamientos claramente encaminados en esa bien reflexionada aproximación. V. entre otras, SAP Madrid [Secc. 28.ª] 31-III-2014: “No hay que olvidar que las facultades de exclusión -que entrañan un ius prohibendi-, constituyen una excepción al principio general de la libre empresa – artículo 53.1 de la Constitución en relación con el artículo 38 de mismo texto fundamental-, por lo que efectuar interpretaciones extensivas de su alcance, más allá de donde el legislador ha preconfigurado su poder ofensivo, resulta bastante discutible”.

La dificultad de la respuesta a las cuestiones planteadas se evidencia en los casos actuales suscitados en la jurisdicción estadounidense, esto es, las demandas interpuestas, entre otros, por New York Times y The Intercept Media, Raw Story Media y Alternet Media, contra Open AI y Microsoft en relación con el uso no autorizado de artículos protegidos para el desarrollo de herramientas de IA, como ChatGPT y Bing Chat, respectivamente, y el juego del límite del uso leal (fair use). Asimismo, el debate se ha extendido a la jurisdicción inglesa, donde en febrero de 2023 Getty Images interpuso una demanda contra Stability UK, por el uso no autorizado de miles de fotografías para el entrenamiento de la IA denominada Stable Diffusion.

En el ámbito de la Unión Europea, el primer caso relevante se encuentra en la sentencia (primera instancia) del Landgericht de Hamburgo de 27 de septiembre de 2024, cuyos hechos, razonamientos y conclusión se reseñan a continuación, junto con una valoración sobre las lecciones que ofrece esta primera aproximación judicial europea a una cuestión de indudable recorrido teórico y práctico en los próximos meses y años, también para la jurisdicción española.

Los hechos del caso

La sentencia del Tribunal Territorial de Hamburgo resuelve, en sentido desestimatorio, la demanda interpuesta por el fotógrafo profesional Robert Kneschke contra Laion, e.V. (Large-scale Artificial Intelligence Open Network), una entidad privada sin ánimo de lucro que había utilizado una de las fotografías del demandante en un conjunto de datos destinado al entrenamiento de modelos de IA. El tribunal concluye que la reproducción de la fotografía estaba amparada por las excepciones de minería de textos y datos

§ 44b de la Ley de Derechos de Autor y Derechos Afines alemana – UrhG – y de investigación científica (§ 60d UrhG).

La asociación demandada tiene como actividad la puesta a disposición al público de forma gratuita de un conjunto amplio (5.800 millones) de pares de texto-imagen, expresamente organizados y facilitados para su uso como entrenamiento para los sistemas de IA generativa. De este modo, la entidad demandada en este caso no era quien realizaba el entrenamiento del modelo de IA, sino una entidad que preparaba el dataset (conjunto de datos) destinado a este fin, para lo que, previamente, habría descargado, almacenado, analizado e incorporado a ese conjunto textos e imágenes descargados de Internet, junto con sus metadatos.

El demandante, por su parte, era el autor de una de las fotografías incluidas en el dataset de la entidad demandada. La fotografía había sido descargada de la web de la agencia de fotografía a la que el demandante la había licenciado. La web de la referida agencia (licenciataria de la fotografía) contenía en sus términos y condiciones una exclusión expresa de uso de herramientas automatizadas para la descarga, indexación, scraping o cacheo de cualquier contenido de la web.

No aplicación al caso del límite de reproducciones provisionales

Según el Derecho de la Unión (art. 5.1 de la Directiva 2001/29) y los ordenamientos español (art. 31.1 del Real Decreto-legislativo 1/1996 por el que se aprueba el texto refundido de la Ley de Propiedad Intelectual [TRLPI] y alemán (§ 44a UrhG), los actos de reproducción provisional de una obra o prestación protegida por la propiedad intelectual no necesitan autorización del titular siempre que (i) sean transitorios o accesorios; (ii) formen parte integrante o esencial de un proceso tecnológico; (iii) su única finalidad sea facilitar una transmisión en red entre terceros por un intermediario o un uso lícito; y (iv) carezcan de una significación económica independiente.

El Tribunal alemán descarta la aplicación de este límite al caso por dos razones fundadas en la jurisprudencia del TJUE en relación con el requisito (i), de manera que solo hay reproducción transitoria o accesoria cuando (a) el procedimiento técnico considerado elimina automáticamente la copia sin intervención humana (STJUE C-5/08, Infopaq, párr. 64) y, en el caso enjuiciado, Laion, al parecer, elimina las copias que realiza de forma deliberada (es decir, de forma no independiente de la voluntad del usuario) mediante un procedimiento específicamente programado para ello; y (b) la reproducción no tiene existencia ni finalidad autónomas en relación con el proceso técnico del que forma parte (STJUE C-360/13, Newspaper Licensing Agency, párr. 43) porque las copias que realiza la demandada no son meramente instrumentales al proceso técnico de análisis, sino que son directamente el objeto de análisis.

Como se ha resaltado en los primeros comentarios más precisos a la sentencia, es probable que la conclusión alcanzada por el Tribunal en este punto sea correcta en el caso enjuiciado, pero no tanto el razonamiento utilizado respecto del punto (a) (Leistner, 2024, p. 1.666). En efecto, el hecho de que la eliminación de la copia sea parte de un proceso automático deliberadamente configurado para ello (y no una decisión individualmente realizada caso por caso) es precisamente lo que se exige por el art. 5.1 de la Directiva 2001/29 y es lo que parece que se cumplía en el caso. Cuestión distinta es que las particularidades de la actividad de la demandada en este caso hagan —al menos con los datos técnicos que refleja la sentencia— poco discutible su falta de encuadramiento en este límite, especialmente a la vista de la posición mayoritaria sobre el requisito de la ausencia de un significado económico independiente (Schack, 2014, p. 114).

Otra cuestión, fuera ya del caso analizado en la sentencia, es la posible concurrencia de los requisitos del art. 5.1 de la Directiva en casos donde la entidad considerada es la que realiza también la actividad de entrenamiento (v. Hofmann, 2024-1, pp. 168-169, quien defiende la posible aplicación del límite y, en particular, que en este caso la reproducción no tendría una significación económica independiente porque no proporcionaría al usuario una ventaja económica distinta del mero uso o análisis de la obra).

Encuadramiento en la excepción de minería de textos y datos

El Tribunal de Hamburgo tiene pocas dudas en cuanto al encaje de la actividad de preparación de sets de datos para el entrenamiento de sistemas de IA en el ámbito de la excepción de minería de textos y datos. La minería de textos y datos se refiere a la utilización de cualquier “técnica analítica automatizada destinada a analizar textos y datos en formato digital a fin de generar información que incluye, sin carácter exhaustivo, pautas, tendencias o correlaciones” (art. 2.2 de la Directiva 2019/790 de 17 de abril de 2019 sobre los derechos de autor y derechos afines en el mercado único digital [Directiva 2019/790]).

A estos efectos, descarta dos de los argumentos recurrentes entre quienes se han manifestado contrarios a la aplicación de esta excepción al ámbito de la IA y, en particular, a la IA generativa, a saber:

(i) La interpretación teleológica de la norma a la vista del estado de la técnica en el momento en que el legislador de la Unión aprobó la Directiva 2019/790. El Tribunal rechaza acertadamente el argumento de que el legislador de la Unión, en el momento de aprobar la Directiva 2019/790, no habría tenido en cuenta las aplicaciones de la minería de textos y datos en el ámbito de la IA generativa y sus consecuencias. A estos efectos, el Tribunal razona que los desarrollos que se han producido en ese ámbito desde 2019 no conciernen tanto al tipo y alcance de la minería, sino más bien al desempeño de las ya conocidas redes neuronales artificiales entrenadas con los datos recabados. Asimismo, recuerda oportunamente que el propio legislador de la Unión ha reconocido de forma expresa la aplicabilidad de la excepción de minería de textos y datos en el art. 53.1.c) del Reglamento de Inteligencia Artificial, al establecer que los desarrolladores de modelos de uso general deberán respetar el mecanismo de opt-out recogido en el art. 4.3 de la Directiva 2019/790.

Importa precisar que, incluso antes del Reglamento de Inteligencia Artificial, existían argumentos muy convincentes para concluir que el límite de minería de textos y datos puede aplicarse a la IA (Dreier, 2022-1, p. 1.032), entre otros, el que resulta del considerando 18 de la Directiva 2019/790, que ya anticipaba la voluntad del legislador europeo de que este límite desempeñara un papel relevante en el “desarrollo de nuevas aplicaciones o tecnologías” (Hofmann, 2024-2, p. 16).

(ii) La aplicación de la regla de los tres pasos. Es una regla reconocida entre nosotros en el art. 40 bis TRLPI que trata de evitar una aplicación excesiva de los límites y excepciones por medio de una cláusula general que exige valorar si la aplicación de un límite o excepción a un caso concreto atenta a la explotación normal de la obra y perjudica injustificadamente los intereses legítimos del titular. Al respecto, el Tribunal considera que no hay razones para apreciar que la reproducción realizada por la demandada impida la normal explotación de la obra por su titular o cause un perjuicio ilegítimo a sus intereses. Pese a reconocer que el dataset creado por la entidad demandada es susceptible de uso para el entrenamiento de modelos que en última instancia podrían resultar en contenido generado por IA que compita con la obra original, el Tribunal considera que se trata de un futurible incierto y, en todo caso, lo mismo sería predicable de cualquier actividad de minería de textos y datos. Por tanto, si tal argumento permitiese excluir la aplicación de la excepción de minería de textos y datos por contravención de la regla de los tres pasos, ello supondría, de facto, vaciar de contenido a esta excepción.

Minería de textos y datos con fines de investigación científica

El Tribunal de Hamburgo encuadra los actos de la demandada en la excepción de minería de textos y datos para fines de investigación científica recogida en el art. 60d UrhG (equivalente al art. 3 de la Directiva 2019/790 y, en parte y con los matices que señalaremos, al art. 67 del Real Decreto-ley 24/2021). Según este límite o excepción, no hay infracción del derecho de reproducción de obras y prestaciones ni del derecho de extracción sobre bases de datos cuando la actividad de minería de textos y datos es realizada por lo que la Directiva 2019/790 denomina “organismos de investigación e instituciones responsables del patrimonio cultural”.

Podría no ser obvio el encaje en esta definición de una institución como la demandada en el caso (una asociación de carácter privado y con finalidad de investigación). Y es que, cuando se acude a los considerandos de la Directiva, podría parecer que los “organismos de investigación” en los que el legislador está pensando son, fundamentalmente, instituciones de carácter público o con facultades de investigación encomendadas o, al menos, reconocidas de forma oficial por los Estados miembros.

Sin embargo, lo cierto es que la Directiva 2019/790 no restringe —ni tendría sentido que restringiera— la forma o naturaleza jurídica que pueden adoptar estos “organismos de investigación”, atendiendo a su finalidad y a la ausencia de ánimo de lucro de la actividad de investigación. Por tanto, la aplicación de la excepción para fines de investigación científica realizada por el Tribunal de Hamburgo es correcta con arreglo a la Directiva 2019/790 (en el mismo sentido, Leistner, 2024, p. 1.668). En todo caso, la redacción de la norma alemana (apdo. 2 del art. 60d UrhG), más acertada que la norma española, ha ayudado a esta calificación, al establecer una definición de organismos de investigación que claramente incluye a aquellas instituciones que llevan a cabo investigación científica, siempre que cumplan alguno de los siguientes requisitos: (i) no tener una finalidad comercial, (ii) reinvertir sus beneficios en investigación, o bien (iii) operar en interés público a través de un acuerdo o convenio reconocido por las autoridades públicas.

Además, en el caso en cuestión, el Tribunal de Hamburgo considera que entre los “fines científicos” quedan comprendidas las distintas actividades que tienen como finalidad la generación de conocimiento, es decir, no únicamente las de aquellas instituciones que buscan alcanzar de forma directa el conocimiento o lo emplean para alcanzar conclusiones empíricas, sino también las actividades realizadas en las fases previas o preparatorias. A estos efectos, el Tribunal entiende que la actividad de generación de conjuntos de datos para el entrenamiento de sistemas de IA realizada por la demandada tiene encaje entre estas actividades previas o preparatorias.

En fin, el Tribunal considera probado que la demandada no persigue fines comerciales por cuanto pone a disposición del público de forma gratuita esos conjuntos de datos. El hecho de que estos conjuntos de datos puedan ser utilizados por empresas con finalidad comercial es irrelevante (porque, en efecto, la actividad de estas empresas deberá enjuiciarse autónomamente con arreglo al derecho aplicable a ellas y, en particular, también podrán estar sometidas a los requisitos de los límites de minería de texto y datos o cualesquiera otros que les sean de aplicación – v., en este sentido, Leistner, 2024, p. 1.668). El hecho de que algunos investigadores de la asociación demandada presten servicios remunerados a esas empresas también es irrelevante para el Tribunal.

¿Y si se hubiese tratado de minería de textos y datos para fines distintos de la investigación científica?

Pese a considerar aplicable la excepción para fines de investigación científica, la sentencia también analiza, a modo de obiter dictum, cuál habría sido su análisis de haber tenido que aplicar la excepción general de minería de textos y datos recogida en el art. 4 de la Directiva 2019/790 (transpuesto al ordenamiento alemán en el art. 44b UrhG). Según estos preceptos, en esencia, el límite de minería de textos y datos también se aplica a fines distintos de la investigación científica y a entidades con ánimo de lucro, pero, en estos casos, los titulares de los derechos pueden excluir la aplicación del límite si previamente se han opuesto expresamente (opt-out), lo que, en el caso de obras y prestaciones disponibles online, deberá hacer con medios de lectura mecánica. La posibilidad del opt-out también está, lógicamente, prevista en nuestro ordenamiento (art. 67.3 Real Decreto-ley 24/2021), pero con la particularidad —contraria a la Directiva 2019/790 y a una mínima sensibilidad con la investigación científica— de que sería aplicable también para la minería de textos y datos realizada con fines de investigación científica y por entidades sin ánimo de lucro.

A estos efectos, el Tribunal aborda en qué medida la exclusión realizada en el sitio web de la agencia de fotografías de la que la entidad demandada descargó la fotografía debe entenderse como válida y correctamente realizada. En particular, el Tribunal se pronuncia obiter dictum sobre dos cuestiones relevantes:

(i) ¿Cómo debe realizarse la reserva expresa de derechos que impide la aplicación del límite? El demandante invocaba el texto incluido por la agencia en los términos y condiciones de su sitio web y que tenía el siguiente tenor:

“RESTRICTIONS: YOU MAY NOT: (…) Use automated programs, applets, bots or the like to access the …com website or any content thereon for any purpose, including, by way of example only, downloading Content, indexing, scraping or caching any content on the website”.

En este punto, el Tribunal realiza una interpretación flexible de lo que ha de entenderse por “medios de lectura mecánica” a los efectos del art. 4 de la Directiva 2019/790, y razona que puede ser válida una exclusión expresada en lenguaje natural en el propio sitio web y por medio de una condición general de la contratación (sin que sea necesariamente precisa la inclusión de medios como robots.txt en el código fuente del sitio web en cuestión). La sentencia justifica este distanciamiento de la interpretación que el Tribunal reconoce como predominante por entender que el estado de la técnica (al que también remite el propio art. 53.1.c) del Reglamento de Inteligencia Artificial) permite a las herramientas de scraping captar y entender el texto en lenguaje natural.

La interpretación que realiza el Tribunal es entendible como obiter dictum, sin entrar en disquisiciones sobre en qué medida era técnicamente posible o razonable esperar que el desarrollador emplease soluciones técnicas concretas para la lectura del lenguaje natural de la web en el momento de la descarga (para ello sería preciso un análisis exhaustivo de las circunstancias del caso y las soluciones tecnológicas disponibles). La regla que resulta de la posición del Tribunal es, de todos modos, razonable y remite al análisis de cada caso (Leistner, 2024, p. 1.673). En efecto, se trata, en esencia, de garantizar que las empresas que realizan minería de textos y datos (es decir, en este caso, las empresas de IA) puedan procesar adecuadamente por medio de algoritmos las reservas sin esfuerzos económicos desproporcionados, por lo que será necesario, en efecto, verificar en cada caso el estado de la técnica disponible en cada momento.

El Tribunal tampoco analiza en qué medida la concreta redacción de la exclusión es apta para descartar cualquier tipo de minería de textos y datos (lo que, en nuestra opinión, no es obvio), probablemente porque la técnica de scraping empleada por la entidad demandada se encontraba entre las expresamente prohibidas por el sitio web. Tampoco analiza el Tribunal la cuestión del lugar dónde debe realizarse la reserva y qué sucede cuando el texto o la imagen aparece luego en otro lugar sin conexión aparente o fácil con la web donde se publicó por primera vez con la reserva, situación en la que sería muy difícil concluir que se aplica esa reserva (Leistner, 2024, p. 1.673).

(ii) La segunda cuestión de interés se refiere a en qué medida el titular de derechos puede ampararse en una exclusión que no ha sido realizada por él mismo, sino por un tercero, como es la agencia a la que ha licenciado la fotografía. La norma alemana, al igual que la Directiva 2019/719 y el art. 67.4 del Real Decreto-ley 24/2012, se refieren a exclusiones realizadas por los “titulares de derechos”. El Tribunal de Hamburgo entiende que ello no significa que la exclusión deba formularla necesariamente el autor o titular originario, sino que es posible que sea un licenciatario u otro titular derivativo de derechos quien formule la exclusión. En el caso analizado, por tanto, el Tribunal entiende válida la exclusión realizada por la agencia licenciataria.

A nuestro modo de ver, la solución alcanzada por el Tribunal es acertada para supuestos como el resuelto en la sentencia, donde nos encontramos ante (i) una exclusión realizada por un licenciatario, sobre los concretos contenidos puestos a disposición por el propio licenciatario en el mismo sitio web donde se realiza la exclusión, y (ii) respecto de la que el autor o titular originario de los derechos no se ha opuesto a esa reserva (pues, como es lógico, ha demandado precisamente amparándose en esa reserva). Por ello, este razonamiento y conclusión no sería extensible a otros casos, como sería, p. ej., el del opt-out formulado en términos genéricos por algunas entidades de gestión europeas respecto del repertorio de sus representados in toto, pues ese pretendido opt-out no reuniría los requisitos mínimos de adecuación y de seguridad jurídica que exige la Directiva 2019/790 para que pueda considerarse operante y no estaría claro si todos los autores y titulares originarios comparten (ni que sea de forma implícita o tácita) esa decisión.

Reflexiones finales

Primero. La sentencia del Tribunal de Hamburgo interpreta y aplica la excepción de minería de textos y datos de acuerdo con la Directiva 2019/790. Evita rigideces interpretativas y pondera equilibradamente los intereses en juego para evitar que la normativa de propiedad intelectual se convierta en un obstáculo desproporcionado al desarrollo tecnológico y a la investigación científica.

Segundo. La excepción de minería de textos es mejorable en su formulación y resulta altamente impredecible en su aplicación, en particular, en lo que se refiere a la facultad y términos en que los titulares de derechos pueden excluir su aplicación.

Tercero. Se ha propuesto derogar la posibilidad de que los titulares de derechos puedan ejercitar un opt-out en los casos de usos comerciales, de manera que la jurisdicción europea facilite el desarrollo de la IA (Hofmann, 2024-2, pp. 14-15)

Del modo en que se intuye que podría entenderse la aplicación del fair use en el Derecho norteamericano, aunque esto es incierto hoy por hoy por la pendencia de los casos citados más arriba. La legislación japonesa – art. 30-4 Ley de Derecho de Autor – prevé específicamente excluir la infracción de derechos de autor en estos casos, aunque actualmente se discute el alcance concreto de la exclusión en relación con la necesidad de que no se perjudique irrazonablemente los intereses del titular de los derechos [v. la guía de interpretación de esta norma de mayo de 2024].

No faltan, en efecto, buenas razones de política jurídica para apoyar esta solución (Hofmann, 2024-2, p. 14):

sin una reforma de este tipo, Europa quedaría (todavía más) excluida de la iniciativa en los desarrollos de la IA generativa. La norma japonesa no oculta las (sensatas) razones que hay detrás de ella: se trata de ofrecer jurisdicciones que permitan atraer la inversión y el talento tecnológico, reduciendo los riesgos de obstáculos jurídicos basados en la normativa de propiedad intelectual (v., sobre esto, las consideraciones sobre ley y jurisdicción aplicables que hacemos infra). No es muy distinta a la preocupación que parece tener el Ministerio de Cultura al referirse, como se ha visto, a la previsible (o directamente segura) pérdida de puestos de trabajo por la IA; pero es una preocupación que, en cambio, tiene en cuenta que, como siempre ha sucedido con cualquier nueva tecnología, generará nuevos puestos de trabajo distintos (y probablemente mejores) y lo razonable y esperable es que los Estados o la Unión Europea apuesten por atraer esos nuevos e interesantes puestos de trabajo (aunque sea a costa de que determinados autores y titulares de derechos dejen de ingresar cantidades individualmente pequeñas; recuérdese que cuando hablamos de autores y titulares de derechos en este caso, estamos hablando de los millones de posibles titulares que tienen contenidos disponibles en Internet, incluidos los autores de esta entrada).
La IA generativa —es obvio, pero tal vez haya que recordarlo— es una herramienta con un potencial enorme y uno de los mayores desarrollos tecnológicos de la historia de la humanidad. Su éxito pasa, no obstante, por la calidad de los datos que se utilicen en el entrenamiento, y no es infrecuente que los contenidos de mayor calidad sean contenidos de pago, respecto de los cuales los titulares de derechos tenderán a ejercitar el opt-out. Si ello es así, la IA generativa, en un régimen como el actual en la Unión Europea, debería basarse en el entrenamiento con contenidos usualmente de peor calidad.

Cuarto. Hay otras voces que proponen establecer un derecho de remuneración, por las razones expuesta en relación con el Proyecto de Real Decreto del Ministerio

Una argumentación más sólida de esta propuesta se encuentra en Schack, 2014, p. 117.

A nuestro juicio, un derecho de remuneración no parece adecuado: puede generar algunos recursos adicionales, pocos, en realidad, a los autores y titulares individualmente considerados;

Quizá se logren recursos importantes pero para que sean administrados y repartidos por las entidades de gestión que, habrá que convenir, son de difícil reparto.

Pero estos recursos se logran a costa de crear un obstáculo serio al desarrollo de herramientas de IA no sólo por el coste de esa remuneración, sino por los costes (de transacción) que su gestión implicará.

Además, pese a lo que pudiera pensarse, hay razones para ser escéptico respecto a que un derecho de estas características fuese verdaderamente beneficioso para los titulares. Aparte de la obvia dificultad para identificar a los titulares de derechos cuando se trate de contenido públicamente accesible en Internet, no puede soslayarse que una inmensa parte de ese contenido es de titulares que no realizan una explotación económica de ese contenido como tal. Piénsese, p. ej., en la gran cantidad de sitios web corporativos (en el ámbito jurídico, las numerosas notas o comentarios de legislación y jurisprudencia de las webs de despachos de abogados) o el contenido académico libremente accesible en Internet (como el de este blog). Carece de sentido otorgar un derecho de remuneración por este tipo de utilizaciones secundarias, cuando los titulares ni siquiera realizan una explotación económica en un mercado primario por estos derechos. Y, respecto de aquellos autores y titulares que sí explotan económicamente sus prestaciones, no parece dudoso que su futuro no está en lo (muy poco) que puedan recibir de ese eventual derecho de remuneración, sino en lo (mucho más) que puedan recibir —si sus contenidos son realmente buenos y apreciados en el mercado— por medio de los muros de pago.

Por otro lado, la propia configuración de los derechos de remuneración, normalmente encomendada a la gestión colectiva y detraída del ámbito de gestión individual de los titulares, restaría libertad a los titulares de derechos que pudieran llegar a acuerdos con las entidades involucradas en el desarrollo de sistemas de IA. El régimen actual, aunque imperfecto y en algunos aspectos ineficiente desde el punto de vista del desarrollo tecnológico, al menos tiene la bondad de permitir el uso sin restricciones para fines de investigación científica (a las entidades comprendidas en esta excepción) y, en el resto de los casos, el uso de todos aquellos contenidos respecto de los que no exista una exclusión expresa y válidamente formulada, permitiendo a los titulares de derechos que válidamente excluyan esta excepción alcanzar acuerdos con desarrolladores en los términos que estimen convenientes.

En la actualidad, como se ha visto, se encuentra en tramitación el proyecto de Real Decreto por el que se regula la concesión de licencias colectivas ampliadas para la explotación de obras y prestaciones protegidas para el desarrollo de modelos de IA. Este mecanismo (que, lógicamente, solo sería de aplicación respecto de aquellos titulares que hubiesen ejercitado válidamente su facultad de opt-out de la excepción de minería de textos y datos) permitiría a las entidades de gestión la concesión de licencias para estos usos, incluso respecto de titulares que no les hubiesen encomendado la gestión de sus derechos. Al margen de las razones que hay detrás de esta propuesta (ya criticadas en esta entrada), su contenido plantea serias dudas de oportunidad y encaje normativo, entre otras, la procedencia y adecuación del mecanismo, en la medida en que la Directiva 2019/790 lo reserva a supuestos de especial dificultad para recabar la autorización de los titulares y, precisamente, estas licencias solo serán aplicables respecto de los titulares que hayan ejercitado válidamente su derecho de opt-out (y, por tanto, deberán ser identificables, sin perjuicio de que el número de licencias que el usuario podría querer recabar sea más o menos elevado). Desde luego, la adopción de este tipo de mecanismos debe considerarse con gran cautela, a fin de evitar que se convierta en una forma subrepticia de implantación, por vía reglamentaria, de un derecho remuneratorio de gestión colectiva para soslayar la aplicación de una excepción prevista por el legislador de la Unión.

Quinto. La mayoría de actividades de entrenamiento de IA que estamos tratando se realizan fuera de la Unión Europea y, en particular, fuera de España y en materia de propiedad intelectual e industrial, rige el principio de territorialidad. En consecuencia, la legislación aplicable es la del Estado para cuyo territorio se reclama la protección (por todos, Garcimartín, 2017, p. 412). Así lo impone el art. 8.1 del Reglamento Roma II.

Por tanto, el criterio relevante será el del lugar donde se realizó o se va a realizar el acto supuestamente infractor (es decir y principalmente, el acto de reproducción)

Lo que podría llevar a pensar que sería el lugar donde se ubica el servidor en el que se cargó la obra o prestación, aunque es sabido que este no es un criterio especialmente útil como criterio de conexión por las dificultades para averiguar dónde se encuentra ese servidor y por el hecho de que la obra o prestación puede haber sido descargada en varios servidores o en la nube (por todos, Schack, 2024, p. 115).

En este escenario, la doctrina entiende que el criterio de conexión más adecuado es el de la sede o centro principal de intereses de la empresa o entidad que es responsable del entrenamiento de la IA (Schack, ibid.). Si esto es así, el margen para la aplicación del derecho europeo y español en el grupo de casos considerado se reduce considerablemente, por cuanto esas sedes o centros no suelen encontrarse en la Unión Europea y, en particular, en España.

Se dirá que el art. 53.1.c) del Reglamento de Inteligencia Artificial exige que los proveedores de modelo de IA cumplan con la legislación europea de propiedad intelectual y, en particular, que respeten el derecho de los titulares que hayan ejercitado su opt-out. Pero cumplir con el Derecho europeo es, en primer término, cumplir con el Reglamento Roma II, que, como se ve, podría excluir en muchos casos la aplicación de esa legislación europea de propiedad intelectual.

Coda

A nuestro modo de ver, se está poniendo excesivamente el foco en las actividades de entrenamiento de sistemas de IA bajo la asunción, no siempre cierta, de que los sistemas de IA resultantes serán potencialmente perjudiciales para los propios titulares, omitiendo consideraciones de política jurídica relevantes relativas al fomento de la competencia y la innovación tecnológica; o bajo la asunción, igualmente discutible, de que esas actividades implican actos infractores de derechos de propiedad intelectual.

Donde ha de centrarse el análisis no es tanto en la esfera del entrenamiento, sino en el resultado de la IA generativa (output) y, más concretamente, en el uso que se realice de ese output, así como en las obligaciones de transparencia en su comercialización, dirigidas a evitar que las creaciones de IA se hagan pasar como creaciones humanas y a fomentar la competencia entre estos dos tipos de creaciones.

Al fin y al cabo, el objeto de protección de la propiedad intelectual no son las ideas en sí mismas, ni los estilos o maneras de hacer, que es lo que se pretende capturar con el entrenamiento de la IA, sino su forma de expresión, que es lo que, en su caso, podría verse afectado por los actos de explotación que se realicen con el output.

Del mismo modo, los distintos derechos de explotación que prevé la normativa de propiedad intelectual tienen precisamente su origen en las distintas formas de disfrute de las obras y demás prestaciones protegidas, disfrute que, de nuevo, no tiene lugar con las actividades de entrenamiento de sistemas de IA, sino, en su caso, con el uso que ulteriormente se realice con su output.

Nota bibliográfica

Casas Vallés (2017), “Digitalización de contenidos y límites a la explotación de obras en Internet”, en R. Escudero / S. Martínez, Cuadernos de Derecho para Ingenieros. Ciberseguridad, Wolters, Madrid, 2017, pp. 21-43; Dreier (2022-1), “§ 44 b”, en T. Dreier / R. Schulze, UrhG – Kommentar, 7.ª ed., C. H. Beck, Múnich; Hofmann (2024-1), “Retten Schranken Geschäftsmodelle generativer KI-Systeme?”, ZUM, 2024, pp. 166-174; Hofmann (2024-2), “Zehn Thesen zu Künstlicher Intelligenz (KI) und Urheberrecht”, WRP, 2024, pp. 11-18; F.J. Garcimartín Alférez (2017), Derecho internacional privado, 4.ª ed., Civitas, Madrid; Leistner (2024), “TDM und KI-Training in der Europäischen Union – Erste Fingerzeige des LG Hamburg im „LAION“-Urteil”, GRUR, 2024, pp. 1.665-1.675; Ohly (2014), Urheberrecht in der digitalen Welt – Brauchen wir neue Regelungen zum Urheberrecht und dessen Durchsetzung?, C.H. Beck, Múnich; Schack (2014), Auslesen von Webseiten zu KI-Trainingszwecken als Urheberrechtsverletzung de lege lata et ferenda, NJW, 2024, pp. 113-117; Schulze (2022), “§ 15”, en T. Dreier / R. Schulze, UrhG – Kommentar, 7.ª ed., C. H. Beck, Múnich.

0 Comentarios

El más antiguo

El más nuevo El más votado

Opinión en línea

Ver todos los comentarios

5 Key Market Trends Every Business Should Watch in 2024 – Trademares

#46435

3 meses

[…] En Europa, se avanza hacia regulaciones más estrictas que podrían afectar el tratamiento de datos, autoría, transparencia en IA. almacendederecho.org […]

Responder

Inteligencia artificial, propiedad intelectual y minería de datos

Por Carles Vendrell y Álvaro Seijo

…

Notas a la Sentencia LG Hamburgo de 27 de septiembre de 2024 y al Proyecto de Real Decreto sobre concesión de licencias colectivas ampliadas para la explotación masiva de obras y prestaciones para el desarrollo de modelos de inteligencia artificial

Los hechos del caso

No aplicación al caso del límite de reproducciones provisionales

Encuadramiento en la excepción de minería de textos y datos

Minería de textos y datos con fines de investigación científica

¿Y si se hubiese tratado de minería de textos y datos para fines distintos de la investigación científica?

Reflexiones finales

Coda

Nota bibliográfica

¿Le interesan estos contenidos?

Se ha suscrito a nuestros contenidos, muchas gracias.

Sobre el Autor

Carles Vendrell Cervantes

Buscar

El proyecto

Comentarios Recientes

Los libros del Almacén

Suscríbase a nuestros contenidos

Se ha suscrito a nuestros contenidos, muchas gracias.

Buscador de contenido

Hemeroteca

Síguenos en redes

Pin It on Pinterest

Inteligencia artificial, propiedad intelectual y minería de datos

Por Carles Vendrell y Álvaro Seijo

…

Notas a la Sentencia LG Hamburgo de 27 de septiembre de 2024 y al Proyecto de Real Decreto sobre concesión de licencias colectivas ampliadas para la explotación masiva de obras y prestaciones para el desarrollo de modelos de inteligencia artificial

Los hechos del caso

No aplicación al caso del límite de reproducciones provisionales

Encuadramiento en la excepción de minería de textos y datos

Minería de textos y datos con fines de investigación científica

¿Y si se hubiese tratado de minería de textos y datos para fines distintos de la investigación científica?

Reflexiones finales

Coda

Nota bibliográfica

¿Le interesan estos contenidos?

Se ha suscrito a nuestros contenidos, muchas gracias.

Sobre el Autor

Carles Vendrell Cervantes

Artículos Relacionados

Deslealtad del administrador en forma de desviación de poder*

Igualdad, identidad y personas trans

Obligaciones de las empresas frente al cambio climático

Supresión de cláusulas restrictivas de la transmisibilidad de acciones y participaciones que reconocen derechos de adquisición preferente a los socios

Buscar

El proyecto

Comentarios Recientes

Los libros del Almacén

Suscríbase a nuestros contenidos

Se ha suscrito a nuestros contenidos, muchas gracias.

Buscador de contenido

Hemeroteca

Síguenos en redes

Pin It on Pinterest