Home » Business » Generative AI & Copyright: Key Takeaways from the US Copyright Office

Generative AI & Copyright: Key Takeaways from the US Copyright Office

IA Générative et Droit d’Auteur : Le Rapport Révélateur du Bureau Américain du Copyright

Dernière mise à jour : [Date]

Par [Nom du Journaliste]

Le 9 mai 2025, le Bureau américain du Copyright a publié une version “pré-publication” de la Partie III de son très attendu Rapport sur le Droit d’Auteur et l’Intelligence Artificielle (IA) (le Rapport). Ce document offre un aperçu technique du développement, de l’entraînement et du déploiement des modèles d’IA générative. Il examine également comment le droit d’auteur américain,en particulier la doctrine de l’utilisation équitable (fair use),devrait s’appliquer dans le contexte de l’entraînement de ces modèles.

Le saviez-vous ? Le rapport a été publié en réponse aux demandes du Congrès et aux expressions d’intérêt des parties prenantes. Une version finale est prévue, sans aucun changement substantiel attendu dans l’analyse ou les conclusions.

La Copie : Un Enjeu Central de l’Entraînement et de l’Utilisation

Le Rapport souligne que la curation, la collecte, le téléchargement, le reformatage, le transfert et l’incorporation de copies dans les ensembles de données d’entraînement des modèles d’IA peuvent impliquer la création de multiples copies d’œuvres protégées. La constitution d’un ensemble de données d’entraînement utilisant des œuvres protégées par le droit d’auteur implique clairement le droit de reproduction. De plus, si les sorties du modèle sont substantiellement similaires aux sources d’entraînement, elles peuvent également impliquer un droit protégé. Dans ces cas, la conduite est présumée contrefaisante, à moins que la défense de l’utilisation équitable ne s’applique.

Conseil de pro : Comprendre les nuances de la doctrine de l’utilisation équitable est crucial pour naviguer dans les complexités juridiques de l’IA générative.

La question de la “mémoire” des modèles est plus complexe. L’étendue de la mémorisation des exemples d’entraînement est contestée et varie probablement selon les modèles. Cependant, selon le Rapport, si le modèle peut générer une copie identique ou presque identique de l’œuvre sous-jacente sans que cette expression ne soit fournie sous forme d’invite ou d’entrée, il existe un argument solide selon lequel les “poids” du modèle – les paramètres numériques qui déterminent l’importance des caractéristiques de l’ensemble de données – pourraient impliquer le droit de reproduction. Les poids du modèle qui ont mémorisé une expression protégeable à partir des données d’entraînement peuvent également enfreindre le droit d’œuvre dérivée.

Le Rapport précise que la question de savoir si les poids d’un modèle impliquent les droits de reproduction ou d’œuvre dérivée dépend de la question de savoir si le modèle a conservé ou mémorisé une expression protégeable substantielle des œuvres sous-jacentes. dans un tel cas, la distribution, le réglage fin ou le déploiement d’un modèle pourrait exposer les développeurs et les utilisateurs en aval à une responsabilité pour contrefaçon.

L’Utilisation Équitable : Une Analyse Contextuelle Essentielle

Lorsque la copie constitue une contrefaçon prima facie, la question suivante est de savoir si la défense de l’utilisation équitable s’applique. L’analyse de l’utilisation équitable prend en compte quatre facteurs non exclusifs : (1) le but et le caractère de l’utilisation, (2) la nature de l’œuvre protégée par le droit d’auteur, (3) la quantité et la substantialité copiées, et (4) l’effet sur le marché.

Le But et le Caractère de l’Utilisation : Un Facteur Clé

L’analyse du Rapport sur le premier facteur – le but et le caractère de l’utilisation – se concentre sur l’identification de l’utilisation, de la transformativité, de la commercialité et de l’accès légal à l’œuvre, la transformativité et la commercialité étant des éléments clés. Sur la question cruciale de l’utilisation transformative, le Rapport s’appuie sur le raisonnement de la Cour suprême dans Warhol c. Goldsmith selon lequel l’utilisation transformative est une question de degré. Appliquée dans le contexte de l’entraînement des modèles d’IA, le Rapport affirme que l’analyse dépend non seulement du processus d’entraînement, mais aussi de la façon dont le modèle est utilisé. À une extrémité du spectre se trouvent les utilisations axées sur la recherche ou les systèmes fermés. Par exemple, la numérisation de livres pour créer une base de données interrogeable en texte intégral pour soutenir la modération du contenu peut être très transformative. L’entraînement de modèles pour générer des œuvres protégées par le droit d’auteur substantiellement similaires, cependant, peut ne pas l’être. Le Rapport note que, contrairement aux cas où la copie n’était qu’un moyen de supprimer les barrières d’interopérabilité, l’utilisation d’images ou d’enregistrements sonores pour générer des sorties expressives substantiellement similaires est peu susceptible d’être transformative, à moins que l’œuvre elle-même ne soit ciblée pour un commentaire ou une parodie.

Le Rapport explique également que la génération augmentée par la récupération (RAG) – qui améliore les performances des modèles d’IA générative en extrayant des informations de bases de données externes, de documents ou du Web – nécessite un examen distinct. Contrairement au pré-entraînement avec un ensemble de données vaste et diversifié, la RAG récupère des œuvres ciblées dans le but d’améliorer la sortie de l’invite. La RAG est moins susceptible d’être transformative lorsque le but est de générer des sorties qui résument ou abrègent des œuvres protégées par le droit d’auteur.

En faisant cette distinction,le Rapport est essentiellement en désaccord avec deux arguments courants selon lesquels l’entraînement des modèles d’IA est intrinsèquement transformatif. Quant à l’argument selon lequel le but n’est pas expressif, le Rapport soutient que, comme les modèles font plus que simplement la reconnaissance statistique de formes (ils apprennent la sélection et l’arrangement des mots, des images et des sons sous-jacents), l’entraînement des modèles englobe l'”essence” de l’expression créative.Quant à l’argument selon lequel le processus est similaire à l’apprentissage humain, le Rapport soutient que la défense de l’utilisation équitable ne protège pas toute copie dans le but d’apprendre et ne fait pas de distinction entre les actes accomplis par un ordinateur ou un humain.

Quant au rôle de l’autre élément essentiel du premier facteur – la commercialité – le Rapport note que la commercialité dépend de la question de savoir si l’utilisation favorise des fins commerciales, et non du statut à but lucratif ou non lucratif de l’entité impliquée dans l’utilisation du modèle d’IA générative.

la nature de l’Œuvre Protégée : Un Facteur Variable

Le Rapport indique que le deuxième facteur – la nature de l’œuvre protégée par le droit d’auteur – dépend du modèle et de l’œuvre en question. Les observateurs ont fait remarquer que le deuxième facteur joue rarement un rôle important dans l’équilibre de l’utilisation équitable. Le Rapport note que la plupart des modèles d’IA sont entraînés sur une variété de types d’œuvres et conclut que si les œuvres sont plus expressives ou précédemment non publiées, ce facteur pèserait contre l’utilisation équitable.

La quantité et la Substantialité Copiées : L’Importance des Garde-Fous

Le troisième facteur d’utilisation équitable examine la quantité d’une œuvre protégée par le droit d’auteur qui a été utilisée et si cette quantité était raisonnable à la lumière du but. Ici, le Rapport note que l’entraînement des modèles d’IA implique généralement la copie complète ou presque complète d’œuvres entières et utilise leur contenu expressif pour l’entraînement, ce qui pèse contre l’utilisation équitable. Cependant, le Rapport suggère que les développeurs peuvent atténuer la présomption contre l’utilisation équitable en montrant que la copie était fonctionnellement nécessaire à un but transformatif et que des garde-fous efficaces ont été utilisés pour empêcher la sortie d’une expression protégée.Il convient de noter que le Rapport constate également que la présence de garde-fous techniques est pertinente pour le premier facteur en tant que moyen de limiter la capacité d’un modèle à reproduire du matériel protégé par le droit d’auteur et le risque de substitution du marché.

L’Effet sur le Marché : Pertes de Ventes, Dilution et Frais de Licence

Quant au quatrième facteur d’utilisation équitable – l’effet sur le marché – le Rapport évalue différentes façons dont l’utilisation d’œuvres protégées par le droit d’auteur dans l’entraînement des modèles d’IA peut affecter la valeur marchande des œuvres protégées et aborde des affirmations plus larges selon lesquelles les avantages publics de l’entraînement sans licence pourraient modifier l’équilibre de l’utilisation équitable. Ici, le Rapport identifie trois catégories de préjudice potentiel : les pertes d’opportunités de licence, les pertes de ventes et la dilution du marché.

En particulier, alors que les première et deuxième catégories sont généralement prises en compte dans l’analyse de l’utilisation équitable, le Rapport note que certains commentateurs ont également plaidé pour la prise en compte du préjudice potentiel causé par la dilution du marché (c’est-à-dire, où même les sorties qui ne sont pas substantiellement similaires à une œuvre protégée par le droit d’auteur spécifique pourraient néanmoins concurrencer sur le marché pour ce type d’œuvre). Les auteurs du Rapport semblent avoir été persuadés par cette nouvelle théorie, notant que l’imitation stylistique rendue possible par l’utilisation [de l’œuvre originale] dans l’entraînement peut avoir un impact sur le marché du créateur, et avertissent que la vitesse et l’échelle auxquelles les systèmes d’IA génèrent du contenu posent un risque sérieux de dilution des marchés pour les œuvres du même type que dans leurs données d’entraînement. Cependant, même le Rapport reconnaît que cette position est un territoire inexploré et qu’aucun tribunal ne l’a encore adoptée comme raison de refuser l’utilisation équitable.

Le Rapport Plaide pour des Licences Volontaires, la Négociation Collective et une Réforme Politique

Le Rapport aborde également diverses solutions de licence pour l’entraînement des modèles d’IA, y compris les licences volontaires, collectives et obligatoires, et une “option de retrait” statutaire. En donnant sa recommandation, le Rapport souligne l’importance de reconnaître que l’entraînement implique une grande variété d’œuvres, ce qui affectera la faisabilité du régime de licence. Les licences volontaires peuvent être réalisables lorsqu’il existe de grands volumes de matériel protégeable par le droit d’auteur ou un nombre limité de propriétaires de droits d’auteur. Les licences collectives peuvent être réalisables et pourraient réduire les coûts transactionnels si des garanties appropriées contre les comportements anticoncurrentiels sont mises en œuvre et pourraient être utilisées pour préserver une certaine capacité à bloquer les utilisations non désirées ou à négocier les termes si le Congrès envisageait un jour une exception ou une limitation pour l’entraînement de l’IA.Cependant,le Rapport reconnaît en outre que les licences obligatoires pourraient entraver des solutions de marché flexibles et créatives et sont sans doute incompatibles avec l’exigence fondamentale du consentement à utiliser des œuvres protégées par le droit d’auteur.

Dans l’ensemble, le rapport de pré-publication sur l’entraînement des modèles d’IA adopte une approche mesurée, mais semble favoriser les propriétaires de droits d’auteur – notamment dans son approbation de la nouvelle théorie du préjudice de dilution du marché.

FAQ : Droit d’Auteur et IA Générative

Qu’est-ce que le rapport du Bureau américain du Copyright ?
C’est une analyse technique et juridique sur l’application du droit d’auteur américain à l’entraînement et à l’utilisation des modèles d’IA générative.
Qu’est-ce que l’utilisation équitable (fair use) ?
C’est une doctrine juridique qui permet l’utilisation limitée de matériel protégé par le droit d’auteur sans autorisation du détenteur des droits, à des fins telles que la critique, le commentaire, le reportage, l’enseignement, l’érudition ou la recherche.
Qu’est-ce que la “dilution du marché” ?
C’est une théorie selon laquelle même les sorties d’IA qui ne sont pas substantiellement similaires à une œuvre protégée peuvent nuire au marché de ce type d’œuvre en raison de l’imitation stylistique.

© [Année] [Nom de l’Organisation]. Tous droits réservés.

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.