IA générative et créativité : une analyse rapide des enregistrements de droits d’auteur américains et canadiens pour les œuvres artistiques

Image générée avec Midjourney

Au milieu de l’année 2022, trois générateurs texte-image d’IA importants ont été mis à la disposition du public : Dall-E 2 (avril 2022), Midjourney (juillet 2022) et Stability Diffusion (août 2022). En plus de soulever des questions sur la propriété des résultats, les violations dans la formation et l’avenir du droit d’auteur en tant qu’outil politique pour encourager la créativitéles économistes en sont aux premiers stades d’analyse des effets de ces technologies sur la créativité humaine. Ces questions sont interdépendantes dans la mesure où l’un des arguments en faveur des restrictions du droit d’auteur sur la formation est la protection que ces restrictions offriront aux créateurs humains contre la concurrence ruineuse de l’IA. Dans ce contexte, cet article de blog propose quelques réflexions provisoires sur l’impact des générateurs de texte en image sur la créativité artistique humaine en analysant les récents enregistrements de droits d’auteur aux États-Unis et au Canada pour des œuvres artistiques.

Pour mieux comprendre les effets des générateurs de texte en image sur la créativité artistique, je compare les enregistrements avant et après août 2022. L’Office américain du droit d’auteur et l’Office de la propriété intellectuelle du Canada (OPIC) tiennent des registres de droits d’auteur consultables publiquement. Bien que ce ne soit pas une condition préalable à la propriété, les deux juridictions encouragent l’enregistrement de diverses manières : aux États-Unis, l’enregistrement est requis pour que les titulaires nationaux de droits d’auteur puissent engager des actions en violation du droit d’auteur ; au Canada, l’enregistrement constitue une preuve de propriété dans les cas de contrefaçon. Bien entendu, la plupart des œuvres artistiques ne sont toujours pas enregistrées et les données d’enregistrement ne fournissent donc que des informations très limitées sur la créativité dans son ensemble. Néanmoins, les données pourraient fournir des informations intéressantes, bien qu’avec des réserves importantes, sur un sous-ensemble de la créativité artistique, à savoir la créativité artistique qui est suffisamment importante sur le plan commercial pour justifier le peu de temps et les dépenses nécessaires à l’enregistrement du droit d’auteur. Par souci de simplicité, j’appellerai cette « créativité artistique d’importance commerciale ». La date d’août 2022 reflète le changement technologique entre avril et août 2022.

En analysant les données, on pourrait émettre l’hypothèse que les enregistrements aux États-Unis ont diminué après août 2022, tandis que les enregistrements auprès de l’Office canadien du droit d’auteur ont augmenté. La raison d’une telle hypothèse réside dans les différentes politiques adoptées en matière d’enregistrement des œuvres d’IA générative. Le Bureau américain du droit d’auteur a pour politique depuis relativement longtemps d’enregistrer uniquement les œuvres d’auteurs humains. En 2018, le Copyright Office a refusé d’enregistrer une œuvre générée par ordinateur (An Entry into Paradise) produite par Creativity Machine de Stephen Thaler, et le 28 octobre 2002, l’Office a annulé la première inscription concernait une œuvre produite via un générateur de texte en image : Zarya of the Dawn, générée par Kris Kashtanova. Avec de telles politiques en place, on pourrait s’attendre à une baisse des enregistrements, car certains artistes humains en marge se tournent vers la création d’œuvres artistiques utilisant les nouvelles technologies et ne sont plus éligibles au droit d’auteur (comme dans l’exemple de Zarya of the Dawn). En revanche, l’OPIC a sans doute adopté une attitude plus libérale à l’égard des œuvres générées par ordinateur. En 2021, Ankit Sahni s’est inscrit une œuvre artistique intitulée SURYAST et répertoriée « RAGHAV Artificial Intelligence Painting App » comme co-auteur, tandis que certaines « 100 % générées par l’IA » des œuvres ont également été enregistrées. Avec cette politique en place, on pourrait s’attendre à une augmentation des enregistrements de droits d’auteur à mesure que les outils d’IA augmentent la capacité de production des artistes et que ces œuvres « assistées par l’IA » sont éligibles à l’enregistrement.

Les données fournissent des preuves de l’hypothèse. À commencer par les États-Unis, si l’on représente les enregistrements mensuels de droits d’auteur pour les œuvres visuelles (c’est-à-dire celles commençant par un numéro d’enregistrement VA) de janvier 2017 à décembre 2023, on constate que les enregistrements diminuent au cours de la période (voir Figure 1). En utilisant les mêmes données et une variable muette (0 pour les inscriptions avant août 2022, 1 pour les inscriptions après août 2022), nous pouvons effectuer une analyse de régression univariée. Le résultat est que la date limite d’août 2022 est associée à une baisse d’environ 765 6971 inscriptions mensuelles pour les œuvres visuelles. Bien qu’il existe des réserves quant à la qualité statistique d’une telle analyse de régression, il convient de noter qu’un tel résultat est statistiquement significatif (valeur P de 0,001 au niveau de 5 %). Bien sûr, nous constatons également une baisse des enregistrements au début de 2020, mais étant donné que nous constatons quelque chose de similaire dans les enregistrements auprès de l’OPIC, il s’agit tout à fait plausiblement de l’impact de la pandémie de Covid-19. Si nous changeons la date limite en choisissant une date aléatoire – dans ce cas, août 2019 – nous constatons également une diminution des inscriptions mensuelles, mais à un taux inférieur de 576,2075. Ces données concordent également avec une baisse annuelle des inscriptions pour les œuvres visuelles présentée dans le tableau 1.

Se tourner vers le Canada, les données sont mitigées et peu concluantes. La figure 2 représente les enregistrements mensuels d’œuvres dans la catégorie « artistique » dans la base de données de l’OPIC. L’analyse de régression univariée démontre que la date limite est associée à une augmentation mensuelle de 6 inscriptions, mais cela n’est pas statistiquement significatif (valeur P de 0,715). Une fois de plus, on constate une légère baisse des inscriptions début 2020, le mois de mars enregistrant le troisième plus faible nombre d’inscriptions pour l’ensemble de la période. Le tableau 2 présente les inscriptions annuelles de 2013 à 2023, montrant que 2023 a été l’année avec le quatrième plus grand volume d’inscriptions d’œuvres artistiques.

Avant de conclure, il convient de préciser pourquoi je n’ai pas inclus les données du début 2024 dans cet exercice. La raison en est qu’au cours des trois premiers mois de 2024, les enregistrements d’œuvres visuelles aux États-Unis ont chuté de façon vertigineuse avec 1 648 en janvier, 221 en février et seulement 8 en mars. Pendant ce temps, au Canada, les chiffres sont conformes à ce à quoi on pourrait s’attendre (respectivement 177, 244 et 162). Compte tenu de l’énorme baisse, je m’attends (et je l’espère même !) à ce que les données américaines reflètent une sorte de décalage dans les rapports. En outre, s’il y a un retard important dans la déclaration, les enregistrements à la fin de 2023 pourraient également être inexacts.

Dans l’ensemble, que nous apprend cet exercice sur l’état de la créativité commercialement significative suite à l’introduction des générateurs de texte en image IA ? Certes, pas grand-chose. Les données canadiennes ne nous disent presque rien de significatif sur le plan statistique. Les données américaines pourraient signifier une diminution de la production créative humaine d’importance commerciale. Si cela est vrai, cette constatation soulève des questions normatives sur le type de créativité que nous valorisons en tant que société et sur la meilleure manière de soutenir cette production créative à l’avenir. Cette conclusion doit cependant être fortement nuancée en reconnaissant le potentiel d’erreurs de déclaration et la difficulté de démêler les autres causes de la baisse des enregistrements. La conclusion la plus significative est peut-être que nous sommes encore profondément dans l’ignorance quant à la manière dont ces nouvelles technologies affecteront la créativité humaine à l’avenir. En gardant cela à l’esprit, il peut être prudent d’aborder avec une certaine prudence les affirmations sur la nécessité de protéger les créateurs humains de la concurrence ruineuse de l’IA.