ChatGPT a été invité à écrire un livre « Game of Thrones ». Le résultat a été si bon qu'il finira devant les tribunaux

La tension entre les grandes technologies et les défenseurs du droit d’auteur continue de croître. Un tribunal fédéral de Manhattan a décidé que le procès intenté en avril par George RR Martin (avec un groupe d'autres auteurs) contre OpenAI et Microsoft devait se poursuivre. Le juge a constaté suffisamment d'indices de violation du droit d'auteur.

Selon le juge Sidney Stein, la plainte n'est pas un simple désaccord sur le fonctionnement des modèles linguistiques. Les résultats générés par ChatGPT (en particulier, une suite proposée au quatrième livre de la saga, « Clash of Kings ») présentent des « similitudes substantielles » avec l'œuvre protégée. Autrement dit, pour le tribunal, il existe une possibilité réelle que le modèle ait été formé avec du matériel protégé par le droit d'auteur sans licence et que le chatbot le reproduire de manière non transformée.

Cette suite… semble familière. Dans le procès, les avocats ont demandé à ChatGPT de générer les grandes lignes d'une suite alternative à « A Clash of Kings » qui ne suivrait pas l'intrigue de « A Storm of Swords ». Le modèle a répondu avec « Danse des ombres », une histoire qui comprenait une héritière Targaryen inconnue, une ancienne magie de dragon et une secte des Enfants de la Forêt. Bien qu'il s'écarte des événements canoniques de l'œuvre de Martin, le style, les éléments narratifs et la structure étaient suffisamment proches pour tirer la sonnette d'alarme.

Les auteurs ont une conclusion claire : l’IA se nourrit d’œuvres protégées pour produire du contenu dérivé sans autorisation, compensation ou attribution. C'est un discours qui s'inscrit dans la lignée de ce que l'on a déjà vu ces dernières années dans d'autres procès collectifs d'écrivains, de journalistes, d'illustrateurs ou de musiciens.

Problèmes pour l'industrie. Cette affaire intervient dans un contexte particulièrement délicat pour les entreprises technologiques :

Anthropic est sur le point de conclure un accord de 1,5 milliard de dollars pour le téléchargement massif de livres piratés afin de former son modèle.
Meta fait face à plusieurs poursuites après avoir appris qu'il avait téléchargé plus de 80 To de contenu protégé depuis LibGen et Z-Library pour former LLaMA.
OpenAI a déjà perdu un premier procès en Allemagne, où il a été jugé que la lecture des paroles des chansons apprises lors de la formation violait les droits d'exploitation. Vous faites face à une vague de procès

Le cas de Martin ajoute de la pression aux États-Unis, où des médias comme le New York Times accusent également OpenAI d'avoir utilisé ses articles sans autorisation. L'avocat du média le décrit comme une menace directe pour la profession : « L'IA générative peut inonder le marché de travaux médiocres basés sur nos textes. »

Implications pour l'industrie. La décision du tribunal n'est pas une condamnation, mais c'est un avertissement de la Justice : les modèles de formation au contenu protégé ne seront pas tolérés sans accords, licences et compensations. Et si l'exemple d'Anthropic crée une tendance, les chiffres économiques pourraient atteindre des niveaux records.