Google pourrait bientôt faire face à une nouvelle action en justice pour des problèmes de droits d’auteur de la part du propriétaire du Daily Mail.
Le moteur de recherche aurait pris illégalement des centaines de milliers d’articles du journal pour former son rival ChatGPT, Bard.
Daily Mail and General Trust (DMGT), la maison d’édition détenue par Lord Rothermere, aurait déjà demandé des conseils juridiques et se prépare à déposer officiellement une plainte contre Google sous peu, selon le Télégraphe.
Pourquoi nous nous soucions. Comme Pierre Far l’a expliqué dans Crawlers, les moteurs de recherche et la splendeur des entreprises d’IA générative, les moteurs de recherche permettaient aux opérateurs de sites Web de contrôler totalement l’exploration et l’indexation de leur contenu. Cependant, l’essor de l’IA générative, construite sur de grands modèles de langage entraînés sur le contenu Web, a changé tout cela. De nombreux créateurs et éditeurs de contenu ne sont pas satisfaits de ce que Google et OpenAI ont fait et craignent que cela n’ait des effets néfastes.
Qu’a fait Google ? Google aurait créé un ensemble de données pour développer Bard en utilisant 1 million d’articles d’éditeurs de presse, sans leur permission ni leur connaissance. On prétend que 75% de ces histoires ont été extraites du Daily tandis que les 25% restants proviennent du site Web de CNN.
Recevez la newsletter quotidienne sur laquelle les spécialistes du marketing de recherche comptent.
Pourquoi le Daily Mail et CNN ? Google aurait utilisé le contenu créé par ces éditeurs, car ils résument tous les deux les articles sous forme de puces en haut de chaque article. On prétend que le moteur de recherche a testé les capacités de Bard en lui présentant ces résumés à puces avec du texte manquant, puis en demandant au chatbot de remplir les blancs en fonction du corps principal de la copie.
Qu’a dit Google ? Google, DMGT et CNN ont tous refusé de commenter les informations.
Plus de problèmes juridiques. La nouvelle de ce procès potentiel survient quelques jours seulement après que huit plaignants aux États-Unis, dont un auteur à succès du Texas, ont accusé Google d’utiliser illégalement du contenu protégé par le droit d’auteur et de voler les informations personnelles de millions d’Américains pour former ses produits d’IA. Les individus ont déposé un projet de recours collectif à San Francisco la semaine dernière, et si Google est reconnu coupable, il pourrait être condamné à verser 5 milliards de dollars d’indemnisation.
Creusez plus profondément. Les robots d’exploration, les moteurs de recherche et la sordide entreprise d’IA générative