OpenAI a quoi bon
Pourquoi OpenAI collabore-t-elle avec ces entreprises médiatiques ?
Il est évident qu'en faisant cela, elle peut obtenir des données d'entraînement autorisées pour construire de puissants nouveaux modèles d'IA dont les capacités d'écriture ne seront pas inférieures à celles des journalistes du Wall Street Journal.
Le but d'OpenAI est d'améliorer les performances de ChatGPT et, à terme, de commercialiser ces outils pour les vendre à ces médias ou à d'autres dans le domaine.
Pour les agences de médias numériques comme Vox qui produisent du contenu vidéo pour YouTube et des documentaires et séries sous licence pour Netflix, OpenAI peut utiliser leurs œuvres pour entraîner le modèle d'IA générative vidéo Sora.
Pourquoi OpenAI est-elle prête à payer ?
Auparavant, pour entraîner ses grands modèles, OpenAI n'hésitait pas à extraire presque tous les messages publics sur Internet.
Cette action a suscité une forte opposition de la part des artistes, des créatifs et même des entreprises médiatiques comme le New York Times.
Cela a conduit OpenAI à abandonner sa position de "collecte légale de données publiques pour réaliser des changements", et ils ont été mis au défi sur l'éthique des données.
Par conséquent, OpenAI a lancé l'année dernière un code que les propriétaires de sites Web peuvent ajouter à leur propre site pour l'empêcher d'être exploré à des fins d'entraînement.
OpenAI a également récemment annoncé la création d'un nouveau produit - le Media Manager - que les artistes, créateurs et éditeurs peuvent utiliser pour marquer les œuvres qu'ils ont l'intention de publier ou ont déjà publiées en ligne, indiquant qu'ils ne souhaitent pas voir ces œuvres extraites par des outils d'IA et utilisées pour entraîner des modèles.
Cependant, cela ne sera pas réalisé avant 2025, et les créateurs de contenu ne seront pas nécessairement d'accord.
Donc, pour OpenAI qui est en plein essor, payer les éditeurs pour qu'ils se taisent et acceptent l'extraction et l'entraînement par l'IA n'est pas une mauvaise affaire.
D'une part, cela lui permet de sortir de l'impasse et d'obtenir les données dont elle a besoin, et d'autre part, cela montre aux investisseurs et aux utilisateurs qu'elle respecte les lois sur le droit d'auteur et les normes éthiques.
Et les propriétaires de contenu n'ont pas obtenu de véritable compensation dans ce processus.
Les éditeurs de médias peuvent-ils vraiment en bénéficier
Sans exception, les éditeurs ont annoncé des accords de licence de contenu avec OpenAI, et ils ont effectivement obtenu quelque chose, dont le plus important n'est pas l'argent, mais la "position".
Plus précisément, presque tous les éditeurs ont indiqué que ChatGPT affichera leurs articles dans ses résultats.
Ainsi, si un utilisateur saisit "résumer les dernières nouvelles technologiques", il pourrait voir des résumés d'articles de Business Insider, The Verge (appartenant à Vox), du Wall Street Journal ou de toute autre publication incluse dans l'accord, ainsi que des liens vers les sources.
Ce n'est qu'une possibilité envisagée, les accords ou documents techniques exacts n'ont pas été partagés publiquement.
De plus, on ne sait pas encore comment ChatGPT utilisera le contenu des médias. S'il adopte un style "robotique" pour résumer le texte original, cela pourrait effacer l'art créé par l'auteur original.
De plus, comme les utilisateurs ont déjà lu les nouvelles résumées sur ChatGPT, ils ne choisiront pas de visiter le site Web qui a publié l'article original, ce qui fera perdre du trafic à ces publications. Pour les publications, cela signifie perdre des utilisateurs payants ou de la valeur commerciale.
C'est pourquoi des professionnels chevronnés comme Jessica Lessin, fondatrice de The Information, Hamilton Nolan, ancien journaliste de Gawker, et Edward Onswego, Jr., ancien journaliste de Vice, ont tous souligné que dans l'accord avec OpenAI, les éditeurs assument des conséquences brutales.
Après tout, si les lecteurs recherchent de l'information pure et que ChatGPT leur fournit de l'information pure, à quoi bon visiter les médias d'origine, sans parler de payer un abonnement.
Les utilisateurs choisiront de devenir ChatGPT Plus, payant 20 dollars par mois à OpenAI, plutôt que de fréquenter les médias qui produisent le contenu.
L'histoire se répète
Ce qui se passe maintenant rappelle inévitablement le lancement de Google News en 2006, lorsque le nombre d'utilisateurs et la popularité des plateformes sociales comme Facebook et Twitter ont commencé à croître et sont rapidement devenues les principales sources de trafic de référence pour les éditeurs.
Cette situation a essentiellement perduré au cours des 15-20 dernières années. Cependant, en raison de la gestion et des ajustements constants des algorithmes par les géants technologiques derrière ces plateformes, le trafic a fluctué.
Lorsqu'une plateforme technologique change soudainement son algorithme, entraînant la disparition du public, les sites Web qui ont investi trop d'énergie dans une plateforme ou une stratégie particulière se retrouvent rapidement désorientés.
Bien sûr, les changements continuent de se produire, et on peut dire que le plus grand changement se présente maintenant aux plateformes technologiques et aux éditeurs : l'IA générative.
Alors que Google place ses résumés d'IA erronés en haut de ses pages de résultats de recherche et repousse les liens directs vers les éditeurs et les articles d'actualité, de plus en plus de personnes pourraient choisir d'adopter ChatGPT comme source d'information ou agrégateur.
Les dirigeants des éditeurs d'actualités et des sociétés mères se sentent peut-être acculés : le jeu change à nouveau, l'IA arrive et remplace les moyens traditionnels d'obtenir des nouvelles en ligne. Alors pourquoi ne pas collaborer avec les perturbateurs et essayer de surfer sur la vague ?
Cependant, comme le montre la brève leçon d'histoire ci-dessus, les entreprises technologiques changent toujours de stratégie et d'outils de manière aléatoire et imprévisible, ce qui frustre les entreprises médiatiques.
Bien qu'OpenAI entretienne actuellement de bonnes relations avec les éditeurs