Et de ce que je comprends de la loi utiliser des oeuvres sous droits d’auteur sans l’accord dudit auteur pour entrainer des modèles est censé être interdit.
Eh bien non, probablement pas. Et c’est ce qui fait gueuler les auteurs. Et c’est pas 100% sur, c’est le genre de truc qui va être jugé pendant 10 ans et dont le jugement va plus dépendre du lobbyisme et de la force de frappe des équipes d’avocats que de la logique ou de la moralité.
La question à 12 trillions c’est de savoir si un modèle entrainé sur un ensemble d’oeuvres est une violation équivalente à une oeuvre dérivée. Sachant qu’un tribunal a déjà établi qu’un algo ne produit pas d’oeuvres. La logique voudrait que ça implique que les modèles ne sont pas soumis au copyright. Démerde toi avec ça.
La réalité est que la loi est complètement à l’ouest sur la question.
C’est plutôt “qu’est-ce que les concepteurs et les utilisateurs de l’algo ont droit de faire?”.
Ben ça tombe bien: j’ai le droit de regarder une oeuvre sous copyright (que j’ai achetée par exemple en DVD). Du coup ça me donne le droit de l’utiliser pour entrainer un modèle ou pas?
C’est là toute la différence. Sans aller dans les débats sur le plagiat, pourquoi je n’ai pas le droit de prendre un film sur Pirate Bay alors que Facebook as le droit de prendre 500 TB sur Libgen de la meme manière ?
Facebook est en procès justement au sujet de libgen.
En fait, les ayant-droits, en vrai, s’en foutent un peu de cette question, leur enjeu est plus gros. S’ils forcent Facebook à payer un exemplaire de tous les livres et DVDs qu’ils ont fait ingérer à leurs modèles, ça augmentera leur budget IA de 10%, les ayant-droits gagneront quelques millions mais vendre un exemplaire en plus de leurs offres c’est pas ça qu’ils visent, c’est marginal pour eux. Ce qu’ils veulent c’est négocier une nouvelle catégorie de droits spécialement pour entraîner les modèles dessus. Un peu comme ils ont réussi à faire en sorte que quelqu’un qui achète un DVD n’a pas le droit d’organiser une projection.
Eh bien non, probablement pas. Et c’est ce qui fait gueuler les auteurs. Et c’est pas 100% sur, c’est le genre de truc qui va être jugé pendant 10 ans et dont le jugement va plus dépendre du lobbyisme et de la force de frappe des équipes d’avocats que de la logique ou de la moralité.
La question à 12 trillions c’est de savoir si un modèle entrainé sur un ensemble d’oeuvres est une violation équivalente à une oeuvre dérivée. Sachant qu’un tribunal a déjà établi qu’un algo ne produit pas d’oeuvres. La logique voudrait que ça implique que les modèles ne sont pas soumis au copyright. Démerde toi avec ça.
La réalité est que la loi est complètement à l’ouest sur la question.
Ben ça tombe bien: j’ai le droit de regarder une oeuvre sous copyright (que j’ai achetée par exemple en DVD). Du coup ça me donne le droit de l’utiliser pour entrainer un modèle ou pas?
C’est là toute la différence. Sans aller dans les débats sur le plagiat, pourquoi je n’ai pas le droit de prendre un film sur Pirate Bay alors que Facebook as le droit de prendre 500 TB sur Libgen de la meme manière ?
Deux niveaux de réponse à ça:
Facebook est en procès justement au sujet de libgen.
En fait, les ayant-droits, en vrai, s’en foutent un peu de cette question, leur enjeu est plus gros. S’ils forcent Facebook à payer un exemplaire de tous les livres et DVDs qu’ils ont fait ingérer à leurs modèles, ça augmentera leur budget IA de 10%, les ayant-droits gagneront quelques millions mais vendre un exemplaire en plus de leurs offres c’est pas ça qu’ils visent, c’est marginal pour eux. Ce qu’ils veulent c’est négocier une nouvelle catégorie de droits spécialement pour entraîner les modèles dessus. Un peu comme ils ont réussi à faire en sorte que quelqu’un qui achète un DVD n’a pas le droit d’organiser une projection.