Een rituele dans van The New York Times met Open AI en Microsoft

The New York Times wants OpenAI and Microsoft to pay for training dataThe New York Times heeft een rechtszaak aangespannen tegen OpenAI en Microsoft:

The New York Times is suing OpenAI and its close collaborator (and investor), Microsoft, for allegedly violating copyright law by training generative AI models on Times’ content.

Content is king en er is natuurlijk niet zoiets als gratis content. En al helemaal niet als het content van een uitgever betreft. Je weet wel, copyright en zo. En de NYT gaat er met gestrekt been in:

The Times contends that millions of its articles were used to train AI models, including those underpinning OpenAI’s ultra-popular ChatGPT and Microsoft’s Copilot, without its consent. The Times is calling for OpenAI and Microsoft to “destroy” models and training data containing the offending material and to be held responsible for “billions of dollars in statutory and actual damages” related to the “unlawful copying and use of The Times’s uniquely valuable works.”

Dat gaat nog een gezellige rechtszaak worden… Overigens denk ik niet dat de soep zo heet gegeten gaat worden, de NYT lijkt het vooral als een pressiemiddel in te zetten, dit is tenslotte wat de reactie van OpenAI is:

In an emailed statement, an OpenAI spokesperson said: “We respect the rights of content creators and owners and are committed to working with them to ensure they benefit from AI technology and new revenue models. Our ongoing conversations with The New York Times have been productive and moving forward constructively, so we are surprised and disappointed with this development. We’re hopeful that we will find a mutually beneficial way to work together, as we are doing with many other publishers.”

Of de NYT vindt dat het niet slecht genoeg gaat, of de vergoeding is te laag, of NYT wil laten zien dat ze niet verslagen is. Hoe dan ook, deze move gat de onderhandelingen niet soepeler maken.

Wat bovenstaande met recruitment te maken heeft? Alles. Want AI-modellen zijn voor wat betreft trainingsdata volledig afhankelijk van data die in het al dan niet publieke domein rondzweeft. AI-modellen moeten op grote hoeveelheden cv’s en vacatures worden getraind om op basis daarvan bijvoorbeeld matching aan te kunnen bieden. Maar hebben de makers van dit soort AI modellen hierover overeenstemming met uitgevers (zoals werkgevers (werken bij sites), uitzenders (uitzendsites) en vacaturesites en vacature-aggregatoren? En in het geval van cv’s met de individuen van wie deze cv’s zijn. In de meeste, zoniet alle, gevallen is het antwoord hierop een overweldigend: NEE. En denken de makers dat dit zo zal blijven en zij kunnen cashen met het werk van anderen? Misschien hopen ze het, maar ook hier is het antwoord een overweldigend: NEE.

De combinatie van de AVG en de AI Act is een tweesnijdend zwaard waarmee de huidige praktijken in overzichtelijke moten gesneden gaan worden. En de rechtszaken die momenteel in de VS lopen gaan hierbij ongetwijfeld behulpzaam zijn. Alle reden dus om deze ontwikkelingen op de voet te volgen.

Geef een reactie