Escrito por Cristina Criddle, Madhumita Murgia, Daniel Thomas, Anna Nicolaou e Laura Pitel.
Leia a íntegra, em inglês, em: https://www.ft.com/content/79eb89ce-cea2-4f27-9d87-e8e312c8601d
As maiores empresas de tecnologia do mundo estão conversando com os principais meios de comunicação para fechar acordos históricos sobre o uso de conteúdo de notícias para treinar a tecnologia de inteligência artificial.
OpenAI, Google, Microsoft e Adobe se reuniram com executivos de notícias nos últimos meses para discutir questões de direitos autorais em torno de seus produtos de IA, como chatbots de texto e geradores de imagens, de acordo com várias pessoas familiarizadas com as negociações.
Essas pessoas disseram que editores como News Corp, Axel Springer, The New York Times e The Guardian estiveram em negociações com pelo menos uma das empresas de tecnologia.
Os envolvidos nas discussões, que permanecem nos estágios iniciais, acrescentaram que os acordos podem envolver organizações de mídia recebendo uma taxa de assinatura por seu conteúdo, a fim de desenvolver a tecnologia que sustenta chatbots como o ChatGPT da OpenAI e o Bard do Google.
As negociações ocorrem no momento em que os grupos de mídia expressam preocupação com a ameaça à indústria representada pela ascensão da IA, bem como temores sobre o uso de seu conteúdo pela OpenAI e pelo Google sem acordos em vigor. Algumas empresas, como Stability AI e OpenAI, estão enfrentando ações legais de artistas, agências de fotografia e programadores, que alegam violação contratual e de direitos autorais.
Falando em maio na INMA, uma conferência de mídia, o presidente-executivo da News Corp, Robert Thomson, resumiu a indignação da indústria, dizendo que “a PI coletiva [da mídia] está sob ameaça e pela qual devemos argumentar veementemente por compensação”.
Ele acrescentou que a IA foi “projetada para que o leitor nunca visite um site de jornalismo, prejudicando fatalmente esse jornalismo”.
Um acordo definiria o modelo para organizações de notícias em seus negócios com empresas de IA generativa em todo o mundo.
“Os direitos autorais são uma questão crucial para todos os editores”, disse o Financial Times, que também está discutindo o assunto. “Como uma empresa de assinaturas, precisamos proteger o valor de nosso jornalismo e nosso modelo de negócios. Engajar-se em um diálogo construtivo com as empresas relevantes, como nós, é a melhor maneira de conseguir isso.”
Os executivos da indústria de mídia querem evitar os erros do início da era da internet, quando muitos ofereciam artigos online gratuitamente que acabavam prejudicando seus modelos de negócios. Grandes grupos de tecnologia, como Google e Facebook, acessaram essas informações para ajudar a construir negócios multibilionários de publicidade online.
À medida que a popularidade da IA generativa cresceu, também aumentaram as preocupações da indústria de notícias, dada a capacidade da tecnologia de produzir trechos convincentes de texto humanoide.
O Google anunciou recentemente uma função de pesquisa generativa, que retorna uma caixa de informações escritas por IA acima de seu formato tradicional de links da web. Ele foi lançado nos EUA e está se preparando para ser lançado em todo o mundo.
Algumas discussões atualmente envolvem a tentativa de encontrar um modelo de precificação para conteúdo de notícias usado como dados de treinamento para modelos de IA. Um número que foi discutido pelos editores é de US$ 5 milhões a US$ 20 milhões por ano, de acordo com um executivo do setor.
Mathias Döpfner, executivo-chefe da Axel Springer, dona do Politico, que conheceu as principais empresas de IA Google, Microsoft e OpenAI, disse que sua primeira escolha seria criar um modelo “quantitativo” semelhante ao desenvolvido pela indústria da música que vê estações de rádio, casas noturnas e serviços de streaming pagam gravadoras cada vez que uma faixa é tocada. Isso exigiria primeiro que as empresas de IA divulgassem seu uso de conteúdo de mídia – algo que atualmente não estão fazendo.
Döpfner, cuja empresa de mídia com sede em Berlim também é dona do tabloide alemão Bild e do jornal Die Welt, disse que um acordo anual para uso ilimitado do conteúdo de uma empresa de mídia seria uma "segunda melhor opção", porque esse modelo seria mais difícil para pequenas empresas regionais ou agências de notícias locais para aproveitar.
“Precisamos de uma solução para todo o setor”, disse Döpfner. “Temos que trabalhar juntos nisso.”
O Google tem liderado as negociações com os meios de comunicação do Reino Unido, reunindo-se com o Guardian e o NewsUK. A empresa de propriedade da Alphabet tem parcerias de longa data com muitas organizações de mídia para usar dados de conteúdo, como artigos, para garantir que seja otimizado para aparecer em seu mecanismo de pesquisa. A empresa usou os dados para treinar seus grandes modelos de linguagem, de acordo com duas pessoas familiarizadas com o arranjo.
“O Google colocou um acordo de licenciamento sobre a mesa”, disse um executivo de um grupo jornalístico. “Eles aceitaram o princípio de que precisa haver pagamento . . . mas não chegamos ao ponto de falar de zeros. Eles reconheceram que há uma conversa sobre dinheiro que precisamos ter nos próximos meses, que é o primeiro passo”.
Depois que este artigo foi publicado pela primeira vez, o Google disse que o comentário do executivo do jornal sobre um possível acordo de licenciamento “não é preciso. É muito cedo e continuamos a trabalhar com o ecossistema, incluindo os editores de notícias, para obter suas opiniões”.
O Google não comenta discussões financeiras. No entanto, a empresa de busca disse que estava tendo “conversas contínuas” com veículos de notícias, grandes e pequenos, nos EUA, Reino Unido e Europa, e já treinou sua IA em “informações publicamente disponíveis”, que podem incluir sites com acesso pago.
A gigante do Vale do Silício acrescentou outra opção que estava considerando era como dar aos editores mais “escolha e controle” sobre se seu conteúdo se tornaria parte de um conjunto de dados de treinamento para IA, semelhante a como permite que os sites desativem seu conteúdo sendo usado em procurar.
Desde o lançamento do ChatGPT em novembro, o chefe da OpenAI, Sam Altman, se reuniu com a News Corp e o The New York Times, de acordo com pessoas familiarizadas com as discussões. A empresa reconheceu que manteve conversas com editoras e associações de publicação em todo o mundo sobre como eles poderiam trabalhar juntos.
Desenvolver um modelo financeiro para o uso de conteúdo de notícias para treinar IA será extremamente difícil, de acordo com líderes editoriais. Executivos seniores de uma grande editora dos Estados Unidos disseram que a indústria de notícias estava trabalhando retroativamente porque as empresas de tecnologia lançaram esses produtos sem consultá-los.
“Não houve discussão e agora temos que tentar receber depois que aconteceu”, disse o executivo. “A forma como eles lançaram esses produtos, o sigilo total, o fato de não haver transparência, nenhuma comunicação antes de acontecer, há motivos para ser bastante pessimista.”
A analista de mídia Claire Enders disse que as negociações estão "muito complicadas no momento", acrescentando que, como cada organização adota sua própria abordagem, um único acordo comercial para grupos de mídia é improvável e pode ser contraproducente.
Enders acrescentou: “Os chatbots não serão ferramentas confiáveis se forem literalmente treinados principalmente nos esgotos da misoginia e do racismo que compõem a maior parte do texto aberto e acessível”.
As empresas de tecnologia que estão construindo a IA estão empenhadas em focar em sua utilidade para gerar eficiência nas redações e aprimorar o jornalismo e estão felizes em pagar milhões para preservar relacionamentos de longa data com a indústria, disseram pessoas envolvidas nas negociações.
Brad Smith, vice-presidente da Microsoft, disse que estava “nos primeiros dias de conversas com mídia e editores, e parte disso é apenas ajudar todos a aprender como os modelos são treinados”.
“Acho que nossa maior oportunidade é realmente trabalhar primeiro com os editores para pensar em como eles podem usar a IA para gerar mais receita”, acrescentou.
O executivo-chefe da Adobe, Shantanu Narayen, disse que se encontrou com a Disney, a Sky e o Daily Telegraph do Reino Unido nas últimas semanas para discutir como poderia desenvolver modelos personalizados para as empresas usarem sua IA generativa para imagens.
O modelo da Adobe é treinado em imagens em sua própria biblioteca de imagens de estoque, bem como em conteúdo de domínio público e licenciado abertamente onde os direitos autorais expiraram. Narayen disse que acordos sob medida e preços dependeriam da empresa, mas os clientes poderiam adicionar seu conteúdo proprietário à ferramenta.
Döpfner, da Axel Springer, expressou otimismo de que os acordos seriam alcançados porque tanto as organizações de mídia quanto os formuladores de políticas compreenderam a escala do desafio mais rapidamente do que durante a última grande onda de disrupção tecnológica.
As empresas de IA “sabem que a regulamentação está chegando e têm medo dela”, disse ele, acrescentando:
“É do interesse de todas as partes encontrar uma solução para um ecossistema saudável. Se não houver incentivo para criar propriedade intelectual, não há nada para rastejar. E a inteligência artificial se tornará estupidez artificial.”
Nossa!