Negócios

Ai Giants vence grande na luta de direitos autorais. Aqui está o que acontece agora.

Big Tech conquistou grandes vitórias recentemente no debate sobre direitos autorais e inteligência artificial.

Está se aproximando do ponto em que qualquer coisa publicada on -line é um jogo justo a ser raspado, copiado e canalizado para Modelos de IA e chatbots Em última análise, isso competirá contra os criadores do material original.

Este é o momento GoogleAssim, MetaOpenai, Microsoft, AntrópicoE outros gigantes da era generativa da IA ​​estão esperando e esperando. Eles estão ficando muito mais próximos de ter certeza legal de que nunca terão que pagar pelos dados essenciais para seus produtos de Blockbuster AI.

O que isso significa para o futuro da Web e os negócios da criação de conteúdo? Leia (ou apenas aguarde uma hora para um resumo da IA ​​do seu chatbot favorito).

Aqui estão as grandes notícias: um juiz decidiu recentemente que o uso de milhões de livros da Anthrópica para treinar seus modelos de IA se qualifica como uso justoUma doutrina legal que permite o uso de conteúdo protegido por direitos autorais gratuitamente sem a permissão do proprietário em determinadas circunstâncias. Meta também ganhou um grande caso legal semelhante.

“Boas notícias para todos os desenvolvedores da Gen AI”, escreveu Adam Eisgrau, diretor sênior da Câmara de Progresso, um grupo de lobby financiado por gigantes da tecnologia, incluindo Google, Amazon, Apple e Nvidia. A decisão antrópica será “provavelmente aplicável em muitos casos”, acrescentou.

O valor de mergulho da palavra escrita

Um banqueiro de investimento com quem falei recentemente resumiu o impacto do uso justo na era da IA ​​generativa: as pessoas pagarão muito pouco pela palavra escrita nos dias de hoje.

Ele está certo. Quando o conteúdo protegido por direitos autorais pode ser retirado de graça e regurgitado de uma forma ligeiramente diferente em milissegundos, o valor do texto online – mesmo exclusivo “conteúdo de fronteira” – mergulham.

O escritório de direitos autorais dos EUA é uma voz solitária do outro lado desta discussão agora. Concluiu recentemente que o uso de conteúdo protegido por direitos autorais para a IA viola o uso justo porque a IA generativa está inundando a web com montanhas de palavras, imagens e vídeos adicionais. Esse suprimento extra prejudica o mercado para o conteúdo original. Os juízes parecem estar ignorando isso até agora.

Um dos meus ex -editores costumava me dar esse conselho quando eu queria escrever sobre questões como esta: ninguém se importa tanto com a mídia. Alguns podem dizer que fazem em jantares, mas realmente não. Hoje em dia, essa indústria é minúscula em comparação com o resto da economia. Vá escrever sobre coisas maiores, diria este editor.

Um exemplo: a Meta detém cerca de US $ 80 bilhões em dinheiro e valores mobiliários comercializáveis. Isso é quase 10 vezes o total Valor do New York Times. A Meta gastará até US $ 72 bilhões em Capex este ano, principalmente para infraestrutura de data center de IA. Mark Zuckerberg também está oferecendo pacotes de remuneração de US $ 100 milhões para tentar contratar especialistas em IA.

E, no entanto, a Meta não pagará um centavo pelo conteúdo do treinamento do modelo de IA e não pagará quando usa esse conteúdo protegido por direitos autorais em saídas generativas de IA. O mesmo para o Google e a maioria dos outros gigantes da IA.

Por que as máquinas não podem fazer o mesmo?

Logo depois Chatgpt Saiu em 2022, e eu percebi que os modelos de IA foram treinados em montanhas de material protegido por direitos autorais sem pagamento ou permissão, eu estava visitando um velho amigo em uma grande empresa de tecnologia. Eu trouxe a questão e essa pessoa respondeu com este argumento: os humanos aprendem ao consumir conteúdo protegido por direitos autorais na web, em livros e em outras fontes. Eles internalizam essas informações, processam e geralmente produzem novas idéias e conteúdos baseados nas coisas originais que leram no passado. Por que as máquinas não podem fazer o mesmo?

Isso foi entregue com tanta velocidade e calma. Não houve uma pausa para refletir ou pensar. Era como se essa grande empresa de tecnologia estivesse se preparando para esse momento há anos – o momento em que todos perceberam que seu trabalho está sendo usado para modelos de IA e chatbots que finalmente competem contra eles.

O trabalho de pesquisa do Google que lançou o boom generativo de IA também tem conotações disso. Atenção é tudo que você precisa apresentou o “transformador” ao mundo. Este é um tipo especial de modelo de IA que ingere montanhas de conteúdo e dados para treinar modelos generativos poderosos.

Por que os Googles que escreveram este artigo criaram o nome “Transformer”? Não sei, mas a palavra aborda a pergunta de uso justo de frente. Um dos testes para se você está violando a lei de direitos autorais é se “transformou” o trabalho original o suficiente para evitar infringir. O Google criou esse nome de transformador em 2017, cinco anos antes do ChatGPT trouxer essa nova tecnologia – e essa pergunta de direitos autorais – para o mundo.

O blogueiro de tecnologia Ben Thompson tem uma visão de cabeça fria e bem informada de tudo isso. Ele apoia fortemente a decisão do juiz no caso antrópico, concordando que o treinamento da IA ​​com livros para se qualificar gratuitamente como uso justo, chamando -o de “criticamente importante”. O aprendizado da IA, como o aprendizado humano, é transformador e não infringe direitos autorais quando as saídas não replicam o material original. Com a lei de direitos autorais, sempre há uma troca destinada a incentivar a criação sem sufocar a inovação, ele explicou, e existe um uso justo para equilibrar esses interesses.

Um aviso do túmulo

Então, o que fluirá do fato de que basicamente qualquer conteúdo protegido por direitos autorais on -line agora é um jogo justo para as empresas de IA usarem gratuitamente?

Aqui está uma previsão. Isso vem do túmulo, mas também do Deep dentro do Openai, a empresa por trás do ChatGPT.

Suchir Balaji fez parte de uma equipe do OpenAI que coletou dados da Internet para treinamento de modelos de IA. Ele se juntou à startup com grandes esperanças de como a IA poderia ajudar a sociedade, mas ficou desiludido. Em novembro, Balaji foi encontrado morto em seu apartamento em São Francisco. O médico médico legista da cidade determinou que a morte era suicídio.

Antes de morrer, Balaji escreveu um ensaio em seu site pessoal, criticando as empresas de IA por usar dados públicos sem compensação e questionou suas reivindicações de “uso justo”. Ele argumentou que essa tendência ameaça a sustentabilidade da Internet, drenando o valor das fontes de conteúdo originais.

Balaji citou um estudo que encontrou tráfego de perguntas e respostas de codificação Pilha estouro O tráfego caiu cerca de 12% após o lançamento do ChatGPT. Os desenvolvedores que já visitaram o site para fazer ou responder a perguntas agora estão se voltando para a IA, reduzindo novas inscrições e o envolvimento da comunidade.

Isso está minando a web “Grande pechincha“O Google e outros gigantes da tecnologia costumavam rastrear sites e coletar os dados sem pagar. Mas, em troca, eles enviaram tráfego e visitantes aos criadores desses sites para que pudessem ganhar dinheiro por meio de publicidade, assinaturas, vendas de produtos e outros métodos. Atualmente, a Big Tech Bots Rast para gratuitamente e envia muito menos tráfego para os criadores dos criadores de conteúdo original.

O CloudFlare, que administra uma das maiores redes da web, lançou uma solução em potencial na terça -feira. A empresa lançou um serviço “Pay Per Crawl” que ajuda os criadores de conteúdo a exigir o pagamento das empresas de IA para acessar e usar seu conteúdo.

O Cloudflare bloqueará os rastreadores da AI por padrão para novos clientes, fazendo o acesso ao conteúdo aceita em vez de optar por não. Os principais editores, incluindo Ziff Davis, The Atlantic e Time, assinaram. A esperança é que isso forçará as grandes empresas de tecnologia a pagarem para eliminar novos conteúdos digitais para o desenvolvimento da IA. Uma startup chamada Tollbit está tentando uma coisa semelhante.

Não sei se esses esforços serão bem -sucedidos. O ponto principal é que os humanos devem aprender com informações protegidas por direitos autorais gratuitamente, e as máquinas provavelmente também deveriam. Reverter isso pode criar ainda mais problemas. Como jornalista, eu seria capaz de ler um boletim de Ben Thompson e incorporar uma de suas idéias em um artigo futuro? Talvez não. Thompson seria proibido de ler Scoops por Business Insider e analisar essas novas informações para um de seus boletins incríveis? Isso é uma boa ideia? Provavelmente não.

Algumas previsões

Um resultado de tudo isso pode ser que, no futuro, informações verdadeiramente valiosas possam não ser mais colocadas na web. Aqui estão três exemplos que sugerem que isso já pode estar acontecendo:

  • Ben Thompson distribui seu conteúdo por meio de boletins pagos, em vez de confiar na distribuição gratuita da web.
  • A Bloomberg dirige provavelmente a maior redação do mundo ocidental. Por que? Uma razão é que seu braço de notícias está enterrado dentro de um negócio de dados financeiros massivamente lucrativo. Outra é que o conteúdo de notícias mais valioso da Bloomberg é publicado no terminal, uma ferramenta de negociação usada por investidores ricos. Este sistema possui sua própria rede – ele não depende muito da web. A Bloomberg apenas publica seu melhor conteúdo de notícias na web após um longo atraso – e muito de seu conteúdo permanece no terminal e nunca entra na web. Surpresa: tem uma redação bem financiada.
  • Finalmente, o conteúdo valioso pode ser compartilhado no futuro apenas por meio de reuniões e relacionamentos pessoais, ou mesmo através de publicações em papel novamente. Qualquer coisa em que os dados estejam fora do alcance imediato da grande tecnologia AI rastreando bots.

Algumas semanas atrás, a Microsoft iniciou uma nova publicação chamada Signal que explora o futuro da IA, da sociedade e dos negócios.

É publicado apenas no papel.



Source link

Artigos Relacionados

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Botão Voltar ao Topo