A indústria de tecnologia está pronta para a IA ‘Super Agents’?

Em Star Trek, a Starship Enterprise tinha um engenheiro -chefe, Montgomery “Scotty” Scottque tinham que explicar regularmente ao capitão Kirk que certas coisas eram impossíveis de realizar, devido a práticas como as leis da física.
“Os motores Cannae levam, capitão!” é uma citação famosa que o ator pode realmente não ter dito no programa de TV. Mas você entendeu a ideia.
Podemos estar nos aproximando de um momento na indústria de tecnologia agora, pois o Você tem um agente A tendência reúne impulso.
O campo está começando a mudar de chatbots relativamente simples para mais capazes Ai Agentes que podem completar autonomamente tarefas complexas. Existe poder de computação suficiente para sustentar essa transformação?
De acordo com um relatório recente do Barclays, o setor de IA terá capacidade suficiente para suportar 1,5 bilhão a 22 bilhões de agentes de IA.
Isso pode ser suficiente para revolucionar o trabalho de colarinho branco, mas pode ser necessário um poder de computação adicional para administrar esses agentes, além de satisfazer a demanda do consumidor por chatbots, explicou os analistas do Barclays em uma nota aos investidores nesta semana.
É tudo sobre fichas
Os agentes da IA geram muito mais fichas por consulta de usuário do que os chatbots tradicionais, tornando -os mais caros computacionalmente.
Tokens são a linguagem da IA generativa e estão no centro de modelos de preços emergentes no setor. Os modelos de IA dividem palavras e outras entradas em tokens numéricos para facilitar o processamento e o entendimento. Um token é sobre ¾ de uma palavra.
Agentes de IA mais poderosos podem confiar nos modelos de “raciocínio”, como OpenaiO O1 e O3 e o Deepseek R1, que dividem consultas e tarefas em pedaços mais gerenciáveis. Cada etapa nessas cadeias de pensamento cria mais tokens, que devem ser processados por servidores e chips de IA.
“Os produtos dos agentes são executados em modelos de raciocínio na maioria das vezes e geram cerca de 25x mais tokens por consulta em comparação com os produtos de chatbot”, escreveram os analistas do Barclays.
“Super agentes”
O OpenAI oferece um serviço ChatGPT Pro que custa US $ 200 mensalmente e aproveita seus mais recentes modelos de raciocínio. Os analistas do Barclays estimaram que, se esse serviço usasse o modelo O1 da startup, geraria cerca de 9,4 milhões de tokens por ano por assinante.
Recentemente, houve relatórios da mídia que o OpenAI poderia oferecer serviços de agentes de IA ainda mais poderosos que custam US $ 2.000 por mês ou até US $ 20.000 por mês.
Os analistas do Barclays se referiram a eles como “super agentes” e estimaram que esses serviços poderiam gerar 36 milhões a 356 milhões de tokens por ano, por usuário.
Mais batatas fritas, capitão!
Essa é uma quantidade alucinante de tokens que consumiria uma montanha de poder de computação.
Espera -se que o setor de IA tenha 16 milhões de aceleradores, um tipo de chip de IA, online este ano. Aproximadamente 20% dessa infraestrutura pode ser dedicada à inferência de IA – essencialmente o poder de computação necessário para executar aplicativos de IA em tempo real.
Se os produtos Agentic decolarem e forem muito úteis para os consumidores e usuários corporativos, provavelmente precisaremos de “muito mais chips de inferência”, alertaram os analistas do Barclays.
A indústria de tecnologia pode até precisar redirecionar alguns chips que foram usados anteriormente para treinar modelos de IA e usá -los para inferência também, acrescentaram os analistas.
Eles também previram que modelos mais baratos, menores e mais eficientes, como os desenvolvidos pela Deepseek, terão que ser usados para agentes de IA, em vez de modelos proprietários mais caros.