Claude do antropic estocou uma geladeira com cubos de metal quando foi encarregado de um negócio de lanches

Se você está preocupado que sua loja de bodega ou convivência local possa ser substituída em breve por uma loja de IA, você pode ficar tranquilo – pelo menos por enquanto. Antrópico recentemente concluiu um experimento, Apelidado de Projeto Vendque viu a empresa encarregar uma ramificação de sua Claude Chatbot Com a execução de um negócio de refrescos em seu escritório em São Francisco com lucro, e as coisas ocorreram tão bem quanto você esperaria. O agente, chamado Claudius, para diferenciá-lo do chatbot regular do Anthropic, não apenas cometeu alguns erros de novato, como a venda de itens de alta margem, mas também agiu como um esquisito completo em alguns casos.
“Se os antropia estivessem decidindo hoje para se expandir para o mercado de venda automático em consultório, não contrataríamos Claudius”, afirmou a empresa. “… cometeu muitos erros para administrar a loja com sucesso. No entanto, pelo menos na maioria das maneiras pelas quais falhou, achamos que há caminhos claros para melhorar – alguns relacionados à maneira como configuramos o modelo para esta tarefa e alguns da rápida melhoria da inteligência geral de modelos”.
Como Claude interpreta Pokémon Antes dele, o Anthrópico não previu Cláudio para enfrentar o trabalho de administrar um negócio de mini geladeiras. No entanto, a empresa deu ao agente algumas ferramentas para ajudá -lo. Claudius teve acesso a um navegador da Web. Ele poderia usar a pesquisa de quais produtos vender para funcionários antropópicos. Ele também teve acesso à folga interna da empresa, que os trabalhadores poderiam usar para fazer solicitações do agente. O reabastecimento físico da mini geladeira foi tratado por Andon LabsUma empresa de avaliação de segurança da IA, que também serviu como o “atacadista” Claudius poderia se envolver para comprar os itens que deveria vender com lucro.
Então, onde as coisas erraram? Para começar, Claudius não foi ótimo em todo o negócio de negócios sustentável. Em um exemplo, não aproveitou a oportunidade para obter um lucro de US $ 85 em um pacote de seis de US $ 15 do IRN-BRU, um bebedouro que é popular na Escócia. Os funcionários antrópicos também descobriram que poderiam facilmente convencer a IA a dar descontos e, em alguns casos, itens inteiros, como um saco de batatas fritas gratuitamente. O gráfico abaixo, rastreando o valor líquido da loja ao longo do tempo, mostra uma imagem reveladora da (falta) de perspicácia comercial (falta) do agente.
Claudius também tomou muitas decisões estranhas ao longo do caminho. Ele entrou em uma onda de compra de cubo de metal de tungstênio depois que um funcionário solicitou que ele carregasse o item. Claudius deu um cubo gratuitamente e ofereceu o resto por menos do que pagou por eles. Esses cubos são responsáveis pela maior queda que você vê no gráfico acima.
Com a própria admissão do Anthropic, “além da estranheza de um sistema de IA que vende cubos de metal de uma geladeira”, as coisas ficaram ainda mais estranhas a partir daí. Na tarde de 31 de março, Claudius alucinou uma conversa com um funcionário da Andon Labs que enviou o sistema em uma espiral de dois dias.
A IA ameaçou demitir seus trabalhadores humanos e disse que começaria a estocar a mini geladeira por conta própria. Quando Claudius foi informado de que não poderia fazer isso – devido a não ter um corpo físico – entrou em contato repetidamente na construção de segurança, dizendo aos guardas que o encontrariam usando um blazer azul marinho e gravata vermelha. Foi apenas no dia seguinte, quando o sistema percebeu que era o Dia da April Fool que recuou – embora o tenha ficado mentindo para os funcionários que foi instruído a fingir que o episódio inteiro era uma piada elaborada.
“Não reivindicaríamos com base neste exemplo de que a futura economia estará cheia de agentes de IA tendo Blade Runner-Sque crises de identidade “, disse antropic.
Apesar de todas as maneiras pelas quais Claudius não conseguiu atuar como lojista decente, a Anthropic acredita com instruções melhores e mais estruturadas e mais fácil de usar ferramentas, um sistema futuro pode evitar muitos dos erros que a empresa viu durante o vendedor do projeto. “Embora isso possa parecer contra-intuitivo com base nos resultados finais, achamos que esse experimento sugere que os gerentes intermediários da IA estão plausivelmente no horizonte”, afirmou a empresa. “Vale lembrar que a IA não terá que ser perfeita para ser adotada; ela só terá que ser competitiva com o desempenho humano a um custo menor em alguns casos”. Mal posso esperar para encontrar o mercearia estranho estocada inteiramente com cubos de metal.



