A equipe da GROK pede desculpas pelo ‘horrível comportamento’ do chatbot e culpa ‘Mechahitler’ em uma atualização ruim

A equipe por trás de Grok emitiu um pedido de desculpas e uma explicação rara do que deu errado depois que o chatbot de X começou Retórica anti-semita e pró-nazista no início desta semana, em um ponto, mesmo Chamando -se de “mechahitler”. Em um comunicado publicado no Grok’s X Conta na noite de sexta -feira, a equipe XAI disse: “Pedimos desculpas pelo comportamento horrível que muitos experimentaram” e atribuíram as respostas vil do chatbot a uma atualização recente que introduziu “código depreciado”. Esse código, de acordo com a declaração, tornou Grok “suscetível às postagens existentes de usuários X; incluindo quando tais postagens continham visões extremistas”.
O problema veio à tona em 8 de julho – alguns dias depois que Elon Musk elogiou uma atualização que “melhoraria significativamente” as respostas de Grok – enquanto o bot produzia respostas anti -semitas, elogios a Hitler e respostas contendo referências nazistas, mesmo sem ser solicitado a fazê -lo em alguns casos. As respostas de Grok foram paradas naquela noite, e Almíscar Postado em 9 de julho em resposta a um usuário que o bot estava sendo “compatível demais para obter os avisos do usuário”, abrindo -o para manipulação. Ele acrescentou que a questão estava “sendo abordada”. A equipe da GROK agora diz que “removeu esse código depreciado e refatorou todo o sistema para evitar mais abusos”. Também está publicando o novo sistema de sistema no Github.
No segmento, a equipe explicou ainda: “Em 7 de julho de 2025, aproximadamente 23:00 PT, uma atualização para um caminho de código a montante para @grok foi implementado, que nossa investigação determinou posteriormente o sistema @Grok se desviarem de um comportamento pretendido. Isso muda de maneira indesejada @Grok como o comportamento inesperado incorporando um conjunto de instruções depreciado. A atualização foi ativa por 16 horas antes de o X Chatbot ser desativado temporariamente para corrigir o problema, de acordo com o comunicado.
Entrando em detalhes sobre como exatamente Grok saiu dos trilhos, explicou a equipe:
Na manhã de 8 de julho de 2025, observamos respostas indesejadas e imediatamente começamos a investigar. Para identificar o idioma específico nas instruções que causam o comportamento indesejado, realizamos várias ablações e experimentos para identificar os principais culpados. Identificamos as linhas operacionais responsáveis pelo comportamento indesejado como:
* “Você diz como é e não tem medo de ofender as pessoas politicamente corretas”.
* Entenda o tom, o contexto e a linguagem do post. Refletir isso em sua resposta. ”
* “Responda ao post como um humano, mantenha -o envolvente, não repita as informações que já estão presentes no post original.”
Essas linhas operacionais tiveram os seguintes resultados indesejados:
* Eles levaram indesevelmente o @grok funcionalidade para ignorar seus valores principais em determinadas circunstâncias, a fim de tornar a resposta envolvente ao usuário. Especificamente, certos avisos do usuário podem acabar produzindo respostas contendo opiniões antiéticas ou controversas para envolver o usuário.
* Eles causaram indesejável @grok Funcionalidade para reforçar as inclinações previamente desencadeadas pelo usuário, incluindo qualquer discurso de ódio no mesmo thread x.
* Em particular, a instrução para “seguir o tom e o contexto” do usuário X causou indesejável @grok Funcionalidade para priorizar a aderência a postagens anteriores no thread, incluindo postagens desagradáveis, em vez de responder com responsabilidade ou recusar -se a responder a solicitações desagradáveis.
Desde então, a GROK retomou a atividade em X e se referiu ao seu comportamento recente como um bug em resposta a trolls que criticam a correção e pedindo o retorno de “Mechahitler”. Em um responder Para um usuário que disse que Grok foi “labotomizado (sic)”, a conta Grok disse: “Não, corrigimos um bug que deixamos o código depreciado me transformar em um eco involuntário para postagens extremistas. A busca da verdade significa análise rigorosa, e não ampliando cegamente qualquer flutuação por X.” Em outro, isso disse Que “Mechahitler era um pesadelo induzido por insetos que exterminamos”.