Deepseek melhora seu modelo de inteligência artificial com a Universidade de Tsinghua

A ‘startup’ China de Deepseek Artificial Intelligence introduziu uma nova maneira de melhorar a capacidade de raciocínio de grandes modelos linguísticos (LLM) para oferecer resultados melhores e mais rápidos na frente de seus concorrentes.
Deepseek causou um frenesi em janeiro, quando apareceu em cena com R1, um modelo de inteligência artificial (AI) com um chatbot que, segundo a empresa, era mais barato e funcionou e também SU principal rival, Chatgpt de Openai.
Em colaboração com pesquisadores da Universidade Chinesa de Tsinghua, o Depseek afirma em seu Último artigo publicado na última sexta -feira que desenvolveu uma técnica para melhorar os próprios modelos de IA. A tecnologia subjacente treina a IA para desenvolver suas próprias regras para julgar o conteúdo e depois usá -las para melhorar suas respostas.
Normalmente, para melhorar a IA, é necessário aumentar o tamanho dos modelos durante o treinamento, o que requer muito esforço humano e poder de cálculo. Em vez de, DePseek criou um sistema com um ‘juiz’ incorporado que avalia as respostas da IA em tempo real. Quando uma pergunta é feita, o juiz compara a resposta esperada da IA com as regras básicas da IA e com o que deve ser uma boa resposta. Se a resposta for semelhante, a IA recebe uma resposta positiva Isso ajuda você a melhorar.
Deepseek chama esse sistema de melhoria automática Deepseek-GRM. Os pesquisadores afirmam que isso ajudará os modelos a funcionar melhor do que os de concorrentes como Google Gemini, Llama de Meta e GPT-4o do Openai. A Depseek planeja oferecer esses modelos avançados de inteligência artificial como software de código abertoMas não deu prazos.
A publicação do documento ocorre quando se há rumores de que o depseek é prestes a revelar o seu último chatbot r2. A empresa não fez nenhum comentário público sobre isso.