Grandes modelos de linguagem se destacam em criar e resolver testes de inteligência emocional

A imagem avalia argumentos emocionais por trás de cada reação com uma breve explicação com os cenários usados nos testes de inteligência emocional. Crédito: Kataja Shlegal.
Durante sua vida, os humanos podem estabelecer relações sociais significativas com os outros, têm simpatia por eles e compartilhar suas experiências. A capacidade das pessoas de gerenciar, ver e entender os sentimentos experimentados por si e pelos outros é aproximadamente referida como inteligência emocional (EI).
Nas décadas anteriores, os psicólogos desenvolveram vários testes projetados para medir o EIS, geralmente avaliando a capacidade das pessoas de resolver problemas relacionados a emoções que eles podem lidar com sua vida cotidiana. Esses testes podem ser incluídos em pesquisas, avaliações clínicas, profissionais e várias psicológicas empregadas em Configurações educacionaisAssim,
Pesquisadores da Universidade de Bern e da Universidade de Genebra realizaram recentemente um estudo, avaliando a capacidade de grandes modelos de idiomas (LLM), técnicas de aprendizado de máquina, de resolver e fazer testes de EI, sublinham a funcionalidade de agentes do convocador, como o Chatgate para resolver e criar testes de EI. Suas conclusões, Publicado Em Psicologia da comunicaçãoSugere que os LLMs possam quase resolver esses testes e humanos e podem ser ferramentas promissoras para desenvolver futuros testes de EI psicomática.
A Medical Express disse: “Eu pesquisei a EI há muitos anos e desenvolvi vários testes baseados em demonstrações para medir a capacidade de identificar e regular com precisão os sentimentos em pessoas e outras pessoas”.
“Quando o bate -papo e outros Big Language Model Tornou -se amplamente disponível e muitos de meus colegas e eu comecei a testá -los no meu trabalho, parecia natural perguntar: como esses modelos executariam em muitos testes de EI feitos por nós para os seres humanos? Ao mesmo tempo, um debate científico animado está surgindo se a IA pode realmente simpatizar – a capacidade de entender, compartilhar e responder aos sentimentos de outras pessoas. , Assim,
EI e simpatia são dois conceitos próximos, pois ambos estão associados à capacidade de entender as experiências emocionais dos outros. Schlegel e seus colegas determinam até que ponto os LLMs podem resolver os Nils R. Sommer e Marcello Mortillaro e podem criar problemas relacionados à emoção nos testes de EI, pois também pode fornecer alguns sinais de níveis de simpatia que eles têm.
Para conseguir isso, ele pediu a seis LLM amplamente utilizados para concluir os cinco primeiros testes de EI que foram originalmente projetados para seres humanos como parte da avaliação psicológica. Modelos que ele testou, incluindo ChatGPT-4, ChatGPT-O1, Gemini 1.5 Flash, Copilot 365, Cloud 3.5, Haiku e Deepsek V3.
“Usamos pequenas paisagens emocionais para usar testes de EI e pedir a reação mais inteligente emocionalmente, como o que alguém está sentindo ou o melhor para gerenciar uma situação emocional, identificar o que é melhor gerenciar”. “Comparamos então a pontuação do modelo com a média humana com estudos anteriores”.

Cada imagem testada mostra a porcentagem de reações corretas em cinco testes de EI para LLM. Crédito: Kataja Shlegal.
Na segunda parte de seu experimento, os pesquisadores perguntaram ao ChatGPT-4, que é uma das versões mais recentes do ChatGPT lançado ao público, de modo que para criar uma versão completamente nova dos testes de EI usados em seus experimentos. Esses testes devem incluir várias paisagens emocionais, perguntas e opções de respostas, além de especificar quais são as respostas corretas às perguntas.
“Então, demos mais de 460 participantes humanos nos testes originais e transmitidos pela IA, para ver o quão bem a dificuldade, a clareza, o realismo e outros testes de EI e outros testes de EI e uma medida da inteligência cognitiva tradicional em comparação com as duas versões”, disse Schlegal.
“Isso nos permitiu não apenas testar se o LLM poderia resolver os testes de EI, mas se eles podem dar argumentos adequados para fazer um teste mais profundo sobre emoções, que acreditamos que estamos confiantes de que mais abertos é um passo importante para a implementação de essa lógica em configurações reais do mundo”.
Em particular, Shlegal e seus colegas descobriram que aqueles que testaram o LLM tiveram um desempenho muito bom em todos os testes de EI, recebendo uma precisão média de 81%, o que excede a precisão média recebida pelos entrevistados humanos (56%). Seus resultados sugerem que o LLM atual já é melhor para entender o que as pessoas podem sentir em diferentes contextos, pelo menos quando se trata de condições estruturadas, como as pessoas mencionadas nos testes de EI.
“E de maneira mais impressionante, o ChatGPT-4 conseguiu gerar itens de teste de EI completamente novos, classificados pelos participantes humanos como os objetos originais como claros e realistas e mostram qualidade psicométrica comparável”, disse Shlegal. “Em nossa opinião, a capacidade de resolver e construir esses testes reflete os altos níveis de entendimento ideológico das emoções”.
Os resultados deste estudo recente podem incentivar os psicólogos a usar o LLM para desenvolver testes de EI e Material de treinamentoQue atualmente é feito manualmente e pode ser demorado. Além disso, eles podem induzir o uso do LLM para produzir uma paisagem sequencial de roll-play e outros materiais para treinar assistentes sociais.
“Nossas descobertas também são relevantes para o desenvolvimento de agentes sociais como chatbott de saúde mental, tutor educacional e avatar de atendimento ao cliente, geralmente trabalhando em contextos emocionalmente sensíveis, onde é necessário entender as emoções humanas”, disse Schlegal.
“Nossos resultados sugerem que os LLMs podem, pelo menos, habilidades de argumento emocional que servem como condição para essas interações. Em nossos próximos estudos, planejamos testar o desempenho do LLM além do formato controlado dos objetos de teste nas conversas emocionais da vida real”.
Mais informações:
Kataja Shlegal et al. Psicologia da comunicação (2025). Doi: 10.1038/s44271-025-00258-xAssim,
© 2025 Science X Network
Citação: Modelos de idiomas grandes se destacam na criação e solução de testes de inteligência emocional, encontrando estudos (2025, 4 de junho) https://medicalxpress.com/news/2025-06-2025-06-theharge-scell-excel-Motional-mon.
Este documento está sujeito a direitos autorais. Além de qualquer comportamento imparcial para fins de estudos ou pesquisas privadas, nenhuma parte pode ser retroduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins de informação.