Revista cancela artigo que apontava efeitos positivos do ChatGPT no desempenho de aprendizagem de alunos

Trabalho publicado em 2025 recebeu mais de 500 citações em outros artigos científicos

A editora Springer Nature anunciou a retratação de um artigo científico que atribuía ao programa ChatGPT efeitos positivos no aprendizado de estudantes. O estudo foi considerado inválido devido a discrepâncias na análise feita pelos autores, que levaram os editores a perder a confiança nas conclusões do paper. O trabalho havia sido publicado em maio de 2025 na revista Humanities & Social Sciences Communications e teve grande repercussão tanto em meios acadêmicos como em mídias sociais: recebeu mais de 500 citações em outros trabalhos científicos e teve alto índice de leitura na internet, sendo consultado on-line por mais de meio milhão de pessoas.

Os autores, Jing Wang e Wenxiang Fan, ambos da Escola de Educação da Universidade Normal de Hangzhou, na China, analisaram os dados de 51 pesquisas sobre efeitos do ChatGPT em indicadores acadêmicos e relataram “grande impacto positivo” na melhoria do desempenho de aprendizagem e “impacto moderadamente positivo” no estímulo ao pensamento crítico. A metodologia implicava comparar dados de grupos que utilizaram o chatbot em atividades educacionais com dados de grupos de controle sem acesso à ferramenta.

Com base nos resultados, foram apresentadas recomendações para uso educacional da ferramenta, incluindo sua integração em diferentes modalidades de aprendizagem. O estudo sugeria ainda o uso contínuo do ChatGPT por quatro a oito semanas para alcançar efeitos mais estáveis, além de sua incorporação flexível no ensino como tutor inteligente, parceiro de aprendizagem e instrumento educacional.

Com a repercussão dos resultados, vários pesquisadores apontaram problemas no artigo, como falhas na seleção e na comparação dos estudos. Um dos críticos, o professor de educação digital Ben Williamson, da Universidade de Edimburgo, na Escócia, afirmou ao site Ars Technica que as pesquisas selecionadas foram combinadas de forma inadequada. “Em alguns casos, parece que o artigo sintetizou estudos de qualidade muito baixa ou misturou resultados de estudos que simplesmente não podem ser comparados com precisão devido a métodos, populações e amostras muito diferentes”, disse.

Para Williamson, o curto intervalo entre o lançamento público do ChatGPT, em 2022, e a publicação de um volume considerado suficiente de estudos revisados por pares sobre seus efeitos na educação já deveria ter sido um sinal de alerta para os revisores. Na nota de retratação, a editora Springer Nature informa que os autores não responderam às tentativas de contato para dirimir as dúvidas sobre o artigo.

Fonte: Revista Fapesp