Use este identificador para citar ou linkar para este item: https://repositorio.unichristus.edu.br/jspui/handle/123456789/1967
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorROCHA, Hermano Alexandre Lima-
dc.contributor.authorLOPES, Rocicleide de Lima-
dc.date.accessioned2025-11-24T11:38:38Z-
dc.date.available2025-11-24T11:38:38Z-
dc.date.issued2025-
dc.identifier.citationLOPES, Rocicleide de Lima. Avaliação da classificação de questões pela Taxonomia de Bloom por ferramentas de inteligência artificial generativa no ensino médico. 2025. Dissertação (Mestrado Profissional em Ensino na Saúde e Tecnologias Educacionais) – Centro Universitário Christus, Fortaleza, 2025.pt_BR
dc.identifier.urihttps://repositorio.unichristus.edu.br/jspui/handle/123456789/1967-
dc.description.abstractO estudo avaliou a classificação de questões de múltipla escolha aplicadas em provas de Medicina por ferramentas de Inteligência Artificial Generativa (IA-G), nesse caso, o ChatGPT, comparando o desempenho de um modelo pré-treinado com o de professores-participantes e de uma especialista (juíza). A pesquisa foi conduzida em uma instituição de ensino superior privada, por meio de um estudo quantitativo, transversal e observacional. Foram selecionadas 200 questões aplicadas nos 1º e 7º semestres do curso de Medicina, analisadas em duas fases. Na primeira, quatro professores-particpantes doutores realizaram a classificação manual segundo a Taxonomia de Bloom, posteriormente revisada por uma especialista com mais de 40 anos de experiência. Na segunda fase, quatro docentes da área da saúde classificaram 30 questões em etapas, alternando julgamentos próprios e apoio da IA-G. Os dados foram tratados estatisticamente por meio de medidas de acurácia, matriz de confusão, coeficiente Kappa de Cohen, teste de McNemar e bootstrap. Os resultados evidenciaram acurácia geral de 95% do modelo pré-treinado em relação ao padrão-ouro estabelecido por especialistas, com elevado desempenho nas categorias “Lembrar”, “Aplicar” e “Avaliar”. As maiores divergências ocorreram entre os níveis “Entender” e “Analisar”, também considerados de difícil delimitação por avaliadores humanos. O índice Kappa de 0,85 confirmou alta concordância entre as classificações da IA-G e as dos professores-participantes. A análise revelou que a IA-G pode atuar como ferramenta de apoio pedagógico, reduzindo a carga de trabalho docente e ampliando a coerência avaliativa, sem substituir o julgamento crítico do professor. A principal limitação encontrada foi a dificuldade do modelo pré-treinado em distinguir categorias intermediárias da Taxonomia de Bloom, o que reforça a necessidade de uso combinado com validação humana. Os principais resultados apontam que a IA-G apresenta potencial relevante na curadoria e classificação pedagógica de bancos de questões, contribuindo para maior objetividade, coerência e eficiência no processo avaliativo no ensino médico, quando utilizada de forma ética e complementar à expertise docente.pt_BR
dc.language.isopt_BRpt_BR
dc.subjectinteligência artificial generativapt_BR
dc.subjecttaxonomia de Bloompt_BR
dc.subjectensino médicopt_BR
dc.subjectavaliação educacionalpt_BR
dc.titleAvaliação da classificação de questões pela Taxonomia de Bloom por ferramentas de inteligência artificial generativa no ensino médicopt_BR
dc.typeDissertaçãopt_BR
dc.title.inglesEvaluation of question classification by Bloom's Taxonomy using generative artificial intelligence tools in medical educationpt_BR
dc.description.resumo_abstractThe study evaluated the classification of multiple-choice questions applied in medical exams using Generative Artificial Intelligence (AI-G) tools, in this case ChatGPT, comparing the performance of a pre-trained model with that of participating teachers and an expert (judge). The research was conducted at a private higher education institution through a quantitative, cross-sectional, and observational study. Two hundred questions applied in the 1st and 7th semesters of the medical course were selected and analyzed in two phases. In the first phase, four participating professors with doctorates performed manual classification according to Bloom's Taxonomy, which was later reviewed by an expert with over 40 years of experience. In the second phase, four health professors classified 30 questions in stages, alternating their own judgments with support from AI-G. The data were statistically processed using accuracy measures, confusion matrix, Cohen's Kappa coefficient, McNemar test, and bootstrap. The results showed an overall accuracy of 95% for the pre-trained model in relation to the gold standard established by experts, with high performance in the categories “Remember,” “Apply,” and “Evaluate.” The greatest discrepancies occurred between the levels ‘Understand’ and “Analyze,” which are also considered difficult to delimit by human evaluators. The Kappa index of 0.85 confirmed high agreement between the AI-G classifications and those of the participating teachers. The analysis revealed that AI-G can act as a pedagogical support tool, reducing the teaching workload and increasing assessment consistency, without replacing the teacher's critical judgment. The main limitation found was the difficulty of the pre-trained model in distinguishing intermediate categories of Bloom's Taxonomy, which reinforces the need for combined use with human validation. The main results indicate that AI-G has significant potential in the curation and pedagogical classification of question banks, contributing to greater objectivity, consistency, and efficiency in the assessment process in medical education when used ethically and complementing teaching expertise.pt_BR
Aparece nas coleções:Mestrado Profissional em Ensino na Saúde e Tecnologias Educacionais - Dissertações Defendidas

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
ROCICLEIDE DE LIMA LOPES.pdf10,99 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.