CHACHOUI, Yasmine2026-03-032026-03-032025-10-15https://dspace.univ-annaba.dz//handle/123456789/4586Cette thèse s'inscrit dans le domaine des Environnements Informatiques pour l'Apprentissage Humain et se concentre sur l'amélioration de l'apprentissage de l'algorithmique dans l'enseignement supérieur. Le taux élevé d'échec des étudiants dans les cours de programmation reste un défi majeur, attribuable à un ensemble de facteurs tels que le déséquilibre des compétences préalables, l'insuffisance des méthodes pédagogiques traditionnelles, le déséquilibre des ensembles de données éducatives, et le manque de moyens pour évaluer de manière nuancée la compréhension des concepts enseignés. Pour répondre à ces défis, cette thèse propose deux contributions principales. La première aborde le problème du déséquilibre des classes dans les données éducatives, une problématique qui complique la formation de modèles prédictifs fiables. L'étude a été menée sur un échantillon de 2176 étudiants de première année en programmation, présentant un taux d'échec de 76%. Afin d’atténuer ce déséquilibre, des techniques de sur-échantillonnage, telles que SMOTE et trois de ses variantes, ont été appliquées. Une méthode nommée Equi-Fused-Data-based SMOTE a ensuite été implémentée pour combiner les jeux de données sur échantillonnés de manière non répétitive. Les résultats obtenus sont prometteurs, avec une précision de 93,85%, un F1-score de 92,86%, et un AUC de 98,08%, démontrant ainsi l'efficacité de cette approche pour améliorer significativement la performance des modèles prédictifs. La seconde contribution concerne l'évaluation de la compréhension des concepts de programmation dans le cadre d'une classification multi-label. Les modèles spécifiques pré-entraînés, tels que CodeBERT et UniXcoder,surpassent les modèles généraux comme BERT et RoBERTa en termes de précision, score F1 et la perte de Hamming pour les tâches de classification multi-label liées à la programmation. Parmi ces modèles, UniXcoder se distingue comme le meilleur, surpassant même CodeBERT, qui affiche pourtant des performances satisfaisantes. Cette thèse propose une approche de fusion pondérée pour améliorer encore la précision des évaluations. Les résultats montrent que l'approche de fusion pondérée permet aux modèles de traiter différents types d'erreurs,ce qui conduit à une amélioration globale des performances, avec UniXcoder en tête. Les résultats expérimentaux démontrent la pertinence des méthodes employées et ouvrent des perspectives pour des recherches futures visant à approfondir l'intégration de l'intelligence artificielle dans les EIAH.PDFfreiah; évaluation automatique; déséquilibre des classes; sur-échantillonnage; modèles de langage pré-traînes; intelligence artificielle en éducationGuidage de l’apprenant dans un EIAH : optimisation des processus d’évaluation automatique de la programmation par l’intelligence artificielleThesis