Carl Saucier-Bouffard
N.B. Veuillez noter que le texte ci-dessous est un "travail en cours" et qu'il est actuellement incomplet. Il sera révisé et complété ultérieurement. - C.S-B.
A. Introduction
Les lectures que j'ai effectuées dans le cadre de ma bourse WID m'ont aidée à reconnaître la vérité des paroles de sagesse suivantes : "Dites-moi et j'oublierai ; enseignez-moi et je me souviendrai ; faites-moi participer et j'apprendrai. (Xun Kuang, Xunzi, livre 8, chapitre 11) La participation au programme WID a considérablement enrichi mon enseignement en m'aidant à concevoir et à intégrer dans mes cours de nombreuses activités d'apprentissage actif, des tâches de collaboration en petits groupes, des entretiens en binôme, des activités d'écriture exploratoire et des travaux formels qui comportent des éléments plus créatifs que les dissertations standard régies par la thèse. Au cours de l'année écoulée, j'ai également intégré de nouvelles technologies de communication dans mes cours. Par exemple, afin d'expérimenter le modèle de "classe inversée", j'ai co-créé quelques vidéos éducatives, dont une sur les droits légaux des grands singes(http://vimeo.com/72014721), que j'utilise en conjonction avec le roman Ishmael dans le cadre d'un séminaire de réflexion.
Étant donné que ce que je considère comme ma tâche professionnelle la plus difficile et la plus lourde est d'attribuer une note numérique aux multiples essais rédigés par chacun de mes 160 étudiants, ce portfolio se concentrera sur les grilles d'évaluation spécifiques aux tâches que j'ai développées à partir de mon expérience en tant que boursier du WID.
Mes réflexions sur cette question ont été principalement influencées par la lecture et la discussion de l'ouvrage de John C. Bean intitulé Des idées engageantes - Le guide du professeur pour intégrer l'écriture, la pensée critique et l'apprentissage actif dans la salle de classe. J'ai également beaucoup bénéficié de mes discussions avec Ian Mackenzie et Anne Thorpe, ainsi que des grilles d'évaluation que Robert Stephens et Sarah Allen, anciens boursiers du WID, ont généreusement accepté de partager avec moi. Afin d'explorer les nombreuses possibilités offertes par les grilles d'évaluation, j'ai consulté la base de données du site web de prévention du plagiat turnitin.com . Sur ce site, on peut trouver un outil de notation en ligne qui permet aux enseignants de choisir (et, dans la plupart des cas, de télécharger) plus de quarante rubriques de notation pré-créées.
B. Les problèmes posés par les notes numériques
J'ai toujours trouvé que l'attribution de notes numériques (sur de nombreux types de travaux ou sur les performances globales des étudiants) était problématique. Comme beaucoup de mes collègues, je suis d'avis que, pour de nombreux types de travaux notés (y compris les billets de blog ou de forum de discussion, les documents de réflexion, les résumés de lecture, les entrées de journal ou d'autres formes d'écriture exploratoire), le système de notation le plus juste est un système "réussite/échec"[1]. Je soutiens également que l'attribution de notes numériques à certains travaux formels (y compris les essais d'analyse critique que mes étudiants doivent rédiger dans le cadre du cours "L'éthique de ce que nous mangeons") peut parfois étouffer l'apprentissage des étudiants. D'après mes discussions avec de nombreux étudiants, je sais que beaucoup d'entre eux sont régulièrement confrontés au dilemme suivant : explorer des lectures supplémentaires et courir le risque d'obtenir des résultats légèrement moins bons dans leurs devoirs ou se concentrer exclusivement sur les lectures qui seront évaluées dans leurs devoirs et obtenir probablement une meilleure note[2].
Un autre problème important lié à l'attribution de notes numériques aux dissertations est ce que Bean appelle le "problème de la précision implicite" (Bean, Engaging Ideas, p.279). En d'autres termes, les notes numériques donnent une impression d'objectivité qui n'est pas authentique. Lorsque les enseignants attribuent une note de 88 % à une dissertation, il semble que le message implicite qu'ils envoient est que cette dissertation ne mérite pas 90 % ou 86 % (mais 88 %). En réalité, peuvent-ils vraiment faire la différence entre une dissertation qui mérite 86 % et une autre qui mérite 90 % ? J'en doute. Si le même enseignant devait noter la même dissertation des mois plus tard, en utilisant les mêmes critères d'évaluation, attribuerait-il les mêmes notes numériques ? Là encore, j'ai des doutes. Dans le même ordre d'idées, Bean souligne que certains enseignants peuvent supposer à tort que leurs critères de notation sont universels et qu'ils n'ont donc pas besoin de les rendre explicites à leurs étudiants. En fait, comme le montrent clairement les travaux de Paul Diederich (1974), il n'existe pas de critères de notation universels, tacites et implicites utilisés par tous les enseignants (ou la plupart d'entre eux) pour attribuer des notes numériques aux dissertations (Bean, p. 268). Les critères d'évaluation et le raisonnement qui produit des notes numériques différentes varient énormément d'un enseignant à l'autre (Bean, p.268).
Diederich a rassemblé trois cents essais rédigés par des étudiants de première année dans trois universités différentes et les a fait évaluer par cinquante-trois professionnels dans six domaines professionnels différents. Il a demandé à chaque lecteur de classer les essais en neuf piles différentes par ordre de "mérite général" et de rédiger un bref commentaire expliquant ce qu'il aimait ou n'aimait pas dans chaque essai. Diederich a rapporté les résultats suivants : Sur les 300 dissertations évaluées, 101 ont reçu toutes les notes de 1 à 9 ; 94 % ont reçu sept, huit ou neuf notes différentes ; et aucune dissertation n'a reçu moins de cinq notes différentes" (p.6). (Bean, p.268)
Si ces 53 enseignants n'ont pas pu se mettre d'accord sur la note, de 1 à 9, que méritait chacun de ces 300 essais, on peut supposer que, si on leur avait demandé d'attribuer une note numérique de 1 à 100, leurs notes auraient varié encore davantage.
C. Une solution partielle : Rubriques d'évaluation spécifiques aux tâches
Le professeur John C. Bean démontre de manière convaincante que les grilles d'évaluation spécifiques à une tâche peuvent en partie résoudre le problème des notes numériques largement incohérentes, étant donné qu'elles clarifient et rappellent aux évaluateurs les critères d'évaluation (pp.269-270). L'utilisation de grilles d'évaluation pourrait être l'un des meilleurs moyens d'obtenir des notes cohérentes et relativement justes pour les dissertations et autres travaux. L'utilisation d'une grille d'évaluation présente de nombreux autres avantages. Par exemple, les grilles d'évaluation peuvent être facilement partagées avec les étudiants et elles leur fournissent une explication claire de nos critères d'évaluation. En outre, comme Bean (p.289), je pense que les grilles d'évaluation, une fois remplies, fournissent un retour d'information significatif aux étudiants. Si elles sont bien conçues, les grilles peuvent mettre en évidence les principales forces et faiblesses des travaux.
D'après ma propre expérience, en communiquant les grilles d'évaluation aux étudiants quelques semaines avant la date de remise du travail, je m'assure que les étudiants savent ce que l'on attend d'eux et qu'ils peuvent utiliser les grilles lorsqu'ils révisent leur travail. Lorsque j'envoie les grilles remplies à mes étudiants une fois leurs devoirs notés, ils se plaignent très rarement de leurs notes. Les grilles aident clairement chacun d'entre eux à comprendre pourquoi leur travail a reçu une note donnée. Les étudiants reçoivent également un retour d'information précieux qu'ils peuvent utiliser pour améliorer leur travail.
Deux exemples de grilles d'évaluation spécifiques à une tâche
Premier exemple
Dans le cadre de mon séminaire Réflexions (qui aborde les visions environnementales des "boomers" et des "doomsters"), mes étudiants doivent rédiger un dialogue imaginaire entre Ishmael (le protagoniste du roman Ishmael) et Zira (l'un des personnages principaux du film La Planète des singes). Dans ce travail écrit, les élèves doivent jouer le rôle des points de vue opposés d'Ishmael et de Zira dans une conversation imaginaire sur la façon d'aider les humains à prospérer sur la Planète des singes ( ). Voici les instructions détaillées que je communique à mes élèves deux ou trois semaines avant la date de remise du devoir.
Pour m'aider à attribuer une note à ce travail, j'utilise une grille d'évaluation spécifique qui repose sur les quatre critères suivants :
Compréhension des arguments avancés par Is maël (les arguments d'Ismaël sont-ils résumés avec clarté, précision et nuance ?)
Compréhension de la position de Zira (la position de Zira est-elle résumée avec clarté, précision et nuance ?)
Soutien (le dialogue comprend-il au moins 7 passages paraphrasés du roman Ishmael, et les meilleurs passages possibles ont-ils été choisis ? Chaque passage paraphrasé est-il identifié par une citation claire de la page).
Mécanisme d'écriture (c'est-à-dire combien de fautes de grammaire et/ou d'orthographe le travail comporte-t-il ?)
Au début de ce trimestre, après avoir montré cette grille d'évaluation à mes étudiants, je leur ai demandé de remettre en question mes critères d'évaluation et, si possible, de les affiner. Un seul de mes étudiants a plaidé pour un changement radical de ma grille : supprimer le critère " mécanique de l'écriture ". Nous avons ensuite débattu des mérites de ce critère. Lorsque j'ai soumis la proposition de mon élève au vote, l'écrasante majorité de mes élèves a voté contre la proposition et en faveur du maintien de la grille d'évaluation telle qu'elle est. La discussion en classe autour de cette grille d'évaluation a eu de nombreux avantages. D'une part, elle m'a amené à mieux justifier l'importance de chacun de ces quatre critères d'évaluation.
Plus tard dans le trimestre, une semaine avant la remise de ce travail, j'organiserai un atelier d'évaluation par les pairs, au cours duquel mes étudiants liront le travail d'un autre étudiant. Ils devront ensuite remplir ma grille d'évaluation et commenter le travail. Je pense que cet atelier générera probablement des commentaires utiles et permettra aux étudiants de mieux comprendre les quatre critères de ma grille d'évaluation.
Deuxième exemple
Dans le cadre de mon cours de pensée critique (intitulé "Connaissance de l'esprit humain"), mes étudiants doivent réaliser une présentation orale vers la fin du semestre. Pour la noter, je m'appuie sur une grille d'évaluation construite sur ces cinq critères:
Énoncé de la thèse (i.e. La présentation comprend-elle un énoncé de thèse clair, pertinent et précis qui répond directement à la question de l'exercice ?)
Validité logique de l'argument (c'est-à-dire dans quelle mesure les prémisses soutiennent-elles logiquement l'énoncé de la thèse ? L'argument présenté est-il logiquement valable ?)
Vérité des prém isses (c'est-à-dire, sur la base des preuves fournies, dans quelle mesure est-il raisonnable de supposer que chaque prémisse est vraie ? Chacune des prémisses est-elle étayée par au moins un article ou un ouvrage universitaire évalué par les pairs).
Objection légitime à leur argument et réponse à cette objection (la présentation se termine-t-elle par une objection légitime à l'argument présenté ? Une réponse valable à cette objection est-elle proposée ?)
Organisation du contenu (c'est-à-dire dans quelle mesure le contenu de votre présentation est-il bien organisé ? Le présentateur s'appuie-t-il sur une présentation PowerPoint claire et concise (ou sur d'autres supports visuels) ?
Cette grille est communiquée et expliquée en détail à mes étudiants deux ou trois semaines avant la date de leur présentation. Avant leur présentation orale, qui a lieu à la fin du semestre, mes étudiants passent quatre semaines à lire et à analyser le manuel Critical Thinking For College Students, écrit par Denise Albert. Ce livre, ainsi que huit de mes cours, sont consacrés aux concepts d'"énoncé de thèse", de "validité logique", de "vérité d'une prémisse" et de "solidité".
Lors de chaque présentation orale, j'écris à la main de nombreux commentaires sur la grille d'évaluation. Je donne ensuite à chaque étudiant la possibilité de répondre à certaines de mes critiques et objections. L'échange qui suit chaque présentation est très utile pour déterminer une note juste et précise pour chaque présentateur. À l'aide de Microsoft Excel, je surligne ensuite chaque case correspondant à la performance du présentateur et j'y inscris mes commentaires finaux. Voici un exemple.
D. Les grilles d'évaluation ne sont pas parfaites
L'un des problèmes des grilles d'évaluation est que, comme elles sont conçues pour évaluer un nombre limité de compétences spécifiques, cela pourrait se faire au détriment de la compréhension et de la connaissance globales. On pourrait dire que les grilles d'évaluation sont trop simplistes pour évaluer avec précision l'apprentissage global des étudiants. Je pense qu'elles évaluent sans aucun doute un type spécifique d'apprentissage (tout comme les tests de QI évaluent un type spécifique de connaissances), mais est-ce suffisant ? Une grille de notation conçue pour évaluer un essai de 1 500 mots m'aiderait-elle vraiment à évaluer correctement le processus de réflexion de mes élèves et ce qu'ils ont appris au cours des 15 dernières heures de cours ? On pourrait faire valoir que tout outil d'évaluation de ce type évalue la mesure dans laquelle les étudiants sont capables de comprendre les critères de ma grille et d'y répondre. S'agit-il d'un bon indicateur de leur compréhension et de leurs connaissances globales ? Peut-être pas.
Mais les grilles ne doivent pas être l'"arbitre final" quant à la note numérique précise que nous attribuons aux travaux. Les grilles peuvent plutôt être utilisées comme un guide, nous aidant à déterminer une fourchette équitable dans laquelle la note d'un travail devrait se situer. Un essai qui démontre une compréhension supérieure des concepts et des idées étudiés en classe pourrait obtenir une note numérique située dans la partie supérieure de cette fourchette. Les commentaires de l'enseignant peuvent expliquer pourquoi un travail mérite une note inférieure ou supérieure à la fourchette déterminée par la grille d'évaluation.
[Il se peut que le système de notation le plus juste pour les performances globales des étudiants soit également un système de "réussite/échec". Un tel système de notation pourrait avoir l'avantage de réduire le stress malsain de nos étudiants et de favoriser la cohésion du groupe (voir http://www.mayoclinicproceedings.org/article/S0025-6196(11)61250-0/pdf).
[Lorsque j'étais étudiant à l'université, l'un des cours où j'ai connu le plus grand développement intellectuel a été mon cours d'éthique normative. Pourquoi ? Parce que mon professeur d'éthique (feu G.A. Cohen, qui avait toujours promu des politiques égalitaires) avait reçu la permission exceptionnelle de n'attribuer que deux types de notes : réussite ou échec.