I PRINCIPES DES ECHELLES DESCRIPTIVES
« La notion d’unidimensionnalité est une trahison de la compréhension du monde. Dès que l’on ramène une chose à un chiffre, il n’en reste plus rien. Un caillou ne vaut pas 10. Il est grand, petit, lourd, il est dur, mais il ne vaut pas 10. De la même manière dire d’une copie qu’elle vaut 15 est une stupidité. […] la copie a un profil, elle est bonne pour les idées, mauvaise pour l’orthographe, etc. […] La seule justification de l’unidimensionnalisation, c’est de hiérarchiser ». Qui mieux qu’Albert Jacquard pouvait prétendre poser le problème de l’évaluation notée des tâches complexes[1] dans notre système éducatif ?
En réalité, si la note est un problème, elle n’est pas « le » problème ; elle ne le devient que si elle n’est pas accompagnée de critères et de descripteurs permettant d’évaluer en fonction des seuils de réussite atteints. Mais l’exercice n’est pas aisé car il ne s’agit pas d'en évaluer les différentes composantes séparément mais simultanément en évitant le piège redoutable du découpage en micro compétences indépendantes les unes des autres : en matière d'évaluation, le tout n'est jamais la somme des parties. L'une des difficultés à évaluer une compétence est donc sa globalité. Elle regroupe aussi bien des connaissances, des capacités, voire des savoir être. Si l'on prend comme exemple une compétence de nos programmes comme "s'informer dans le monde du numérique", elle prendre en compte des connaissances et notions comme celles de métadonnées ou de réseau social, des capacités comme l'utilisation de mots-clés dans un moteur de recherche et enfin des attitudes ou savoir-être comme le respect de la propriété intellectuelle quand on cite une source.
Les outils permettant d'évaluer les tâches complexes existent depuis longtemps : les échelles descriptives critériées. Elles ont comme intérêt majeur de prendre en compte l'ensemble de ces paramètres au sein d'un même outil d'aide à l'évaluation. Elles prennent tout leur sens dans l'évaluation d'une tâche complexe qui conjugue plusieurs capacités, voire plusieurs compétences. Elles ont depuis longtemps fait la preuve de leur efficacité et plusieurs disciplines s'en sont emparées précocément comme les langues avec le cadre européen.
Plusieurs échelles descriptives sont intégrées aux fiches Eduscol sur les programmes de cycle 4, en fournissant des exemples d'évaluation.
II REFLEXION SUR L'UTILISATION DES ECHELLES DESCRIPTIVES
L'une des premières tâches dans la construction d'une échelle descriptive est la définition des critères. Ceux-ci peuvent être regroupés en catégories, afin d'être plus lisibles. Un critère est un élément d’appréciation sur lequel on va pouvoir s’appuyer pour évaluer. Il est indispensable d'associer les élèves à cette étape. Il convient ensuite d'effectuer un descriptif du niveau attendu pour chaque critère. C'est cette explicitation qui différencie l'échelle descriptive d'un barème de notation et facilite ainsi la correction permettant ainsi de donner aux élèves une rétroaction (feed-back) de qualité dans l'optique d'une évaluation formative. L'échelle descriptive ne sert pas à calculer un barème mais reste avant tout un outil d'aide à la décision. S'il s'agit de positionner une note elle permet de situer dans quelle fourchette de note la copie se situe. Une attention particulière doit être portée sur le seuil de maîtrise satisfaisant. Il correspond aux attentes d'un critère rempli, au regard du niveau de la classe et des attentes institutionnelles ( programmes, socle ) pour chaque cycle.
Prenons l'exemple du raconter à l'écrit en histoire. La recherche des critères est un moment crucial car il permet de se représenter la tâche à accomplir et d'en rechercher les principales composantes dans une démarche métacognitive. Ils ne doivent pas être nombreux car cela complique la correction inutilement et la recherche a montré ( cf. Roegiers, 2010 ) qu'un nombre élevé de critères ne permet pas d'évaluer mieux, du moins à l'école ou au collège. La notion de choix est donc très importante dans la conception d'une échelle descriptive, dans le sens où elle ne vise pas à l’exhaustivité, mais l'enseignant doit effectuer des choix dans les éléments qui vont être évalués. L'exemple choisi, extrait de la fiche Eduscol Ecrire en histoire-géographie en a retenu trois à propos du récit d'une crise de la guerre froide comme exemple de la confrontation Est-Ouest :
- la maîtrise de la langue,
- les connaissances, l'apport d'informations,
- le respect du sujet
Fig.1 : grille descriptive extraite de la fiche Eduscol Ecrire en histoire-géographie
Ces critères retenus sont des critères minimaux, c'est-à-dire les critères qui conditionnent la réussite et peuvent attester de la réelle maîtrise de la compétence.
Il faut ensuite, pour chaque critère, définir des descripteurs. Il s'agit des informations recueillies, observables et contextualisées car liées à la tâche proposée. Ils doivent être exprimés de façon simple, même si toutes les nuances ne sont pas exprimées, de façon à pouvoir associer les élèves au processus d'évaluation. Pour le critère maîtrise de la langue, les descripteurs peuvent être basés par exemple sur le respect de l'orthographe, de la syntaxe et de la ponctuation. Ils peuvent obéir à une logique quantitative ( "de nombreuses fautes d'orthographe" ) ou qualitative ( pertinence des informations ), parfois les deux à la fois. Ils doivent être le plus opérationnels possibles.
Il est à noter que les critères peuvent concerner des capacités (localiser des espaces, organiser une composition) mais également des connaissances. L'exemple ci-dessous est extrait de l'échelle descriptive envoyée à titre indicatif l'an passé aux correcteurs du DNB 2017, avec les additifs académiques. On constate que le positionnement se fait sur un nombre quantitatif de critères mais la progression peut également être qualitative.
Fig. 2 : extrait de la grille descriptive envoyée aux coordinateurs de centre de correction comme aide indicative à la correction du développement construit.
Enfin, il faut pour chaque critère répartir les descripteurs selon différents seuils de maîtrise. Une répartition sur quatre niveaux est pertinente : insuffisant, fragile satisfaisant, très bonne maîtrise. Vouloir en mettre davantage n'apporte rien à la qualité du feed-back. La maîtrise satisfaisante est naturellement attendue. Il faut donc toujours commencer la réalisation de l'échelle descriptive par ce niveau.
La question de la progressivité des apprentissages ne doit pas être oubliée. Pour une même tâche complexe ou une même compétence, les attentes ne seront pas identiques au cycle 3 et au cycle 4. Il est conseillé de ne pas toucher aux critères mais de jouer sur le nombre ou la qualité des descripteurs qui sera logiquement plus élevé au cycle 4.
L'un des intérêts de l'échelle descriptive est qu'elle n'est pas figée mais elle a vocation à évoluer au fur et à mesure des corrections en précisant certains éléments non envisagés au départ mais rencontrés dans les copies. Contrairement à la modification d'un barème qui serait source d'inégalités entre les copies, cette évolution permet de prendre en compte au fur et à mesure les éléments de réponse rencontrés. C'est pour cette raison que certains auteurs préconisent d'affiner l'échelle descriptive uniquement après avoir relevé le travail des élèves et donc à partir du contenu observé sur les copies.
Cet outil permet de faire progresser y compris les élèves les plus avancés. La variété des critères fait que le niveau "très bonne maîtrise" est rarement atteint pour tous les items. Une copie peut ainsi très bien obtenir un 18/20 mais l'élève dispose de pistes de progrès pour plusieurs critères.
III UTILISATION PÉDAGOGIQUE DES ÉCHELLES DESCRIPTIVES
La force des échelles descriptives ne réside pas uniquement dans l'aide précieuse qu'elles vont apporter au professeurs dans le difficile processus d'évaluation d'une tâche complexe. Elles constituent également un formidable outil d'évaluation formative.
Dans le cas le plus simple, l'enseignant peut rendre l'échelle descriptive en même temps que la copie ce qui permet à l'élève de comprendre ses points forts et de voir les éléments qu'il faut continuer à travailler. C'est plus efficace que les appréciations indiquées sur la copie et que les élèves ne regardent pas toujours! Un travail de réécriture peut alors être réalisé en collaboration avec le professeur de français comme cela se fait déjà parfois dans certains établissements. Mais on peut aller beaucoup plus loin et de manière bien plus efficace en associant l'élève au processus d'évaluation dans le cadre d'une auto-évaluation ou d'une évaluation par les pairs. Il suffit alors de modifier l'échelle descriptive pour la rendre plus simple d'utilisation. Une réflexion des élèves au choix des critères peut également être menée en classe dans le cadre d'une démarche réflexive sur l'évaluation.
L'oral du DNB constitue également un très bon exemple d'utilisation des échelles descriptives permettant d'évaluer une tâche complexe tout en se plaçant d'un point de vue formatif pour l'élève. L'épreuve telle qu'elle est définie dans le BO n° 14 du 8 avril 2016 est évaluée sur 100 points : 50 pour la maîtrise du sujet présenté, 50 pour la maîtrise de l'expression orale. De nombreux critères sont proposés. Ceux qui concernent la maîtrise du sujet, du fait de leur complexité, peuvent être choisis par l'équipe enseignante. En revanche, la sélection des critères relevant de l'expression orale doivent donner lieu à un débat avec les élèves. Comme cette épreuve est notée, il est important de pondérer chaque critère en fonction de l'importance qui leur est accordée.
Fig. 3 : Exemple de pondération de critères suivant leur importance dans le cadre de l'épreuve orale du DNB (grille complète)
Dans tous les cas, il est primordial que ces derniers connaissent et intègrent le plus rapidement possible les caractéristiques de cette épreuve en utilisant régulièrement la grille d'évaluation dans des situations d'évaluation par les pairs. En effet, et c'est là un aspect majeur de cet outil, elle permet à l'évaluateur d'améliorer rapidement ses propres performances.
Un exemple d'utilisation qui pourrait être pertinent serait de donner une échelle descriptive à l'élève comme évaluation avec le sujet. Ce serait ensuite à lui de rédiger le sujet, à partir du corrigé.
Conclusion
Les échelles descriptives permettent de passer d'une évaluation des apprentissages à une évaluation pour les apprentissages. Elles font prendre conscience de la trop grande importance donnée à l'évaluation comme outil de vérification des acquis en oubliant l'essentiel : les apprentissages des élèves. Comme le dit si justement Olivier Rey dans la présentation d'un article de septembre 2014 : "Imaginer une évaluation pour apprendre… plutôt que d’apprendre pour l’évaluation", tel est l'enjeu majeur des prochaines années. Dans une situation de classe, on n'évalue pas que pour donner une note ( classement en fonction d'une performance ) et vérifier des acquis; l'évaluation participe pleinement du processus d'apprentissage en donnant à l'élève des informations lui permettant de progresser.
[1]
A. Jacquard, cité par Castincaud & Zakhartchouk, 2014, in Olivier Rey Annie Feyant, Evaluer pour (mieux) faire apprendre, Dossier de l’IFE, n°94, sept 2014 )