Taille de police : small-medium-big

L'évaluation des compétences à travers des situations complexes

in G. Baillat., D. Niclot & G. Ulma (Dir.). La formation des enseignants en Europe, Bruxelles : De Boeck, pp. 231-241 / GERARD, F.-M. / 2010

Télécharger la publication


1.    Nécessité et difficultés


L'approche par les compétences vise à rendre les élèves capables de mobiliser leurs savoirs et savoir-faire pour résoudre des situations-problèmes (Le Boterf, 1994 ; Rey, 1996 ; Perrenoud, 1997 ; De Ketele, 2000 ; Roegiers, 2000 ; Legendre, 2001 ; Jonnaert, 2002).


Dans cette perspective, les outils d'évaluation des acquis des élèves ne peuvent plus se limiter à prélever un échantillon de contenus et/ou d'objectifs opérationnels, mais proposent une ou des situations complexes, appartenant à la famille de situations définie par la compétence, qui nécessiteront de la part de l'élève une production elle-même complexe pour résoudre la situation (Beckers, 2002 ; Roegiers, 2004 ; Rey, Carette, Defrance & Kahn, 2003 ; Scallon, 2004 ; De Ketele & Gerard, 2005 ; Gerard - BIEF, 2008 ; Tardif, 2006).


L'élaboration, l'utilisation et la validation de tels outils ne sont pas sans difficultés (De Ketele & Gerard, 2005) :

  • la théorie classique des scores ou les théories de réponse à l'item sont fondées en grande partie sur le postulat d'une distribution normale des résultats et sur l'unidimensionnalité du trait mesuré, ce qui est peu compatible avec une évaluation par situations complexes qui exigent de la part des élèves une production elle-même complexe et flexible, non réductible à une seule et unique démarche ni à un seul et unique produit ;
  • l'équivalence des situations, leur appartenance à une même famille de situations, n'est évidente ni au moment de leur construction ni pour leur validation, d'autant plus que face à certains problèmes, il n'existe pas d'algorithmes de résolution. C'est pour cela que la situation est complexe et nécessite une véritable compétence pour pouvoir la résoudre, celle d'analyser la situation, d'identifier et de mobiliser des ressources pertinentes et de les articuler entre elles de manière inédite, ponctuelle et éphémère et souvent propre à chaque individu ;
  • les exigences de validité et de fiabilité des épreuves d'évaluation nécessitent de prendre en compte la représentativité de l'échantillon des questions par rapport à l'univers de référence, tant en termes de nombres d'items que de recouvrement qualitatif des différentes strates de l'univers de référence. Dans le cas de situations complexes, cette représentativité est quasi impossible à respecter dans la mesure où on ne peut décemment proposer aux élèves qu'une ou deux situations complexes à résoudre. C'est pourtant sur la base de ces quelques situations qu'il faudra inférer la maîtrise de la compétence, c'est-à-dire considérer si l'élève est capable ou non de résoudre toutes les situations de la famille de situations ;
  • enfin, si l'évaluation par situations complexes est la seule pertinente dans le cadre d'un système éducatif inscrit dans la perspective de l'approche par les compétences (Roegiers, 2004), il n'est pas facile de passer d'une culture du par coeur ou de l'application mécanique à celle de la résolution de problèmes, d'autant plus que celle-ci entraîne d'autres manières de corriger et de communiquer l'information, et qu'elle n'offre pas le même caractère de légitimité que les épreuves classiques où la réponse pseudo-objective conduit trop souvent à la seule sélection.


Ces difficultés ne doivent pas empêcher la réalisation et l'utilisation de tels outils d'évaluation des acquis des élèves. En effet, la qualité première d'un outil d'évaluation doit être sa pertinence par rapport au système dans lequel il s'insère. À quoi servirait-il de déclarer vouloir développer des compétences si l'évaluation des acquis, qu'elle soit formative ou certificative, ne se fonde que sur la maîtrise de savoir-reproduire et/ou de savoir-faire isolés, aussi performants soient les outils utilisés ?


Inversement, il serait absurde de vouloir évaluer les acquis scolaires par l'intermédiaire de situations complexes si la résolution de problèmes n'a pas fait préalablement l'objet d'un apprentissage systématique, que celui-ci soit permanent ou ponctuel. Cette remarque est particulièrement importante : tout dispositif d'évaluation de compétences par des situations complexes devrait d'abord s'assurer que les élèves ont réellement appris à résoudre des situations appartenant à la famille de situations visée.


Trop rares cependant sont les moments où les élèves sont confrontés - dans le cadre d'un apprentissage, avec toute la régulation que celui-ci nécessite - à des situations complexes avec un travail systématique d'analyse de la situation, d'émission d'hypothèses de résolution, d'identification des ressources pertinentes, de mobilisation et de mise en oeuvre de celles-ci pour résoudre la situation. Tout se passe comme si les enseignants considéraient qu'à partir du seul apprentissage des ressources, les élèves pouvaient apprendre d'eux-mêmes à identifier celles qui sont pertinentes dans une situation, à les mobiliser et à les intégrer dans une démarche complexe, alors qu'on sait depuis longtemps que certains savent hors école comment faire et que l'École ne l'explique pas aux autres (Bourdieu & Passeron, 1970).


L'utilisation d'outils d'évaluation fondés sur des situations complexes ne conduit alors qu'à constater que les élèves ne savent pas résoudre celles-ci. L'évaluation des compétences par des situations complexes ne peut avoir lieu que si un apprentissage systématique de ce type de résolution est préalablement réalisé. En bonne logique, il faudrait d'ailleurs que les situations proposées lors de l'évaluation soient plus faciles que les situations proposées lors de l'apprentissage.

2.    Une méthodologie pour l'élaboration des épreuves


Sollicité par les bailleurs de fonds en charge de l'éducation, qu'ils soient multilatéraux (Banque Mondiale, UNESCO, UNICEF...) ou nationaux (USAID, AFD, CTB...), le BIEF accompagne en ce sens des projets de réécriture des curriculums et d'élaboration de systèmes d'évaluation scolaire dans une quinzaine de pays (Algérie, Belgique, Bénin, Djibouti, Espagne, Liban, Luxembourg, Madagascar, Maroc, Mauritanie, Suisse, Tchad, Vanuatu...), depuis la première année de l'enseignement de base jusqu'à la dernière année du secondaire, mais aussi au niveau de la formation initiale et continue des enseignants et des inspecteurs, ou de la formation professionnelle.


Si la contextualisation des outils est un souci premier, la démarche méthodologique proposée par le BIEF est globalement la même quel que soit le terrain de réalisation (Roegiers, 2004 ; Gerard - BIEF, 2008) :

  • des groupes d'enseignants et/ou d'inspecteurs définissent les compétences qui sont visées à la fin d'un cycle ou d'une année, à raison de deux à quatre compétences par discipline et d'un objectif terminal d'intégration (Roegiers, 2000) ;

Exemple de compétence de base, en Chimie, pour la 9e année de l'enseignement de base - Liban : Face à une situation problème, nouvelle et significative pour l'élève, liée à l'utilisation des réactifs et des produits chimiques et leur impact sur l'environnement, l'élève sera  capable d'identifier le problème et de proposer une solution appropriée à ce problème tout en faisant appel à ses connaissances concernant : l'atome, la classification, les liaisons chimiques, l'électrochimie, la chimie organique et chimie et environnement.
Exemple de compétence de base, en Franēais oral (2e langue d'enseignement), pour la 6e année de l'enseignement de base - Mauritanie : Produire dans une situation significative pour l'élève un récit oral cohérent, respectant la suite des actions, intégrant la description de certains éléments du contexte et contenant l'explication d'au moins un fait.

  • ils associent à chaque compétence les ressources (savoirs et savoir-faire) qui peuvent être mobilisées lors de sa mise en oeuvre. Ces ressources correspondent le plus souvent aux objectifs qui figurent dans les programmes fondés sur la pédagogie par objectifs, mais ils sont réorganisés en fonction des compétences. C'est donc l'occasion de réaliser un élagage important : tous les objectifs qui ne sont pas directement reliés à une compétence disparaissent du curriculum ;
  • ils élaborent 2 ou 3 situations qui illustrent la famille de situations susceptibles d'être résolues par l'élève maîtrisant la compétence. C'est une démarche relativement pragmatique : les concepteurs se demandent quelles situations concrètes permettraient de certifier la maîtrise des compétences visées. Ce n'est que sur la base de ces situations concrètes qu'ils dégagent les paramètres de la famille des situations, c'est-à-dire les éléments communs à toutes les situations de la famille. Souvent même, ils reviennent sur la formulation des compétences qui s'expriment alors seulement en termes de résolution de problèmes. Ces paramètres concernent l'univers de référence en termes de ressources, le type de situations, le type et le nombre de supports, le type de tāche attendue, les conditions de résolution, le type de critères utilisés pour évaluer la production... Les paramètres de la famille de situations ne se limitent donc pas aux connaissances ou aux procédures à mobiliser, mais reprennent toute une série d'éléments qui devraient permettre à d'autres concepteurs d'élaborer de nouvelles situations, considérées comme équivalentes ;
Exemple (incomplet) de paramètres de la famille de situations de la compétence de base, en Chimie, pour la 9e année de l'enseignement de base - Liban
Univers de référence en termes de ressources à mobiliser (savoirs, savoir-faire, savoir-être) :
Savoirs : constituants de l'atome, classification des éléments, réactions chimiques, formules et équations, solutions, électrochimie, hydrocarbures,  polymérisation et polymères, pollution ...
Savoir-faire : Exploiter les différents types de supports, trier les informations, les traiter ; analyser ; déduire, communiquer par écrit (et/ou oral), tracer des courbes, des schémas et des diagrammes..., réaliser des activités expérimentales en utilisant un protocole
Savoir-être : se comporter positivement envers l'environnement, avoir un sens critique, être autonome.
Type de situations :
Situation-problème liée à la vie quotidienne, environnementale (urbaine et/ou rurale) technologique ou industrielle et au travail au laboratoire, pollution, dégradation des sols, alimentation, polymères, etc., faisant intervenir l'exploitation d'un ou de plusieurs supports  nécessitant  d'identifier un problème et de le résoudre.
Type et nombre de supports :
Texte, photo, schéma et tableau. Nombre : entre 2 et 4 ...
Type de tāche attendue :
Identifier un problème, exploiter un document, un graphe..., traiter des résultats expérimentaux, et résoudre le problème.
Conditions de résolution :
Temps : 30 minutes
Travail individuel en classe ou au laboratoire
Critères utilisés pour évaluer la production :
I- Critères minimaux  :
   1. Adéquation de la production de l'élève à la situation
   2. Utilisation correcte des outils de la discipline
   3. Cohérence de la production de l'élève.
II- Critère de perfectionnement :
   4. Qualité de la présentation de la production de l'élève.
  • sur la base de ces paramètres, les épreuves d'évaluation sont élaborées en veillant d'une part à ce que les situations respectent les paramètres de la famille de situations et puissent donc être considérées comme équivalentes les unes aux autres et d'autre part à ce que la règle dite des deux tiers soit respectée (De Ketele, 1996 ; Roegiers, 2000). Cette règle consiste - au moment de l'élaboration de l'épreuve - à s'assurer que l'élève aura au moins trois occasions indépendantes de vérifier chaque critère, et - au moment de la correction - à considérer qu'un critère est maîtrisé si au moins deux occasions sur trois sont positives ;
  • les critères d'évaluation sont détaillés pour chaque situation en indicateurs sur la base desquels un barème de notation est élaboré consistant avant tout à déterminer quand le critère sera ou non considéré comme maîtrisé ;
  • chaque situation d'évaluation est préexpérimentée auprès de quelques élèves, essentiellement à des fins de régulation, et ensuite expérimentée dans un échantillon représentatif afin de permettre sa validation empirique ;
  • à côté de ces épreuves « compétences » fondées sur des situations complexes, des épreuves « ressources » semblables aux épreuves classiques sont également élaborées pour accroître l'acceptabilité de l'évaluation et en accroître le sens : si un élève ne parvient pas à résoudre une situation complexe, il est important de savoir si cela est lié au fait qu'il ne maîtrise pas les ressources à mobiliser ou qu'il ne parvient pas à les mobiliser ni à les intégrer pour résoudre la situation-problème.

3.    Quelques étapes-clés


3.1    La définition des paramètres de la famille de situations


Ce travail est essentiel parce qu'il permet de délimiter de manière concrète et précise quelle est la famille de situations concernée par la compétence. De sa qualité dépendra fortement la validité de l'inférence qui sera réalisée à partir d'une ou deux situations d'évaluation sur la maîtrise de la compétence.

La qualité de cette inférence dépend non seulement de la précision des paramètres de la famille de situations qui lui est liée, mais aussi du moment de la phase de formation : moins on est avancé dans le processus de formation, plus la précision des paramètres devra être grande et détaillée.

3.2    La définition des critères d'évaluation


Les critères d'évaluation sont un des paramètres essentiels de la famille de situations puisque c'est à travers eux que toutes les situations relatives à la compétence vont être analysées. Un critère est un point de vue auquel on se place pour évaluer un objet, une qualité attendue de celui-ci. Les critères doivent permettre d'évaluer la production de l'élève, c'est-à-dire « d'en faire sortir la valeur » (e-valuere). Il est indispensable que ces critères soient indépendants l'un de l'autre afin de ne pas évaluer deux fois la même chose (et donc de ne pas pénaliser deux fois l'élève pour la même erreur).

Ainsi, un élève « hors sujet » ne peut être pénalisé qu'une fois, à travers un critère de « pertinence » (adéquation de la production à la situation). Il convient d'évaluer sa production par d'autres critères - par exemple sa correction orthographique -, même s'il est « hors sujet ». Cet élève sera vraisemblablement en échec, parce qu'il ne satisfait pas à un critère minimal, mais au moins ce qu'il aura réussi sera reconnu.

Il est sans doute impossible et inutile de proposer une liste de critères qui seraient pertinents et exhaustifs pour toutes les disciplines et tous les niveaux. Néanmoins, il est possible d'identifier - de manière non exhaustive - quelques critères auxquels on peut se référer (voir aussi Roegiers, 2004) :
  • la pertinence, ou adéquation de la production à la situation (et notamment à la consigne) : « Est-ce que l'élève fait bien ce qu'il doit faire ? n'est-il pas hors sujet ? » ;
  • la correction ou utilisation correcte des concepts et des outils de la discipline : « Est-ce que l'élève fait correctement ce qu'il fait ? », même si ce n'est pas cela qu'il doit faire (orthographe correcte, utilisation correcte des techniques de calculs, exactitude scientifique d'une justification...) ;
  • la cohérence, c'est-à-dire l'utilisation d'une démarche logique sans contradiction interne (même si elle n'est pas pertinente), le choix cohérent des outils, l'enchaînement logique de ceux-ci, l'unité de sens de la production, etc. ;
  • la complétude, ou le caractère complet de la réponse, pour autant qu'il soit possible de déterminer ce qu'est une réponse complète ;
  • la qualité de la langue, pour les disciplines non littéraires ;
  • la qualité de la présentation du travail, de la copie de l'élève ;
  • l'utilité sociale ou la profondeur des propositions émises, par exemple dans l'analyse de problèmes sociaux, historiques, géopolitiques, d'environnement... ;
  • l'originalité de la production, spécialement pour les disciplines littéraires ou sociales ;
  • ...

La liste des critères découle toujours d'un choix effectué en fonction des objectifs des évaluateurs (et de ceux de leur système éducatif), des accents qu'ils souhaitent mettre, en tenant compte de la spécificité de chaque discipline et de chaque niveau. Il n'y a pas de liste idéale de critères qui s'imposerait de manière absolue. D'autres critères peuvent être utilisés, avec d'autres formulations, mais il faut toujours s'assurer que le critère est pertinent par rapport à la compétence et vérifier l'indépendance intercritère.

Cette affirmation d'absence de modèle absolu au niveau des critères ne va pas à l'encontre des efforts légitimes d'harmonisation (inter)nationale des critères. Par exemple, les partenaires libanais du BIEF qui ont élaboré un nouveau système d'évaluation fondé sur l'approche par les compétences ont souhaité avoir le plus de cohérence possible entre les disciplines et au sein de celles-ci dans le choix des critères, alors que ce projet porte sur toutes les disciplines tout au long des douze premières années de scolarisation. Dans un contexte international, l'équivalence des diplômes nécessiterait également une harmonisation des critères d'évaluation.

3.3    La définition et la gestion des indicateurs


L'évaluation critériée est complexe : il ne faut pas la rendre plus complexe qu'elle ne l'est. Tout le monde en est conscient, et tout tourne finalement autour des indicateurs et de ce que l'on décide de faire avec eux.

Si le critère est général et abstrait, l'indicateur est contextualisé et concret. C'est lui qui - dans la production de l'élève - apporte de l'information sur sa maîtrise de la compétence. À ce titre, il ne donne jamais qu'une indication. Un des dangers, fréquemment observé, est d'accorder à l'indicateur plus de valeur qu'il n'en a.

Ce que l'on évalue, c'est la maîtrise du critère, non pas la maîtrise de l'indicateur. Celui-ci n'est qu'un élément parmi d'autres qui permet à l'évaluateur d'estimer, d'apprécier le degré de maîtrise du critère.

Un indicateur ne devrait jamais être un « indicateur minimal » qui devrait absolument être présent pour décider de la maîtrise du critère. L'indicateur ne fait que donner une indication. Certains indicateurs sont bien sûr plus importants que d'autres, mais cela ne devrait jamais les rendre indispensables pour attester de la réussite d'un critère (et donc de la réussite de la compétence, de celle de la discipline, et de celle du cycle...).

Une question importante est de savoir comment passer de l'identification et de l'analyse des indicateurs à l'appréciation du critère... Il n'y a sans doute pas de bonne et unique solution, mais des solutions. Il faut néanmoins éviter de déboucher sur un système infaisable, parce que trop difficile à gérer par les correcteurs. S'ils doivent tout le temps se référer à leur grille de correction, à leur barème, on peut être sûr que très rapidement, ils ne le feront plus... et finiront par revenir à une évaluation classique.

L'expérience nous a montré que l'acte de correction d'épreuves constituées de situations complexes est une opération difficile et reste fortement influencé par la personnalité, les valeurs et l'histoire des correcteurs. Lors de la correction d'épreuves classiques constituées d'items, il suffit - dans la plupart des cas - de constater si la réponse est exacte ou non. On fait ensuite la somme du nombre de points attribués à chaque item réussi pour obtenir la note finale. Le seul critère utilisé, de manière plus ou moins implicite, est « l'exactitude de la réponse » et la réponse à chaque item peut être évaluée de manière séparée. L'évaluation critériée d'une production complexe nécessite de la part des correcteurs une sorte de révolution culturelle dans la manière de considérer les copies des élèves.

Notamment, on a pu constater la difficulté des correcteurs à préserver l'indépendance des critères. Ils acceptent facilement d'utiliser des critères qui portent sur des dimensions différentes, mais cette utilisation n'est pas toujours cohérente dans la mesure où ce n'est pas toujours le même critère qui prime. La « logique » de nombreux correcteurs est, malheureusement, de privilégier ce qui pénalise l'élève, alors que la logique critériée de l'évaluation, surtout en termes de certification, devrait être au contraire de privilégier les réussites des élèves (Gerard - BIEF, 2008).

Ce travail de définition et de gestion des indicateurs est fondamental, car il permet de réguler les exigences attendues dans le cadre de l'approche par les compétences. En effet, si l'approche par les compétences de base poursuit explicitement des objectifs d'équité, elle place la barre très haut en termes pédagogiques :
  • d'une part, elle se situe aux niveaux taxonomiques les plus élevés : la mobilisation et la résolution de problèmes sont les deux niveaux supérieurs de la taxonomie des opérations cognitives proposées par D'Hainaut (1983) ;
  • d'autre part, elle établit un seuil de réussite élevé puisque - dans son application stricte - elle conduit à ne considérer qu'une compétence est maîtrisée que lorsque tous les critères minimaux sont maîtrisés, la réussite dans une discipline étant liée à la maîtrise de toutes les compétences et la réussite d'une année ou d'un cycle scolaire devant se fonder sur la réussite dans toutes les disciplines... ;
  • enfin, l'expérience nous montre que les concepteurs de situations ont souvent tendance à élaborer des situations plus complexes, voire plus compliquées, que les paramètres de la famille de situations ne le requièrent.

Il faut donc un peu de souplesse quelque part. Cela peut se faire principalement dans la définition des indicateurs et dans leur gestion définie au sein d'un barème de notation et concrètement utilisée au moment de la correction. Il ne s'agit pas d'être laxiste, mais de définir des seuils de réussite suffisamment souples - ce n'est pas la perfection qui est recherchée - et d'orienter le processus de correction - surtout au moment de la certification - vers la valorisation de ce qui a été réussi plutôt que vers la sanction de ce qui a été raté.


Conclusion


Pour des pays ayant inscrit leur système éducatif dans la perspective de l'approche par les compétences, l'évaluation des acquis scolaires par des situations complexes est la seule pertinente puisqu'elle est la seule à susciter la mobilisation et l'intégration de ressources pour résoudre des problèmes.

Même dans une perspective strictement formative, l'utilisation de situations complexes permet d'optimiser le diagnostic des difficultés en permettant de disposer et de traiter des informations non seulement sur la maîtrise ponctuelle d'objectifs spécifiques, mais aussi sur leur mobilisation et leur intégration dans la résolution de problèmes.

L'élaboration, l'utilisation et la correction de telles épreuves présentent cependant un ensemble de difficultés qui nécessitent encore de nombreux travaux pour être pleinement résolues.

Les difficultés principales tiennent
  • à la définition claire et précise des paramètres de la famille de situations pour garantir la meilleure équivalence possible entre les différentes situations complexes, même si cette équivalence ne sera jamais totale ;
  • à la définition des critères d'évaluation qui doivent être à la fois pertinents et indépendants ;
  • à la définition des indicateurs et de leur mode de gestion pour apprécier les critères dans un système qui soit à la fois pertinent et faisable ;
  • au processus de correction des productions des élèves et d'appréciation des critères qui nécessite de la part des correcteurs un détachement par rapport à leurs pratiques habituelles ainsi qu'un travail spécifique pour réduire au mieux l'inévitable désaccord intercorrecteurs.

Ces difficultés réelles n'empêchent pas l'élaboration et l'utilisation d'épreuves par situations complexes. Elles invitent à la vigilance et à la recherche de solutions.


6.    Références


Beckers, J. (2002). Développer et évaluer des compétences à l'école : vers plus d'efficacité et d'équité. Bruxelles : Labor Éducation.
Bourdieu, P. et Passeron, J.-C. (1970). La reproduction. Éléments pour une théorie du système d'enseignement. Paris : Éditions de Minuit.
De Ketele, J.-M. (1996). « L'évaluation des acquis scolaires : quoi ? pourquoi ? pour quoi ? », Revue Tunisienne des Sciences de l'Éducation, 23, 17-36.
De Ketele, J.-M. (2000). « En guise de synthèse : Convergences autour des compétences ». In C. Bosman, F.-M. Gerard, X. Roegiers (Éds). Quel avenir pour les compétences ? (p.187-191). Bruxelles : De Boeck.
De Ketele, J.-M. et Gerard, F.-M. (2005). « La validation des épreuves d'évaluation selon l'approche par les compétences », Mesure et évaluation en Éducation, Volume 28, n°3, 1-26.
D'Hainaut, L. (1983). Des fins aux objectifs. Bruxelles-Paris : Labor-Nathan.
Gerard, F.-M. - BIEF. (2008). Évaluer des compétences - Guide pratique. Bruxelles : De Boeck.
Jonnaert, P. (2002). Compétences et socioconstructivisme - Un cadre théorique. Bruxelles : De Boeck.
Le Boterf, G. (1994). De la compétence. Essai sur un attracteur étrange. Paris : Éditions de l'organisation.
Legendre, M.-F. (2001). « Sens et portée de la notion de compétence dans le nouveau programme de formation », Revue de l'AQEFLS, 23(1), 12-30.
Perrenoud, P. (1997). Construire des compétences dès l'école. Paris : ESF.
Rey, B. (1996). Les compétences transversales en question. Paris : ESF.
Rey, B., Carette, V., Defrance, A. et Kahn, S. (2003). Les compétences à l'école - Apprentissage et évaluation. Bruxelles : De Boeck.
Roegiers, X. (2000). Une pédagogie de l'intégration. Bruxelles : De Boeck.
Roegiers, X. (2004). L'école et l'évaluation. Bruxelles : De Boeck.
Scallon, G. (2004). L'évaluation des apprentissages dans une approche par les compétences. Bruxelles : De Boeck Université.
Tardif, J. (2006). L'évaluation des compétences - Documenter le parcours de développement. Montréal : Chenelière Éducation.

BIEF