Taille de police : small-medium-big

Les experts du BIEF
Xavier ROEGIERSPrésident

Curriculum et évaluation : des liens qui ne seront jamais assez forts

Currículo e Avaliação: ligações que nunca serão suficientemente fortes, in M.P. ALVES, & J.-M. DE KETELE. (Dir.). Do Currículo à avaliação, da avaliação ao currículo, Porto : Porto Editora, pp. 143-158. / GERARD, F.-M. & ROEGIERS, X. / 2011

Télécharger la publication


L'évaluation est indissociable du processus pédagogique, à tel point que certains qualifient celui-ci de processus d'enseignement-apprentissage-évaluation. Cette appellation est intéressante, car elle montre qu'au centre du processus pédagogique, il y a l'apprentissage, et que l'enseignement et l'évaluation sont deux actions indispensables à l'épanouissement de celui-ci. Associer l'évaluation au processus d'enseignement-apprentissage permet de montrer de manière forte qu'il ne s'agit pas seulement d'un processus assorti d'une obligation de moyens, mais qu'il importe aussi que ce processus débouche sur des résultats clairement identifiables et mesurables (Lessard & Meirieu, 2008).

La plupart des curriculums intègrent dès lors aujourd'hui cette dimension « évaluation ». Cette association est sans doute heureuse, car elle permet d'insister sur le besoin d'efficacité et d'équité des systèmes éducatifs, mais elle peut aussi être pernicieuse lorsque l'évaluation risque d'occulter l'essentiel qui reste que les élèves apprennent réellement ce qu'ils ont à apprendre. Certes, l'évaluation permet de constater si les élèves ont appris ou non, mais ce n'est pas elle qui permet aux élèves d'apprendre.

Un enjeu important pour les systèmes éducatifs est dès lors de trouver un juste équilibre entre les démarches d'apprentissage et celles d'évaluation.

1.    Liens entre évaluation et curriculums

1.1    L'omniprésence de l'évaluation


Déjà en 2001, Gérard Figari évoquait le phénomène galopant de la généralisation d'une « culture de l'évaluation » dans le monde scolaire, qui tire sa source « d'opérations d'évaluation initiées par des institutions ou des observatoires, au moyen d'expertises, d'études et de recherches » (Figari, 2001, page 235). Gérard Figari ajoute avec raison que ce phénomène « ne se déroule plus seulement dans des espaces extérieurs, mais au sein même de l'école ».

Les récentes évolutions des systèmes éducatifs lui ont — heureusement et malheureusement — donné raison, à plus d'un titre. En effet, ce constat s'est encore accru, à un tel point que bon nombre de programmes internationaux d'appui aux systèmes éducatifs, notamment sur le continent africain, se sont polarisés sur la composante « évaluation des produits de l'éducation » par la définition d'indicateurs globaux de l'action éducative (c'est assez facile à faire...) en reléguant souvent au second plan les appuis au développement de la composante relative aux apprentissages en classe (c'est beaucoup plus difficile à faire...). Cette évolution caractérise aussi les systèmes éducatifs occidentaux spécialement dans les pays de l'OCDE autour des études PISA, et en particulier celui de la Belgique francophone où les « avancées » les plus marquantes de ces dernières années consistent en l'instauration d'évaluations externes, certificatives ou non, alors que traditionnellement cette fonction était attribuée aux seuls enseignants.

Autrement dit, on met de plus en plus de ressources pour évaluer les produits de l'éducation à laquelle on attribue cependant de moins en moins de ressources. Cette contradiction n'est sans doute pas un phénomène isolé et découle dans une certaine mesure de la priorité donnée dans nos sociétés de ce début du 21e siècle à l'immédiatement consommable. Cette tendance à surévaluer ne témoigne-t-elle pas ainsi d'une tendance à ne gérer qu'à court terme et à contrôler des résultats au lieu d'aider les acteurs des systèmes, dérives qui ont conduit notamment à une certaine crise financière ?

L'évolution des systèmes éducatifs au cours de ces dernières années se caractérise aussi par le fait que le développement de cette culture de l'évaluation, entendue dans le sens d'évaluation relative aux systèmes d'éducation et de formation — la manière dont ils fonctionnent, et leurs produits —, va de pair avec la poursuite du développement d'une autre culture de l'évaluation, à savoir celle de l'évaluation des acquis des élèves, avec des indicateurs relatifs à la performance scolaire proprement dite, c'est-à-dire au niveau des acquis scolaires de chaque élève.

Ce phénomène tire sa source de plusieurs évolutions, dont deux nous paraissent prépondérantes. Tout d'abord, face aux développements récents des curriculums, et en particulier des curriculums en termes de compétences (Roegiers, 2008) — que ce soit dans une optique de développement de « standards » chers au monde anglo-saxon, dans une optique de développement de compétences de vie (life skills), comme le préconisent les principales coopérations internationales multilatérales et bilatérales, dans une optique de développement de compétences transversales ou encore dans une optique d'intégration des acquis (pédagogie de l'intégration) —, l'évaluation des acquis semble constituer l'aune à laquelle se mesurent les réussites, les demi-réussites et les échecs de l'une ou l'autre approche. Autrement dit, la réussite d'une approche semble être essentiellement fonction de sa capacité à avoir pu intégrer la problématique de l'évaluation des acquis des élèves.

Une autre source provient de la montée en puissance des épreuves internationales (TIMMS, PISA, MLA, PIRLS...), qui ont une double « vertu » : d'un point de vue passif, elles permettent une comparaison des performances des systèmes éducatifs, puisque ces épreuves débouchent sur un classement, mais, d'un point de vue plus actif, elles constituent aussi une occasion de situer un système éducatif par rapport aux autres, et d'y apporter des régulations. Ces épreuves posent cependant plusieurs questions, dont la principale est de savoir ce qu'on évalue et ce qu'on n'évalue pas. Ainsi, ces évaluations ne s'intéressent pas à des compétences aussi fondamentales que la communication orale, la production écrite ou des « compétences de vie ». Elles se fondent de plus sur l'idée d'un « élève idéal standard », sans prendre en compte des réalités locales, régionales ou nationales alors que celles-ci expliquent une bonne part de la variance, comme le montrent par exemple les études réalisées autour du concordat HarmoS, en Suisse (Behrens, 2009). Malgré les critiques que l'on peut adresser à ces épreuves internationales, force est de constater qu'elles représentent aujourd'hui un repère majeur dans l'évolution des systèmes éducatifs, qui conduit ces derniers à renforcer leurs dispositifs d'évaluation externes des acquis des élèves, comme c'est le cas par exemple en Belgique francophone.

Quoi qu'il en soit, il semble, aujourd'hui plus encore que jamais, que l'évaluation est indissociable de l'élaboration des curriculums. Un système éducatif qui élaborerait des curriculums sans se poser la question de l'évaluation des acquis des élèves risque d'être confronté à de nombreuses difficultés lorsqu'il s'agira de les évaluer. C'est par exemple le cas des systèmes qui ont fondé en tout ou en partie leur approche curriculaire sur des « compétences transversales ». Comment évaluer celles-ci ? Comment déterminer si un élève est, notamment, capable ou non de « traiter de l'information », dans la mesure où le fait de pouvoir traiter de l'information dans une situation de type historique ne garantit pas de pouvoir le faire dans une situation mathématique et vice-versa ? Il est bien sûr possible (et nécessaire) de réaliser de nombreuses activités d'apprentissage nécessitant de traiter de l'information. Mais s'il n'est pas possible d'évaluer la maîtrise par des élèves d'une telle « compétence transversale », on risque fort que les enseignants abandonnent progressivement le travail sur ces compétences - pourtant fondamentales - pour se concentrer sur ce qui est réellement évaluable et qui permettra en temps utile de « certifier » les acquis des élèves, ce qui d'ailleurs signifie souvent un retour en arrière, purement et simplement. Autrement dit, si l'évaluation certificative ne prend pas en compte les contenus du curriculum parce qu'il n'est pas possible de le faire, les enseignants reporteront leurs efforts sur ce qui est réellement évalué pour certifier.

1.2    L'évaluation au coeur des curriculums


Les dernières évolutions préconisent de placer la notion de curriculum au coeur des réformes des systèmes éducatifs. Cette notion englobe les problématiques liées à l'évaluation. Cette façon de voir rompt avec les pratiques anciennes qui consistaient à envisager séparément une révision des programmes scolaires et une révision du système d'évaluation. Autrement dit, la problématique de l'évaluation était abordée de façon parallèle à la question des programmes scolaires.

L'introduction de ce concept de « curriculum » n'a pas toujours provoqué les changements de mentalité espérés en matière de conception d'une réforme. En effet, trop souvent encore, la tendance est de dire « on va changer les programmes, et l'organisation des apprentissages qui s'ensuit, et on étudiera après coup la manière d'adapter l'évaluation des acquis aux changements desdits programmes et de l'organisation des apprentissages ». Parfois même, ce sont deux directions au sein d'un même ministère qui sont chargées, l'une des programmes, et l'autre de l'évaluation. De la sorte, et malgré qu'on parle de « curriculum », on revient implicitement à l'ancienne conception des programmes scolaires.

L'enjeu d'une conception qui conduit à revoir l'ensemble du curriculum est justement d'aborder, au départ, et de manière articulée, les différentes composantes que représentent les programmes scolaires, l'organisation des apprentissages, l'évaluation, la formation des enseignants et le matériel didactique, pour ne citer que les principales.

Le fait de se poser la question de l'évaluation dès l'élaboration du curriculum, et notamment de préciser dès le départ les situations qui permettront d'évaluer les compétences des élèves, permet de mieux garantir que les curriculums seront réellement mis en oeuvre, car les enseignants peuvent mieux percevoir ce que les élèves devront être à même de faire quand ils seront évalués. Le risque existe cependant de ne concevoir les curriculums qu'en termes d'évaluation. Si les outils fournis aux enseignants pour traduire de nouveaux curriculums en actions concrètes n'abordent le processus d'enseignement-apprentissage qu'à travers des situations d'évaluation, il se peut que les enseignants ne prennent en compte les nouveaux curriculums que par le prisme de l'évaluation, en continuant à se référer pour l'apprentissage à leurs anciennes pratiques.

Par exemple, si les concepteurs de curriculums souhaitent que les élèves soient à même de résoudre des situations complexes en mobilisant différentes ressources, il est utile qu'ils précisent de manière concrète les types de situations que les élèves devraient pouvoir résoudre. Le meilleur moyen d'y arriver est de proposer aux enseignants, dans le curriculum ou dans des outils d'accompagnement, des exemples de situations qui correspondent aux compétences visées. Ces situations devraient à la fois servir de support pour l'apprentissage des compétences et pour leur évaluation. Le risque réel est qu'elles ne soient utilisées que dans une perspective d'évaluation et de déboucher sur le constat que les élèves ne sont pas plus compétents qu'avant.

L'enjeu est donc double : il importe de ne pas dissocier les curriculums de l'évaluation, car ils risqueraient de n'être jamais mis en oeuvre, ou de manière très parcellaire. À l'inverse, il convient aussi d'éviter de ne présenter les curriculums qu'en termes d'évaluation, car ils ne seraient mis en oeuvre qu'à travers des activités d'évaluation en faisant l'impasse sur les indispensables activités d'apprentissage.

2.    Étude de cas : Madagascar


Madagascar est un bel exemple de la manière dont l'évaluation peut être intimement liée à l'élaboration de nouveaux curriculums, dans une interaction constante et dynamique.

Au début de l'année 2003, les responsables du système éducatif malgache s'interrogent sur l'efficacité de l'enseignement fondamental. Une étude est alors réalisée pour analyser les pratiques d'évaluation des apprentissages, en recueillant des informations qualitatives sur les faits et les représentations des acteurs du système d'évaluation (Ranorovololona, 2006).

Cette analyse met notamment en évidence que les pratiques d'apprentissage et d'évaluation sont orientées quasi exclusivement vers des savoir-reproduire, accompagnés de quelques savoir-faire de l'ordre de l'application simple. Par exemple, l'analyse des épreuves du C.E.P.E. (Certificat d'Études Primaires Élémentaires) - Concours d'entrée en classe de 6e montre qu'elles ne contiennent aucune situation de communication, aucune résolution de problèmes, aucune mise en relation entre des démarches, très peu de contextualisations et par ailleurs très limitées, etc.

Sur cette base, et sur d'autres encore comme le manque d'efficacité et le manque d'équité du système éducatif (Roegiers, 2007), les responsables optent pour l'approche par compétences (APC) comme moyen d'améliorer l'efficacité et l'équité du système éducatif. Dès le départ, avec l'accompagnement du BIEF et le soutien de l'UNICEF, plusieurs démarches sont mises en oeuvre :

  • réalisation de recherches-actions permettant d'expérimenter l'intégration des apprentissages, à travers des « cahiers de situations » ;
  • formation des enseignants, des encadreurs et des responsables à l'approche par les compétences ;
  • développement d'une base de données afin de piloter le dispositif sur la base de l'évaluation des acquis des élèves, à travers deux cohortes d'élèves constituées chaque fois d'un échantillon expérimental (APC) et d'un échantillon témoin (NON-APC).


Le dispositif a été implanté de manière progressive, selon le schéma suivant (MENRS, 2008) :

Tableau 1 - Chronologie du dispositif

 

Août 2003

2003-2004

2004-2005

2005-2006

2006-2007

2007-2008

2008-2009

Conception des outils

CP

CE

CM1

CM2

 

 

 

Expérimentation

 

CP

CE

CM1

CM2

 

 

Prégénéralisation à 50%

 

 

CP

CE

CM1

 

 

Généralisation

 

 

 

CP

CE

CM1 CM2

 

Base de données

 

 

Coh1: CP2

Coh2: CP1

Coh1: CE

Coh2: CP2

Coh1: CM1

Coh2: CE

Coh1: CM2

Coh2: CM1

 

Évaluation certificative

 

 

 

CP2

CE

CEPE à l'essai

CEPE « APC »

 

2.1    En quoi consiste le dispositif ?


Les changements principaux introduits par l'APC tiennent au fait que l'ensemble des apprentissages de chaque année est articulé autour de 2 ou 3 compétences de base à acquérir par les enfants dans chaque discipline.

L'année est divisée en 5 « bimestres » de 6 semaines environ. Les 5 premières semaines de chaque période sont consacrées aux apprentissages ponctuels des « ressources » qui vont nourrir les « compétences » : les savoirs, les savoir-faire, les savoir-être. Ces apprentissages se déroulent dans un premier temps en tout cas, selon les pratiques habituelles des enseignants, avec les manuels existants. Le changement principal intervient, normalement, à la fin de la dernière semaine du bimestre, appelée « semaine d'intégration » ou « période d'intégration », au cours de laquelle l'enseignant arrête les apprentissages ponctuels, et soumet aux élèves, avec l'aide de cahiers de situations, des situations complexes au sein desquelles chaque élève est invité à intégrer ses acquis. Ces situations correspondent à un niveau déterminé de maîtrise de la compétence, appelé « palier de la compétence » (Roegiers, 2000, 2003). Une première situation complexe est présentée aux élèves à titre d'apprentissage de l'intégration. Elle est travaillée en partie en groupe, et en partie individuellement. Une deuxième situation, qui fait partie de la même famille de situations que la première, est ensuite présentée aux élèves, de manière tout à fait individuelle. Cette deuxième situation est suivie d'une remédiation immédiate, en fonction des difficultés rencontrées. Enfin, si nécessaire une troisième situation est proposée individuellement à titre d'évaluation formative, suivie d'une nouvelle remédiation basée sur les erreurs relevées chez les élèves.

2.2    Place de l'évaluation dans le dispositif


L'évaluation des acquis des élèves est présente à trois niveaux correspondant à trois perpectives :

  • une perspective de régulation : au terme de chaque semaine d'intégration, les enseignants pratiquent une évaluation formative qui doit leur permettre de diagnostiquer, sur la base des critères d'évaluation, les difficultés rencontrées par les élèves et d'y remédier de manière appropriée ;
  • une perspective de pilotage : la base de données permet de suivre l'efficacité et l'équité du dispositif. À l'aide de prétests et de post-tests, les acquis des élèves dans les trois disciplines-outils (malagasy, mathématiques, français) sont évalués d'une part en termes de ressources (correspondant aux savoirs et aux savoir-faire « classiques ») et d'autre part en termes de compétences, à travers des situations complexes (Gerard, 2005, 2008 ; Roegiers, 2003, 2004). Les hypothèses expérimentales sont que les acquis des élèves de l'échantillon expérimental (APC) ne devraient pas être inférieurs à ceux de l'échantillon témoin (NON-APC) en ce qui concerne l'évaluation des ressources, mais devraient être supérieurs pour l'évaluation des compétences ;
  • une perspective certificative : afin d'accompagner la généralisation du dispositif, les évaluations certificatives pour les passages de cycle et pour l'obtention du CEPE au terme du CM2 ont été réalisées en intégrant l'évaluation des compétences. Pour le CEPE, une expérimentation a été réalisée en 2008 avant généralisation en 2009.

2.3    Résultats issus de la base de données


La base de données a permis de suivre les résultats des élèves de 2 cohortes, issues d'échantillons représentatifs de la population des élèves malgaches, et permettant de comparer des résultats d'élèves APC à ceux d'élèves NON-APC.

2.3.1    Résultats pour la 1re cohorte

Tableau 2 -Scores moyens obtenus aux post-tests par les élèves de la 1recohorte

 

 

N

Mg_Ress

Mg_Comp

Mt_Ress

Mt_Comp

Fr_Ress

Fr_Comp

CP2 (2005)

APC

428

61,3

63,3

56,7

44,8

73,4

41,6

Non-APC

445

60,7

63,1

55,5

44,6

71,5

43,4

CE (2006)

APC

603

31,8

55,6

32,1

44,3

47,6

23,0

Non-APC

293

31,5

57,5

32,7

39,2

47,1

19,6

CM1 (2007)

APC

553

35,3

66,1

41,9

28,7

35,1

45,9

Non-APC

261

34,6

63,6

39,1

29,6

33,9

41,1

CM2 (2008)

APC

605

52,1

62,9

61,0

35,8

48,8

44,2

Non-APC

342

52,6

57,5

62,5

32,9

47,5

30,4

Légende :

·      Mg :Malagasy (langue malgache) ; Mt : Mathématique ; Fr :Français (2e langue d'enseignement)

·      Ress :scores « ressources » (savoirs et savoir-faire isolés) ;Comp : scores « compétences » (résolution d'une sitiuationcomplexe)

·      APC :échantillon expérimental « approche par les compétences » ;Non-APC : échantillon témoin

·      Les scores sontdes pourcentages, non normalisés.

·      Les cases griséesindiquent les différences positives significatives.

Constats : au début de la mise en oeuvre de l'APC, il ne semble pas y avoir eu d'effet systématique de l'APC en termes d'impact sur les acquis des élèves. Cependant, les résultats obtenus en 2008 montrent des différences très significatives dans l'évaluation des compétences des trois disciplines, à l'avantage de l'échantillon APC dont les élèves ont pratiqué l'APC durant trois ou quatre années.

2.3.2    Résultats pour la 2e cohorte

Tableau 3 - Scoresmoyens obtenus aux post-tests par les élèves de la 2e cohorte

 

 

N

Mg_Ress

Mg_Comp

Mt_Ress

Mt_Comp

Fr_Ress

Fr_Comp

CP1 (2005)

APC

676

56,9

54,6

61,7

32,9

/

/

Non-APC

352

43,1

45,4

50,5

20,3

/

/

CP2 (2006)

APC

604

65,5

54,6

54,3

58,7

73,3

37,4

Non-APC

321

60,2

49,2

49,7

57,1

64,0

31,2

CE (2007)

APC

702

32,2

60,3

32,6

54,3

46,6

29,1

Non-APC

1501

24,3

55,2

26,0

48,2

36,5

18,9

CM1 (2008)

APC

626

35,2

66,9

38,1

40,5

37,4

42,9

Non-APC

1196

30,6

67,6

34,8

34,2

30,9

34,5



Constats : il y a un effet systématique de l'APC en termes d'impact sur les acquis des élèves de cette 2e cohorte (dont les enseignants engagés dans le dispositif en ont donc une meilleure connaissance et expérience) : les moyennes obtenues par les élèves des classes APC sont systématiquement supérieures à celles des classes Non-APC, cela de manière significative (sauf pour les compétences en mathématiques au niveau du CP2 et en malagasy au niveau du CM1), voire même de manière très significative. La différence moyenne pour toutes les données est de 7,8% en faveur des élèves APC.

2.3.3    Comparaison des résultats post-test 2007 (Non-APC) vs post-test 2008 (APC) CM2


En juin 2007, 1713 élèves de CM2, issus des 120 écoles concernées par la base de données et qui n'avaient pas du tout été concernés par le dispositif APC, sauf quelques-uns dans le cadre de l'expérimentation, ont été évalués sur leur maîtrise des ressources et des compétences dans les trois disciplines.
En juin 2008, 1834 élèves de CM2, issus des 120 mêmes écoles, ont subi les mêmes tests. Ces élèves ont normalement tous bénéficié de l'APC dans le cadre de la généralisation survenue en 2007-2008.
Le tableau suivant présente les résultats obtenus, qui seront ensuite discutés.

Tableau 4 - Comparaison des résultats2007 (N-APC) <> 2008 (APC) pour l'évaluation des ressources

 

2007 (N-APC)

2008 (APC)

P Test t

Malagasy Ressources

49,74

51,81

0,0002

Maths Ressources

62,63

60,50

0,0004

Français Ressources

45,78

46,51

0,2424

« Ressources »

52,72

52,94

0,6422


Constats : si des différences légèrement significatives apparaissent en ce qui concerne la maîtrise des ressources en malagasy, à l'avantage de l'échantillon APC, et en ce qui concerne la maîtrise des ressources en mathématiques, à l'avantage de l'échantillon Non-APC, il n'y a cependant pas de différences globales. Ce constat confirme la première hypothèse : l'introduction toutes les cinq semaines de modules d'intégration, qui limitent le temps consacré à l'apprentissage des ressources (savoirs et savoir-faire), n'influence pas de manière significative la maîtrise de celles-ci. Il n'y a pas de gain lié aux semaines d'intégration, mais surtout il n'y a pas de déperdition.

Tableau 5 - Comparaison des résultats2007 (N-APC) <> 2008 (APC) pour l'évaluation des compétences

 

2007 (N-APC)

2008 (APC)

P Test t

Malagasy Compét. Ecrit

45,06

54,91

8,67E-35

Malagasy Compét. Oral

54,12

62,69

1,56E-28

Maths Compétences

22,82

32,54

1,24E-37

Français Compét. Ecrit

24,94

33,64

8,51E-36

Français Compét. Oral

29,40

34,81

5,87E-11

« Compétences »

35,27

43,72

6,23E-55


Constats : en ce qui concerne les évaluations des compétences, tous les résultats de l'échantillon APC sont très significativement supérieurs à ceux de l'échantillon Non-APC, que ce soit pour les compétences orales et écrites en Malagasy et en Français, ainsi que pour les mathématiques. La moyenne de tous les scores « Compétences » est ainsi très significativement supérieure pour l'échantillon APC interrogé en 2008, par rapport à l'échantillon Non-APC interrogé en 2007. Ce constat confirme de manière très nette la deuxième hypothèse : l'introduction des modules d'intégration, à raison d'une semaine par bimestre, accroît de manière très significative la possibilité pour les élèves de résoudre des situations complexes et significatives.

En réalité, si le gain entre les deux échantillons est très important, il n'est pas suffisant en termes de maîtrise : les scores restent faibles, même s'ils sont en nette progression. L'introduction de modules d'intégration est efficace et équitable, mais elle ne fait - malheureusement - pas de miracles : il reste encore beaucoup de travail à faire pour améliorer l'efficacité des pratiques des enseignants. Notamment et comme nous en avons dénoncé le risque plus haut, on a pu observer que de nombreux enseignants n'utilisent les situations d'intégration mises à leur disposition qu'à des fins d'évaluation, en oubliant de les exploiter avant tout dans une perspective d'apprentissage de l'intégration. Un travail de formation et d'accompagnement afin que les enseignants se concentrent avant tout sur l'apprentissage de l'intégration est à ce niveau indispensable pour accroître encore l'efficacité du dispositif.

Notons enfin que ces résultats rejoignent ceux qui ont été obtenus dans plusieurs pays, à travers des études nationales ou internationales, portant sur la pédagogie de l'intégration (Altet & Develay, 1999 ; Amin, 2004 ; Bipoubout, 2007 ; Lynd 2006).


3.    Évaluation des ressources vs évaluation des compétences


La première caractéristique de l'évaluation des acquis des élèves devrait être sa pertinence par rapport aux curriculums. En d'autres termes, l'évaluation devrait prendre avant tout en compte les orientations fournies par les curriculums. Cette affirmation triviale ne va pourtant pas de soi une fois qu'on observe les dispositifs concrets d'évaluation. La pertinence de l'évaluation est une dimension qui passe souvent après les deux autres caractéristiques promues par la théorie classique des tests, la validité et la fiabilité (De Ketele & Gerard, 2005). Il en est ainsi des systèmes éducatifs qui, tout en étant engagés dans une approche par les compétences, continuent à évaluer, dans les évaluations systématiques comme les évaluations externes certificatives ou les enquêtes internationales, avec des tests fondés sur des standards et constitués d'items dispersés organisés aujourd'hui le plus souvent en fonction de la théorie de la réponse à l'item.

Au stade actuel, deux dispositifs émergent pour évaluer les compétences :
  • le portfolio (Scallon, 2004 ; Tardif, 2006) qui offre plusieurs avantages en tant qu'outil d'évaluation. D'une part, il permet de partir des compétences réelles des élèves plutôt que de partir des compétences visées pour évaluer les compétences réelles (Gerard, 2006). En ce sens, il est un véritable outil d'évaluation authentique (Mottier-Lopez, 2006). D'autre part, il implique la participation de l'élève à la sélection des contenus, à la définition des critères de sélection et d'appréciation des travaux, ainsi que le développement de pratiques métacognitives (Nunziati, 1990). Le portfolio devient ainsi lui-même outil d'apprentissage : en le créant, l'élève est supposé apprendre mieux et plus en profondeur en le rendant conscient de ses apprentissages ;
  • les « situations complexes construites » (Gerard, 2005, 2008 ; Gerard - BIEF, 2008 ; Rey, Carette, Defrance & Kahn, 2003 ; Roegiers, 2004) qui consistent à confronter l'étudiant à une situation complexe dont la résolution nécessite la mobilisation de différentes ressources, tant internes qu'externes. Si l'évaluation par les situations complexes se révèle un processus complexe (Gerard, 2008), elle reste une méthode relativement économique. En effet, une fois le processus maîtrisé, les enseignants peuvent s'échanger des situations. On voit ainsi se développer de plus en plus des banques de situations, que ce soit à l'échelon local, régional ou national, par exemple en Belgique, au Liban, au Québec..., ou encore au niveau international, grâce notamment à la Communauté des pratiques suscitée par le Bureau International de l'Éducation (BIE, UNESCO).

Quel que soit le dispositif choisi (les deux peuvent coexister), une question se pose, tant au moment de la conception des curriculums que pour leur mise en oeuvre : faut-il continuer à évaluer les ressources ou faut-il baser l'évaluation uniquement sur les compétences ?

La réponse est vraisemblablement différente selon la fonction de l'évaluation. Dans le cadre d'une évaluation formative, l'essentiel est de pouvoir faire le meilleur diagnostic possible et d'apporter les remédiations nécessaires en fonction des difficultés rencontrées par les élèves. Il est dès lors essentiel d'évaluer les ressources et les compétences afin de cerner au mieux la situation de l'élève, d'autant plus que des difficultés dans la maîtrise des ressources entraînent la plupart du temps et logiquement des difficultés dans la maîtrise des compétences. Évaluer les ressources, par des items classiques portant sur des savoir-faire ciblés, permet de s'assurer que les ressources sont maîtrisées (Rey, Carette, Defrance & Kahn, 2003).

Pour une évaluation utilisée à des fins de pilotage d'une réforme s'inscrivant dans l'approche par les compétences, il est aussi important de recueillir des informations tant sur la maîtrise des ressources que sur celle des compétences afin de s'assurer qu'il n'y a pas de déperdition au niveau de l'apprentissage des ressources et qu'il y a des gains en termes de compétences.

Enfin, dans le cadre de l'évaluation certificative, la réponse pourrait être autre sur un plan théorique. Ce qui doit être maîtrisé par les élèves, ce sont les compétences qui elles-mêmes intègrent les ressources. On pourrait donc se contenter d'évaluer les compétences, par exemple par des situations complexes. Néanmoins, cette position comporte plusieurs difficultés :
  • sur un plan théorique d'abord, l'évaluation même à des fins certificatives ne devrait pas se contenter du verdict final (maîtrise ou non), mais doit donner du sens à celui-ci. En cas de non-maîtrise, une évaluation des seules compétences ne permettra pas d'identifier la cause de la non-maîtrise : est-elle due à l'impossibilité pour l'élève de mobiliser ses ressources pour résoudre la situation ou est-elle liée à une non-maîtrise des ressources elles-mêmes ?
  • sur le plan de l'acceptabilité sociale, l'absence d'une évaluation des ressources risque de déstabiliser certains bénéficiaires de l'évaluation, notamment les parents.

Il est donc préférable d'évaluer tant les ressources que les compétences. La question qui se pose alors, pour l'évaluation certificative, est de savoir quel poids accorder aux unes et aux autres dans le processus de décision. Il n'existe pas à cet égard de réponse unique, même si on peut penser a priori que l'évaluation des ressources ne devrait pas représenter plus de 25% des points, car c'est l'évaluation des compétences qui importe pour un système engagé dans une approche par les compétences. Néanmoins, si on prend en compte les exigences de faisabilité du système d'évaluation, il est parfois plus simple d'accorder autant de poids à l'évaluation des ressources que des compétences. C'est par exemple la solution qui a été retenue à Madagascar.

Comme souvent en matière de pédagogie, il n'y a pas une et une seule bonne solution. L'important est de savoir ce que l'on veut et d'opter pour la solution qui est la plus en cohérence. Le choix dépendra parfois des visées éducatives qu'on se donne : veut-on préparer à réussir les études secondaires ou les études supérieures ? Veut-on avant tout amener les élèves à réussir ou à se dépasser ? Ces options fondamentales influencent les choix en matière d'évaluation. On pourrait croire que ces choix sont arbitraires, mais ils ne le sont que lorsqu'ils ne sont pas conscients.

En réalité, dans le domaine des sciences sociales - et donc de l'évaluation des acquis des élèves -, tout est toujours une question d'équilibre à trouver entre trois pôles :
  • la pertinence sociale : en matière d'évaluation des compétences, les hypothèses les plus pertinentes sont « on n'évalue que les compétences » et « on évalue à partir des situations (tâches) qui sont les plus pertinentes sur le plan social » ;
  • la validité interne : l'épreuve d'évaluation des compétences doit être bien construite, les critères bien identifiés et indépendants, les indicateurs pertinents et bien gérés... et le système de décision doit éviter les réussites abusives, mais surtout les échecs abusifs ;
  • la faisabilité opérationnelle : il est plus faisable de constater qu'une réponse est correcte ou non plutôt que d'utiliser des critères d'évaluation, d'additionner des points que de vérifier si les deux tiers des critères sont maîtrisés, de n'accorder les points liés à un critère de perfectionnement que si un critère minimal non maîtrisé a au moins une maîtrise partielle...


La solution à retenir dans la prise en compte de l'évaluation des ressources et celle des compétences est la solution qui, dans le contexte où l'on se trouve, optimise ces trois dimensions. On pourrait bien sûr y ajouter, conformément aux théories classiques des tests, la fiabilité, mais celle-ci peut plus facilement être neutralisée, alors que les trois dimensions que nous retenons doivent faire l'objet d'un compromis, d'une articulation dans laquelle, ce qu'on gagne d'un côté, on le reperd de l'autre.

En effet, entre l'épreuve qui a le plus de sens (la pertinence sociale veut que l'on évalue des compétences), celle qui couvre les contenus les plus importants (la validité interne veut que le plus important soit évalué) et la plus rapidement corrigée (la faisabilité opérationnelle veut que le temps de correction des copies soit réduit au minimum), on ne peut arriver qu'à des compromis plus ou moins satisfaisants.

Le schéma suivant montre l'évolution actuelle, d'une situation 1 qui néglige la pertinence sociale, mais a tout misé sur la validité interne et sur la faisabilité, et une situation 2, qui met l'accent sur la pertinence sociale (évaluation à travers des  situations complexes), mais qui a encore des progrès à réaliser en termes de validité interne et de faisabilité opérationnelle à l'échelle de l'ensemble d'un système éducatif.

Selon le contexte où l'on se trouve, les moyens dont on dispose (notamment le temps), les objectifs prioritaires que l'on se donne..., une épreuve d'évaluation peut dès lors se trouver plus ou moins proche ou éloignée d'un des trois pôles. L'idéal est sans doute la position externe du triangle équilatéral, mais l'équilibre est chaque fois à reconstruire dans la réalité.

C'est ce difficile équilibre entre ces trois pôles en tension qu'il faut trouver. Celui-ci ne peut être obtenu que par négociation, par expérimentation, par analyse de résultats, etc. et nous semble toujours lié au contexte d'utilisation, sans possibilité de généralisation abusive.


4.    Conclusion


Pour plusieurs raisons, mais surtout pour des raisons de redevabilité de l'école vis-à-vis de la société civile, les liens entre curriculums et évaluation sont plus que jamais en train de se renforcer aujourd'hui.

Le renforcement de ces liens traduit plus que toute autre mesure cette nécessité d'efficacité et d'équité, cette nécessité d'un pilotage fondé sur des résultats, et non pas seulement sur des intentions. La force de ces liens n'est toutefois pas sans poser de questions. En effet, elle conduit à deux dérives potentielles : d'une part celle qui consisterait à ne déterminer les contenus du curriculum que sur la base de « standards » d'évaluation, en esquivant, ne fut-ce que partiellement, les besoins sociaux, et d'autre part celle qui consisterait à inciter les enseignants à se concentrer avant tout sur l'évaluation au détriment de l'essentiel qu'est l'apprentissage.

Dès lors, il apparaît que les liens entre curriculums et évaluation dans le monde scolaire pourraient aujourd'hui bénéficier d'un double recentrage.

D'une part, un recentrage, que l'on peut qualifier d'externe, viserait à dépenser un peu moins de ressources (financières, humaines, matérielles...) pour évaluer les performances des systèmes éducatifs (le niveau macrosocial, ou institutionnel), et un peu plus de ressources pour optimiser les dispositifs au niveau des classes (le niveau microsocial).

D'autre part, un recentrage, interne à l'évaluation des acquis des élèves, consisterait à conférer progressivement davantage de place à la pertinence sociale, en recourant à des dispositifs comme le portfolio, ou l'évaluation à travers des situations complexes. Dans ce sens, les résultats obtenus à Madagascar, au niveau de l'ensemble du système éducatif, ouvrent quelques pistes qu'il conviendrait d'approfondir.


Bibliographie


Altet, M. & Develay, M. (1999). Le programme expérimental des compétences de base: éléments d'analyse en vue d'une prise de décision de généralisation, Tunis : Ministère de l'éducation tunisien et UNICEF.
Amin, M. E. (2004). The Evaluation of the Pilot Experiment on the Reduction of Class Repetition in Cameroon Primary Schools. Yaounde : MINEDUC/ADB.
Berhens, M. (2009). Le cas de la Suisse, un laboratoire à petite échelle. Communication lors de l'atelier « L'évaluation de l'école par les standards internationaux », au colloque international Un seul monde, une seule école ? Les modèles scolaires à l'épreuve de la mondialisation, Revue internationale d'éducation de Sèvres, Sèvres : CIEP.
Bipoupout, J.-C. (2007). The contribution of the competency-based approach to education for all in Cameroon, Prospects, vol. XXXVII, no. 2, June 2007.
De Ketele, J.-M. & Gerard, F.-M. (2005). La validation des épreuves d'évaluation selon l'approche par les compétences, Mesure et évaluation en Éducation, (28), n°3, 1-26.
Figari, G. (2001). Réinterroger l'évaluation d'un point de vue social, in G. Figari & M. Achouche (Éds). L'activité évaluative réinterrogée. Regards scolaires et socio-professionnels. Bruxelles : De Boeck., pp. 235-236.
Gerard, F.-M. (2005), L'évaluation des compétences par des situations complexes, Actes du Colloque de l'Admee-Europe, IUFM Champagne-Ardenne, Reims, 24-26 octobre 2005.
Gerard, F.-M. (2006). Les outils ouverts d'évaluation, ou la nécessité de clés de fermeture, in G, Figari et L, Mottier-Lopez (Éds). Recherche sur l'évaluation en éducation - Problématiques, méthodologies et épistémologie,. Paris : L'Harmattan, pp. 147-154.
Gerard, F.-M. (2008). La complexité d'une évaluation des compétences à travers des situations complexes, in Ettayebi, M., Opertti, R. et Jonnaert, Ph. (dir.) (2008).  Logique de compétences et développement curriculaire : débats, perspectives, alternative. Paris : l'Harmattan, collection Éducations et Sociétés, pp. 167-183.
Gerard, F.-M. - BIEF. (2008). Évaluer des compétences - Guide pratique, Bruxelles : De Boeck.
Lessard, C. & Meirieu, P. (2008). L'obligation de résultats en éducation - Évolutions, perspectives et enjeux internationaux, Bruxelles : De Boeck.
Lynd, M. (2006). Une évaluation de l'organisation de la Réforme et la mise en place des nouveaux curricula (APC) dans l'école fondamentale de Djibouti. MENESUP, Rapport Banque Mondiale.
Ministère de l'Éducation nationale et de la Recherche scientifique. (2008). Approche par les compétences - Rapport  de la base de données chargée de suivre les résultats des élèves depuis 2004 du CP1 au CM2, Antananarivo : MENRS.
Mottier-Lopez, L. (2006). Interroger la pratique du portfolio en situation scolaire dans une perspective « située » de l'apprentissage, Mesure et Évaluation en Éducation, (29), n°2, 1-21.
Nunziati, G. (1990). Pour construire un dispositif d'évaluation formatrice. Cahiers pédagogiques, 280, 47-64.
Ranorovololona, E. (2006). Madagascar, évaluer les acquis des élèves pour évaluer la réforme. Les évaluations en éducation au niveau international : impacts, contradictions, incertitudes. Sèvres : CIEP, pp. 45-48.
Rey, B., Carette, V., Defrance, A. et Kahn, S. (2003). Les compétences à l'école — Apprentissage et évaluation, Bruxelles : De Boeck.
Roegiers, X. (2000). Une pédagogie de l'intégration. Bruxelles : De Boeck.
Roegiers, X. (2003). Des situations pour intégrer les acquis, Bruxelles : De Boeck.
Roegiers, X. (2004). L'école et l'évaluation, Bruxelles : De Boeck.
Roegiers, X. (2007). Curricular reforms guide schools : but, where to ?, Prospects, vol. XXXVII, no. 2, June 2007.
Roegiers, X. (2008). L'approche par les compétences dans le monde : entre uniformisation et différenciation, entre équité et inéquité, Revue inDirect, n°10, p. 61-77, Wolters Plantyn.
Scallon, G. (2004). L'évaluation des apprentissages dans une approche par les compétences. Bruxelles : De Boeck Université.
Tardif, J. (2006). L'évaluation des compétences - Documenter le parcours de développement, Montréal : Chenelière Éducation.




BIEF