Psychologie cognitive pour l'enseignant/Réduire la charge cognitive intrinsèque

L'effet de génération : application et controverses

Pour rappel, la mémoire de travail est utilisée pour comprendre ce que raconte un professeur, un texte, etc. Lors de cette compréhension, les informations à apprendre sont maintenues en mémoire de travail, afin d'être associées et reliées à des connaissances antérieures. Plus une information à apprendre est composée d'un grand nombre de sous-éléments, plus elle aura tendance à saturer la mémoire de travail. Le nombre d’éléments présents en mémoire de travail s'appelle la charge cognitive : plus elle est élevée, moins la tache ou le concept abordé est facile. Dans ces conditions, diminuer la charge cognitive est de première importance, reste à voir comment.

Psychologie cognitive pour l'enseignant

Introduction

Partie 1 : L'apprentissage conceptuel

Partie 2 : La théorie de la charge cognitive

Partie 3 : Les révisions

Partie 4 : Généralités

Partie 5 : Apprentissages spécifiques

L'apprentissage de la lecture

Version imprimable

[ Modifier le sommaire ]

L'effet de génération : application et controverses

Supports pédagogiques

Dans les grandes lignes, on peut identifier deux types de charge cognitive : une charge intrinsèque induite par la structuration des explications et des connaissances à apprendre, et une charge extrinsèque inutile qui dépend de la méthode de présentation utilisée. Diminuer la charge cognitive extrinsèque demande d'aller à l’essentiel, d'éliminer les informations superflues. Pour ce qui est de réduire la charge intrinsèque, les choses sont plus compliquées et ce chapitre est là pour rendre les choses plus claires.

L'idée générale est de séquencer les informations de manière à faire des regroupements conceptuels. Au lieu de présenter mettons 15 informations sans faire de regroupements, il vaut mieux organiser le tout de manière à avoir des regroupements logiques de 5 informations chacun. Idéalement, un bon cours doit être découpé en petites unités d'information simples, qui sont assemblées progressivement pour donner des connaissances de plus en plus complexes. La raison à cela est que les regroupements conceptuels seront mémorisés dans la mémoire à long-terme et pourront être chargés ultérieurement en mémoire de travail. Et peu importe la complexité du regroupement, celui-ci sera considéré comme un seul item en mémoire de travail, ce qui fait que les utiliser dans une explication est particulièrement économe. Pour rappel, de tels regroupements conceptuels composé d'une constellation d'informations reliées entre elles, qui a une organisation hiérarchique, est appelé un schéma (voir le premier chapitre du cours). Voyons maintenant comment séquencer des notions et structurer un cours, afin de réduire la charge intrinsèque.

Séparer les connaissances théoriques et pratiques

Quelques études recommandent de séparer l'apprentissage des connaissances théoriques et les connaissances pratiques (procédures ou méthodes). Cela vient du fait que les connaissances qui portent sur les connaissances verbales ont souvent une forte charge cognitive, surtout comparé aux connaissances procédurales. Les aborder en même temps risque de faire saturer la mémoire de travail. Pour éviter cela, il est donc préférable d'aborder un maximum de connaissances verbales séparément des connaissances procédurales. Les connaissances procédurales doivent être abordées quand on en a besoin, alors que les connaissances verbales peuvent être abordées n'importe quand.

Une expérience faite par Kester, Kirschner et van Merriënboer (2006) semble montrer que cette séparation augmentait la compréhension et la mémorisation. Leur étude a montré que, dans le cas qu'ils étudiaient, le séquencement de la théorie avant la pratique ou de la pratique après la théorie marchait mieux qu'une présentation intégrée. L'ordre n'avait pas d'importance dans ce cas précis, peut-être en a-t-il dans d'autres exemples. Le choix dépend sûrement de l'enseignement en question et il n'y a pas d'ordre parfait, ni même de tendance générale.

La méthode du pré-entraînement

Pour réduire la charge cognitive intrinsèque, il existe diverses méthodes très reliées entre elles qui sont regroupés sous le terme de pré-entraînement (pre-training en anglais). L'idée consiste à introduire de manière précoce certaines notions, afin de les utiliser pour réduire la charge cognitive des apprentissages ultérieurs. Globalement, l'idée consiste à identifier des connaissances particulières, qui gagnent à être introduites au préalable. Précisons que le pré-entraînement ne se confond pas avec les connaissances propédeutiques, même si les deux se ressemblent. Les connaissances propédeutiques sont facultatives et ne sont pas obligatoires. On doit souvent les rajouter dans un cours qui n'était pas prévu pour. À l'inverse, le pré-entraînement consiste à réorganiser les connaissances présentes dans le cours, à en modifier le plan, pour que certaines notions soient introduites précocement.

Introduire le vocabulaire et les concepts importants en priorité

La première idée est de présenter le vocabulaire et les concepts importants au début d'une leçon, avant que l'on doive les utiliser. Pour le dire autrement, au lieu de présenter le vocabulaire et les concepts importants juste avant qu'on en ait besoin, il vaut mieux les introduire à l'avance.

Pour donner un exemple, on peut citer l'étude de Mayer, Mautone, et Prothero, datée de 2002. Dans cette étude, des sujets jouaient à un jeu basé sur une leçon de géologie. Les élèves qui avaient reçu une instruction sur les termes de base (faille, arc, chaîne de montagne, etc) avant de jouer avaient une meilleure performance que les sujets qui découvraient la signification de ces termes en cours de jeu. Les élèves qui découvraient les termes en cours de jeu devaient acquérir ces connaissances en même temps qu'ils réfléchissaient sur les problèmes. En comparaison, les sujets ayant reçu un enseignement préalable pouvaient se concentrer sur la résolution des problèmes posés lors du jeu.

Précisons à ce sujet que bien utiliser le jargon technique permet de réduire la charge cognitive intrinsèque. Le jargon est souvent rebutant, surtout pour les novices, mais s'il existe c'est pour une bonne raison. Le jargon permet de simplifier les explications ultérieures à sa présentation. Introduire un nouveau mot de jargon, c'est avant tout mettre une étiquette sur un concept ou un principe important afin de le réutiliser par la suite sans devoir faire de longues périphrases difficiles à comprendre. Et en termes de charge cognitive, le jargon est plus économe que la périphrase qu'il remplace. Le jargon rentre donc dans le cadre du pré-entraînement s'il est introduit assez tôt. C'est tout le paradoxe du jargon : d'un côté il est compliqué à apprendre, de l'autre il rend les explications plus simples, plus claires, moins chargées. On comprend ainsi qu'introduire un mot de jargon n'est utile que si cela simplifie les explications qui suivent. Et encore, seulement sous la condition que l'explication du jargon soit simple, pour ne pas perdre d'un côté ce qu'on gagne de l'autre.

Factoriser certaines portions "indépendantes" d'une explication

Une solution reliée à la précédente est de factoriser certaines portions du cours qui ont peu de liens avec les autres, pour en faire un chapitre ou une section séparée. Comme exemple, on peut citer l'étude de Clarke, Ayres, et Sweller, datée de 2005. Dans cette étude, des étudiants recevaient un cours de mathématiques sur les graphes, et devaient utiliser un tableur pour faire les exercices. Un premier groupe de sujets n'avait aucune connaissance des tableurs avant d'entrer en cours et recevait des instructions sur le fonctionnement du tableur lors du cours, les explications étant intercalées entre les explications mathématiques sur les graphes. Le second groupe avait déjà reçu une instruction sur les tableurs avant le cours, et recevait uniquement une instruction sur le concept mathématique à aborder. Le second groupe voyait tout ce qui a rapport aux tableurs séparément de ce qui a rapport aux graphes : les informations liées aux tableurs étaient alors mémorisées avant leur utilisation, diminuant la charge cognitive lors de l'apprentissage ultérieur sur les graphes. Et conformément à ce qui était attendu, le second groupe avait des performances nettement meilleures.

Mais cela vaut aussi à l'intérieur des explications, qu'il est parfois bon de scinder en plusieurs parties interdépendantes. Un exemple est celui des démonstrations qui utilisent des lemmes. Dans certains de mes cours d'université, les professeurs commençaient la démonstration du théorème, et l'interrompait au fil de l'eau pour démontrer les lemmes dont ils avaient besoin. Au lieu de faire cela, ils auraient du démontrer les lemmes avant de commencer la démonstration.

La séparation entre modèle componentiel et modèle dynamique/causal

Factoriser, scinder des explications en portions indépendantes est souvent compliqué et demande d'avoir des idées. Mais il existe des situations un peu particulières où scinder les explications est assez simple. Il s'agit d'un cas assez particulier, qui revient souvent dans les sciences et les matières technologiques : l'étude d'un système composé de composants/parties qui interagissent entre elles de manière dynamique. Avec un peu d'expérience, on peut facilement déceler de telles situations.

Un exemple est donné dans l'étude de Mayer, Mathias, et Wetzell, datée de 2002. Dans cette étude, les élèves devaient apprendre le fonctionnement de certains freins, à partir d'une explication orale. Lors de cet apprentissage, les élèves devaient apprendre deux choses différentes : un modèle qui décrit les composants du frein et un autre qui décrit son fonctionnement dynamique (comment les composants du frein interagissent lors du freinage). L'application du pré-entraînement consistait ici à décrire les composants du frein/parties dans une explication séparée de l'explication dynamique. Juste donner le nom des différents composants et de leur composant suffisait à améliorer la compréhension des élèves.

La logique de l'exemple précédent s’applique dans d'autres exemples similaires. Typiquement, on trouve beaucoup d'exemples de ce type dans les matières technologiques. Par exemple, prenez le cas d'un professeur de technologie/physique qui veut expliquer le fonctionnement d'une centrale thermique : il gagnera à expliquer ce qu'est une turbine, un condenseur et les autres composants du circuit de production d'électricité, avant de montrer comment ceux-ci interagissent lorsque la centrale fonctionne. Même chose en électronique, où les circuits électroniques sont composés de circuits élémentaires reliées entre eux : mieux vaut décrire chaque circuit élémentaire avant de voir comment ils interagissent lorsque le circuit global fonctionne. Autre exemple, en informatique cette fois-ci : vous voulez enseigner comment fonctionne un processeur simple. Celui-ci contient plusieurs composants bien précis : une unité de calcul, un séquenceur, des registres, etc. Certains professeurs commencent directement leur cours par montrer comment une instruction s’exécute sur ce processeur : ils abordent chaque composant au fil de l’eau, quand ils en ont besoin. La théorie de la charge cognitive recommande de voir indépendamment chaque composant du processeur un par un, avant de montrer le déroulement de l’exécution d'une instruction avec cet ensemble de composants.

Mais on peut trouver des situations semblables dans les matières scientifiques. Pensez par exemple à la médecine, où il est souvent nécessaire de donner des notions d'anatomie (décrire les parties du corps, d'un organe ou d'un tissu) avant de parler de physiologie (le fonctionnement du corps, de l'organe ou du tissu). Par exemple, si vous voulez expliquer le fonctionnement du circuit anatomique du réflexe du genou, il est préférable de décrire chaque composant de l'arc réflexe indépendamment, avant de montrer comment le tout fonctionne lors de l'exécution du réflexe.

Dans les exemples précédents, il y a une séparation entre le "modèle de composants" qui décrit les parties d'un système, et le "modèle causal/dynamique" qui décrit comment ces éléments interagissent entre eux lorsque le système fonctionne/évolue. Le conseil à tirer des études sur la charge cognitive est le suivant : lorsqu'on décrit un système, il vaut mieux d'abord présenter le modèle de composants, avant d'aborder le modèle causal/dynamique (comment le système fonctionne/évolue). La raison est que le modèle causal/dynamique est incompréhensible sans le modèle de composants, mais que la réciproque n'est pas vraie. Dans ces conditions, autant factoriser la présentation des parties du système, avant de passer au modèle dynamique.

La méthode d'isolation des éléments

La mémoire de travail surcharge facilement lors de l’apprentissage de concepts composés d’un grand nombre de composants/sous-concepts interagissant entre eux. Dans ce cas, la théorie de la charge cognitive recommande d’aborder chacun des composants indépendamment, avant de montrer comment ceux-ci interagissent ensemble. La méthode conseillée consiste à ne pas étudier la tâche complète et à en retirer certains éléments. Les éléments à retirer sont ceux qui servent de liant entre les éléments. S'ils sont présents, l'élève est obligé de maintenir à l'esprit tous les éléments simultanément. Si on les retire, les autres éléments peuvent se voir indépendamment les uns des autres, de manière isolée.

Cette méthode est appelée la méthode d'isolation des éléments ou encore méthode d'isolation. En faisant cela, la charge cognitive sera répartie dans le temps, améliorant l’apprentissage : on parle d’effet de l'isolation des éléments. La méthode d'isolation donne un cours dont la progression va généralement du simple vers le complexe. Elle commence par étudier des cas particuliers simples, avant d'arriver aux cas généraux. Typiquement, elle commence par étudier une version simplifiée d'une tâche ou d'un système, puis elle le complète progressivement en rajoutant des éléments.

Les premières expériences sur le sujet

Les premières expériences sur le sujet ont été réalisées par Pollock, Chandler, et Sweller en 2002. La première expérience portait sur l'apprentissage de procédures de sécurité électrique assez complexes qui requièrent beaucoup d'étapes. Appliquer les procédures testées demande de savoir utiliser plusieurs instruments comme des voltmètres ou des ampèremètres, de s'adapter à l'appareil à diagnostiquer, de gérer l'isolation électrique, etc. Lors de la phase d'apprentissage, les élèves étaient regroupés en deux groupes : un groupe qui voyait la totalité de la procédure avec les explications détaillées, et un autre dans lequel une partie de la procédure était présentée sous la forme d'un exemple travaillé qui expliquait une partie de la procédure. En théorie, la procédure complète avait une charge cognitive de 16 éléments, contre 7 dans la procédure modifiée. Les résultats ont clairement montré l'efficacité de ce principe d'isolation, sur les élèves ayant peu de connaissances antérieures dans le domaine. Les élèves avec suffisamment de connaissances antérieures ne bénéficiaient pas de la méthode d'isolation.

L'expérience précédente était cependant assez peu concluante, car elle testait l'application d'une procédure, sans compter que la méthode d'isolation appliquée se basait sur des exemples travaillés. Aussi, ils ont réalisé une seconde expérience, qui cette fois-ci impliquait surtout des connaissances conceptuelles. Dans celle-ci, ils devaient étudier un circuit électronique de commande d'un four industriel. Les deux groupes recevaient un diagramme légendé qui décrivait le circuit. Le premier groupe recevait un diagramme simplifié avec seulement les éléments principaux et essentiels, l'autre le diagramme complet et plus d'explications sur la dynamique du circuit. Les résultats allaient encore une fois en faveur de la méthode d'isolation pour les novices/débutants.

Le cas où une procédure combine les résultats de plusieurs sous-procédures indépendantes

Maintenant, voyons voir un autre cas particulier, qui a été étudié par l’expérience de Ayres de 2006 sur l'apprentissage de l'algèbre et l'expérience de 2010 de Blayney, Kalyuga, et Sweller sur l'apprentissage de l'utilisation d'un tableur pour des applications de comptabilité. Dans cette dernière, les élèves devaient apprendre à utiliser un tableur pour faire des calculs de comptabilité afin de faire un budget. Lors de la première phase de l'expérience, les élèves étaient séparés en deux groupes. Le premier effectuait la tâche complète dans une seule feuille de tableur, en utilisant une formule dans laquelle de nombreux sous-calculs étaient combinés pour donner le résultat. Dans le second, chaque sous-calcul était réalisé dans une feuille de tableur séparée et leurs résultats étaient combinés dans une autre feuille de tableur. Lors de la seconde phase, les élèves étaient testés sur la tâche complète. Les résultats montraient que le second groupe faisait mieux que le premier.

Pour donner un autre exemple, je vais citer l'exemple de la procédure des minterms en électronique, qui parlera surtout aux professeurs de matières technologiques. Cette méthode permet de créer un circuit électronique numérique simple, qui prend en entrée une suite de bits fournit un résultat de 1 bit (0 ou 1). La méthode permet de concevoir ce circuit à partir de sa "table de vérité", un tableau qui dit quel est le bit de sortie en fonction de l'entrée. La méthode des minterms demande de sélectionner certaines lignes de la table, d'appliquer une sous-procédure sur celles-ci, avant d'en combiner les résultats. La sous-procédure permet de calculer ce qui s'appelle un minterm. Dans la plupart des cas, la procédure est présentée complète et les élèves appliquent la totalité de la procédure dans les exercices d’entraînement (c'était comme cela quand j'étais élève, c'est le cas dans tous les manuels que j'ai lu ou utilisé en tant que professeur dans le domaine). Appliquer la méthode d'isolation dans ce cas particulier donnerait un tout autre résultat. À la place, les élèves verraient la sous-procédure indépendamment et feraient des exercices dessus. On apprendrait aux élèves à calculer le minterm d'une suite de bit, les élèves feraient des exercices d'application, et ainsi de suite. Puis, dans une seconde phase, on apprendrait aux élèves la procédure complète, qui revient juste à sélectionner certaines lignes bien précises de la table de vérité, calculer le minterm de celles-ci, puis combiner le résultat.