« Précis d'épistémologie/La modélisation du corps savant » : différence entre les versions

Contenu supprimé Contenu ajouté
Apprendre à percevoir, les actes volontaires, la construction de soi
Ligne 3 :
Le traité d'Aristote, ''De l'âme'', peut être considéré comme le livre fondateur de la science de la cognition.
 
=== La perception, l'imagination et les inférences muettes ===
 
Un agent (un corps animé : un être vivant ou un robot) est un système qui interagit avec son environnement par l'intermédiaire de capteurs et d'effecteurs (Turing 1936, Russell & Norvig 2010).
Ligne 24 :
 
Simuler la perception consiste à simuler l'activation de nos systèmes de détection. On peut simuler la perception sensorielle et reconstituer partiellement des images ou des impressions d'origine sensorielle, mais l'imagination n'est pas forcément associée à des images sensorielles. Pour imaginer un être dangereux il n'est pas nécessaire de s'en faire une image visuelle, ou d'imaginer sa voix, ou toute autre forme de perception sensorielle simulée, il suffit de simuler l'activation d'un détecteur de danger. On peut s'imaginer à proximité d'un être dangereux même si on ne perçoit rien de lui, sauf qu'il est dangereux.
 
 
La plupart des représentations internes influencent les actions non directement en commandant les muscles mais indirectement, en participant à la production d'autres représentations. Les représentations internes, sauf peut-être celles qui servent directement à commander les effecteurs, ont toujours pour fonction de produire, modifier ou supprimer d'autres représentations internes, ou au moins de participer à la dynamique de production des représentations internes.
Ligne 35 ⟶ 34 :
 
 
=== Les concepts ===
 
==== La détection des concepts ====
 
Une représentation est conceptuelle lorsqu'elle attribue des concepts aux objets qu'elle représente. Les concepts sont des propriétés ou des relations. Une propriété, ou une qualité, est d'un unique objet. Une relation est entre plusieurs objets. Lorsqu'une relation est entre deux objets, on peut considérer qu'elle est une propriété du couple. Une relation entre trois objets est une propriété du triplet, et ainsi de suite pour les relations entre davantage d'objets.
Ligne 53 ⟶ 52 :
On conçoit souvent les concepts comme des produits du langage. Les concepts sont signifiés par les expressions qui servent à les nommer et ils ne sont pas connus avant d'avoir un nom. Selon l'acception retenue dans ce livre les concepts précèdent le langage. Dès qu'un système de perception est capable de détecter des objets, il leur attribue automatiquement des concepts. Les représentations conceptuelles sont très généralement utilisées par les animaux, qu'ils se servent ou non d'un langage (Gould & Gould 1994). Par exemple tous les animaux capables d'avoir peur attestent par leur comportement qu'ils sont capables de détecter le danger. Le concept de danger est donc une de leurs représentations internes.
 
==== Les concepts sont-ils des êtres concrets ? ====
 
« la Forme se retrouve une et identique en même temps en plusieurs endroits. C'est comme si tu étendais un voile sur plusieurs êtres humains et que tu disais « Le voile reste un en sa totalité, lorsqu'il est étendu sur plusieurs choses. » (Platon, ''Parménide'', 131b, traduit par Luc Brisson)
Ligne 67 ⟶ 66 :
Plus couramment les concepts sont conçus comme des êtres abstraits. Seuls les êtres qui peuvent être identifiés à un substrat matériel, un corps, sont considérés comme des êtres concrets. Or un concept n'est pas un corps, il peut être vrai de très nombreux êtres concrets, qui ont tous un corps, mais il est différent de chacun d'eux. Un corps ne peut pas prétendre être à lui tout seul un concept qui est vrai de lui.
 
==== Les cadres conceptuels de la perception ====
 
Une modélisation simpliste et partiellement fausse de la perception suppose qu'elle est unidirectionnelle. Les informations sont d'abord produites par les détecteurs sensoriels puis synthétisées, par étapes successives, jusqu'aux représentations de haut-niveau, qui déterminent les principaux objets perçus et les principaux concepts qui leur sont attribués. On suppose que les représentations complexes émergent à partir des perceptions élémentaires, comme dans une peinture pointilliste. Une telle dynamique de production des représentations est dite ascendante, ou bottom-up, parce que les signaux sensoriels sont considérés comme des représentations de bas-niveau, tandis que les concepts attribués aux objets complexes sont de haut-niveau.
Ligne 80 ⟶ 79 :
Les sensations sont les sources des processus ascendants de la perception, les concepts de base et les cadres conceptuels sont les sources des processus descendants.
 
==== Les concepts comme fins de l'action ====
 
Les fins d'une action sont les buts, les êtres, les qualités, les relations et les situations désirés.
Ligne 95 ⟶ 94 :
 
 
== Les émotions et les motivations ==
=== Un administrateur central dans le cerveau ===
 
Une émotion (la tristesse, la peur, la colère, le dégoût, la honte, la joie, l'apaisement, le plaisir, la fierté, la surprise... et toutes les variations, les combinaisons et les nuances sur ces thèmes) est une affection consciente, déclenchée par une perception qui lui est spécifique (la peur par la perception du danger, la tristesse par la perception du malheur, la colère par la perception de l'inacceptable...) et accompagnée de réactions réflexes et de modifications physiologiques (provoquées par la libération d'hormones et de neurotransmetteurs). Elle détermine des motivations (des désirs ou des aversions) et prépare ainsi le comportement ultérieur (James 1890, LeDoux 1996, 2002). Les émotions permettent d'adapter rapidement ses réactions et ses motivations à des situations nouvelles. Elles sont donc d'une importance fondamentale pour la préparation de l'action. Elles sont aussi très importantes pour l'apprentissage, parce qu'elles signalent ce qui mérite d'être mémorisé.
==== Les modules du cerveau et les activités routinières ====
 
Évidemment cette définition de l'émotion n'est pas destinée à faire connaître ce qu'est une émotion à quelqu'un qui ne le saurait pas déjà. Pour savoir ce qu'est une émotion, il faut d'abord être ému. La première clause, 'une affection consciente', sort du cadre de la présente théorie, puisque l'émergence de la conscience à partir de la vie du corps n'y est pas expliquée (Chalmers 1996). Les clauses suivantes en revanche montrent comment intégrer les émotions dans la modélisation du corps savant.
Un module cérébral est un réseau de neurones spécialisé dans certaines tâches de traitement de l'information. Il a des voies d'entrée, où il reçoit des informations et des ordres, et des voies de sortie, où il émet lui-même des informations et des ordres. Il peut être très localisé (un petit noyau de neurones, une micro-colonne corticale...) ou assez étendu (un vaste réseau réparti sur plusieurs régions cérébrales). Il a des compétences qui lui sont propres et un mode de fonctionnement partiellement autonome.
 
L'activité cérébrale dans son ensemble résulte de l'activité coordonnée de tous les modules. Ils échangent des informations et des ordres et produisent ainsi toutes les représentations internes qui préparent l'action et tous les signaux qui la déclenchent et la contrôlent.
 
== L'instinct, l'apprentissage et la mémoire ==
Un module cérébral peut être conçu comme un pilote automatique. Les pilotes les plus subordonnés sont les plus périphériques, les réseaux de neurones qui commandent les muscles et le reste du corps. Ces modules subordonnés sont commandés par d'autres modules, et ainsi de suite.
 
=== Qu'est-ce que l'apprentissage ? ===
Un module cérébral a toujours une compétence assez limitée. Il n'a accès qu'à une petite partie des informations disponibles dans le cerveau, et le répertoire des tâches qu'il peut accomplir est également très limité. Or pour atteindre des fins il faut en général recruter de nombreuses ressources qui doivent coopérer pour produire le comportement adapté. Aucun module à lui-seul ne suffit pour cela. Faut-il qu'il y ait un chef ? Un module qui commande à tous les autres et mobilise ainsi les ressources requises ? Y a-t-il dans le cerveau un pilote automatique qui pilote tous les autres pilotes automatiques ?
 
Un savoir-faire ou un comportement est instinctif lorsqu'il est commun à tous les individus d'une même espèce et qu'il fait partie de leurs traits phylogénétiques, c'est à dire qu'il est transmis par une hérédité biologique commune (Lorenz 1981, Tinbergen 1951). Un tel savoir-faire apparaît naturellement au cours du développement normal des individus de l'espèce. C'est un savoir inné, même s'il se manifeste seulement longtemps après la naissance.
La coordination spontanée entre les modules suffit pour expliquer les comportements routiniers. Les ressources nécessaires sont recrutées automatiquement et accomplissent leurs tâches comme elles en ont l'habitude. Il n'est pas nécessaire qu'il y ait un chef qui dirige la marche de l'ensemble. Chaque module peut représenter ses propres fins, donner et recevoir des ordres, et participer ainsi au bon fonctionnement de l'organisme.
 
Pour qu'un savoir soit appris il faut que son acquisition passe par la mémorisation des expériences. Pour que les animaux soient capables d'apprendre il faut que leurs systèmes nerveux sont capables de conserver des traces de ce qu'ils ont vécu. Ce critère ne suffit pas pour distinguer l'appris de l'instinctif, parce qu'à peu près tous les comportements instinctifs apparaissent à la suite d'une période de maturation cérébrale, pendant laquelle l'expérience détermine la constitution des circuits neuronaux. La régulation des battements du cœur, par exemple, est instinctive, mais l'expérience des premiers battements est cruciale pour le développement ultérieur des réseaux de neurones qui les réguleront. De façon générale le développement du système nerveux est épigénétique, c'est à dire qu'il n'est pas déterminé seulement par les gènes mais aussi et surtout par l'expérience. En particulier, les synapses peuvent être modifiées par les signaux qu'elles transmettent. De cette façon une expérience de stimulation d'un réseau peut être déterminante pour son développement ultérieur. De même qu'en forgeant on devient forgeron, on devient capable de vivre en vivant.
L'hypothèse d'un administrateur central dans le cerveau, même si elle n'est pas toujours nécessaire pour expliquer les comportements, semble très profitable pour comprendre le fonctionnement et le dysfonctionnement des facultés cognitives supérieures (Shallice 1988, 2011, Changeux 2002, Dehaene 2001).
 
Pour comprendre la différence entre l'inné et l'acquis, il faut considérer les différences de comportement. Celles-ci ont parfois une explication génétique, parce qu'il y a de petites différences génétiques entre les individus d'une même espèce. Mais le plus souvent les différences de comportement sont causées seulement, ou surtout, par des différences d'expérience. Nous disons alors qu'elles sont acquises ou apprises. Un comportement est appris lorsque ses particularités dépendent des particularités de l'expérience antérieure et non d'un héritage génétique. Pour nous les comportements appris sont les plus importants, parce que nos facultés naturelles et nos talents particuliers ne sont rien si nous n'apprenons pas à les développer.
==== L'administrateur central d'un ordinateur ====
 
=== L'instinct d'apprendre ===
Dans un ordinateur, le système d'exploitation est le programme (UNIX, Linux, MacOS, Windows, etc.) qui gère l'exécution de tous les autres programmes, les applications.
 
Les facultés animales d'apprentissage sont elles-mêmes d'origine instinctive. Le savoir-apprendre est un savoir-faire et pour qu'il y ait apprentissage il faut qu'il y ait au préalable un savoir-apprendre instinctif. Nous pouvons apprendre à apprendre et donc acquérir du savoir-apprendre, mais nous ne pourrions pas apprendre si nous n'avions pas naturellement la capacité d'apprendre. Cet instinct d'apprendre repose sur la capacité des systèmes nerveux à profiter de leur expérience pour orienter leur développement.
Un système d'exploitation est généralement constitué d'un noyau, qui est doté des facultés de gestion les plus fondamentales, et qui n'est jamais modifié, ou presque, et d'une écorce, qui rassemblent des facultés plus spécifiques ou plus élaborées. Sauf en fixant quelques paramètres quand il veut personnaliser sa machine, un utilisateur moyen n'a pas la liberté de modifier le système d'exploitation. Ce travail est réservé aux experts, surtout s'il s'agit de modifier le noyau, parce que le système d'exploitation est responsable du bon usage des ressources matérielles de la machine. S'il est mal programmé, il pourrait la détruire, ne serait-ce qu'en faisant fondre le microprocesseur.
 
=== La plasticité neuronale ===
Un ordinateur est un calculateur universel, c'est à dire qu'il est en principe capable de faire tout ce qui peut être fait par le calcul. Il suffit qu'il soit convenablement programmé (Turing 1936). Il est en particulier capable d'écrire des programmes qu'il est ensuite capable d'exécuter.
 
Pour qu'il y ait mémorisation il faut un matériau plastique, c'est à dire capable de conserver des traces de son expérience (plastique s'oppose ici à élastique : un matériau élastique ne conserve pas de traces des déformations qu'il subit). Il semble que la plasticité des neurones est surtout celles de leurs synapses. L'expérience de transmission des signaux peut renforcer ou affaiblir une synapse (Kandel 1999). Elle peut également conduire à la formation d'autres synapses voisines qui connectent les mêmes neurones. De cette façon l'expérience des neurones modifie leur connectivité. De nouveaux réseaux peuvent être formés et de nouvelles fonctionnalités peuvent apparaître. Dans le même temps de nombreux neurones disparaissent, vraisemblablement parce qu'ils n'ont pas fait les preuves de leur utilité, parce que leurs synapses n'ont pas été renforcées par l'expérience.
Si elle est initialement dotée d'un bon système d'exploitation et d'applications d'écriture de programmes adéquates, une machine peut programmer son propre système d'exploitation.
 
Donald Hebb a proposé une règle simple qui explique de nombreux apprentissages neuronaux : deux neurones connectés renforcent leur connexion lorsqu'ils sont excités ensemble. C'est une sorte de processus de renforcement par la réussite : lorsqu'un neurone A transmet un signal d'excitation à un autre neurone B, il n'est pas sûr de réussir. L'excitation de A à elle-seule n'est pas forcément suffisante pour déclencher l'excitation de B. Souvent il faut plusieurs signaux d'excitation en provenance d'autres neurones que A pour que B soit excité. La règle de Hebb énonce qu'une synapse d'un neurone excitateur est récompensée par la réussite. Elle est renforcée lorsque le neurone visé est vraiment excité.
Une application peut être conçue comme une sorte de pilote automatique. Une fois qu'elle est lancée, elle utilise de façon automatique une partie des ressources de la machine. Les pilotes automatiques peuvent être organisés de façon hiérarchique. Un pilote commande à des pilotes subordonnés, qui peuvent à leur tour commander à leurs subordonnés. Ainsi conçu, le système d'exploitation, et tout particulièrement son noyau, est le pilote de tous les autres pilotes, le grand chef, l'administrateur central de l'ordinateur.
 
=== Le développement des instincts ===
==== L'innovateur ====
 
Pour qu'il y ait un savoir-faire il faut qu'il y ait un réseau de neurones fonctionnel, c'est à dire capable de se servir des signaux de la perception pour donner les signaux d'action appropriés. Le savoir-faire instinctif n'est pas appris, mais il est tout de même acquis, au sens où il apparaît au cours du développement naturel de l'individu. Comment les gènes peuvent-ils contrôler le développement d'un réseau de neurones fonctionnel ?
Face à une situation nouvelle, les réactions habituelles ne sont pas toujours adaptées. Il se peut que l'animal dispose des ressources intérieures nécessaires pour réagir comme il convient, mais qu'il ne sache pas les mobiliser, parce qu'il lui faudrait pour cela inventer un nouveau mode de coordination entre les modules. Aucun d'entre eux n'a les moyens de recruter les autres, alors qu'il suffirait qu'ils travaillent ensemble pour atteindre les fins recherchées.
 
Le mystère du contrôle génétique du développement de l'organisme et de son système nerveux est partiellement élucidé : les gènes contrôlent le métabolisme (la synthèse et la dégradation des molécules de l'organisme) par l'intermédiaire de la synthèse des ARN et des protéines. La différenciation cellulaire dépend de l'activation de gènes particuliers qui synthétisent des protéines spécifiques au type cellulaire. Les gènes contrôlent la différenciation cellulaire en contrôlant la synthèse des ARN ou des protéines qui activent ou inhibent des gènes. Les propriétés des cellules et leurs interactions dépendent de leur type cellulaire. Les gènes peuvent ainsi contrôler la prolifération, la différenciation et la migration de toutes les cellules de l'organisme lors de son développement. Pour les cellules nerveuses, ils peuvent aussi déterminer la migration des terminaisons de leurs axones et construire ainsi des réseaux de neurones. Mais ils ne contrôlent ainsi que le plan d'ensemble du système. La structure fine des connexions entre neurones est épigénétique, elle dépend de l'expérience. Là encore les gènes peuvent exercer une influence sur le développement, parce que la plasticité des synapses, la façon dont elles réagissent aux divers signaux qu'elles reçoivent, peut varier en fonction du type cellulaire.
Un module administrateur central dispose justement des ressources nécessaires pour innover en composant avec les facultés des modules subordonnés, du fait de sa position hiérarchique. Il peut être à la fois un compositeur et un chef d'orchestre. Un administrateur peut se comporter d'une façon très disciplinée, en se contentant de suivre le règlement et en commandant de façon routinière le passage d'un comportement routinier à un autre, en fonction des circonstances. C'est ainsi que fonctionnent la plupart des systèmes d'exploitation des ordinateurs. Mais un administrateur central peut aussi être un créateur, l'analogue d'un petit Mozart dans la tête.
 
=== La mémoire procédurale ===
L'administrateur central est un innovateur mais il ne faut pas entendre par là qu'il est forcément un révolutionnaire. Une petite variation d'un itinéraire habituel est déjà une innovation à laquelle l'administrateur central peut se consacrer.
 
La mémoire procédurale est la mémoire d'un savoir-faire appris. L'apprentissage d'un savoir-faire consiste à construire un réseau de neurones fonctionnel. Tant que le réseau est conservé, et qu'il reste fonctionnel, le savoir-faire est conservé. La mémoire procédurale est donc la conservation des réseaux de neurones fonctionnels que nous avons construits par un apprentissage.
L'administrateur central est un réseau de neurones, vraisemblablement assez complexe et sophistiqué. Ses contours ne sont pas forcément fixes, parce qu'en fonction des circonstances divers réseaux peuvent participer aux tâches d'administration centralisée.
 
=== Un modèle neuronal pour la mémoire épisodique : les ZCD ===
Pour expliquer nos facultés d'innovation, l'hypothèse de l'administrateur central postule l'existence d'un module innovateur. Mais cela ressemble à une croyance aux prodiges surnaturels. Comment un réseau de neurones, même très sophistiqué, pourrait-il inventer tout ce que nous inventons ? Où donc pourrait-il trouver ses idées ? Il n'y a que des neurones qui s'excitent ou s'inhibent les uns les autres. Il semble qu'il n'y ait rien qui puisse jouer le rôle d'une source pour des idées nouvelles.
 
La mémoire épisodique est la mémoire des souvenirs. Quand on se souvient on simule par l'imagination une expérience qu'on a déjà vécue. Comment un réseau de neurones peut-il accomplir une telle performance, enregistrer une expérience, la conserver et la reproduire par l'imagination ?
==== Résolution de problèmes, innovation par la connaissance et réseaux de neurones ====
 
Une zone de convergence-divergence (ZCD) est un réseau de neurones, qui reçoit des projections convergentes en provenance des sites dont l'activité doit être mémorisée, et qui renvoie des projections divergentes vers ces mêmes sites (Damasio 1989, 2009). Lorsqu'une expérience est mémorisée, les signaux qui convergent sur la ZCD y excitent des neurones qui renforcent alors leurs connexions réciproques et forment ainsi un réseau auto-excitateur. Il suffit alors d'exciter à nouveau le réseau ainsi formé pour reproduire la combinaison de signaux initialement reçus. Dans un réseau auto-excitateur l'excitation d'une partie se propage à toutes les autres. De même un fragment de souvenir suffit pour réveiller l'intégralité d'une expérience mémorisée. Une ZCD peut être ainsi un lieu d'enregistrement et de reproduction des souvenirs.
Poser un problème consiste à se donner une fin, un but, un objectif. Le problème est déterminé par les représentations des situations initiale et désirée. On a résolu le problème quand on a atteint la fin qu'on s'est fixée ou quand on sait comment l'atteindre. Toute action ou séquence d'actions, tout comportement adapté, qui permet de passer de la situation initiale à la situation désirée, est une solution du problème. Si on n'a pas atteint la fin mais si on sait comment l'atteindre, si on a une représentation de la séquence d'actions, ou du mode de comportement, qui permet d'atteindre la fin, alors on peut considérer que le problème est résolu et que la représentation de sa solution est elle-même une solution.
 
En plus des voies convergentes-divergentes, une ZCD peut être connectée au reste du cerveau de toutes les façons imaginables, par des signaux en entrée qui l'activent ou l'inhibent, et des signaux en sortie avec lesquels elle fait son effet sur le reste du système. En particulier les ZCD peuvent s'organiser en un système et former une sorte d'arborescence. Une ZCD peut recruter en entrée des voies convergentes issues de nombreuses autres ZCD. Elle peut ainsi faire une synthèse des capacités de détection et de production de toutes les ZCD ainsi recrutées.
Les modules cérébraux sont en général spécialisés dans la résolution de problèmes particuliers. Ils peuvent résoudre les problèmes auxquels ils sont naturellement consacrés, des problèmes qu'ils se posent ou qui leur sont posés. Ils les résolvent soit en contrôlant les actions qui conduiront à l'objectif, soit en produisant des représentations des solutions.
 
Pour faire un modèle du système des ZCD, on distingue dans le système nerveux une partie périphérique et une partie centrale. La périphérie réunit les régions dédiées à la perception, à l'émotion et à l'action. L'arborescence des ZCD est organisée d'une façon hiérarchique, de la périphérie vers le centre. Les ZCD les plus périphériques ont des voies convergente issues directement de la périphérie. On se rapproche du centre en remontant les arborescences de ZCD. On peut songer à des racines qui plongent dans la terre, la périphérie, et qui se rapprochent de la base du tronc, le centre. Mais dans le cerveau, il y a de très nombreux centres. Les ZCD les plus centrales ont des voies convergentes issues d'autres ZCD, et ne sont pas recrutées par des ZCD plus centrales. Le souvenir d'un épisode de notre vie pourrait être conservé par une telle ZCD centrale. Lorsque nous revivons les perceptions, les émotions et les actions d'une expérience passée, l'excitation de cette ZCD centrale activerait toutes les ZCD subordonnées, jusqu'aux aires périphériques, et reconstituerait ainsi l'expérience préalablement vécue.
Lorsque leurs comportements sont routiniers, les agents n'ont pas besoin de chercher des solutions. Ils les trouvent spontanément parce que leurs modules cérébraux savent comment les produire, par instinct ou par habitude. Les agents se contentent de résoudre les problèmes qu'ils savent déjà résoudre. Pour sortir des sentiers battus ils doivent trouver des solutions qu'ils ne connaissent pas par avance. Comment font-ils ?
 
=== Apprendre à percevoir ===
Le hasard suffit pour innover. Un programme d'actions choisies au hasard est en général très innovateur, très différent de ce qui est prescrit par l'instinct ou l'habitude. Mais évidemment le hasard seul est rarement suffisant pour trouver de véritables solutions. Il faut en général du savoir, des compétences, pour évaluer les possibilités de solution a priori envisageables, et trouver parmi elles celles qui méritent d'être retenues. La connaissance est très généralement un préalable nécessaire à l'innovation.
 
La perception est évidemment nécessaire pour agir sur le présent. Mais son effet ne s'arrête pas aux actions sur l'environnement perçu, parce que nous apprenons en permanence à partir de ce que nous percevons ou imaginons. Chaque expérience, réelle ou imaginaire, peut modifier nos façons de percevoir et d'imaginer.
Comment un réseau de neurones pourrait-il acquérir des connaissances, les conserver, et s'en servir pour trouver des solutions nouvelles à des problèmes nouveaux ?
 
Les réseaux de neurones dédiés à la perception de bas niveau, proche des organes sensoriels, sont vraisemblablement peu modifiables par l'expérience, dès qu'ils ont fini leur période de maturation initiale. Une fois qu'ils sont fonctionnels, ils ne doivent plus être modifiés, ou seulement un peu, parce qu'ils sont devenus nécessaires à l'accomplissement des fonctions de niveau supérieur. Si on modifie un réseau de bas niveau, on risque de perturber tous les réseaux de niveau supérieur qui se servent de lui.
Il est très facile de concevoir des réseaux de neurones dotés de telles facultés. Ils mémorisent des connaissances en modifiant les connexions entre neurones. On peut leur soumettre des problèmes en activant leurs voies d'entrée. Ils produisent des solutions sur leurs voies de sortie. Et ils sont très capables d'innover (David E. Rumelhart, James L. McClelland & PDP Research Group 1986). La conception de réseaux de neurones est une méthode très puissante pour résoudre de très nombreux problèmes.
 
Les agitations intérieures ressemblent parfois un peu aux mouvements d'un fluide, comme s'il y avait des forces de pression qui nous poussent à pervevoir, ou à imaginer. Pour expliquer comment nos expériences nous transforment on peut alors songer à la façon dont une rivière creuse son lit, au modelage des dunes par le vent, et plus généralement aux façons dont l'air, l'eau, ou tout autre fluide, peuvent modifier les solides au contact desquels ils s'écoulent. Les influx nerveux sont comme des courants fluides, les réseaux de neurones sont comme des canalisations dans lesquels ils s'écoulent et qu'ils peuvent creuser, élargir ou obstruer. Bien sûr ce n'est qu'une analogie. Les influx nerveux sont des courants électriques dans les neurones et à travers leurs membranes. Ils "creusent leur lit" dans les réseaux principalement en agissant sur leurs synapses.
==== L'espace de travail global ====
 
Ce modèle de mémorisation fluide, où les influx nerveux peuvent modifier en permanence les voies dans lesquelles ils s'écoulent, ne peut pas suffire pour expliquer comment nous sommes transformés par nos expériences, parce qu'il donne une trop grande importance à l'oubli. Chaque nouvelle expérience pourrait effacer les traces laissées par les anciennes. Les souvenirs seraient comme des traces sur le sable d'une plage balayée par les vagues.
Un module cérébral n'a en général accès qu'à une petite partie des informations disponibles dans le cerveau, parce qu'il est limité par ses voies d'entrée. Si d'autres modules cérébraux, auxquels il n'est pas directement connecté, disposent d'informations qui pourraient lui servir, il n'en est pas directement informé. D'où l'utilité d'un espace de travail commun, un espace de production de représentations internes, d'informations, de connaissances, élaborées à partir des données fournies par les modules spécialisés, et utilisées par ces mêmes modules. Cet espace de travail global peut être conçu comme un lieu d'échanges où chacun donne tout ce qui peut être utile aux autres et reçoit des autres tout ce qui peut lui être utile.
 
Notre mémoire fonctionne souvent d'une façon accumulative. Les souvenirs, les compétences et toutes les informations mémorisées sont acquis et conservés indépendamment les uns des autres. En général les nouveaux items mémorisés n'effacent pas les plus anciens. Comment les cerveaux développent de telles facultés de mémorisation est assez mystérieux. Les ZCD, qui requièrent au minimum la constitution d'un nouveau réseau, avec des neurones jusque là inutilisés, pour chaque nouvel item mémorisé, sont probablement une partie de l'explication, mais seulement une partie.
 
Nous apprenons à percevoir et à imaginer en apprenant à faire des inférences muettes à partir des informations fournies par les sens. Quand on mémorise une inférence muette, on retient une combinaison entre une condition et une conséquence. Pour cela il suffit en principe de conserver une liaison excitatrice entre le réseau qui représente la condition et celui qui représente la conséquence. Comme nos facultés d'inférence se développent d'une façon accumulative, il faut supposer que nos cerveaux savent construire de telles laisons sans modifier les anciennes, qu'ils ont une mémoire qui ressemble parfois à celle des ordinateurs, où les liaisons entre les conditions, c'est à dire les adresses en mémoire, et les conséquences, les contenus conservés à ces adresses, sont apprises d'une façon accumulative.
 
Une expérience vécue réunit toujours de très nombreux éléments, d'une façon qui peut sembler parfois très désordonnée. Pour que l'inférence d'une condition à une conséquence soit légitime il ne suffit pas qu'elles aient été réunies lors d'une expérience, parce que leur association pourrait être fortuite. Comment reconnaissons-nous les inférences légitimes, celles qui augmentent vraiment notre savoir ? Par exemple de nombreux animaux savent identifier la cause de leur malaise s'ils ont ingéré un mauvaise nourriture. Qu'ils évitent d'en manger à nouveau montre qu'ils ont identifié correctement la source de leur souffrance. Mais comment font-ils ? De nombreuses autres perceptions ont précédé leur malaise. Pourquoi sélectionnent-ils comme cause précisément la nourriture et non les autres perceptions qui faisaient elles aussi partie de la même expérience ?
 
La perception ne s'arrête pas à la sensation. Elle construit des modèles de la réalité qui vont au delà du savoir fourni directement par les sens et qui guident l'identification des relations de condition à conséquence. Par exemple, nous reconnaissons les objets solides et leur attribuons spontanément des qualités de permanence. Nous savons qu'ils ne disparaissent pas et que leur forme reste inchangée, tant qu'il n'y a pas de cause capable de les faire disparaître ou de les déformer. Cette connaissance de la solidité est une source inépuisable d'inférences muettes, avec lesquelles nous connaissons le futur, le présent qui n'est pas perçu par les sens, et le passé qu'on n'a pas vécu. De façon générale nous savons naturellement percevoir des qualités de permanence, des relations de causalité, ou d'autres qualités et relations qui conduisent à des inférences légitimes. Nous savons naturellement identifier des causes et des effets, nous savons reconnaître ce qui agit et ce qui subit, nous percevons des traces et des signes annonciateurs... De telles facultés de perception alliées à la mémoire épisodique permettent de développer l'imagination déductive.
 
Nous savons instinctivement percevoir la causalité, ou d'autres qualités et relations qui conduisent à des inférences légitimes, seulement dans des cas simples, comme la solidité, l'action par contact ou la nourriture comme cause de malaise. De façon générale, l'identification correcte des inférences légitimes est un problème très difficile que notre savoir instinctif n'est pas capable de résoudre à lui seul. De fait nous sommes naturellement portés à percevoir des relations causales là où il n'y en a pas. Toutes les formes de superstition et de divagation montrent que nos facultés naturelles de perception de la causalité sont d'une fiabilité très limitée.
 
Dans la théorie de Baars (1988), l'espace de travail global est conçu comme un lieu de distribution généralisée de l'information, une sorte de tableau noir, où tous les modules spécialisés peuvent écrire, et qu'ils peuvent tous lire. Dès qu'un module met une information dans l'espace de travail global, elle est automatiquement distribuée à tous les autres modules. C'est très peu vraisemblable, parce que ce n'est pas fonctionnel. Un module a des compétences spécialisées. Il est fait pour traiter un certain type d'information. Il est en général incapable de traiter l'information reçue par les autres. S'il était en permanence informé du contenu de l'espace de travail global, il serait submergé par une multitude d'informations dont il ne saurait que faire. C'est pourquoi il faut concevoir que l'espace de travail global est davantage qu'un simple lieu de distribution de l'information. C'est surtout un lieu d'élaboration de la connaissance. Il met à contribution les compétences de tous les modules spécialisés et chacun d'entre eux peut y trouver ce dont il a besoin, mais aucun n'a accès à la totalité de la connaissance ainsi élaborée, parce qu'il ne saurait pas quoi en faire. Chacun ne reçoit de l'espace de travail global que l'information qui lui est destinée en particulier, parce qu'il est fait pour la traiter.
 
== La réflexion ==
=== La réflexion et l'action sur soi-même ===
 
La réflexion est la perception de soi-même. Elle est donc la production de représentations internes de l'agent lui-même.
Ligne 168 ⟶ 174 :
Pour percevoir l'environnement il faut des organes sensoriels qui relient l'intérieur à l'extérieur. Même pour la perception de l'intérieur du corps, il y a une une interface sensorielle entre le système nerveux et le reste du corps qui est perçu. Faut-il en conclure que la réflexion requiert des organes sensoriels ? Y a-t-il une interface sensorielle entre le moi perçu et le moi qui perçoit ? Lorsque je sais que je vois le ciel, est-ce un œil introspectif qui me montre que je vois le ciel ? Non, parce qu'il n'y a pas de séparation entre un moi qui perçoit et un moi perçu, entre un intérieur et un extérieur, donc pas d'interface sensorielle. Tout se passe à l'intérieur. Toutes les informations sur l'agent, en tant qu'il perçoit, qu'il imagine et qu'il agit, sont déjà présentes à l'intérieur de l'agent. Pour développer ses facultés de réflexion il lui suffit d'exploiter ces sources intérieures d'information. Un organe sensoriel de réflexion n'est pas nécessaire parce que les informations recherchées sont déjà présentes à l'intérieur.
 
La réflexion accompagne naturellement la perception du monde extérieur. Elle est presque une composante nécessaire de la perception parce qu'en percevant, on se connaît soi-même en tant qu'être qui perçoit. Une représentation n'apporte pas que des informations sur l'objet représenté, elle peut aussi en dire beaucoup sur la façon de le représenter. Or laLa connaissance du mode de représentation est de nature réflexive. On se connaît soi-même en connaissant sa relation à l'objet qu'on se représente. Par exemple, quand on se souvient, on sait qu'on se souvient, on se connaît soi-même en tant qu'être capable de se souvenir, et on ne pourrait pas faire la différence entre un souvenir et la perception du présent si on ne le savait pas.
 
Pour se préparer à l'action, connaître son environnement ne suffit pas, il faut aussi se connaître soi-même, ne serait-ce que pour connaître sa position et ses capacités. Un agent doit souvent imaginer comment agir avant d'agir. De cette façon, se savoir capable le rend capable. Dès qu'il anticipe correctement les résultats des actions qu'il pourrait entreprendre il se rend capable de les atteindre. C'est pourquoi la réflexion est au cœur de la préparation à l'action.
 
Un agent peut vouloir non seulement une transformation de son environnement mais également une transformation de lui-même. Il peut vouloir changer ses habitudes ou ses façons de réagir, acquérir de nouvelles capacités et du savoir. La production du savoir peut être elle-même une fin de l'action, pas seulement un moyen. Évidemment un agent a besoin de se connaître lui-même pour agir ainsi sur lui-même.
 
== Un administrateur central dans le cerveau ==
Comme l'administrateur central est responsable de l'utilisation de toutes les ressources de l'organisme, il a évidemment besoin des ressources de la réflexion pour contrôler les pilotes subordonnés et se contrôler lui-même.
 
=== Les modules du cerveau et les activités routinières ===
 
Un module cérébral est un réseau de neurones spécialisé dans certaines tâches de traitement de l'information. Il a des voies d'entrée, où il reçoit des informations et des ordres, et des voies de sortie, où il émet lui-même des informations et des ordres. Il peut être très localisé (un petit noyau de neurones, une micro-colonne corticale...) ou assez étendu (un vaste réseau réparti sur plusieurs régions cérébrales). Il a des compétences qui lui sont propres et un mode de fonctionnement partiellement autonome.
=== Les émotions et les motivations ===
 
L'activité cérébrale dans son ensemble résulte de l'activité coordonnée de tous les modules. Ils échangent des informations et des ordres et produisent ainsi toutes les représentations internes qui préparent l'action et tous les signaux qui la déclenchent et la contrôlent.
Une émotion (la tristesse, la peur, la colère, le dégoût, la honte, la joie, l'apaisement, le plaisir, la fierté, la surprise... et toutes les variations, les combinaisons et les nuances sur ces thèmes) est une affection consciente, déclenchée par une perception qui lui est spécifique (la peur par la perception du danger, la tristesse par la perception du malheur, la colère par la perception de l'inacceptable...) et accompagnée de réactions réflexes et de modifications physiologiques (provoquées par la libération d'hormones et de neurotransmetteurs). Elle détermine des motivations (des désirs ou des aversions) et prépare ainsi le comportement ultérieur (James 1890, LeDoux 1996, 2002). Les émotions permettent d'adapter rapidement ses réactions et ses motivations à des situations nouvelles. Elles sont donc d'une importance fondamentale pour la préparation de l'action. Elles sont aussi très importantes pour l'apprentissage, parce qu'elles signalent ce qui mérite d'être mémorisé.
 
Un module cérébral peut être conçu comme un pilote automatique. Les pilotes les plus subordonnés sont les plus périphériques, les réseaux de neurones qui commandent les muscles et le reste du corps. Ces modules subordonnés sont commandés par d'autres modules, et ainsi de suite.
Évidemment cette définition de l'émotion n'est pas destinée à faire connaître ce qu'est une émotion à quelqu'un qui ne le saurait pas déjà. Pour savoir ce qu'est une émotion, il faut d'abord être ému. La première clause, 'une affection consciente', sort du cadre de la présente théorie, puisque l'émergence de la conscience à partir de la vie du corps n'y est pas expliquée (Chalmers 1996). Les clauses suivantes en revanche montrent comment intégrer les émotions dans la modélisation du corps savant.
 
Un module cérébral a toujours une compétence assez limitée. Il n'a accès qu'à une petite partie des informations disponibles dans le cerveau, et le répertoire des tâches qu'il peut accomplir est également très limité. Or pour atteindre des fins il faut en général recruter de nombreuses ressources qui doivent coopérer pour produire le comportement adapté. Aucun module à lui-seul ne suffit pour cela. Faut-il qu'il y ait un chef ? Un module qui commande à tous les autres et mobilise ainsi les ressources requises ? Y a-t-il dans le cerveau un pilote automatique qui pilote tous les autres pilotes automatiques ?
 
La coordination spontanée entre les modules suffit pour expliquer les comportements routiniers. Les ressources nécessaires sont recrutées automatiquement et accomplissent leurs tâches comme elles en ont l'habitude. Il n'est pas nécessaire qu'il y ait un chef qui dirige la marche de l'ensemble. Chaque module peut représenter ses propres fins, donner et recevoir des ordres, et participer ainsi au bon fonctionnement de l'organisme.
=== L'instinct, l'apprentissage et la mémoire ===
 
L'hypothèse d'un administrateur central dans le cerveau, même si elle n'est pas toujours nécessaire pour expliquer les comportements, semble très profitable pour comprendre le fonctionnement et le dysfonctionnement des facultés cognitives supérieures (Shallice 1988, 2011, Changeux 2002, Dehaene 2001).
==== Qu'est-ce que l'apprentissage ? ====
 
=== L'administrateur central d'un ordinateur ===
Un savoir-faire ou un comportement est instinctif lorsqu'il est commun à tous les individus d'une même espèce et qu'il fait partie de leurs traits phylogénétiques, c'est à dire qu'il est transmis par une hérédité biologique commune (Lorenz 1981, Tinbergen 1951). Un tel savoir-faire apparaît naturellement au cours du développement normal des individus de l'espèce. C'est un savoir inné, même s'il se manifeste seulement longtemps après la naissance.
 
Dans un ordinateur, le système d'exploitation est le programme (UNIX, Linux, MacOS, Windows, etc.) qui gère l'exécution de tous les autres programmes, les applications.
Pour qu'un savoir soit appris il faut que son acquisition passe par la mémorisation des expériences. Pour que les animaux soient capables d'apprendre il faut que leurs systèmes nerveux sont capables de conserver des traces de ce qu'ils ont vécu. Ce critère ne suffit pas pour distinguer l'appris de l'instinctif, parce qu'à peu près tous les comportements instinctifs apparaissent à la suite d'une période de maturation cérébrale, pendant laquelle l'expérience détermine la constitution des circuits neuronaux. La régulation des battements du cœur, par exemple, est instinctive, mais l'expérience des premiers battements est cruciale pour le développement ultérieur des réseaux de neurones qui les réguleront. De façon générale le développement du système nerveux est épigénétique, c'est à dire qu'il n'est pas déterminé seulement par les gènes mais aussi et surtout par l'expérience. En particulier, les synapses peuvent être modifiées par les signaux qu'elles transmettent. De cette façon une expérience de stimulation d'un réseau peut être déterminante pour son développement ultérieur. De même qu'en forgeant on devient forgeron, on devient capable de vivre en vivant.
 
Un système d'exploitation est généralement constitué d'un noyau, qui est doté des facultés de gestion les plus fondamentales, et qui n'est jamais modifié, ou presque, et d'une écorce, qui rassemblent des facultés plus spécifiques ou plus élaborées. Sauf en fixant quelques paramètres quand il veut personnaliser sa machine, un utilisateur moyen n'a pas la liberté de modifier le système d'exploitation. Ce travail est réservé aux experts, surtout s'il s'agit de modifier le noyau, parce que le système d'exploitation est responsable du bon usage des ressources matérielles de la machine. S'il est mal programmé, il pourrait la détruire, ne serait-ce qu'en faisant fondre le microprocesseur.
Pour comprendre la différence entre l'inné et l'acquis, il faut considérer les différences de comportement. Celles-ci ont parfois une explication génétique, parce qu'il y a de petites différences génétiques entre les individus d'une même espèce. Mais le plus souvent les différences de comportement sont causées seulement, ou surtout, par des différences d'expérience. Nous disons alors qu'elles sont acquises ou apprises. Un comportement est appris lorsque ses particularités dépendent des particularités de l'expérience antérieure et non d'un héritage génétique. Pour nous les comportements appris sont les plus importants, parce que nos facultés naturelles et nos talents particuliers ne sont rien si nous n'apprenons pas à les développer.
 
Un ordinateur est un calculateur universel, c'est à dire qu'il est en principe capable de faire tout ce qui peut être fait par le calcul. Il suffit qu'il soit convenablement programmé (Turing 1936). Il est en particulier capable d'écrire des programmes qu'il est ensuite capable d'exécuter.
==== L'instinct d'apprendre ====
 
Si elle est initialement dotée d'un bon système d'exploitation et d'applications d'écriture de programmes adéquates, une machine peut programmer son propre système d'exploitation.
Les facultés animales d'apprentissage sont elles-mêmes d'origine instinctive. Le savoir-apprendre est un savoir-faire et pour qu'il y ait apprentissage il faut qu'il y ait au préalable un savoir-apprendre instinctif. Nous pouvons apprendre à apprendre et donc acquérir du savoir-apprendre, mais nous ne pourrions pas apprendre si nous n'avions pas naturellement la capacité d'apprendre. Cet instinct d'apprendre repose sur la capacité des systèmes nerveux à profiter de leur expérience pour orienter leur développement.
 
Une application peut être conçue comme une sorte de pilote automatique. Une fois qu'elle est lancée, elle utilise de façon automatique une partie des ressources de la machine. Les pilotes automatiques peuvent être organisés de façon hiérarchique. Un pilote commande à des pilotes subordonnés, qui peuvent à leur tour commander à leurs subordonnés. Ainsi conçu, le système d'exploitation, et tout particulièrement son noyau, est le pilote de tous les autres pilotes, le grand chef, l'administrateur central de l'ordinateur.
==== La plasticité neuronale ====
 
=== L'innovateur ===
Pour qu'il y ait mémorisation il faut un matériau plastique, c'est à dire capable de conserver des traces de son expérience (plastique s'oppose ici à élastique : un matériau élastique ne conserve pas de traces des déformations qu'il subit). Il semble que la plasticité des neurones est surtout celles de leurs synapses. L'expérience de transmission des signaux peut renforcer ou affaiblir une synapse (Kandel 1999). Elle peut également conduire à la formation d'autres synapses voisines qui connectent les mêmes neurones. De cette façon l'expérience des neurones modifie leur connectivité. De nouveaux réseaux peuvent être formés et de nouvelles fonctionnalités peuvent apparaître. Dans le même temps de nombreux neurones disparaissent, vraisemblablement parce qu'ils n'ont pas fait les preuves de leur utilité, parce que leurs synapses n'ont pas été renforcées par l'expérience.
 
Face à une situation nouvelle, les réactions habituelles ne sont pas toujours adaptées. Il se peut que l'animal dispose des ressources intérieures nécessaires pour réagir comme il convient, mais qu'il ne sache pas les mobiliser, parce qu'il lui faudrait pour cela inventer un nouveau mode de coordination entre les modules. Aucun d'entre eux n'a les moyens de recruter les autres, alors qu'il suffirait qu'ils travaillent ensemble pour atteindre les fins recherchées.
Donald Hebb a proposé une règle simple qui explique de nombreux apprentissages neuronaux : deux neurones connectés renforcent leur connexion lorsqu'ils sont excités ensemble. C'est une sorte de renforcement par la réussite : lorsqu'un neurone A transmet un signal d'excitation à un autre neurone B, il n'est pas sûr de réussir. L'excitation de A à elle-seule n'est pas forcément suffisante pour déclencher l'excitation de B. Souvent il faut plusieurs signaux d'excitation en provenance d'autres neurones que A pour que B soit excité. La règle de Hebb énonce qu'une synapse d'un neurone excitateur est récompensée par la réussite. Elle est renforcée lorsque le neurone visé est vraiment excité.
 
Un module administrateur central dispose justement des ressources nécessaires pour innover en composant avec les facultés des modules subordonnés, du fait de sa position hiérarchique. Il peut être à la fois un compositeur et un chef d'orchestre. Un administrateur peut se comporter d'une façon très disciplinée, en se contentant de suivre le règlement et en commandant de façon routinière le passage d'un comportement routinier à un autre, en fonction des circonstances. C'est ainsi que fonctionnent la plupart des systèmes d'exploitation des ordinateurs. Mais un administrateur central peut aussi être un créateur, l'analogue d'un petit Mozart dans la tête.
==== Le développement des instincts ====
 
L'administrateur central est un innovateur mais il ne faut pas entendre par là qu'il est forcément un révolutionnaire. Une petite variation d'un itinéraire habituel est déjà une innovation à laquelle l'administrateur central peut se consacrer.
Pour qu'il y ait un savoir-faire il faut qu'il y ait un réseau de neurones fonctionnel, c'est à dire capable de se servir des signaux de la perception pour donner les signaux d'action appropriés. Le savoir-faire instinctif n'est pas appris, mais il est tout de même acquis, au sens où il apparaît au cours du développement naturel de l'individu. Comment les gènes peuvent-ils contrôler le développement d'un réseau de neurones fonctionnel ?
 
L'administrateur central est un réseau de neurones, vraisemblablement assez complexe et sophistiqué. Ses contours ne sont pas forcément fixes, parce qu'en fonction des circonstances divers réseaux peuvent participer aux tâches d'administration centralisée.
Le mystère du contrôle génétique du développement de l'organisme et de son système nerveux est partiellement élucidé : les gènes contrôlent le métabolisme (la synthèse et la dégradation des molécules de l'organisme) par l'intermédiaire de la synthèse des ARN et des protéines. La différenciation cellulaire dépend de l'activation de gènes particuliers qui synthétisent des protéines spécifiques au type cellulaire. Les gènes contrôlent la différenciation cellulaire en contrôlant la synthèse des ARN ou des protéines qui activent ou inhibent des gènes. Les propriétés des cellules et leurs interactions dépendent de leur type cellulaire. Les gènes peuvent ainsi contrôler la prolifération, la différenciation et la migration de toutes les cellules de l'organisme lors de son développement (Wolpert, Tickle & Martinez 2015). Pour les cellules nerveuses, ils peuvent aussi déterminer la migration des terminaisons de leurs axones et construire ainsi des réseaux de neurones. Mais ils ne contrôlent ainsi que le plan d'ensemble du système. La structure fine des connexions entre neurones est épigénétique, elle dépend de l'expérience. Là encore les gènes peuvent exercer une influence sur le développement, parce que la plasticité des synapses, la façon dont elles réagissent aux divers signaux qu'elles reçoivent, peut varier en fonction du type cellulaire.
 
Pour expliquer nos facultés d'innovation, l'hypothèse de l'administrateur central postule l'existence d'un module innovateur. Mais cela ressemble à une croyance aux prodiges surnaturels. Comment un réseau de neurones, même très sophistiqué, pourrait-il inventer tout ce que nous inventons ? Où donc pourrait-il trouver ses idées ? Il n'y a que des neurones qui s'excitent ou s'inhibent les uns les autres. Il semble qu'il n'y ait rien qui puisse jouer le rôle d'une source pour des idées nouvelles.
==== La mémoire procédurale ====
 
=== Résolution de problèmes, innovation par la connaissance et réseaux de neurones ===
La mémoire procédurale est la mémoire d'un savoir-faire appris. L'apprentissage d'un savoir-faire consiste à construire un réseau de neurones fonctionnel. Tant que le réseau est conservé, et qu'il reste fonctionnel, le savoir-faire est conservé. La mémoire procédurale est donc la conservation des réseaux de neurones fonctionnels construits par un apprentissage.
 
Poser un problème consiste à se donner une fin, un but, un objectif. Le problème est déterminé par les représentations des situations initiale et désirée. On a résolu le problème quand on a atteint la fin qu'on s'est fixée ou quand on sait comment l'atteindre. Toute action ou séquence d'actions, tout comportement adapté, qui permet de passer de la situation initiale à la situation désirée, est une solution du problème. Si on n'a pas atteint la fin mais si on sait comment l'atteindre, si on a une représentation de la séquence d'actions, ou du mode de comportement, qui permet d'atteindre la fin, alors on peut considérer que le problème est résolu et que la représentation de sa solution est elle-même une solution.
==== Un modèle neuronal pour la mémoire épisodique : les ZCD ====
 
Les modules cérébraux sont en général spécialisés dans la résolution de problèmes particuliers. Ils peuvent résoudre les problèmes auxquels ils sont naturellement consacrés, des problèmes qu'ils se posent ou qui leur sont posés. Ils les résolvent soit en contrôlant les actions qui conduiront à l'objectif, soit en produisant des représentations des solutions.
La mémoire épisodique est la mémoire des souvenirs. Quand on se souvient on simule par l'imagination une expérience qu'on a déjà vécue. Comment un réseau de neurones peut-il accomplir une telle performance, enregistrer une expérience, la conserver et la reproduire par l'imagination ?
 
Lorsque leurs comportements sont routiniers, les agents n'ont pas besoin de chercher des solutions. Ils les trouvent spontanément parce que leurs modules cérébraux savent comment les produire, par instinct ou par habitude. Les agents se contentent de résoudre les problèmes qu'ils savent déjà résoudre. Pour sortir des sentiers battus ils doivent trouver des solutions qu'ils ne connaissent pas par avance. Comment font-ils ?
 
Le hasard suffit pour innover. Un programme d'actions choisies au hasard est en général très innovateur, très différent de ce qui est prescrit par l'instinct ou l'habitude. Mais évidemment le hasard seul est rarement suffisant pour trouver de véritables solutions. Il faut en général du savoir, des compétences, pour évaluer les possibilités de solution a priori envisageables, et trouver parmi elles celles qui méritent d'être retenues. La connaissance est très généralement un préalable nécessaire à l'innovation.
 
Comment un réseau de neurones pourrait-il acquérir des connaissances, les conserver, et s'en servir pour trouver des solutions nouvelles à des problèmes nouveaux ?
 
Il est très facile de concevoir des réseaux de neurones dotés de telles facultés. Ils mémorisent des connaissances en modifiant les connexions entre neurones. On peut leur soumettre des problèmes en activant leurs voies d'entrée. Ils produisent des solutions sur leurs voies de sortie. Et ils sont très capables d'innover (David E. Rumelhart, James L. McClelland & PDP Research Group 1986). La conception de réseaux de neurones est une méthode très puissante pour résoudre de très nombreux problèmes.
 
=== L'espace de travail global ===
 
Un module cérébral n'a en général accès qu'à une petite partie des informations disponibles dans le cerveau, parce qu'il est limité par ses voies d'entrée. Si d'autres modules cérébraux, auxquels il n'est pas directement connecté, disposent d'informations qui pourraient lui servir, il n'en est pas directement informé. D'où l'utilité d'un espace de travail commun, un espace de production de représentations internes, d'informations, de connaissances, élaborées à partir des données fournies par les modules spécialisés, et utilisées par ces mêmes modules. Cet espace de travail global peut être conçu comme un lieu d'échanges où chacun donne tout ce qui peut être utile aux autres et reçoit des autres tout ce qui peut lui être utile, comme Wikipédia.
 
Dans la théorie de Baars (1988), l'espace de travail global est conçu comme un lieu de distribution généralisée de l'information, une sorte de tableau noir, où tous les modules spécialisés peuvent écrire, et qu'ils peuvent tous lire. Dès qu'un module met une information dans l'espace de travail global, elle est automatiquement distribuée à tous les autres modules. C'est très peu vraisemblable, parce que ce n'est pas fonctionnel. Un module a des compétences spécialisées. Il est fait pour traiter un certain type d'information. Il est en général incapable de traiter l'information reçue par les autres. S'il était en permanence informé du contenu de l'espace de travail global, il serait submergé par une multitude d'informations dont il ne saurait que faire. C'est pourquoi il faut concevoir que l'espace de travail global est davantage qu'un simple lieu de distribution de l'information. C'est surtout un lieu d'élaboration de la connaissance. Il met à contribution les compétences de tous les modules spécialisés et chacun d'entre eux peut y trouver ce dont il a besoin, mais aucun n'a accès à la totalité de la connaissance ainsi élaborée, parce qu'il ne saurait pas quoi en faire. Chacun ne reçoit de l'espace de travail global que l'information qui lui est destinée en particulier, parce qu'il est fait pour la traiter.
 
=== Les actes volontaires ===
 
La plupart de nos gestes, de nos comportements et de notre activité intérieure est involontaire. Les réseaux de neurones fonctionnent comme des pilotes automatiques. Ils peuvent être déclenchés, modulés, coordonnés et arrêtés indépendamment de tout contrôle volontaire. Notre corps est en cela semblable à tous les autres corps. Nous découvrons sa façon de réagir par l'expérience, comme s'il était le corps d'un autre.
 
Lorsque nous voulons, nous nous représentons consciemment des buts et des façons de les atteindre avant d'avoir agi. Nos comportements et nos actions volontaires sont connus, au moins dans leurs intentions initiales, avant d'être exécutés. C'est pourquoi nous les reconnaissons plus volontiers comme les nôtres que des réactions réflexes ou d'autres comportements involontaires.
 
Il semble que l'hypothèse de l'administrateur central pourrait expliquer la différence entre les comportements volontaires et les autres (Shallice 2011). Les comportements involontaires seraient ceux qui sont exécutés par des modules subordonnés qui fonctionnent comme des pilotes automatiques sans que leur chef ait à intervenir. Mais lorsque les circonstances l'y incitent, l'administrateur central se prononce en faveur des buts qui lui sont présentés et contrôle alors l'action de ses subordonnés. On peut alors supposer que de tels buts sont justement ceux que nous nous proposons consciemment et que les décisions prises par l'administrateur central sont nos décisions volontaires. Il faut remarquer qu'avec une telle hypothèse, on n'explique pas l'émergence de la conscience à partir de la vie du corps, on ne fait que la postuler.
 
=== La construction de soi ===
 
Un agent peut vouloir non seulement une transformation de son environnement mais également une transformation de lui-même. Il peut vouloir changer ses habitudes ou ses façons de réagir, acquérir de nouvelles capacités et du savoir. Il peut même vouloir changer sa volonté.
 
Comme nous sommes transformés par toutes nos expériences, par tout ce que nous percevons ou imaginons, toutes nos décisions volontaires à l'origine de nos expériences ont toujours pour effet de nous transformer. C'est ainsi que nous acquérons de nouvelles habitudes. Au début elles requièrent un effort volontaire, mais elles sont ensuite accomplies d'une façon automatique.
 
Nos décisions volontaires ne sont pas limitées à l'action sur le présent. Elles portent souvent sur un avenir plus ou moins lointain ou déterminé. Nous décidons par avance sur les objectifs que nous poursuiverons et les règles, les engagements ou les contraintes que nous respecterons. Tout se passe comme si nous écrivions dans nos têtes les contrats et les cahiers des charges pour lesquels nous nous décidons volontairement. Une telle écriture se produit automatiquement. Il suffit que nous arrêtions nos décisions pour qu'elles soient mémorisées d'une façon définitive, ou presque. Elles peuvent alors exercer leurs effets même des années ou des décennies plus tard, sauf si on les oublie. Arrêter ses décisions par avance est comme vouloir vouloir, parce qu'on se décide maintenant à vouloir ce qu'on voudra plus tard. En déterminant sa volonté on la construit.
 
La volonté a quelque chose de magique : il suffit de vouloir lever le petit doigt pour qu'il se lève automatiquement. Il en va de même lorsque la volonté se veut elle-même, lorsqu'elle prend des engagements sur son avenir. Il suffit de vouloir déterminer sa volonté pour qu'elle soit automatiquement déterminée. Mais que ce soit pour l'action sur son environnement ou sur elle-même, la magie de la volonté a toujours des limites. La volonté à elle seule est en général insuffisante pour déplacer des montagnes. Elle ne peut pas non plus faire d'elle-même ce qu'elle ne peut pas être. Si elle se donne des objectifs inaccessibles, elle se condamne à l'impuissance.
Une zone de convergence-divergence (ZCD) est un réseau de neurones, qui reçoit des projections convergentes en provenance des sites dont l'activité doit être mémorisée, et qui renvoie des projections divergentes vers ces mêmes sites (Damasio 1989, 2009). Lorsqu'une expérience est mémorisée, les signaux qui convergent sur la ZCD y excitent des neurones qui renforcent alors leurs connexions réciproques, en suivant la règle de Hebb, et forment ainsi un réseau auto-excitateur. Il suffit alors d'exciter à nouveau le réseau ainsi formé pour reproduire la combinaison de signaux initialement reçus. Dans un réseau auto-excitateur l'excitation d'une partie se propage à toutes les autres. De même un fragment de souvenir suffit pour réveiller l'intégralité d'une expérience mémorisée (Proust 1927). Une ZCD peut être ainsi un lieu d'enregistrement et de reproduction des souvenirs.
 
Nous nous construisons nous-mêmes en permanence, à chaque fois que nous prenons des décisions et que nous vivons leurs conséquences. Comme pour toute construction, le constructeur doit adapter son action aux matériaux disponibles, s'il veut un résultat viable et fiable. La réflexion, la connaissance de soi, est donc essentielle, vitale, pour se construire soi-même.
En plus des voies convergentes-divergentes, une ZCD peut être connectée au reste du cerveau de toutes les façons imaginables, par des signaux en entrée qui l'activent ou l'inhibent, et des signaux en sortie avec lesquels elle fait son effet sur le reste du système. En particulier les ZCD peuvent s'organiser en une arborescence. Une ZCD peut recruter en entrée des voies convergentes issues de nombreuses autres ZCD. Elle peut ainsi faire une synthèse des capacités de détection et de production de toutes les ZCD ainsi recrutées.
 
Pour faire un modèle du système des ZCD, on distingue dans le système nerveux une partie périphérique et une partie centrale. La périphérie réunit les régions dédiées à la perception, à l'émotion et à l'action. L'arborescence des ZCD est organisée d'une façon hiérarchique, de la périphérie vers le centre. Les ZCD les plus périphériques ont des voies convergente issues directement de la périphérie. On se rapproche du centre en remontant les arborescences de ZCD. On peut songer à des racines qui plongent dans la terre, la périphérie, et qui se rapprochent de la base du tronc, le centre. Mais dans le cerveau, il y a de très nombreux centres. Les ZCD les plus centrales ont des voies convergentes issues d'autres ZCD, et ne sont pas recrutées par des ZCD plus centrales. Le souvenir d'un épisode de notre vie pourrait être conservé par une telle ZCD centrale. Lorsque nous revivons les perceptions, les émotions et les actions d'une expérience passée, l'excitation de cette ZCD centrale activerait toutes les ZCD subordonnées, jusqu'aux aires périphériques, et simulerait ainsi l'expérience préalablement vécue.