Systèmes sensoriels/Oiseaux/Apprentissage du chant

Les oiseaux: mecanismes neuraux d’apprentissage de chant chez le diamant mandarin

Introduction

Au fil des décennies, les passereaux sont devenus un organisme modèle pour les scientifiques étudiant les comportements complexes ainsi que l’entraînement sensori-moteur. Les jeunes passereaux apprennent les sons qu’ils utilisent pour communiquer en imitant les adultes, tout comme les bébés apprennent à parler en imitant leur parents. Un passereau est d'un intérêt particulier pour la recherche. Il s’agit du diamant mandarin (Taeniopygia guttata). Il est utilisé pour de nombreuses études à cause de sa propension à chanter, se reproduire en captivité ainsi que son temps de maturation relativement court. Le chant d’un male mandarin adulte est une série de signaux acoustiques stéréotypiques ayant une structure ainsi qu’une modulation temporelle allant de la milliseconde à quelques secondes. Le chant d’un adulte est compose d’une séquence répétée de sons, appelée motif, qui dure environ une seconde. Chaque motif est compose de petits clusters de sons appelés syllabes, qui contiennent eux-mêmes des séquences acoustiques plus simples, les notes (Fig.1). Le système d’apprentissage des passereaux est un très bon modèle pour étudier l’intégration du système sensori-moteur car le jeune oiseau écoute activement son tuteur afin de modifier son propre chant en corrigeant les erreurs dans la fréquence de chaque note ainsi que dans le rythme du chant. Le mécanisme neural et l’architecture du cerveau du passereau qui joue un rôle crucial dans l’apprentissage sont très similaires à la region du cortex préfrontal dédiée au traitement du langage chez les humains. Une étude détaillée du résau de neurones hiérarchique dédié au processus d’apprentissage pourrait éclaircir certains mécanismes neuraux sous-jacents de l’apprentissage de la parole chez les humains.

Figure 1: Illustration d'une structure de chant typique & lphases d'apprentissage impliquées lors du chant. Panneau supérieur: Phases impliquées dans le processus d'aprentissage du chant. Panneau du milieu: Structure d'un chant crystallizé a,b,c,d,e denotent les différentes syllabes du chant. Panneau inférieur: Evolution de la dynamique du chant lors de l'apprentissage.

Illustration de la structure typique du chant et les phases d’apprentissages impliquées dans le chant chez les passereaux.

L’apprentissage du chant chez les passereaux se déroule en deux étapes, à savoir, la phase sensorielle et la phase sensori-moteure. Lors de la phase sensorielle, l’oisillon écoute son tuteur (généralement le père), sans produire de vocalisation ressemblant à du chant. L’oiseau utilise cette phase pour mémoriser certaines structures du chant du tuteur, formant ainsi un modèle neural du chant. Ensuite il entre dans la phase sensori-moteure, où il commence ses premiers balbutiements du chant, tout en corrigeant ses erreurs en utilisant du feedback auditif. La première tentative de l’oisillon de recréer ou d’interpréter le modèle neural du chant du tuteur est très bruyant, déstructuré et très variable. Cela s’appelle un sous-chant. Un exemple est montré dans le spectrogramme de la Figure 1. Dans les jours suivants, l’oisillon va entrer dans une “phase plastique”, où il y a une quantité de plasticité signifiante dans le réseau de neurones responsable de la génération de syllabes plus structurées. Ceci va contribuer à réduire la variabilité dans le chant de l’oisillon. Une fois la maturité sexuelle atteinte, la variabilité dans le chant est pratiquement éliminée. Ce processus s’appelle la cristallisation. Le jeune oiseau se mettra alors à produire un chant digne d’un adulte, une imitation frappante du chant du tuteur (Fig.1). La réduction graduelle de variabilité au sein du chant, à partir du stade de sous-chant jusqu’au chant adulte, ainsi que l’augmentation de la qualité d’imitation du chant du tuteur, font partie intégrante de l’apprentissage vocal chez les passereaux. Dans les sections suivantes, nous allons explorer quelques aires du cerveau aviaire, ainsi que les mécanismes neuraux sous-jacents qui sont responsables de la remarquable imitation vocale observée chez les passereaux.

Réseaux de neurones hiérarchiques impliqués dans la génération de séquences du chant

Il est essentiel de comprendre la neuroanatomie des passereaux en détail car elle apporte une quantité signifiante d’informations à propos des mécanismes d’apprentissage impliqués dans plusieurs pathways d’intégration moteur et sensorielle. Ceci pourrait aider à éclaircir le traitement de langage et l’apprentissage vocal chez les humains. Les données neuroanatomiques exactes du traitement de langage chez les humains reste inconnu. Malgré cela, l’anatomie et la physiologie des passereaux pourrait nous aider à faire des hypothèses plausibles à propos des architectures et mécanismes chez les humains. Une comparaison du cerveau mammifère at du cerveau des passereaux (aviaire) est faite dans la dernière section de ce chapitre (Fig.6). La voie impliquées dans le cerveau aviaire peut être divisé en la voie de contrôle moteur et en voie antérieure du cerveau (Fig.2). La voie auditive fournit les signaux codant le feedback ce qui génère des phénomènes de potentiation ou dépression sur les connections synaptiques impliquée dans la voie moteure, qui joue un rôle crucial lors de l’apprentissage vocal. La voie de contrôle moteur comprend l’Hyperstriatum Ventral, pars Caudalis (HVC), le noyeau robuste de l’Acropallium (RA), la subdivision Tracheosyringeale du noyau hypoglossal (nXllts) et le Syrinx. Cette voie est necessaire à la génération de signaux de contrôle moteur requis pour la production de chants hautement structurées ainsi que la coordination de la respiration lors du chant. La voie antérieure du cerveau comprend le noyau magnocellulaire latéral du nidopallium antérieur (LMAN), l’aire X (X) ainsi que le noyau médial du thalamus dorsolatéral (DLM). Cette voie joue un rôle crucial lors de l’apprentissage du chant chez les juvéniles, la variabilité du chant chez les adultes ansi que la représentation du chant. La voie auditive comprend, quant à elle, la substantia nigra (SNc) et l’aire tegmentale ventrale (VTA). Cette voie joue un rôle crucial dans le traitement des signaux auditifs, ainsi que dans l’analyse de feedback des erreurs commises lors de la reproduction du chant. Les muscles du syrinx sont innerves par un sous-groupe de neurones moteurs provenant du nXllt. Une projection principale sur le nXllts provient de neurones dans le noyau du cerveau antérieur (RA). Le noyau RA reçoit des projections liées au système moteur d’une autre region corticale analogue, à savoir le noyau HVC, qui quant à lui reçoit des projections directes de plusieurs zones du cerveau, notamment le noyau thalamique uvaeformis (Uva).

Figure 2. Architecture du cerveau du passereau & différentes voies motrices et de feedback de signaux auditifs.

Mécanismes neuraux pour la génération de patterns de syllabes hautement structurées et temporellement précis

Le noyau HVC et le RA sont impliqués d’une manière hiérarchique dans le contrôle moteur de la chanson (Yu et Margoliash 1996). Des enregistrements chez le diamant mandarin montrent que les neurones du HVC qui projettent au RA transmettent un pattern d’activation extrêmement clairsemé: chaque neurone HVC qui projette au RA génère une rafale de potentiels d’action qui dure à peu près 6 millisecondes a un instant spécifique de la chanson (Hahnloser, Kozhevnikov et al. 2002). Pendant le chant, les neurones du RA génèrent une séquence de rafales à haute fréquence de potentiels d’action qui est relativement complexe. Le pattern ou la séquence en question est reproduite très précisément chaque fois que l’oiseau chante le même motif de la chanson (Yu et Margoliash 1996). Pendant un motif, chaque neurone du RA produit un pattern unique d’à peu près 12 rafales, chacune durant environ 10 millisecondes (Leonardo et Fee 2005). En se basant sur le fait que les neurones du HVC projetant au RA génèrent une seule rafale de potentiels d’action pendant un motif de la chanson et que d’autres neurones semblent générer des rafales à plusieurs instants différents dans le motif, nous pouvons poser l’hypothèse suivante. Ces neurones génèrent une séquence continue d’activité en fonction du temps (Fee, Kozhevnikov et al. 2004, Kozhevnikov et Fee 2007). En d’autres mots, à chaque instant dans la chanson, il y’a un ensemble de neurones HVC projetant au RA actif à et seulement à cet instant (Figure 3). Chaque ensemble de neurones active de façon transitoire (pendant ~10 ms) un sous ensemble de de neurones du RA déterminé par les connections synaptiques des neurones HVC dans le RA (Leonardo et Fee 2005). De plus, dans ce modèle, le vecteur d’activités musculaires, et donc la configuration de l’organe vocal, est déterminé par la convergence des inputs provenant des neurones du RA sur un intervalle de temps relativement petit, d’environ 10 à 20 ms. Le point de vue que les neurones du RA puisse simplement contribuer de façon transitoire, avec un certain poids, à l’activité des muscles vocaux est consistante avec d’autres modèles de contrôle cortical du mouvement des bras chez les primates (Todorov 2000). De nombreuses études suggèrent que le timing de la chanson est contrôlé, sur une base temporelle de l’échelle de la milliseconde, par une vague, ou une chaîne, d’activité qui se propage à travers les neurones HVC. Cette hypothèse est supportée par l’analyse de la variabilité du timing pendant le chant (Glaze et Troyer 2007) ainsi que des expériences dans lesquelles la dynamique des circuits de l’HVC est manipulée afin d’observer l’effet sur le timing du chant. Dans ce modèle, le timing du chant est contrôlé par la propagation d’activité à travers une chaîne dans l’HVC. L’activation séquentielle de cette chaîne est transférée, par les connections du HVC dans le RA, dans une séquence précise de configurations vocales.

Figure 3. Mechanismes de génération de sequence dans le pathway du chant adulte. Illustration de l'hypothèse que les neurones HVC projettant au RA (HVC(RA)) génèrent des clusters d'activation et s'activent séquentiellement entre eux par groupes de 100 à 200 neurones co-actifs. Chaque groupe de neurones HVC stimule un ensemble de neurones du RA pour qu'ils émettent des décharges. Les neurones convergent avec un certain poids effectif au niveau des neurones moteurs pour activer les muscles syrinxaux.

La plasticité synaptique dans la voie du cerveau postérieur est un potentiel substrat pour l’apprentissage vocal

Un grand nombre de zones du cerveau aviaire liées au chant ont été découvertes (Fig.4A). Les zones liées à la production du chant sont l’HVC (Hyperstriatum Ventrale, pars Caudalis) et le RA ( le “robust nucleus of the arcopallium”). Elles génèrent des séquences de patterns d’activité neurale et à travers de neurones moteurs contrôlent les muscles de l’appareil vocal pendant le chant (Yu and Margoliash 1996, Hahnloser, Kozhevnikov et al. 2002, Suthers and Margoliash 2002). Une lésion du HVC ou du RA cause la perte de la capacité à chanter (Vicario and Nottebohm 1988). D’autres voies dans le pathway du cerveau postérieur (AFP) semblent être importantes pour l’apprentissage du chant mais pas pour la génération du chant, chez les adultes. L’AFP peut être vu comme l’homologue aviaire de la boucle thalamocorticale de la membrane basale des mammifères (Farries 2004). En particulier, une lésion dans la zone du LMAN (“le noyau latéral magnocelullaire du nidopallium”) a peu d’effet immédiat sur la production du chant chez les adultes, mais arête l’apprentissage du chant chez les juvéniles (Doupe 1993, Brainard and Doupe 2000). Ces faits suggèrent que le LMAN joue un rôle lors de l’apprentissage du chant, mais la localisation de la plasticité dans le cerveau se situe dans les régions liées à la production du chant, telles que l’HVC et le RA. Doya et Senjowski proposent en 1998 un schéma triparti, dans lequel, l’apprentissage est basé sur des interactions entre un acteur et une critique (Fig.4B). La critique évalue la performance de l’acteur lors d’une certaine tâche. L’acteur utilise alors cette évaluation pour changer sa performance de façon à l’améliorer. Lors d’un apprentissage par tâtonnements, l’acteur exécute sa tâche différemment lors de chaque essai. Ceci génère de bonnes et de mauvaises performances. L’évaluation de la critique est utilisée afin de renforcer les bonnes performances. A l’époque, il était supposé que l’acteur générait ces variations de par lui-même. Cependant, la source de variation est externe à l’acteur. Appelons-la l’expérimentateur. L’acteur identifié, dans notre cas, serait l’HVC, le RA et les neurones moteurs qui contrôlent la vocalisation. L’acteur apprend grâce à la plasticité aux synapses du HVC au RA (Fig.4C). Basé sur des preuves de changements structurels, comme la croissance ou la rétraction des axones qui prennent place dans la projection du HVC au RA, pendant l’apprentissage du chant. Cette proposition est considérée comme un mécanisme plausible. Pour l’expérimentateur et la critique, Doya et Senjowski se sont tournés vers la voie de l’aire antérieure du cerveau, et postulent ue la critique est l’aire X et l’expérimentateur est le LMAN.

Figure 4. La plasticité dans des voies spécifiques permettent l'apprentissage. (A) Voies du chant aviaire et hypothèses tripartites. A : zones du cerveau aviaire impliquées dans la production et l'apprentissage du chant. Le trajet pré-moteur (ouvert) inclut les zones nécessaires à la production du chant. Le trajet antérieur du cerveau (rempli) est requis pour l'apprentissage du chant mais pas pour la production du chant. (B) Schéma tripartite d'apprentissage par renforcement : l'acteur produit un comportement ; l'expérimentateur envoie des entrées variables à l'acteur, produisant une variabilité dans le comportement utilisée pour l'apprentissage par tatônnement ; le critique évalue le comportement de l'acteur et lui envoie un signal de renforcement. Pour le chant des oiseaux, l'acteur comprend les zones de production pré-motrices du chant HVC et RA. (C) Synapses plastiques et empiriques. Le RA reçoit une entrée synaptique à la fois du HVC et du LMAN. Nous appellerons les synapses du HVC "plastiques", en accord avec l'hypothèse selon laquelle ces synapses sont le lieu de la plasticité pour l'apprentissage du chant.

Modèle biophysique realiste des règles de plasticité de l'apprentissage du chant

Le role des projections du LMAN au RA est de générer une fluctuation constante pendant toute la durée d'une séquence du chant, directement dans la force des connections synaptiques du HVC au RA. D'un point de vue fonctionnel, le modèle de Doya et Sejnowski est similaire a la perturbation des poids (weight perturbation)(Dembo and Kailath 1990, Seung 2003) et relativement facile à implémenter: un changement de poids HVC->RA temporaire mais statique qui dure l'entièreté d'une chanson, est capable de changer la performance de la chanson. Si la performance est bonne, la critique renvoie un signal de renforcement, ce qui rendra la perturbation statique temporaire permanente. D'un point de vue neurobiologique, ce modèle nécessite un mécanisme par lequel la transmission synaptique médiée par le N-méthyl-D-aspartate (NMDA) de LMAN à RA peut entraîner des changements de poids synaptiques qui restent stables pendant 1 à 2 secondes. En bref, le LMAN semble donner lieu à des fluctuations rapides et transitoires du chant au niveau subsyllabique, impactée par une transmission excitatrice ordinaire qui entraîne des fluctuations dynamiques de la conductance membranaire postsynaptique dans les neurones postsynaptiques RA. Le but de ce modèle est de lier le un concept de haut niveau, tel que l'apprentissage par renforcement par le schéma triparti, à niveau de description plus simple et biologiquement plausible en termes d'événements microscopiques au niveau des synapses et des neurones dans le système du chant chez les oiseaux. Il devrait démontrer l'apprentissage du chant dans un réseau de neurones à impulsions réalistes et examiner la plausibilité des algorithmes de renforcement pour expliquer l'apprentissage des compétences motrices fines biologiques par rapport au temps d'apprentissage dans le réseau de chants d'oiseaux. Ce modèle est basé sur plusieurs hypothèses similaires à celles faites par Doya and Sejnowski. Nous assumons un schéma triparti acteur-critique-expérimentateur. La critique est faible, et contribue seulement à une évaluation scalaire du signal. La séquence HVC est fixée, et seulement le chemin de l'HVC aux neurones moteurs est mémorisé, ceci par plasticité aux synapses HVC->RA. Le LMAN perturbe le chant à travers ses inputs à la voie pr-motrice du chant. Cependant, la structure et la dynamique des inputs du LMAN, ainsi que leurs influences sur l'apprentissage, sont toutefois différentes, chacune avec des implications neurobiologiques distinctes. En gardant en tête notre hypothèse que la fonction du LMAN sur le RA est de faire l'expérimentateur pour l'apprentissage par tâtonnements, les connections synaptiques du LMAN au RA seront appelées, synapses empiriques (Fig. 4C). La conductance d'une synapse plastique d'un neurone j de l'HVC à un neurone i du RA est donnée par $W_{ij}S_{ij}HVC(t)$ , où l'activation synaptique $S_{ij}HVC(t)$ determine le temps au fil duquel la conductance varie, et le paramètre de plasticité $W_{ij}$ détermine leur amplitude. Les variations dans $W_{ij}$ sont gouvernées par la loi de plasticité qui est donnée par la formule suivante:

{\frac {\partial {{W}_{ij}}}{\partial t}}=\eta \,R(t)\,{{e}_{ij}}(t)

Le paramètre positif $\eta$ , soit la vitesse d'apprentissage, contrôle l'amplitude totale des changements synaptiques. La trace d'éligibilité $e_{ij}(t)$ est une quantité hypothétique présente à chaque synapse plastique. Elle indique si le synapse est "éligible" à une modification par le renforcement et est basée sur l'activation récente du synapse plastique et du synapse empirique sur le même neurone RA.

{{e}_{ij}}(t)=\int \limits _{0}^{t}{d{t}'}\,G(t-{t}')\left[S_{i}^{LMAN}(t)-\left\langle S_{i}^{LMAN}\right\rangle \right]\,\,S_{ij}^{HVC}(t)

Ici, $S_{i}^{LMAN}(t)$ est la conductance de la synapse empirique (LMAN->RA) projettant sur le neurone du RA. Le filtre temporel G(t) est supposé non-négatif, et sa forme détermine à quel point en arrière dans le temps la trace d'éligibilité se rappelle du passé. L'activation instantanée de la synapse empirique dépend de l'activité moyenne $\left\langle \,S_{i}^{LMAN}(t)\right\rangle$ . Les principes d'apprentissage suivent deux principes basiques, illustrés en (Fig.5).

Figure 5. Illustration des règles synaptiques régissant les mécanismes d'apprentissage du chant chez les passereaux.

Règle #1: Si l'activation d'un neurone plastique et d'un neurone empirique coincide sur le même neurone du RA, elle est suivie d'un renforcement positif, la synapse est alors renforcée. Règle #2: Si l'activation d'une synapse plastique se fait sans l'activation d'une synapse empirique sur le même neurone du RA et est suivie d'un renforcement positif, alors la synapse est affaiblie. Ces règles basées sur les perturbations de conductance dynamiques des neurones acteurs effectuent une montée en gradient stochastique sur la valeur attendue du signal de renforcement. Cela signifie que la performance du chant, telle qu'évaluée par le critique, est garantie de s'améliorer en moyenne.

Comparaison de l'architecture du cerveau des mammifères et des oiseaux

L'aire X aviaire est homologue aux ganglions basaux (GB) des mammifères et comprend des types de cellules striates et pallidales. Les GB font partie d'une boucle anatomique hautement conservatrice qui traverse plusieurs stations, du cortex aux GB (striatum et pallidum), puis au thalamus et retour au cortex. Des boucles similaires sont observées chez les oiseaux : le noyau analogue cortical LMAN se projette sur l'aire X, dont les composants striataux se projettent sur le noyau thalamique DLM, qui se projette à nouveau sur LMAN. Les composants striataux sont responsables de l'apprentissage basé sur la récompense et de l'apprentissage par renforcement. Les types de neurones et leurs fonctions sont exactement comparables dans l'aire X des oiseaux aux ganglions basaux humains, comme le montre la figure 6. La similarité anatomique étroite nous motive à étudier le cerveau des oiseaux chanteurs en plus de détails, car cela nous permettra enfin de comprendre de manière significative l'apprentissage de la parole chez l'homme et de traiter de nombreux troubles de la parole avec une plus grande précision.

Figure 6. Comparaison de la circuiterie des ganglions basaux du cortex antérieur des mammifères et des oiseaux

References

Brainard, M. S. and A. J. Doupe (2000). "Auditory feedback in learning and maintenance of vocal behaviour." Nat Rev Neurosci 1(1): 31-40.

Dembo, A. and T. Kailath (1990). "Model-free distributed learning." IEEE Trans Neural Netw 1(1): 58-70.

Doupe, A. J. (1993). "A neural circuit specialized for vocal learning." Curr Opin Neurobiol 3(1): 104-111.

Farries, M. A. (2004). "The avian song system in comparative perspective." Ann N Y Acad Sci 1016: 61-76.

Fee, M. S., A. A. Kozhevnikov and R. H. Hahnloser (2004). "Neural mechanisms of vocal sequence generation in the songbird." Ann N Y Acad Sci 1016: 153-170.Glaze, C. M. and T. W. Troyer (2007). "Behavioral measurements of a temporally precise motor code for birdsong." J Neurosci 27(29): 7631-7639.

Hahnloser, R. H., A. A. Kozhevnikov and M. S. Fee (2002). "An ultra-sparse code underlies the generation of neural sequences in a songbird." Nature 419(6902): 65-70.

Kozhevnikov, A. A. and M. S. Fee (2007). "Singing-related activity of identified HVC neurons in the zebra finch." J Neurophysiol 97(6): 4271-4283.

Leonardo, A. and M. S. Fee (2005). "Ensemble coding of vocal control in birdsong." J Neurosci 25(3): 652-661.

Seung, H. S. (2003). "Learning in spiking neural networks by reinforcement of stochastic synaptic transmission." Neuron 40(6): 1063-1073.

Suthers, R. A. and D. Margoliash (2002). "Motor control of birdsong." Curr Opin Neurobiol 12(6): 684-690.

Todorov, E. (2000). "Direct cortical control of muscle activation in voluntary arm movements: a model." Nat Neurosci 3(4): 391-398.

Vicario, D. S. and F. Nottebohm (1988). "Organization of the zebra finch song control system: I. Representation of syringeal muscles in the hypoglossal nucleus." J Comp Neurol 271(3): 346-354.

Yu, A. C. and D. Margoliash (1996). "Temporal hierarchical control of singing in birds." Science 273(5283): 1871-1875.