« La documentation/Langages documentaires à structure combinatoire, thésaurus » : différence entre les versions

 
..........
 
Il est également possible de présenter les thésaurus sous forme de schémas fléchés, après un découpage du domaine en champs sémantiques, c'est-à-dire en groupes de 30 à 40 descripteurs hiérarchisés relatifs à un même thème. Le descripteur le plus général du groupe fournit le titre de la page, dont il occupe le centre. Ce schéma peut être réalisé en se servant d'un quadrillage dont les cases sont numérotées, à moins que l'on préfère les coordonnées polaires.
 
== Thésaurus et macro thésaurus ==
 
Les thésaurus connaissent actuellement un important développement, lié à l'informatisation grandissante des systèmes documentaires. Les '''macro thésaurus''', encore peu nombreux actuellement, sont destinés à servir de cadre commun à un ensemble de systèmes documentaires touchant à des domaines différents. Ils restet à un niveau de généralité assez élevé mais peuvent servir de structures d'accueil pour des thésaurus spécialisés.
 
Le thésaurus de l'Organisation de Coopération et de Développement Économique (OCDE), édité en 1972, recouvre 19 rubriques divisées en 24 sous-rubriques (culture, société, éducation, formation, agriculture, industrie, travail, démographie, population, etc.). Pas moins de 27 organisations ont collaboré à ce travail, qui a demandé trois ans.
 
Le macro thésaurus des Sciences et Techniques du Bureau National de l'Information Scientifique et Technique (BNIST) couvre par exemple les cinq secteurs suivants :
 
- mathématiques - physique.
- terre - mer - espace - sciences de l'ingénieur
- médecine - biologie - agriculture
- chimie
 
 
== Informatique documentaire ==
 
L'ordinateur, par sa formidable puissance de traitement des données, est un outil dont les documentalistes se sont emparés avec avidité depuis déjà bien des années. Des progrès étonnants ont déjà été accomplis mais d'autres restent à venir :
 
* énormes possibilités de '''stockage d'information''' sur de nouveaux types de mémoires informatiques, '''numérisation d'images'''...
 
* '''lecture automatique''' des documents écrits, grâce à la vision artificielle.
 
* '''indexation automatique''' : l'ordinateur peut, si on le lui a appris, reconnaître les mots vides et les distinguer des mots ou expressions susceptibles de servir de descripteurs. Il peut également étudier la fréquence à laquelle ces descripteurs surviennent dans le texte. Cependant, il est actuellement incapable de reconnaître à coup sûr le sens d'un mot, si celui-ci est caractérisé par une forte polysémie.
 
* '''traduction automatique''' : elle est actuellement loin d'être vraiment opérationnelle, sauf pour des textes très simples. Naturellement, l'ordinateur ne sait pas encore reconnaître les jeux de mots ou s'esclaffer en lisant des histoires belges ; les automatismes actuels, qui sont encore bien médiocres par rapport au but à atteindre, donnent parfois de bien étranges analyses que l'homme se doit de corriger.
 
* développement de la '''télématique''' : cette rencontre des télécommunications et de l'information, autorise maintenant ce rêve du documentaliste, ''avoir la documentation traitée et stockée chez les autres et y accéder rapidement à partir de son propre centre de documentation'' (J. Chaumier, 1982).