« Goélette Cardabela/Références » : différence entre les versions
Contenu supprimé Contenu ajouté
m →Quellle documentation peut-on extraire de ces fichiers ? : WL:RD : * diverses retouches |
m →Quellle documentation peut-on extraire de ces fichiers ? : WL:RD : * diverses retouches |
||
Ligne 1 263 :
==== Quellle documentation peut-on extraire de ces fichiers ? ====
On peut extraire les liens et obtenir une page ''Index'' très complète. Cependant ce système ne permet pas de préciser directement les pages ni les Licences associées, pour cela il faut automatiser la lecture des pages d'images et compléter les noms des auteurs et les licences.
; Projet
# Transformer le fichier ArticleUn.1 en fichier html avec les commandes cat et sed :<br />'''<pre>cat ArticleUn.1 | sed -e "s/\"\/wiki\//\"https:\/\/fr.wikibooks.org\/wiki\//g" > ArticleUn.html</pre>''' Signifie : Remplacer de façon récursive (option g) la chaîne de caractères ''"/wiki/'' par la chaîne''<nowiki>"https://fr:wikibooks.org/wiki/</nowiki>'' et la copier dans un fichier ArticleUn.str
# ''Vérifier avec le navigateur internet que ce fichier html a bien été correctement modifié et s'affiche correctement.''
#
# Sélectionner les chaînes qui contiennent les liens d'images avec la commande ''grep''<br />'''<pre>cat ArticleUn.str | grep -n -i -e fichier: -e file: -e image: > ArticleUn.img</pre>'''Signifie : Sélectionner les lignes contenant ''fichier:'' ou ''file:'' ou ''image:'' avec -i sans distinction majuscules/minuscules et avec -n numéroter la ligne.
# Couper les chaînes avec la commande ''awk et split'' avec comme séparateur le retour chariot '\n'
# -
# Sélectionner les liens d'images et les compléter pour éditer la page de l'image.
|