« Goélette Cardabela/Références » : différence entre les versions

Contenu supprimé Contenu ajouté
Ligne 1 263 :
==== Quellle documentation peut-on extraire de ces fichiers ? ====
On peut extraire les liens et obtenir une page ''Index'' très complète. Cependant ce système ne permet pas de préciser directement les pages ni les Licences associées, pour cela il faut automatiser la lecture des pages d'images et compléter les noms des auteurs et les licences.
; Projet flouà l'étude :
# Transformer le fichier ArticleUn.1 en fichier html avec les commandes cat et sed :<br />'''<pre>cat ArticleUn.1 | sed -e "s/\"\/wiki\//\"https:\/\/fr.wikibooks.org\/wiki\//g" > ArticleUn.html</pre>''' Signifie : Remplacer de façon récursive (option g) la chaîne de caractères ''"/wiki/'' par la chaîne''<nowiki>"https://fr:wikibooks.org/wiki/</nowiki>'' et la copier dans un fichier ArticleUn.str
# Extraire toutes les chaînes de caractères avec mkd option -p ''(mkd -p '**' ArticleUn.html ArticleUn.str)''
# ''Vérifier avec le navigateur internet que ce fichier html a bien été correctement modifié et s'affiche correctement.''
# Sélectionner les chaînes qui contiennent les liens d'images ''(src ou upload)' avec la commnde ''grep'' ou ''awk''
# CouperExtraire toutes les chaînes de caractères avec lamkd commandeoption -p<br />''split''<pre>mkd avec-p comme séparateur'**' le retour chariotArticleUn.html ArticleUn.str</pre>''\n'
# Sélectionner les chaînes qui contiennent les liens d'images avec la commande ''grep''<br />'''<pre>cat ArticleUn.str | grep -n -i -e fichier: -e file: -e image: > ArticleUn.img</pre>'''Signifie : Sélectionner les lignes contenant ''fichier:'' ou ''file:'' ou ''image:'' avec -i sans distinction majuscules/minuscules et avec -n numéroter la ligne.
# Couper les chaînes avec la commande ''awk et split'' avec comme séparateur le retour chariot '\n'
# -
# Sélectionner les liens d'images et les compléter pour éditer la page de l'image.