« Utilisateur:Goelette Cardabela/Sandbox/Annexion et indexation des wiki-livres/Référencement automatique » : différence entre les versions

Contenu supprimé Contenu ajouté
→‎Code d'essai avec wget : WL:RD : * diverses retouches
Ligne 337 :
# Extraire toutes les chaînes de caractères avec mkd option -p et les'' pousser'' dans un nouveau fichier AtrticleUn.str<br />'''<pre>mkd -p '**' ArticleUn.html ArticleUn.str</pre>'''
# Sélectionner les lignes qui contiennent les liens d'images, avec la commande ''grep'', et les ''pousser'' dans un nouveau fichier ArticleUn.img<br />'''<pre>cat ArticleUn.str | grep -n -i -e fichier: -e file: -e image: > ArticleUn.img</pre>'''Signifie : Sélectionner les lignes contenant ''fichier:'' ou ''file:'' ou ''image:'' avec -i : sans distinction majuscules/minuscules et avec -n : numéroter les lignes.<br />Code ArticleUn.img résultant : ligne 42 de ArticleUn.<br />'''<syntaxhighlight lang="html">42:<div class="center"><div class="thumb tnone"><div class="thumbinner" style="width:502px;"><a href="https://fr.wikibooks.org/wiki/Fichier:Gabriel_Garcia_Marquez_-_Fresque.jpg" class="image"><img alt="" src="//upload.wikimedia.org/wikipedia/commons/thumb/b/ba/Gabriel_Garcia_Marquez_-_Fresque.jpg/500px-Gabriel_Garcia_Marquez_-_Fresque.jpg" width="500" height="375" class="thumbimage" srcset="//upload.wikimedia.org/wikipedia/commons/thumb/b/ba/Gabriel_Garcia_Marquez_-_Fresque.jpg/750px-Gabriel_Garcia_Marquez_-_Fresque.jpg 1.5x, //upload.wikimedia.org/wikipedia/commons/thumb/b/ba/Gabriel_Garcia_Marquez_-_Fresque.jpg/1000px-Gabriel_Garcia_Marquez_-_Fresque.jpg 2x" data-file-width="1280" data-file-height="960" /></a> <div class="thumbcaption"><div class="magnify"><a href="https://fr.wikibooks.org/wiki/Fichier:Gabriel_Garcia_Marquez_-_Fresque.jpg" class="internal" title="Agrandir"></a></div>Gabriel Garcia Marquez - Fresque de Pohline Blast</div></div></div></div></syntaxhighlight>'''
# Couper les chaînes avec la commande ''awk'' et comme séparateur le retour chariot '\n' ("\n" double le ''new-line'')<br />Nonbre de champs du fichier ArticleUn.img avec le séparateur de champ "=" : '''cat ArticleUn.img | awk -F"=" '{print NF}'''' ⇒ 20 champs.<br />
::''' <pre>cat ArticleUn.img |awk -F"=" '{for (i=1;i<=NF;i++) print $i "\n"}' | grep https | sed "s/\"/%/g" | cut -d'%' -f2 > ArticleUn.lnk</pre>'''<br
:: />⇒ donne '''un champ $0''' contenant les '''deux liens''' de ArticleUn.img vers la page de l'image sur wikibooks, sur deux lignes : <br />ArticleUn.lnk :<br />{{cadre|couleur fond=#EEE|https://fr.wikibooks.org/wiki/Fichier:Gabriel_Garcia_Marquez_-_Fresque.jpg<br />https://fr.wikibooks.org/wiki/Fichier:Gabriel_Garcia_Marquez_-_Fresque.jpg}}
 
:;Couper le doublon : <pre>'''cat ArticleUn.lnk | sed 'N;s/\nh/%h/g;P;D;' | cut -d'%' -f1 > ArticleUn.lnk3''' :<br />ArticleUn.lnk3images</pre> ( il reste):<br />'''<pre>https://fr.wikibooks.org/wiki/Fichier:Gabriel_Garcia_Marquez_-_Fresque.jpg</pre>'''
<!--: Concaténer les deux lignes : cat ArticleUn.lnk | sed 'N;s/\nh/ h/g;P;D;' > ArticleUn.lnk2
: Séparer les deux liens pour n'en faire qu'un : cat ArticleUn.lnk2 |sed "s/ /%/" | cut -d'%' -f1 > ArticleUn.lnk3