« Utilisateur:Goelette Cardabela/Sandbox/Annexion et indexation des wiki-livres/Référencement automatique » : différence entre les versions
Contenu supprimé Contenu ajouté
m →{{75}}Extraire les liens des images de la page ArticleUn ( Étude en cours) : WL:RD : * diverses retouches |
→{{0}}Construire la section Source des articles; droits; auteur(s), de la page Annexe ( Projet ) : WL:RD : ! mise en page, * diverses retouches |
||
Ligne 320 :
<li id="footer-info-copyright">Les textes sont disponibles sous <a href="//creativecommons.org/licenses/by-sa/3.0/">licence Creative Commons attribution partage à l’identique</a> ; d’autres termes peuvent s’appliquer.<br/>
</syntaxhighlight>'''
====== Extraire les chaînes de caractères de la page html ======
Les commandes ci-après sont à inclure dans un fichier shell bash pour l'exécution automatique. On pourra ensuite essayer de créer un équivalent pour Windows 10.
# Transformer le fichier ArticleUn.1 en fichier html avec les commandes cat et sed :
::'''<pre>cat ArticleUn | sed -e "s/\"\/wiki\//\"https:\/\/fr.wikibooks.org\/wiki\//g" > ArticleUn.html</pre>''' Signifie : Remplacer de façon récursive (option g) la chaîne de caractères ''« "/wiki/ »'' par la chaîne''<nowiki>« "https://fr:wikibooks.org/wiki/ »</nowiki>'' et ''concaténer'' le résultat dans un nouveau fichier ArticleUn.html
# ''Vérifier avec le navigateur internet que ce fichier html a bien été correctement modifié et s'affiche avec un navigateur web. Remarque: La mise en page n'est pas copiée.''
# Extraire toutes les chaînes de caractères avec mkd option -p et les copier dans un nouveau fichier AtrticleUn.str
::'''<pre>mkd -p '**' ArticleUn.html ArticleUn.str</pre>'''
====== {{0}}Construire la section ''Source des articles; droits; auteur(s)'', de la page ''Annexe'' ( Projet ) ======
|