Le système d'exploitation GNU-Linux/Le backup : tar et gzip



Régulièrement, il vous faudra archiver des informations, en particulier des données utilisateurs. Pour cela, le système GNU/Linux intègre 2 outils: TAR et GZIP. Comme vous allez le voir, ces 2 outils sont complémentaires dans le procéssus d'archivage des données, ou backup.

Archiver des données avec tarModifier

Le nom de cette commande vient du système de sauvegarde sur bande: Tape ARchive. Le principe est simple : prendre un grand nombre de fichiers (et/ou de répertoires) et les regrouper en un seul gros. tar est une commande récursive. Elle va archiver toute l'arborescence en partant du répertoire que vous lui spécifiez.


ArchivageModifier

Syntaxe :

 $ tar cf <nom du fichier tar> <nom du répertoire à archiver>

Si vous rajoutez v après c, la commande va afficher à l'écran toutes ses actions.

Exemple:

 # tar cvf etc.tar /etc
 tar: Removing leading `/' from member names /etc
 # ls -l etc.tar
 -rw-r--r-- 1 root root 2829320 Nov 12 18:41 etc.tar

Note: Comme vous le voyez sur notre exemple, la commande tar retire le / du répertoire parent. En faisant cela, elle évite les écrasements de fichiers dans le cas ou vous restituez votre fichier au même endroit.

Test de l'archiveModifier

Une fois l'archivage effectué, vous pouvez vérifier votre archive avec la commande :

 $ tar tf <nom du fichier tar>

RestitutionModifier

 # tar xf <nom du fichier tar>

De même, si vous rajoutez v après x, la commande affichera les informations.

Exemple:

 # tar xvf etc.tar
 etc/
 etc/GNUstep/
 etc/GNUstep/Defaults/
 etc/GNUstep/Defaults/WMGLOBAL
 etc/GNUstep/Defaults/WMRootMenu
 etc/GNUstep/Defaults/WMState
 ...

Compresser un fichier avec gzipModifier

La commande gzip est un compresseur de données. Il va partir d'un fichier et compresser l'information pour en diminuer la taille.


Compresser un fichierModifier

 $ gzip <nom du fichier à compresser>

Exemple :

 # ls -l images.tar*
 -rw-r--r-- 1 root      root      10240 Nov  8 20:00 images.tar
 # gzip images.tar
 # ls -l images.tar*
 -rw-r--r-- 1 root      root       4662 Nov  8 20:00 images.tar.gz

En utilisant ls -l , on voit très bien la taille du fichier images non compressé, qui est passé de 10240 octets à 4662 octets.

Pour compresser tous les fichiers d'un dossier, gzip -r.

Décompresser un fichierModifier

 $ gzip -d <nom du fichier gzip>

Exemple:

 # ls -l images.tar*
 -rw-r--r-- 1 root      root       4662 Nov  8 20:00 images.tar.gz
 # gzip -d images.tar.gz
 # ls -l images.tar*
 -rw-r--r-- 1 root      root      10240 Nov  8 20:00 images.tar

Combiner tar et gzipModifier

On peut combiner tar et gzip pour archiver et compresser en une action (option z) :

 # tar cvzf <nom du fichier archivé compressé>.tar.gz <nom du répertoire à archiver et compresser>
À faire... 

parler des autres outils : dump/restore, compress, cpio ...

Les alternatives à gzipModifier

bzip2Modifier

bzip2 est un autre algorithme de compression. Il est plus performant mais beaucoup moins rapide que gzip.

Pour compresser un fichier avec bzip2 :

 # bzip2 unfichier

Pour le décompresser :

 # bzip2 -d unfichier.bz2


Tout comme gzip, on peut indiquer à tar d'utiliser bzip2 pour compresser l'archive (option j):

 # tar cjf cible.tar.bz2 /repasauver

Comparaison des logiciels de compressionModifier

Comparaison des logiciels de compression

Un shell script de sauvegarde journalière de /etcModifier

Voici un shell script qui permet de sauvegarder quotidiennement le répertoire /etc :

 #!/bin/bash
 #
 # Ne pas oublier : 
 # - de creer le repertoire /backup : mkdir /backup
 # - de rendre ce script executable : chmod +x backup_etc
 #
 # Tester le script une fois manuellement : ./backup_etc
 #
 # Le rajouter dans la crontab
 DATEJOUR=$(date +"%Y-%m-%d-%H-%M-%S")
 REPABACKUPER="/etc"
 REPBACKUP="/backup"
 NOMFIC=$REPBACKUP/etc-$DATEJOUR.tgz
 tar czf $NOMFIC $REPABACKUPER


Les sauvegardes incrémentalesModifier

La commande find permet de trouver des fichiers correspondants à des critères donnés. On peut par exemple connaître la liste des fichiers modifiés depuis 1 jour :

 # find / -mtime -1 -type f

En combinant la commande find et la commande tar, on peut ainsi facilement sauvegarder les fichiers modifiés depuis la veille, et ainsi réaliser une sauvegarde incrémentale.

La commande suivante retourne la liste de tous les fichiers du système modifiés depuis hier (en excluant les fichiers contenus dans /proc, /dev et /sys), et stocke la liste de ces fichiers dans le fichier /tmp/fic_du_jour:

 # find / \( -path /proc -o -path /dev -o -path /sys \) -prune -o 
   -mtime -1 -type f -print > /tmp/fic_du_jour

On peut ensuite appeler la commande tar avec l'option -T qui permet d'indiquer la liste des fichiers à archiver :

 # tar cz -T /tmp/fic_du_jour -f backup.tgz

Grâce aux tubes (pipe), on peut s'affranchir de passer par un fichier temporaire et directement enchaîner les deux commandes :

 # find / \( -path /proc -o -path /dev -o -path /sys \) -prune -o 
   -mtime -1 -type f -print | tar cz -T - -f backup.tgz

Toujours grâce aux tubes, on peut découper le fichier obtenu en plusieurs fichiers d'une taille donnée :

 # find / \( -path /proc -o -path /dev -o -path /sys \) -prune -o 
   -mtime -1 -type f -print | tar cz -T - | split - -b 5m backup_
 
 # ls -lh backup_*
 -rw-r--r-- 1 root root 5,0M 2007-12-06 14:30 backup_aa
 -rw-r--r-- 1 root root 5,0M 2007-12-06 14:30 backup_ab
 -rw-r--r-- 1 root root 5,0M 2007-12-06 14:30 backup_ac
 -rw-r--r-- 1 root root 3,5M 2007-12-06 14:30 backup_ad

Pour re-assembler les fichiers découpés, on utilise la commande cat :

 # cat backup_* > backup.tgz

Les logiciels spécialisésModifier

À faire... 

parler de rsync, amanda, bacula, mondorescue et partimage