Utilité des statistiques pour un site Internet ?

modifier

Les statistiques fournies par Piwik, si elles sont correctement analysées, permettent très rapidement d’améliorer la gestion du visiteur sur le site, et donc d'améliorer les statistiques d'accès globales. La connaissance de vos visiteurs est un atout très important, car vous pourrez faire évoluer votre site en fonction de leur besoin et intérêts. Vous saurez par exemple quelles pages intéressent le plus, celles qui intéressent le moins (peut être devrez vous améliorer vos liens, mettre à jour le contenu ?). Par exemple si vos visiteurs passent du temps sur le site (plus de quelques minutes en moyenne), cela signifie qu’il propose un contenu non négligeable qui intéresse ; un temps court de visite peut être synonyme d’une page d’accueil peu accrocheuse, d’un contenu pauvre ou au contraire d’un site régulièrement (re)visité, les visiteurs s’intéressant alors majoritairement aux nouveautés (pourquoi ne pas augmenter la fréquence de mises à jour ?).

Il est aussi important de tirer des conclusions sur les évolutions des statistiques (nombre de visites, nombre de pages vues) : pourquoi les chiffres sont ils en hausse soudaine ? Avez vous récemment ajouté un nouveau type de contenu ou complété celui existant ? Au contraire, suite à une brusque diminution du trafic, avez vous des éléments de réponse : est ce simplement un site au contenu événementiel, donc passager, ou est ce dû à un manque dans la publication de nouveautés ? Ou encore à un changement dans l'architecture du site qui n'a peut être pas convaincue ? Il existe ainsi de nombreuses questions que l'on peut se poser, simplement en observant les évolutions dans les chiffres ; les conclusions les plus faciles sont celles faites suites à l'observation des statistiques sur des périodes longues, comme le mois par exemple.

Il vous sera possible d’aller encore plus loin grâce à l’analyse du suivi du visiteur : connaissant les principales pages d’arrivées, si celles ci sont peu convaincantes (si elles ont un taux de sortie élevé), vous devrez améliorer leur apparence, mettre plus de liens disponibles, favoriser la navigation dans votre site sur ces pages précisément. Si certains chemins sont peu empruntés, essayez de comprendre pourquoi et d’améliorer votre architecture dans ce sens.

De même la provenance (votre site intéresse t-il seulement des francophones ?) ainsi que les aspects matériels sont fondamentaux dans la conception et l’évolution de votre site. Pourquoi par exemple s’efforcer de maintenir à jour une version anglaise d’un site si celle ci ne reçoit pas de visite ? Pourquoi optimiser le site pour Netscape 4.5 si moins de 0,1% des visiteurs du mois précédent utilisaient ce navigateur ? Votre site optimisé en 1024*768 reçoit beaucoup de visiteurs avec une résolution de 800*600 ? Assurez vous que votre site soit compatible aussi pour cette résolution ! Ce sont des points indispensables à la réussite et à l’évolution de votre site web.

Vous ne devrez pas non plus négliger le référencement de votre site : consultez pour cela les mots clés qui ont permis à vos visiteurs d’arriver sur le site, les moteurs utilisés, etc. Si peu de visiteurs arrivent par des moteurs de recherche, essayez de correctement vous référencer (avez vous bien mis les balises <meta> de description et de mots clés sur toutes vos pages ?). Vous pourrez améliorer votre référencement de manière significative de cette manière !

Pour plus de renseignements sur chaque rubrique et statistique proposée par Piwik, consultez la partie suivante qui décrit en détail les différentes fonctionnalités de la mesure d'audience de sites Internet, et qui donne des pistes d'analyse des différents résultats.

Statistiques & informations fournies par Piwik

modifier

Les statistiques fournies par Piwik sont assez nombreuses et structurées en 5 grandes rubriques principales. Elles évoluent continuellement au fur et à mesure des différentes versions publiées. Dans des prochaines versions la structure pourrait encore être transformer pour intégrer de nouvelles informations et fonctionnalités.

Vous trouverez ci-dessous une description exhaustive des différentes rubriques et fonctionnalités de Piwik. Chaque fonctionnalité sera analysée et nous tenterons de répondre à la question : Comment analyser les statistiques de sites internet ? Pourquoi un simple compteur de visite n'est pas suffisant ? Comment tirer des conclusions et quelle réaction adopter en fonction des résultats de votre mesure d'audience ?

Si vous-même vous tirez des conclusions différentes de celles présentées par la suite, n'hésitez pas à nous en informer. Nous serions intéressés de voir les utilisations faites de ces résultats par les utilisateurs de Piwik. L'interprétation personnelle peut être très diverse, et il serait très intéressant de constituer une sorte d'encyclopédie de l'analyse d'audience et de l'étude de l'évolution de la fréquentation de sites Internet.

Visites

modifier

Cette rubrique est la rubrique par défaut, car elle fournie les chiffres nécessaires à une rapide étude de l'évolution du site dans le temps : le trafic du site est il plus important aujourd'hui, ce mois ou cette semaine ?

Statistiques

modifier

Vous trouverez dans cette rubrique de nombreuses informations sur les visiteurs de votre site Internet. Il est important de bien faire la distinction entre les visites et les visiteurs uniques : une même personne, appelée visiteur unique, peut visiter plusieurs fois le site Internet dans la même journée. Un visiteur unique peut donc faire plusieurs visites. Le nombre de visiteurs uniques sera donc toujours inférieur ou égal au nombre de visites. Une grande différence entre ces 2 chiffres est signe d'un intérêt important des visiteurs, qui reviennent plusieurs fois dans la journée sur le site Internet. Votre public se fidélise à court terme, ce résultat intéressant prouve que vous avez certainement un contenu dynamique intéressant et régulièrement mis à jour. Si le nombre de visiteurs uniques et de visites est presque le même, ce n'est pas pour autant un point négatif ; mais peut être pourriez vous essayer de favoriser les mises à jour, et si votre site est important, pourquoi ne pas créer un forum qui permettrait aux visiteurs de se rencontrer et de traiter des sujets en relation avec le site ?

Le nombre de pages vues précise, comme son nom l'indique, le nombre de pages différentes que vos visiteurs ont consulté sur le site. Bien sûr, seules les pages sur lesquelles vous avez placé le code JavaScript seront comptées. L'analyse plus profonde des pages vues a lieu dans la rubrique correspondante (lire Analyser les statistiques sur les pages vues).

Vous connaîtrez aussi la moyenne de page vue par visiteur ; si ce nombre est important, cela montre que votre site dispose d'un contenu important, que la structure actuelle incite les visiteurs à cliquer plusieurs fois sur les liens proposés et à réellement naviguer sur le site, c'est donc très positif. Une moyenne de pages vues par visiteur supérieure à 8 pages est un excellent résultat, la moyenne se situant généralement vers 4-5 pages.

Le temps moyen de visite ou par page vue sur le site vous permettra d'avoir un ordre d'idée de la durée moyenne de parcours sur le site, ou sur une page. Une courte durée (inférieure à 2 minutes) sera certainement signe d'un faible nombre de pages vues par visiteur, et à l'inverse un temps de visite important (est considéré comme importante une durée moyenne supérieure à 6 minutes) est un signe très positif : les visiteurs prennent leur temps à la lecture du site, s'intéressent au contenu (certainement riche).

Le taux de visites à une page vue indique le pourcentage de visiteurs qui n'ont consulté qu'une seule page sur le site et ont fermé la fenêtre. Cela peut être dû à plusieurs facteurs : page d'accueil non attrayante (lisez à ce sujet Les analyses des pages vues en entrées ou Les pages de sorties, les pages qui repoussent les visiteurs), un mauvais référencement (les mots clés qui vous apportent des visiteurs sont ils cohérents avec le contenu du site ? Lisez à ce sujet Analyser les mots clés des moteurs de recherche), la cohérence visuelle du site est elle évidente ? Votre site est il accessible à tous : avez vous beaucoup d'images lourdes (problèmes avec les petites connexions de type 56K) ou le site nécessite t-il un plugin particulier ? Faites le savoir clairement et expliquer comment le télécharger et l'installer. À propos de la compatibilité avec les différents navigateurs, lisez Analyse des résultats des navigateurs des visiteurs.

Récapitulatifs sur la période

modifier

Cette rubrique vous permettra de consulter un récapitulatif de vos statistiques sur une période qui dépend de la période sélectionnée. Par exemple si vous auditez la journée d'hier, le tableau vous présentera un récapitulatif des nombres de visites et de pages vues des 7 jours précédant le jour audité. De même si vous étudiez une semaine en particulier, les 7 semaines précédentes seront présentées et comparées (idem pour le mois).

Les chiffres présentés entre parenthèses et en petit caractère sont ceux du jour correspondant à la colonne en cours. Les pourcentages indiquent l'évolution du chiffre du jour audité par rapport au jour de la colonne courante. Par exemple, si vous avez +59% cela veut dire que vos chiffres du jour que vous auditez sont en hausse par rapport au jour de la colonne courante, c'est donc positif pour votre site (ce qui explique la couleur verte utilisée pour les résultats). De même s'il est indiqué -15%, le résultat est en baisse par rapport au jour en question (une baisse de la fréquentation est négatif pour le site internet, ce qui explique la couleur rouge utilisée). Le texte [ Non archivé ] apparaît si la période... n'est pas archivée. Pour régler le problème, il vous suffit de consulter les statistiques de cette période (cela enclenchera le calcul des données). Il vous suffit ensuite de reconsulter la période qui vous intéresse, et toutes les données apparaîtront.

Depuis la version 1.2 et suite aux demandes de nombreux utilisateurs, l'ordre est maintenant de gauche à droite pour la chronologie du tableau (idem pour le graphique récapitulatif). De plus la comparaison se fait bien sur les 7 jours précédents la journée auditée, et il inclue la journée en cours pour plus de clarté.

Graphique récapitulatifs de l'audience sur une période

modifier

Reprenant les résultats du tableau récapitulatif, le graphique permet une visualisation plus rapide des résultats. La droite rouge représente le nombre de pages vues mesurées et les barres oranges les visites comptabilisées durant les différentes périodes. Notez que l'échelle des pages vues n'a pas 0 comme origine, la droite peut donc varier brusquement ; cela permet de mettre en valeur les variations, mêmes faibles, des statistiques des pages vues.

Graphique durée des visites

modifier

Ce graphique expose les temps de visites moyens. Plus précisément il permet de répondre à la question « Combien de temps passent les visiteurs sur mon site Internet ? ». Indication plus pertinente que la simple moyenne de la durée des visites, le graphique vous présente le nombre de personnes ayant accédé au site pendant une durée pré-déterminée. Vous pourrez alors analyser les résultats pour déterminer si les personnes passent très peu de temps (désintérêt du visiteur, ou simple visite pour vérifier si une mise à jour a été effectuée), ou si globalement les temps de visites sont élevés (site à contenu conséquent qui intéresse le visiteur). Un temps de visite moyen de 4min peut par exemple révéler que la moitié des personnes ne restent que 30s sur le site et la majorité de l'autre moitié y passe plus de 8min. Il est important de mettre en corrélation ces deux résultats. Si les échelles pré-déterminées ne vous semble pas optimales, n'hésitez pas à nous le faire savoir (postez un message sur le forum « Suggestions et questions diverses » sur le site officiel).

Graphique visites heures serveur

modifier

Ce graphique présente le nombre de visites mesurées par rapport à l'heure du serveur. Cette information peut être utile si vous souhaitez faire des mises à jour sur le serveur directement et qu'il risque d'y avoir des dysfonctionnements sur le site Internet (coupures, interruptions, serveur de base de données temporairement indisponible). Il est bon de choisir un créneau horaire ou le site est peu visité, d'où l'intérêt des informations des visites par heures du serveur. Bien sûr si votre serveur n'est pas dans votre fuseau horaire, faites une rapide conversion pour vous assurer d'effectuer les transformations à l'heure serveur réelle !

Graphique visites heures locales

modifier

Ce graphique présente les horaires utilisées par vos visiteurs lorsqu'ils visitent votre site Internet. Cela ne présente qu'un faible intérêt, mais peut être utile pour mettre en valeur le type de population de votre site (surfent-ils plutôt pendant les horaires de travail ou plutôt le soir et pendant les pauses ?).

Lieux de connexion

modifier

Ce graphique vous présente les lieux de connexion privilégiés par vos visiteurs. Se connectent ils plutôt le soir, le matin et pendant les pauses sur votre site, ou au contraire essentiellement au travail ? Les connexions entre 8h et 12h, et entre 14h et 18h les jours ouvrés (sans le Samedi et le Dimanche) sont considérés comme heure de travail. Le reste est considéré comme des connexions effectuées depuis le domicile.

Pages vues

modifier

Les résultats de cette rubrique vous permettront de connaître les parties précises du site qui intéresse vos visiteurs. Toutes les données pour la période sélectionnée seront comparées aux données de 2 périodes antérieures (J-7 et J-14 pour les visites, semaines et mois précédents pour les semaines et mois).

Statistiques globales

modifier

Dans le tableau vous est rappelé plusieurs statistiques importantes : le nombre de pages vues, le nombre de pages vues différentes : combien de pages ayant un nom différent ont été vues ? Est ce justement le nombre de pages total de votre site, auquel cas toutes les pages du site ont été vues au moins une fois ? Il indique aussi le record de pages vues pour un visiteur.

Tableau des détails des pages vues

modifier

Ce tableau présente les différentes page accédées sur votre serveur. Le nom correspond au chemin complet du fichier correspondant à la page mesurée (notez que les pages vues sont enregistrées en minuscule, nous conseillons en effet de ne pas donner de pages ou de variables sensibles à la casse). Le tableau met en avant les pages les plus visitées, et il est conseillé de regarder avec intérêt les évolutions dans ces pages, mais aussi les pages de votre site qui ne semblent pas appréciées (ou dont la cote de popularité est en baisse). Sont-elles faciles d'accès ? Les liens qui pointent vers ces pages sont ils correctement mis en avant sur le site ? Les mots clés sont ils bien choisis dans le texte des pages ? (le choix de mauvais mots clés dans un texte peut être synonyme de désintérêt par les moteurs de recherche).

Certaines pages peuvent être de la forme « C:\toto\php\superbe.htm » (ou l'équivalent sur Linux : /usr/test/ ou même /toto/ alors que ce répertoire n'existe pas sur le site) : cela est dû à des visiteurs qui ont sauvegardé les pages de votre site sur leur ordinateur et qui y accèdent par celui-ci. Le code JavaScript est bien sûr toujours présent dans la page, l'appel à Piwik se fait donc toujours et l'enregistrement des logs a lieu dans votre base de données. Ces pages peuvent être considérées comme parasites mais elles font réellement partie de votre audience. Une option sera certainement développée dans une prochaine version pour permettre aux webmasters qui le souhaitent de désactiver l'enregistrement de pages de ce style.

Graphique des visites par nombre de pages vues

modifier

Ce graphique présente le nombre de visites qui ont eu lieu par nombre de pages vues comptabilisées. Un grand nombre de visiteurs qui n'ont consulté que 1 ou 2 pages est en général assez mauvais signe, mais cela reste très fréquent et ne doit pas vous alarmer. Néanmoins il convient de se poser les bonnes questions : le site est il mis à jour fréquemment ? Ajoutez vous des articles, du contenu divers de manière régulière ? Votre site, à première vue, est il cohérent avec le sujet traité ? Que ce soit au niveau des couleurs, de la présentation (est ce très strict ou plutôt artistique ? Cela correspond il à votre audience ?) ou même tout simplement des termes employés tout au long des premières pages ? N'hésitez pas à vous questionner ainsi, les conclusions que vous tirerez pourront être très favorables à l'évolution de votre trafic.

Graphique pages vues par heures serveur

modifier

cf description de Graphique visites heures serveur

Graphique pages vues par heures locales

modifier

cf description de Graphique visites heures locales

Suivi du visiteur

modifier

Cette rubrique est une réelle innovation dans le domaine du logiciel libre de mesure d'audience de sites Internet : Piwik est la première application à proposer une gestion performante et complète du suivi du visiteur sur le site Internet. Cette rubrique vous permettra de connaître les chemins empruntés par vos visiteurs dans les différentes rubriques, ainsi que les principales pages d'arrivées et de départ du site.

Pages d'entrées

modifier

Ces pages vues correspondent aux pages par lesquelles les visiteurs accèdent à votre site Internet. Dans la plupart des cas le premier résultat sera votre page index, car la majorité des visiteurs accèdent au site par l'adresse dit « brute » de votre site. Cette page (et les suivantes du classement) doivent être particulièrement soignée car ce sont celles qui permettent la navigation au sein du site Internet et qui sont consultées dès l'arrivée sur le site. Les liens qu'elles proposent doivent permettre d'accéder à une grande partie du reste des pages, le contenu de ces pages et leur présentation dépendent énormément du sujet traité. L'utilisation d'images afin d'attirer l'œil du visiteur peut être efficace et parfois conseillée, il ne faut cependant pas en abuser. Faites de préférence des liens sur les images, afin de favoriser les gens à cliquer et parcourir.

L'analyse des pages d'entrées peut aussi mettre en avant un phénomène peu fréquent mais extrêmement important : les cibles des liens de vos partenaires, ou mêmes les pages sur lesquelles mènent les moteurs de recherche. En effet si vous développez des partenariats avec d'autres sites Internet, ceux-ci pourront pointer leur lien vers des pages spécifiques de votre site Internet. La prédominance d'un sujet plus précis dans certaines rubriques peut aussi favoriser l'importance des moteurs de recherche qui apporteront vos visiteurs directement dans les rubriques concernées. Essayez de comprendre pourquoi telle ou telle page est importante en tant que page d'entrée, cela peut avoir beaucoup de raisons et de conséquences intéressantes.

Pages de sorties

modifier

Ce tableau permet de répondre à la question fondamentale : est ce que cette rubrique ou cette page est intéressante pour les visiteurs ? Quel meilleur critère utiliser pour répondre à cette question que le taux de sortie des visiteurs sur chaque page ? Ainsi si sur une page donnée, vous constatez un taux de sortie de 95%, cela signifie qu'une écrasante majorité des visiteurs qui ont parcouru cette page sont sortis du site Internet et n'ont pas continué leur visite ! Plus grave, vous pourrez constater que certaines pages sont continuellement accompagnées d'un taux de sortie très important : ces pages sont impérativement à reconsidérer, n'hésitez pas à les revoir entièrement, les rendre plus attractives, complètes, et favoriser la continuité de la navigation (augmentation des liens pointant vers des pages ou rubriques annexes, etc.).

Par défaut les pages de sorties sont classées par nombre de fois où ces pages ont été comptabilisées en tant que pages de sorties. Dans une prochaine version, nous envisageons de proposer la possibilité de classer les pages par taux de sortie. Cela permettra de mettre directement en tête les pages qui font en moyenne le plus « fuir » vos visiteurs. Néanmoins le classement actuel reste très pertinent, vous constaterez que les premières pages ont généralement un taux de sortie élevé et méritent une reconsidération.

Cette partie vous permet d'étudier les différentes combinaisons de navigation choisies par les visiteurs. Le principe est simple : vous analysez les pages sur lesquelles se rendent les visiteurs, à partir d'une page d'étude (par défaut, la page d'entrée la plus visitée est sélectionnée). Vous pouvez sélectionner la page à étudier en cliquant sur celle-ci dans le tableau du suivi (vous ne pouvez donc analyser que les pages qui sont affichées dans le suivi). L'étude du suivi des visiteurs sur le site permet de mettre en avant une éventuelle qualité et la facilité dans la navigation (c'est le cas si en moyenne toutes les pages mènent à plusieurs pages différentes).

L'étude du chemin du visiteur peut aussi montrer une certaine tendance : imaginons un article en deux parties distinctes. Vous pourrez, en sélectionnant la première page de l'article à étudier, déterminer si majoritairement les visiteurs qui consultent cette page souhaitent finir leur lecture, ou si au contraire une majorité d'entre eux cliquent sur d'autres liens (de même thématique ou non).

Vous pouvez aussi mettre ces résultats en parallèle avec les taux de sortie : si une page propose un taux de sortie élevé mais que le faible nombre de visiteurs qui continuent leur visite le font majoritairement sur une même page, pourquoi ne pas mettre encore plus en valeur le lien vers cette page ?

Vous pourrez aussi mettre en évidence d'intéressantes phénomènes : dans le cas d'un site marchand, pourquoi la page de listage du caddie n'emmène que 10% des visiteurs vers la phase de commande ? La réponse ne viendra pas de Piwik, il faudra se questionner soi-même : le processus est il assez clair, la présentation assez soignée ? Parlez vous suffisamment du processus de vente, de livraisons, etc. ?

Vous pourrez ainsi, grâce à l'analyse du parcours du visiteur sur le site Internet, tirer de nombreuses conclusions très importantes pour les futures évolutions à mettre en œuvre. Vous pourrez de cette manière améliorer fortement le trafic et la popularité générale de votre site.

Provenance

modifier

D'où viennent vos visiteurs ? Votre site intéresse t-il des internautes de tous les continents ? Quel fournisseurs d'accès utilisent ils ?

Mappemonde

modifier

La mappemonde est un outil visuel très apprécié permettant en un regard, de constater la présence et l'intérêt de votre site sur le globe. Elle permet de visualiser (première étape) le regroupement des visiteurs par continent, puis lors d'un clic sur un continent particulier (deuxième étape), le détail des pays pour ce continent. Les cartes se veulent simples, claires et donc efficaces. Pour plus de précisions et de détails sur des chiffres, il suffit de consulter le tableau récapitulatif chiffré en dessous de la mappemonde.

Si l'échelle de couleur ne vous convient pas, consulter cette rubrique : 5.9 Échelle de couleur pour la mappemonde

Le développement de ces cartes est un travail très long et minutieux, et a demandé de nombreuses heures. Les cartes disponibles dans l'archive de Piwik ne sont pas du domaine public, elles sont comme l'application publiées sous licence GNU/GPL, et ne peuvent donc être librement utilisées que dans un logiciel ou un site publié sous cette même licence. Depuis la version 1.3, les cartes sont traduites dans toutes les langues de Piwik, les noms de pays et de continents sont écrits dynamiquement sur les cartes.

Récapitulatif des pays

modifier

Cette rubrique dresse un panel complet des différentes nationalités des visiteurs de votre site. Ce paramètre est important pour un site Internet : votre public est-il essentiellement français ou plus généralement francophone (Belgique, Luxembourg, Québec, Suisse, etc.) ? Certains pays qui ne sont a priori pas directement ciblés par votre site sont ils majoritairement présents, auquel cas la création d'une section internationale pourrait être envisagée ? Le site déjà traduit dans plusieurs langues rencontre t-il le succès espéré pour les différents pays ?

Fournisseurs d'accès

modifier

L'information du fournisseur d'accès (provider) des visiteurs n'a pas énormément d'importance. Elle permet seulement, sur une importante affluence, de réaliser des statistiques sur l'utilisation de tel ou tel fournisseur d'accès, et donc de dégager les tendances du marché. En cliquant sur les noms des providers, vous arriverez sur son site internet officiel.

Configurations matérielles

modifier

La connaissance de l'environnement matériel de vos visiteurs est fondamentale car elle permet de savoir si le site est globalement bien conçu pour le public rencontré.

Systèmes d'exploitation (OS)

modifier

Ce récapitulatif des systèmes d'exploitation utilisés par les visiteurs de votre site Internet vous permettra de connaître la tendance globale d'utilisation de tel ou tel système. Nous pourrions même aller plus loin : cela vous permettra de constater l'évolution fulgurante du puissant système d'exploitation libre Linux. Piwik est capable de reconnaître la totalité des systèmes d'exploitations couramment utilisés : Windows (toutes versions), Linux, Macintosh, FreeBSD, SunOS, etc. (au total une quinzaine de systèmes différents).

Pour l'analyse en fonction des résultats obtenus, vous ne pourrez pas tirer d'indications intéressantes de ce résultat car il est évident que votre site est compatible tous systèmes d'exploitation : vous avez banni tous les scripts qui ne marchent « que sous Internet Explorer » et vous n'utilisez pas les répugnants active X qui ne marchent que sous Windows. Votre site compatible n'a pas de soucis à se faire de ce côté, voyons plutôt la suite.

modifier

Ce récapitulatif des navigateurs (browsers en anglais) utilisés par les utilisateurs de votre site Internet vous permettra, comme pour les systèmes d'exploitation, de constater l'état global du marché. Plus important, l'analyse des résultats vous permettra de déterminer s'il est vraiment obligatoire d'optimiser votre site pour les vieux navigateurs qui ne semblent plus utilisés ; les résultats sur des navigateurs comme Netscape 4.x vous convaincront certainement (vous ou votre patron) de l'inutilité (relative) de passer des heures à optimiser pour ce navigateur (dépassé, vieillot, et complètement incompatible avec les standards).

Bien sûr, une prédominance fréquemment constatée du navigateur Web Explorer de Microsoft ne doit pas empêcher de fournir du code HTML propre et qui soit compatible avec les navigateur de type Gecko (Mozilla Firefox, Mozilla) ou Opera. Ces navigateurs restent très utilisés et il ne faut les négliger. Ne voyez pas dans la phrase « fournir du code HTML propre » un objectif long et rempli d'embûches, il suffit de respecter les quelques règles établies par la norme (X)HTML.

Résolutions

modifier

Ce récapitulatif des résolutions vous permettra de tirer d'intéressantes conclusions sur la présentation de votre site Internet. La résolution d'écran caractérise la quantité d'informations disponible, plus elle est élevée plus les visiteurs verront de choses, mais plus la taille globale des textes et images diminuera (sauf si le site s'étire automatiquement, voir ci-dessous).

Les résolutions moyennes varient énormément selon le type de sites Internet et le public visé. Nous avons constaté, suite à des bilans effectués par les utilisateurs de Piwik (bilans effectués sur des très grandes quantités de visiteurs : 30000 à 200000), que la « domination » d'une résolution en particulier ne pouvait pas être établie comme règle générale. Il est certain que sur des sites moyens, de contenu assez habituel (articles divers, contenu riche sur différents sujets, sites marchands), il est fréquent de voir la résolution 1024*768 prédominer avec plus de 30%. Cela représente la majorité des cas, mais il est impossible de négliger les autres résolutions d'écran : 800*600 notamment, ainsi que toutes les résolutions supérieures (qui sont très variées). À l'inverse sur un site traitant de sujets plus précis tel que le design, la conception (internet, multimédia, etc.), les résolutions prédominantes sont supérieures ou égales à 1280*1024. Le public ciblé est alors mieux équipé, cela se comprend facilement, et il semble important de faire un design en conséquence.

D'une manière générale il est déconseillé d'optimiser son site pour une résolution en particulier : il est tout à fait possible de faire un design qui soit adaptable à tout type de résolutions, et qu'il le soit automatiquement. Cela est largement favorisé par l'utilisation des normes XHTML/CSS, même si le HTML 4 peut très bien faire l'affaire pour concevoir un design qui s'étire automatiquement.

Écran large/normal

modifier

Ce récapitulatif est un « trip » du développeur de Piwik, qui voulait voir la proportion d'écran large utilisée actuellement par les internautes, et éventuellement constater l'évolution du phénomène au cours des mois et années à venir.

Un écran est dit large lorsque le rapport entre sa largeur et sa hauteur est supérieur à 1,4 (Ex : 1280*800 est un écran large, 1280*1024 est un écran classique).

Couleurs (profondeur d'écran)

modifier

L'information sur les profondeurs d'écran (nombre de couleurs en bits), n'a en soi que peu d'importance, sachant que la quasi majorité des utilisateurs sont maintenant en 16 bits minimum, et que cela suffit largement pour afficher correctement des images de sites Internet.

Plugins

modifier

Ce récapitulatif des principaux plugins vous permettra de tirer d'intéressantes conclusions sur les technologies disponibles dans les navigateurs de votre audience. Cela vous permettra de faire les meilleurs choix entre Java, Flash et Director si vous envisagez de proposer du contenu interactif, ou entre WindowsMedia, Quicktime ou RealVideo si vous voulez fournir des vidéos en flux (streaming). Pour les vidéos streaming, il est de toutes façons déconseillé de fournir du WindowsMedia quand on sait que la compatibilité avec tous les systèmes est très aléatoire...

De la même manière, si vous proposez déjà ces différents types de contenus, ces statistiques vous permettront de savoir s'il est utile de continuer vos efforts pour proposer les différents formats ou si une technologie sort clairement du lot, auquel cas il pourrait être intéressant de la privilégier...

Affluents

modifier

Cette rubrique est fondamentale dans l'étude de l'audience : elle permet de déterminer d'où viennent vos visiteurs lorsqu'ils visitent le site Internet. Elle répond aussi à de nombreux autres points : a quoi est due cette soudaine augmentation de la popularité du site ? Création d'un partenariat, meilleure indexation dans les moteurs de recherche, ou bien un bouche à oreille fonctionnant plutôt bien ? Si vous êtes bien référencé dans les moteurs, les visiteurs arrivent ils avec les mots clés que vous aviez prévu ?

Récapitulatif

modifier

Le camembert 2D résume et dresse un bilan global de l'affluence de votre site. Il donne les proportions (détaillées par la suite) des arrivées par moteur de recherche, par site internet référant (origine de la visite), ou par entrée directe. Certains considèrent qu'un camembert idéal est un camembert à peu près équilibré (environ un tiers des arrivés par chaque moyen), mais vous pouvez bien sûr vous-même fonder votre propre théorie du camembert.

Moteurs de recherche

modifier

Les moteurs de recherche prennent de plus en plus d'importance car de plus en plus sollicités par les utilisateurs. Le tableau présente les différents moteurs de recherche comptabilisés et leur proportion par rapport au total, et il est possible d'avoir les détails des mots clés utilisés pour chaque moteur (en cliquant sur le « + »). Vous constaterez certainement l'hégémonie du moteur Google qui à lui seul catalyse plus de 80% des recherches en moyenne. Néanmoins Piwik ne se limite pas aux moteurs les plus connus et gère ainsi plus d'une centaine de moteurs différents (la liste est en constante évolution).

Pour un webmaster, il est conseillé de connaître la qualité de son référencement : les moteurs de recherche apportent-ils un nombre conséquent de visites ? Suis je bien présent sur chacun d'entre eux ? M'apportent ils tous des visites ou bien seuls un ou deux moteurs sont pour moi rentables ? Vous pourrez accéder aux mots clés utilisés pour chaque moteur afin de voir si ces mots varient d'un moteur à l'autre. Si c'est le cas, quel moteur semble le plus pertinent ?

Mots clés

modifier

Le tableau vous présente les différents mots clés utilisés par vos visiteurs et qui ont permis d'aboutir sur votre site Internet. Cette indication est primordiale car elle permet de connaître les attentes en termes de contenu du site pour ces visiteurs (qui en général représentent entre 5 et 50% du total des visiteurs).

Si les mots clés vous semblent cohérents avec le contenu de votre site Internet, il est intéressant d'améliorer son positionnement sur les mots qui sont majoritairement utilisés (ne négligez pas pour autant les autres mots clés car ils pourraient être peu utilisés du fait d'un mauvais classement sur le moteur pour ces mots précis).

Si au contraire certains mots clés ne vous semblent pas parfaitement cohérents avec votre site, ou si les mots clés auxquels vous pensiez sont absents, posez vous les questions suivantes : les textes du site, les images et leur attributs alt, contiennent ils bien les chaînes qui m'intéressent ? Avez vous suffisamment utilisé ces mots sur le site ? (une phrase sur la page d'accueil décrivant le contenu ne suffit pas !). Pourquoi certains mots clés qui n'ont pas de rapport direct m'apportent ils des visiteurs ? Vos textes sont ils correctement ciblés, le vocabulaire employé est il cohérent (n'hésitez pas à employer des synonymes !).

En répondant à ces quelques questions, vous pourrez mettre en avant d'éventuels problèmes sur votre site, lesquels il faudra corriger pour obtenir un meilleur « rendement » de vos arrivés par moteurs de recherche, et avec des mots clés intéressants (généralement les mots clés qui n'ont pas de rapport avec le site entraîneront une visite à une page vue, ce qui n'est pas positif pour le site).

Sites Internet

modifier

Le tableau récapitulatif des sites Internet qui sont dits « référents » vous permettra de connaître les pages Internet qui ont permis d'accéder à votre site. Il est très intéressant de connaître les sites Internet qui vous apportent des nouveaux visiteurs, vous constaterez ainsi le succès (ou l'inefficacité) de votre partenariat avec tel ou tel site, vous pourrez découvrir les sites qui parlent de votre site et font des liens sans que vous n'en ayez fait expressément la demande (signe de qualité certaine pour votre site). De la même manière vous pourrez découvrir si l'on parle de votre site sur des forums de discussion, si des accès sont réalisés par des annuaires, etc. Avoir des liens vers son site est très important pour la promotion et pour se faire connaître, de plus cela permet d'améliorer son référencement dans les moteurs de recherche qui utilisent cette information pour leur classement des sites. L'algorithme PageRank de Google est ainsi largement basé sur le nombre de liens qui pointent vers votre site Internet (n'hésitez pas à consulter le site http://www.webrankinfo.com/ pour plus d'informations sur le référencement et sur Google).

Entrées directes

modifier

Le nombre de visiteurs ayant accédé directement au site correspond aux visiteurs ayant accédé au site en tapant l'adresse dans leur navigateur ou à partir de leur marque-pages (« favoris », « bookmarks », « signets », etc. en fonction du navigateur utilisé). Cela traduit bien souvent l'intérêt des visiteurs pour le site, car ils ont retenu l'adresse ou pris soin de l'enregistrer ; ce sont souvent des visiteurs fidèles, qui visitent régulièrement (ou à fréquence régulière) le site pour voir les nouveautés et les changements.

Archivage

modifier

L'archivage est un procédé unique dans les application libres et gratuites. Directement inspiré des méthodes utilisées par les entreprises professionnelles éditant ce type d'outils, l'archivage des données propose de très nombreux avantages et est même indispensable pour la consultation de statistiques sur des sites à fort trafic.

Présentation

modifier

L'archivage consiste à calculer toutes les statistiques de visites à partir des informations brutes enregistrées pour chaque utilisateur lors de leur visite sur le site web. Les résultats des calculs sont alors stockés définitivement dans la base de données.

L’archivage dynamique des données a de nombreux avantages : il permet une forte diminution de l’espace disque de la base de données (20% à 40%), économise les ressources serveurs (les calculs d’une période terminée ne sont effectués qu’une seule fois) et surtout un gain de performances saisissant : le temps d’exécution est de 5 à 20 fois plus court, ce qui permet l’accès à des statistiques plus poussées dans certains domaines (suivi du visiteur par exemple). Le développement de l’ensemble des fonctions d’archivage dynamique au sein de Piwik a nécessité plus de 60 heures de développement.

Piwik est la seule application libre à proposer cette puissante alternative, qui rend possible la consultation des statistiques temps réel sur des sites à fort trafic, et le développement de nouvelles analyses.

Comment fonctionne t-il ?

modifier

Son fonctionnement est simple : lors de la consultation d’une journée, l’archivage dynamique se lance automatiquement et calcule toutes les informations (toutes les données qui apparaissent lors de la consultation des statistiques) pour cette journée. La masse de calcul est considérable, notamment pour les sites à fort trafic, puisque la totalité des informations ’pré calculées’ peut représenter plusieurs centaines de milliers de caractères. Le tout est ensuite stockée sous forme de texte dans la base de données. Il ne reste alors qu’à faire une simple sélection des données (procédé très rapide à réaliser pour le serveur, donc qui utilise très peu de ressources) et à mettre en forme ces tableaux de données. Une fois les calculs effectués avec succès, les champs de la table des logs sont supprimés ; ils ne seront plus utilisés. Le gain d’espace disque est conséquent.

Pourquoi l’archivage systématique ?

modifier

Bien que l’archivage d’une journée puisse nécessiter plusieurs secondes de calcul, le calcul est effectué une seule fois pour toujours (il est stocké dans la base de données). Ainsi le serveur, à chaque consultation des différents statistiques pour la même date, ne doit pas ré-effectuer les mêmes masses de calcul comme ce serait le cas sans l’archivage. Le temps de calcul ne pose aucun problème sur des sites à faible trafic (entendons moins de 100 visites par jour), l’archivage a donc pour ceux-ci une fonction principale de ’purge des données’ et l’économie des ressources serveurs. La rapidité peut devenir problématique sur des sites à trafic moyen (300 visites par jour par exemple) et constitue l’ennemi principal des sites à fort trafic, lesquels ne peuvent pas calculer leurs statistiques dans un temps acceptable.

Archivage d’une période

modifier

La première fois que vous consultez les données d’une semaine ou d’un mois, l’archivage dynamique calcule les données pour cette période. Il base son calcul sur le calcul de chaque jour de la période ; cela signifie donc que si vous n’avez consulté aucun jour de la période, l’archivage calculera et stockera les données de chaque jour séparément avant de calculer la période sélectionné. La durée du calcul est là encore fonction du trafic : il est normal que sur une période comme la semaine, l’archivage mette quelques secondes à s’effectuer.

Constatez ensuite par vous-même la rapidité de chargement de toutes les pages ; une telle rapidité ne serait pas possible sans la phase d’archivage préalable.

Archivage temporaire

modifier

Si vous consultez des statistiques sur des périodes qui ne sont pas terminées (jour d’aujourd’hui, la semaine ou le mois en cours), la fonction d’archivage le reconnaîtra automatiquement et n’archivera que ’temporairement’ les données. Attention, il est déconseillé, pour les sites à fort trafic, de consulter les statistiques du jour en cours en raison de la quantité des informations à calculer, et ce à chaque page (l’archivage temporaire du jour d’aujourd’hui est recalculé à chaque consultation des statistiques).

Cela a moins d’importance pour la semaine ou mois en cours car ne sont archivés que les jours terminés, ce qui signifie que les statistiques ne prennent pas en compte les données du jour d’aujourd’hui non terminé. Il est de toutes façons beaucoup plus intéressant d’analyser des statistiques sur des périodes qui sont terminées, et de comparer ces données aux périodes précédentes elles aussi terminées.

Notes importantes pour les sites à fort trafic

modifier

Dans le cas de sites Internet à forte ou très forte audience, le calcul des statistiques de Piwik peut poser problème, car gourmand en ressources. Pour éviter que votre serveur ne soit pendant trop longtemps surchargé en pleine journée, nous conseillons activement aux administrateurs de configurer un « crontab » (système d'exécution programmée de programmes) pour lancer les calculs des statistiques dans la nuit, heure visiteurs. L'expérience montre que programmer le lancement des archivages des jours/mois/semaines à 3 heure du matin permettait de minimiser très fortement les gênes occasionnées.

D'un point de vue technique, il suffit de lancer la consultation des pages jours/semaines/mois, l'archivage se fera automatiquement.

Il faut donc visiter les pages :

Programmez le crontab (ou utilisez les services du site http://www.webcron.org et http://www.easycron.com) vers 4h du matin (heure la moins fréquentée). Notez qu'il faut laisser environ 20 min entre chaque page, pour laisser le temps au serveur de calculer les statistiques (notamment sur les sites à très fort trafic).

Rapidité et performances générales de l’application sur différentes configurations

modifier

Piwik est optimisé pour des fonctionnements optimaux sur tous les types de sites Internet. L'ensemble des phases de calcul a été optimisée, du point de vue php mais aussi des requêtes base de données.

Les sites à faibles fréquentations (inférieures à 400 visites/jour environ) sont parfaitement gérés, quelle que soit la capacité du serveur qui héberge Piwik.

Les sites moyens (de 400 à 2000 visites/jour environ) sont de la même manière très bien gérés, sur la plus grande majorité des hébergements gratuits et professionnels. Cela pourrait néanmoins poser des problèmes sur des serveurs de qualité limitée (ex de certains hébergeurs gratuits comme Free), qui limitent les temps d'exécution des scripts php, ce qui peut bloquer le calcul de l'archivage. Néanmoins les hébergements ainsi « bridés » sont très rares, et dans la grande majorité des cas vous ne rencontrerez aucun problème.

Les sites à fort trafic (environ plus de 2000 visites/jour) seront très bien gérés si le serveur hébergeant Piwik est rapide et performant. Un hébergement sur serveur dédié n'est pourtant pas nécessaire pour des fréquentations inférieures à 20000 visites/jour, si votre hébergement mutualisé propose de très bonnes performances. Au dessus de cette limite (qui n'a rien de précise, car elle dépend entièrement des qualités de votre hébergement), il sera sûrement nécessaire d'héberger Piwik sur un serveur dédié (celui de votre site, bien sûr). Les phases de calcul de périodes longues (périodes des mois notamment) sont très gourmandes en ressources et vous pourriez ne pas pouvoir archiver les périodes pour obtenir les statistiques que vous souhaitez.

Nous serions très intéressé d'obtenir de la part des utilisateurs leurs avis sur les performances de Piwik. Si vous voulez nous aider, nous vous proposons une courte démarche à réaliser (lisez la suite). Lorsque vous lancez l'archivage de vos statistiques sur le mois (le mois est fini ou non), Piwik effectue de nombreux calculs et requêtes sur la base de données (il enregistre ensuite toutes les données précalculées dans la base). Une fois cette phase terminée et que les statistiques demandées s'affichent à l'écran, vous avez tout en bas de la page le temps de génération de la page. Il peut être très faible (moins d'une seconde pour un mois entier sur des petits sites) ou très élevé (plus de 100 secondes sur des sites à grandes fréquentations). Voici les informations que nous aimerions recevoir :

  • temps de génération de la page (écrit en gris clair en bas de la page) pour la page qui vient d'effectuer le calcul d'archivage
  • nombre de visiteurs pour la période archivée (nous conseillons de faire ce test sur des mois terminés ou presque terminés)
  • hébergement gratuit ou professionnel (si vous le souhaitez, précisez la société)
  • type de l'hébergement : mutualisé (cela concerne la majorité des hébergements, signifie que le serveur qui vous héberge le fait pour plusieurs sites à la fois, d'où le terme de mutualisé) ou dédié (le serveur ne s'occupe que de votre site Internet, ou d'un très faible nombre, la rapidité est très élevée et les performances très importantes)

Merci d'avance aux utilisateurs de Piwik qui effectueront ce rapide test. Vous pouvez envoyer le résultat (temps de génération de la page + infos ci-dessus) via le formulaire de contacts sur le site officiel.