Publications des statistiques de visites par GoAccess

Auto-hébergement

Je n’ai jamais été un grand fan du tracking web, également pour les gens qui viennent visiter mes sites. J’ai d’ailleurs progressivement abandonné Google Analytics, installé Piwik, puis Ackee… Enfin, en début d’année, j’ai supprimé tous les outils de tracking sur la SheevaBoite, en désinstallant Ackee et j’ai publié une page sur la vie privée.

Les stats ne me manquent pas spécialement puisque j’écris moins d’articles. Mais j’ai quelques articles qui attirent encore un peu de monde et je voulais compter un peu “ce monde”, mais je ne voulais plus me reposer sur un script JS pour une fonctionnalité si inutile pour les visiteurs.

La seule solution autre que le tracking JS que je connaisse est l’analyse des logs du serveur web lui-même.

Analyse statique des logs

En effet, il n’existe rien de plus précis qu’une ligne dans un fichier de log dans un server, c’est donc grâce aux fichiers de logs que je vais avoir un aperçu des statistiques de la SheevaBoite.

Il existe deux projets open-source qui font ça, AWStats et Goaccess. C’est ce dernier que j’ai choisi pour les raisons suivantes :

L’installation est facile aussi puisqu’il existe un container Docker, mais vous pourrez facilement le compiler si besoin, la doc est plutôt très complète.

Préparation des logs nginx

Si vous me suivez un peu vous savez que la SheevaBoite est hébergée dans un container docker avec un serveur nginx, pour avoir mes stats il me suffit de parser les logs d’accès.

Sauf que ce n’est pas si simple, les logs sont pourris par des milliers d’entrées de bots et de crawlers qui checkent le contenu du flux RSS ou qui monitorent que le serveur soit toujours UP.
Bref, avant de pouvoir faire de l’analyse, il faudra nettoyer un peu les fichiers logs, sauf que la loi oblige à conserver la totalité des logs d’accès de votre site (sauf si vous vous pliez à la loi Européénne qui requiert de conserver les logs pendant 14 jours).

J’ai écrit un petit article qui résume comment filtrer les logs avec nginx il y a peu, j’y décrit comment j’ai filtrer les lignes de logs de certaines IPs, de certains User-Agent ou encore ne pas logguer certaines URLs.

J’ai ainsi pu créer un nouveau fichier de logs à côté des fichiers de logs standards «access» et «error» qui contiendra uniquement les hits des visiteurs sur des pages HTML.

Configuration de GoAccess

Comme je disais la configuration de GoAccess est simple, il a juste besoin du fichier de log à parser et après il est capable de se débrouiller tout seul en utilisant une conf par défaut. Je ne vous cache pas que j’ai un peu tweaker la configuration selong mes envies, mais vous devriez obtenir une page HTML qui ressemblera un peu à celle-ci :

Aperçu du dashboard de GoAccess
Aperçu du dashboard de GoAccess

Et voilà, un petit dashboard qui permet d’avoir un aperçu des stats de son serveur. De nombreuses infos sont disponibles mais je ne les affiche pas toutes car je les trouves pertinentes, mais sachez que GoAccess est capable de vous donner pleins d’informations sur vos visiteurs à partir de leur lignes de logs….

Des statistiques publiques

Comme je le disais en introduction, je ne suis pas un grand fan des analytics, je vais les voir de temps en temps, mais je n’ai pas un onglet toujours ouvert dessus comme j’ai pu voir certaines connaissances le faire.

Et comme je n’ai rien à cacher, que ça peut éventuellement intéresser des gens, j’ai décidé de rendre publique la page des stats de GoAccess, parce que voilà je trouve la transparence cool.

L’idée n’est pas nouvelle, je ne suis pas le premier à le faire, mais l’envie m’est venue en visitant le blog d’un certain Tom Brossman, qui a lui aussi rendu publique les stats de son site.

Conclusion

Voilà, avec GoAccess je vais de nouveau avoir une petite idée du nombre de visiteurs qui passent par la SheevaBoite mais surtout je vois voir la répartition des systèmes d’exploitation et des navigateurs que vous utilisez.

Pour l’instant GoAccess affiche les stats à partir du moment ou j’ai créé le fichier de logs dédié aux statistiques, je ne sais pas quand je flusherai le fichier de log, mais c’est une interrogation qui reste en suspens.

Partager