Qu'est-ce qu'un log de serveur web ?

Arfan Sharif - mars 15, 2023

Un log de serveur web est un document au format texte qui enregistre toute l’activité liée à un serveur web spécifique au cours d’une période déterminée. Un serveur web collecte des données en continu et de manière automatique, ce qui fournit aux administrateurs des informations sur la manière dont il est utilisé, à quel moment et par quels utilisateurs.

Si les données du serveur sont disponibles immédiatement dans le log du serveur lui-même, le fichier log est, dans la plupart des cas, également stocké dans une base de données et peut être utilisé pour produire des rapports personnalisés à la demande. Les administrateurs peuvent ensuite se servir de ces informations pour mieux comprendre les modèles de trafic web et s’y conformer, optimiser l’affectation des ressources informatiques, et adapter l’activité commerciale et marketing.

Format standard des fichiers log

Pour chaque requête HTTP, la plupart des serveurs web génèrent un log au format CLF (Common Log Format). Chaque entrée du log contient des informations détaillées sur la requête : adresse IP du terminal, date et heure de la requête, nom, emplacement et taille du fichier demandé, etc.

Les fichiers CLF étant des logs au format brut, ils sont généralement d’une utilité limitée pour les administrateurs ou les webmasters dans leur forme existante. En outre, compte tenu du volume des données capturées, la plupart des entreprises suppriment automatiquement les fichiers CLF passé un certain délai.

Contenu et valeurs d’un log de serveur

Chaque ligne du log de serveur contient des informations importantes :

  • Adresse IP du terminal
  • Méthode de requête
  • Date et heure de la requête
  • État de la requête
  • Méthode utilisée par le référent
  • Agent utilisateur
  • Informations concernant le fichier demandé, notamment son nom et sa taille, ainsi que son emplacement réseau

Les données du log de serveur peuvent également servir à obtenir les informations suivantes :

  • Nombre d’utilisateurs ayant accédé au serveur
  • Nombre de visiteurs uniques ou authentifiés
  • Localisation géographique des visiteurs
  • Périodes de pic du trafic
  • Durée des visites
  • Nombre de pages consultées par visite
  • Pages ou contenus les plus consultés
  • Référents HTTP
  • État HTTP
  • Erreurs HTTP
  • Termes ou expressions de recherche utilisés pour trouver le site
  • Utilisation ou non d’un terminal mobile

À quoi sert un log de serveur ?

Les logs de serveur web offrent un aperçu de l’activité associée au serveur. Pour la plupart des entreprises, ces logs sont la seule façon de comprendre comment et quand le serveur est utilisé, et par qui.

Comment utiliser un log de serveur ?

Les informations contenues dans un log de serveur web peuvent être exploitées à l’échelle de l’entreprise pour améliorer les performances et optimiser les opérations. Elles peuvent par exemple être utilisées aux fins suivantes :

  • Optimiser les ressources informatiques limitées, y compris les effectifs
  • Établir des niveaux de journalisation dédiés et prioriser l’activité selon son impact sur l’entreprise ou la gravité du problème
  • Résoudre et déboguer les erreurs HTTP
  • Identifier et corriger les liens brisés provenant de sources externes
  • Simplifier le parcours utilisateur en fonction de modèles de navigation types
  • Adapter les autres activités de l’entreprise, comme les ventes, le marketing ou les relations avec les partenaires
  • Identifier les risques et problèmes de sécurité, y compris la présence de bots, de code malveillant ou de spam

Autres fonctions d’un log de serveur web

La plupart des entreprises utilisent les logs de serveur web pour produire d’autres logs servant un objectif distinct. En voici quelques exemples :

  1. Logs d’erreurs
  2. Logs d’accès
  3. Logs des sites référents

Log d’erreurs : ce sont les logs de serveur les plus courants. Comme leur nom l’indique, ces logs retracent toutes les requêtes du serveur ayant échoué. Les administrateurs web peuvent utiliser ces informations pour examiner les erreurs standard et déterminer les aspects de leur site web qui doivent être mis à jour ou modifiés.

Log d’accès : ces logs collectent des données concernant les fichiers demandés au serveur. Ils révèlent le nombre d’utilisateurs ayant accédé au serveur, comment ils ont été redirigés vers le site et leur activité sur le site. Un log d’accès aide à comprendre comment un site est utilisé, ainsi que ses pages les plus populaires ou utiles. Ces informations pourront ensuite servir à améliorer ou à faire évoluer le parcours utilisateur, la navigation sur le site ou le contenu.

Log des sites référents : ce type de log collecte des informations sur les URL qui dirigent les utilisateurs vers votre site. Un log des sites référents est fondamental pour les initiatives modernes de vente et marketing, car la plupart des entreprises souhaitent améliorer le trafic naturel. Ces logs sont une façon de déterminer quels liens ou partenaires affiliés attirent le plus grand nombre d’internautes vers le site.

Comment surveiller les logs de serveur web ?

Bien que les logs de serveur fournissent une multitude d’informations, plusieurs défis de taille empêchent les entreprises de tirer pleinement parti de leur valeur.

Défi n° 1 : volume

Les logs de serveur produisent une quantité significative de données qu’il faut collecter, stocker et analyser afin d’en extraire des informations pertinentes et opportunes.

Défi n° 2 : intégration

Les logs de serveur web peuvent fournir des données très utiles, mais en les intégrant à d’autres logs (logs des événements, des applications, du système, des disponibilités et des ressources), il est possible d’en retirer une valeur encore plus élevée.

Défi n° 3 : normalisation

Malheureusement, les logs n’utilisent pas tous le même format. Selon le type de log, les données peuvent être structurées, semi-structurées ou non structurées. Pour pouvoir analyser efficacement les logs, un certain degré de normalisation des données est nécessaire.

Défi n° 4 : charge informatique élevée

La gestion manuelle des logs est une activité extrêmement chronophage et onéreuse. Les outils numériques, en automatisant une partie de cette activité, peuvent alléger la charge de travail des équipes informatiques.

Journalisez toutes vos données et répondez à toutes les questions – gratuitement

Falcon LogScale Community Edition (anciennement Humio) offre une plateforme moderne et gratuite de gestion des logs pour le cloud. Exploitez l’ingestion des données de streaming pour bénéficier d’une visibilité instantanée sur les systèmes distribués, de même que détecter et résoudre les incidents.

Falcon LogScale Community Edition, disponible instantanément et gratuitement, inclut les fonctionnalités suivantes :

  • Ingestion de jusqu’à 16 Go de données par jour
  • Durée de rétention de 7 jours
  • Aucune carte de crédit requise
  • Accès continu sans période d’essai
  • Journalisation sans index, alertes en temps réel et tableaux de bord en direct
  • Accès à notre place de marché et à nos packages, y compris aux guides de création de nouveaux packages
  • Formation et collaboration avec une communauté active

DÉMARRER GRATUITEMENT

À PROPOS DE L'AUTEUR

Arfan Sharif est responsable du marketing produits pour le portefeuille d’observabilité chez CrowdStrike. Il possède plus de 15 ans d’expérience dans les solutions de gestion des logs, ITOps, d’observabilité, de sécurité et d’expérience client pour des entreprises telles que Splunk, Genesys et Quest. Arfan est titulaire d’un diplôme en informatique de la Buckinghamshire New University, et a travaillé aussi bien dans le marketing produits que dans l’ingénierie commerciale.