TP de Supervision avec Nagios

TP : Déploiement d'un environnement avec supervision Nagios

1. Introduction et objectifs du TP

L'objectif de ce TP est de :

Mettre en place une infrastructure composée de :
- Un pare-feu (PF) disposant de trois interfaces réseau (WAN/LAN/DMZ).
- Un serveur Debian dédié à rsyslog (RSYSLOG) sur le LAN.
- Un serveur Debian hébergeant WordPress (SRV-WEB) en DMZ.
- Un poste client sous Windows (PC-CLIENT) sur le LAN.
- Un serveur Debian hébergeant Nagios XI 2024 (NAGIOS) sur le LAN.
Installer et configurer les services suivants :
- WordPress sur SRV-WEB.
- Nagios XI 2024 sur NAGIOS.
- rsyslog sur RSYSLOG.
Déployer des sondes de supervision Nagios sur chaque équipement :
- Contrôle du CPU (avec différents seuils et intervalles de mesure).
- Contrôle du disque (partitions principales).
- Contrôle de la RAM.
- Contrôle du nombre d'utilisateurs root connectés.
- Contrôle de certains services : HTTP, index WordPress, MariaDB.
- Etc.
Rédiger une documentation technique pour chaque sonde :
- Numéro de la sonde.
- Nom de la sonde.
- Objectif de la sonde.
- Seuils de WARNING et CRITICAL.
- Action(s) à entreprendre en cas d'anomalie.
Présenter un tableau récapitulatif (Serveurs/Postes, Sondes, Paramètre) indiquant clairement, pour chaque équipement, le nom des sondes et leurs paramètres techniques (seuils, etc.).

2. Topologie réseau et configuration des IP

2.1 Pare-feu (PF)

Interface WAN : récupération d'une adresse IP par DHCP (accès à Internet).
Interface LAN : 10.10.10.1/24
Interface DMZ : 10.10.20.1/30

Les règles du pare-feu devront :

Permettre la communication nécessaire entre le LAN et la DMZ (accès HTTP/HTTPS vers le SRV-WEB, accès SSH éventuel, etc.).
Permettre le trafic Nagios entre NAGIOS (LAN) et les autres machines (LAN + DMZ).
Bloquer tout trafic non autorisé.

2.2 RSYSLOG (sur le LAN)

Adresse IP : 10.10.10.x/24 (à définir, ex. 10.10.10.2).
Passerelle : 10.10.10.1
DNS : Selon votre configuration ou ceux de votre FAI.

2.3 SRV-WEB (en DMZ)

Adresse IP : 10.10.20.2/30.
Passerelle : 10.10.20.1
DNS : Selon votre configuration ou ceux de votre FAI.

2.4 PC-CLIENT (sur le LAN)

Adresse IP : 10.10.10.x/24 (à définir, ex. 10.10.10.3).
Passerelle : 10.10.10.1
DNS : Selon votre configuration ou ceux de votre FAI.

2.5 NAGIOS (sur le LAN)

Adresse IP : 10.10.10.x/24 (à définir, ex. 10.10.10.4).
Passerelle : 10.10.10.1
DNS : Selon votre configuration ou ceux de votre FAI.

3. Installation et configuration des services

3.1 Installation de WordPress sur SRV-WEB

Installer Apache, MariaDB et PHP :

sudo apt update
sudo apt install apache2 mariadb-server php php-mysql libapache2-mod-php

Sécuriser MariaDB :

sudo mysql_secure_installation

Créer la base de données WordPress :

sudo mysql -u root -p

CREATE DATABASE wordpress_db;
CREATE USER 'wp_user'@'localhost' IDENTIFIED BY 'votre_mot_de_passe';
GRANT ALL PRIVILEGES ON wordpress_db.* TO 'wp_user'@'localhost';
FLUSH PRIVILEGES;
EXIT;

Installer WordPress :

Télécharger la dernière version de WordPress.
Décompresser et placer les fichiers dans /var/www/html/wordpress.
Adapter le fichier wp-config.php avec les informations de la base.

Configurer Apache pour pointer vers wordpress comme VirtualHost si nécessaire.

Vérifier l'accessibilité de WordPress via l'URL (http://10.10.20.2/wordpress par exemple).

3.2 Installation de Nagios XI 2024 sur NAGIOS

Préparer le serveur :

sudo apt update
sudo apt install wget curl -y

Télécharger le package Nagios XI 2024 depuis le site officiel ou via un script fourni par Nagios (les étapes exactes peuvent varier selon la version).

Décompresser et exécuter le script d'installation :

tar xzf nagiosxi-2024*.tar.gz
cd nagiosxi-2024/
sudo ./fullinstall

Suivre l'assistant d'installation jusqu'à la fin.
Accéder à l'interface web de Nagios XI (ex. http://10.10.10.4/nagiosxi).
Créer un compte administrateur si ce n'est pas fait automatiquement.

3.3 Installation de rsyslog sur RSYSLOG

Sur Debian, rsyslog est souvent déjà installé. Sinon :

sudo apt update
sudo apt install rsyslog

Vérifier que le service est actif :

systemctl status rsyslog

Configurer éventuellement la réception de logs distants (optionnel selon vos besoins).

4. Configuration de la supervision Nagios

Nous allons déployer les sondes suivantes sur NAGIOS. Chaque hôte (PF, RSYSLOG, SRV-WEB, PC-CLIENT, NAGIOS lui-même) doit être monitoré selon les sondes listées.

4.1 Principe général

Pour superviser un hôte Linux (ex. RSYSLOG, SRV-WEB, NAGIOS, PF), vous pouvez déployer un agent NRPE ou utiliser SSH/NRPE.
Pour superviser un hôte Windows (PC-CLIENT), vous pouvez utiliser NSClient++, les fonctionnalités facultatives de Windows (SNMP), ou un autre agent compatible (ex. NCPA).
Les seuils (WARNING/CRITICAL) et les intervalles de mesures (par ex. moyenne sur 1min, 5min, 15min) doivent être configurés dans la définition de vos commandes/services Nagios.
Les contrôles tels que check_load, check_disk, check_users, check_procs (ou équivalent pour Windows) seront paramétrés selon vos seuils.

5. Documentation technique des sondes

Vous trouverez ci-dessous la liste détaillée de toutes les sondes à configurer, classées par équipement. Chaque sonde est documentée avec les informations suivantes :

Numéro de la sonde
Nom de la sonde
Objectif
Seuils WARNING et CRITICAL
Action(s) à entreprendre en cas d'anomalie

5.1 PC-CLIENT (Windows)

N°	Nom de la sonde	Objectif	Seuils W/C	Action en cas d'anomalie
1	CPU 1min	Vérifier la charge CPU moyenne sur 1 min	WARNING : 70% / CRITICAL : 90%	Vérifier les processus gourmands. Fermer l'application incriminée.
2	DISK (C:\)	Vérifier l'espace disponible sur C:\	WARNING : 70% / CRITICAL : 80%	Libérer de l'espace, archiver/supprimer des fichiers inutiles.
3	RAM 1min	Vérifier l'utilisation de la RAM sur 1 min	WARNING : 70% / CRITICAL : 85%	Vérifier les processus, augmenter la RAM si nécessaire.

5.2 RSYSLOG (Debian)

N°	Nom de la sonde	Objectif	Seuils W/C	Action en cas d'anomalie
1	CPU 15min	Surveiller la charge CPU moyenne sur 15 min	WARNING : 50% / CRITICAL : 70%	Analyser les processus, vérifier la charge sur la durée.
2	CPU 5min	Surveiller la charge CPU moyenne sur 5 min	WARNING : 60% / CRITICAL : 80%	Idem ci-dessus, examiner la montée en charge plus courte.
3	CPU 1min	Surveiller la charge CPU moyenne sur 1 min	WARNING : 70% / CRITICAL : 90%	Intervention plus rapide : stopper un service incriminé si besoin.
4	DISK /	Vérifier l'espace disque racine (/)	WARNING : 70% / CRITICAL : 85%	Archiver/supprimer des logs ou fichiers inutiles, augmenter la partition.
5	USERS (root)	Vérifier qu'il n'y a pas plus d'une session root simultanée	> 1 connexion root	Vérifier si un autre administrateur n'est pas connecté ou s'il y a un souci sécurité.

5.3 SRV-WEB (Debian + WordPress)

N°	Nom de la sonde	Objectif	Seuils W/C	Action en cas d'anomalie
1	CPU 15min	Charge CPU moyenne sur 15 min	WARNING : 50% / CRITICAL : 70%	Vérifier si un grand nombre de requêtes web sur la durée.
2	CPU 5min	Charge CPU moyenne sur 5 min	WARNING : 60% / CRITICAL : 80%	Idem, contrôle sur une période plus courte.
3	CPU 1min	Charge CPU moyenne sur 1 min	WARNING : 70% / CRITICAL : 90%	Intervention d'urgence si la charge dépasse 90%.
4	DISK /	Espace disponible sur la racine (/)	WARNING : 70% / CRITICAL : 90%	Vérifier logs Apache, logs applicatifs, base de données.
5	HTTPD 1min	Vérifier si Apache tourne (service httpd ou apache2)	Service up/down	Redémarrer le service si down, analyser les logs d'erreur.
6	INDEX 1min	Vérifier l'accessibilité de la page index.php (WordPress)	HTTP 200 (ou code 2xx) attendu	Vérifier la config Apache, le VHost, le code WordPress s'il y a un souci.
7	MARIADB 1min	Vérifier si MariaDB tourne	Service up/down	Redémarrer le service si down, vérifier logs MySQL.
8	RAM 1min	Vérifier l'utilisation de la RAM	WARNING : 70% / CRITICAL : 85%	Optimiser les services, augmenter la RAM ou vérifier la conf MySQL/Apache.
9	USERS (root)	Vérifier le nombre de sessions root	> 1 connexion root	Vérifier qu'il n'y a pas d'accès non autorisé.

5.4 NAGIOS (Debian + Nagios XI 2024)

Note : Nagios se surveille lui-même.

N°	Nom de la sonde	Objectif	Seuils W/C	Action en cas d'anomalie
1	CPU 15min	Charge CPU moyenne sur 15 min	WARNING : 50% / CRITICAL : 70%	Vérifier la charge, trop de checks simultanés ?
2	CPU 5min	Charge CPU moyenne sur 5 min	WARNING : 60% / CRITICAL : 80%	Réduire la fréquence de checks si surcharge.
3	CPU 1min	Charge CPU moyenne sur 1 min	WARNING : 70% / CRITICAL : 90%	Vérifier si un pic anormal, stopper les checks non critiques.

5.5 PF (Pare-feu)

Les sondes CPU et DISK sur un pare-feu peuvent varier selon qu'il s'agisse d'un OS dédié (pfsense, ipfire) ou d'un Linux. Adaptez selon votre pare-feu. Ici, on considère un firewall Linux.

N°	Nom de la sonde	Objectif	Seuils W/C	Action en cas d'anomalie
1	CPU 15min	Surveiller la charge CPU moyenne sur 15 min	WARNING : 50% / CRITICAL : 70%	Vérifier règles iptables, logs, etc.
2	CPU 5min	Surveiller la charge CPU moyenne sur 5 min	WARNING : 60% / CRITICAL : 80%	Vérifier les services, potentiels scans, tentatives d'intrusion.
3	CPU 1min	Surveiller la charge CPU moyenne sur 1 min	WARNING : 70% / CRITICAL : 90%	Action rapide : bloquer des IP malveillantes si besoin.
4	DISK /	Vérifier la partition racine du pare-feu (/)	WARNING : 70% / CRITICAL : 85%	Archiver logs, déplacer ou supprimer des fichiers temporaires.
5	USERS (root)	Vérifier qu'il n'y a pas plus d'une session root simultanée	> 1 connexion root	Vérifier une intrusion possible, couper immédiatement la session suspecte.

6. Tableau récapitulatif (Serveurs/Postes, Sondes, Paramètre)

Afin d'avoir une vision globale, voici un tableau listant chaque équipement, la sonde et le paramètre technique à surveiller (seuils, intervalle, etc.).

Serveur/PC	Sonde	Paramètre
PC-CLIENT	CPU (1min)	WARNING : 70%, CRITICAL : 90%
	DISK C:\	WARNING : 70%, CRITICAL : 80%
	RAM (1min)	WARNING : 70%, CRITICAL : 85%
RSYSLOG	CPU (15min, 5min, 1min)	15min : W=50%/C=70% ; 5min : W=60%/C=80% ; 1min : W=70%/C=90%
	DISK /	WARNING : 70%, CRITICAL : 85%
	USERS (root)	> 1 connexion root
SRV-WEB	CPU (15min, 5min, 1min)	15min : W=50%/C=70% ; 5min : W=60%/C=80% ; 1min : W=70%/C=90%
	DISK /	WARNING : 70%, CRITICAL : 90%
	HTTPD (1min)	Service up/down
	INDEX (1min)	Vérifier http:///wordpress/index.php - code 200
	MARIADB (1min)	Service up/down
	RAM (1min)	WARNING : 70%, CRITICAL : 85%
	USERS (root)	> 1 connexion root
NAGIOS	CPU (15min, 5min, 1min)	15min : W=50%/C=70% ; 5min : W=60%/C=80% ; 1min : W=70%/C=90%
PF	CPU (15min, 5min, 1min)	15min : W=50%/C=70% ; 5min : W=60%/C=80% ; 1min : W=70%/C=90%
	DISK /	WARNING : 70%, CRITICAL : 85%
	USERS (root)	> 1 connexion root

7. Conseils d'organisation et validations

Ordre de réalisation :

Mettre en place le pare-feu et vérifier la connectivité LAN ↔ DMZ ↔ Internet.
Installer et configurer RSYSLOG, SRV-WEB (WordPress), NAGIOS.
Vérifier l'accessibilité du poste client PC-CLIENT (ping, navigation HTTP vers SRV-WEB).
Installer les agents (NRPE, NSClient++ ou autre) sur chaque machine pour permettre la communication avec Nagios.
Ajouter les hôtes et services dans Nagios XI, paramétrer les checks correspondants.

Tests et validation :

Lancer des tests de charge légers pour vérifier le bon fonctionnement des sondes CPU.
Simuler une saturation disque (fichiers de test) pour voir l'alerte DISK.
Tester un arrêt du service Apache pour SRV-WEB, vérifier la remontée de l'alerte.
Vérifier la remontée des logs (si vous activez la centralisation via rsyslog).
Confirmer que vous recevez bien des alertes par mail/sms (si configuré dans Nagios).

Conclusion

À la fin de ce TP, vos stagiaires auront :

Installé et configuré un environnement réseau complet (pare-feu, LAN, DMZ).
Mis en place un serveur web avec WordPress en DMZ.
Mis en place un serveur de supervision Nagios XI 2024 et un serveur de logs rsyslog.
Paramétré des sondes de monitoring adaptées à chaque type de machine (Windows, Debian, pare-feu).
Rédigé une documentation technique claire pour chacune des sondes, incluant objectifs, seuils et actions correctives.

Cela leur donnera un aperçu très complet de la mise en œuvre d'une infrastructure professionnelle supervisée.

⬆️ Retour en haut de la page