Monitoring & Alertes
Ce fichier documente comment nous surveillons les services et comment nous sommes alertés en cas de problème.
État Actuel
Monitoring limité
Le projet dispose d'un monitoring de base mais pas d'alertes automatisées.
Ce document décrit ce qui existe réellement et ce qui manque.
Ce Qui Est en Place
Backend (SigNoz)
| Outil | Usage | Configuration |
|---|---|---|
| SigNoz | Tracing distribué | Auto-configuré via OpenTelemetry |
Configuration actuelle :
# backend/app/main.py
otlp_exporter = OTLPSpanExporter(
endpoint=os.getenv("SIGNOZ_ENDPOINT", "http://localhost:4319/v1/traces")
)
SigNoz est configuré pour collecter :
- Traces des requêtes API FastAPI
- Logs d'erreurs
- Métriques de performance
URL d'accès : Consulter SIGNOZ_ENDPOINT dans les variables d'environnement (SigNoz UI sur port 8080)
Frontends (Vercel)
| Plan | Monitoring |
|---|---|
| Gratuit | Dashboard basique |
Sur le plan gratuit Vercel :
- Temps de réponse
- Requêtes par jour
- Erreurs 5xx
Limitation : Pas d'alertes automatisées sur le plan gratuit.
Backend (Dokploy)
Dokploy fournit :
- Logs du conteneur Docker
- Statut du service (up/down)
- Utilisation des ressources (CPU, RAM)
Ce Qui N'Est Pas en Place
| Élément | Statut |
|---|---|
| Alertes automatisées | ❌ Non configuré |
| Slack/Email notifications | ❌ Non configuré |
| Uptime monitoring | ❌ Non configuré |
| Dashboard unifié | ❌ Fragmenté |
Logs
Backend
Via Dokploy :
- Logs Docker accessibles dans l'interface Dokploy
- Filtrage par niveau (ERROR, INFO, DEBUG)
Via SigNoz :
- Traces consultables
- Détail des requêtes lentes
Frontends
Via Vercel :
- Function logs (plan gratuit)
- Pas de logs détaillé sans upgrade
Lacunes
Risques Actuels
- Pas d'alertes proactives : Personne n'est notifié si le site est down
- Dépendance au free tier : Vercel gratuit = monitoring limité
- Pas de SLI/SLO : Pas d'objectifs de disponibilité définis
Impact
| Risque | Gravité |
|---|---|
| Site down non détecté | Haute |
| Erreurs non vues | Moyenne |
| Performance non mesurée | Moyenne |
Plans Futurs
Migration depuis Vercel
Contexte : Vercel devient coûteux. Envisagé :
- Hostinger ou VPS dédié
- Monitoring centralisé à mettre en place
Améliorations prévues
- Alertes : Configurer des alertes (Slack/Email)
- Uptime : Monitoring externe (UptimeRobot, Grafana)
- Dashboard : Vue unifiée backend + frontends
Commandes Utiles
Vérifier les logs backend (Dokploy)
# Via l'interface Dokploy
# ou
docker logs stageconnect-backend -f
Tester SigNoz
# Envoyer une requête pour générer une trace
curl http://localhost:8000/api/v1/...
# Consulter sur SIGNOZ_ENDPOINT (port 8080 pour l'UI)
Vérifier Vercel
# Via dashboard Vercel
# Analytics → Performance
Règle Absolue
Vérifier régulièrement :
- Dashboard SigNoz pour les erreurs récentes
- Logs Dokploy pour les warning/erreurs
- Dashboard Vercel pour les métriques