Aller au contenu principal

Monitoring & Alertes

Ce fichier documente comment nous surveillons les services et comment nous sommes alertés en cas de problème.

État Actuel

Monitoring limité

Le projet dispose d'un monitoring de base mais pas d'alertes automatisées.

Ce document décrit ce qui existe réellement et ce qui manque.

Ce Qui Est en Place

Backend (SigNoz)

OutilUsageConfiguration
SigNozTracing distribuéAuto-configuré via OpenTelemetry

Configuration actuelle :

# backend/app/main.py
otlp_exporter = OTLPSpanExporter(
endpoint=os.getenv("SIGNOZ_ENDPOINT", "http://localhost:4319/v1/traces")
)

SigNoz est configuré pour collecter :

  • Traces des requêtes API FastAPI
  • Logs d'erreurs
  • Métriques de performance

URL d'accès : Consulter SIGNOZ_ENDPOINT dans les variables d'environnement (SigNoz UI sur port 8080)

Frontends (Vercel)

PlanMonitoring
GratuitDashboard basique

Sur le plan gratuit Vercel :

  • Temps de réponse
  • Requêtes par jour
  • Erreurs 5xx

Limitation : Pas d'alertes automatisées sur le plan gratuit.

Backend (Dokploy)

Dokploy fournit :

  • Logs du conteneur Docker
  • Statut du service (up/down)
  • Utilisation des ressources (CPU, RAM)

Ce Qui N'Est Pas en Place

ÉlémentStatut
Alertes automatisées❌ Non configuré
Slack/Email notifications❌ Non configuré
Uptime monitoring❌ Non configuré
Dashboard unifié❌ Fragmenté

Logs

Backend

Via Dokploy :

  • Logs Docker accessibles dans l'interface Dokploy
  • Filtrage par niveau (ERROR, INFO, DEBUG)

Via SigNoz :

  • Traces consultables
  • Détail des requêtes lentes

Frontends

Via Vercel :

  • Function logs (plan gratuit)
  • Pas de logs détaillé sans upgrade

Lacunes

Risques Actuels

  • Pas d'alertes proactives : Personne n'est notifié si le site est down
  • Dépendance au free tier : Vercel gratuit = monitoring limité
  • Pas de SLI/SLO : Pas d'objectifs de disponibilité définis

Impact

RisqueGravité
Site down non détectéHaute
Erreurs non vuesMoyenne
Performance non mesuréeMoyenne

Plans Futurs

Migration depuis Vercel

Contexte : Vercel devient coûteux. Envisagé :

  • Hostinger ou VPS dédié
  • Monitoring centralisé à mettre en place

Améliorations prévues

  1. Alertes : Configurer des alertes (Slack/Email)
  2. Uptime : Monitoring externe (UptimeRobot, Grafana)
  3. Dashboard : Vue unifiée backend + frontends

Commandes Utiles

Vérifier les logs backend (Dokploy)

# Via l'interface Dokploy
# ou
docker logs stageconnect-backend -f

Tester SigNoz

# Envoyer une requête pour générer une trace
curl http://localhost:8000/api/v1/...
# Consulter sur SIGNOZ_ENDPOINT (port 8080 pour l'UI)

Vérifier Vercel

# Via dashboard Vercel
# Analytics → Performance

Règle Absolue

Vérifier régulièrement :

  • Dashboard SigNoz pour les erreurs récentes
  • Logs Dokploy pour les warning/erreurs
  • Dashboard Vercel pour les métriques