Runbook d'exploitation
Ce guide rassemble les gestes d'exploitation de Telaria en production (VPS Ubuntu + Apache). Il complÚte le guide de déploiement en se concentrant sur le maintien en condition opérationnelle.
Stack de production complĂšte :
stack-production.md.
Déployer une mise à jour
Ordre sĂ»r â un faux pas sur l'OPcache casse le web alors que le CLI reste vert :
git pullcomposer install --no-dev --optimize-autoloaderphp bin/console doctrine:migrations:migrate --no-interactionphp bin/console cache:clear && php bin/console cache:warmupsudo systemctl reload php8.5-fpmâ indispensablesudo systemctl restart telaria-messenger-async telaria-veille-schedulerâ les workers ne rechargent pas automatiquement le code
â ïž Le piĂšge OPcache. En prod,
opcache.validate_timestamps=0impose le rechargement de PHP-FPM aprĂšs tout changement de code ou de schĂ©ma. Sans lui, le CLI et les tests sont verts mais le web (FPM) sert l'ancien code â vĂ©cu :SQLSTATE[42S22] Unknown column 't0.username'aprĂšs un drop de colonne. DĂ©tail :deployment.md§5.
â ïž Le piĂšge workers Messenger. Les workers
telaria-messenger-asyncettelaria-veille-schedulerne rechargent pas le code PHP augit pullâ ils tournent sur la version compilĂ©e au dĂ©marrage. Un dĂ©ploiement sans redĂ©marrage des workers laisse la veille tourner sur l'ancien code silencieusement. VĂ©cu 2026-06-02 : 12 jours de veille silencieuse suite Ă un dĂ©ploiement sans redĂ©marrage des workers â zĂ©ro token consommĂ©, 5500 items en backlog.
Superviser
- Consommation API IA et coûts : back-office
/admin/metrics(usage et coût par modÚle, projection, alertes e-mail). Voir../specs/telaria-admin.md. - Veille agentique : une source qui échoue plusieurs fois passe en standby automatique (seuil de 3 échecs consécutifs) ; à surveiller dans le back-office veille.
- Logs : Apache (
/var/log/apache2/), application (var/log/),sudo fail2ban-client status sshd. - Certificats TLS : renouvellement Certbot automatique ; contrĂŽler avec
certbot renew --dry-run. Voirssl-tls.md.
Sauvegarder
- Base de données : sauvegarde réguliÚre (
mysqldump) â c'est la seule donnĂ©e non rĂ©gĂ©nĂ©rable. - Index vectoriel RAG : artefact dĂ©rivĂ©, non sauvegardĂ© â se rĂ©gĂ©nĂšre avec
php bin/console app:rag:ingest. - Documentation : versionnée dans
telaria-doc(git) â pas de sauvegarde sĂ©parĂ©e nĂ©cessaire.
Incidents courants
| SymptĂŽme | Cause probable | Geste |
|---|---|---|
| Web KO mais CLI vert aprÚs un déploiement | OPcache sert l'ancien code | sudo systemctl reload php8.5-fpm |
SQLSTATE ⊠Unknown column |
migration appliquée sans reload FPM | recharger FPM ; vérifier doctrine:schema:validate |
| Source de veille muette | passée en standby aprÚs 3 échecs | lever le standby dans le back-office veille |
| Veille tourne mais 0 token / 0 résumé | workers Messenger sur ancien code aprÚs déploiement | sudo systemctl restart telaria-messenger-async telaria-veille-scheduler puis vérifier php bin/console app:rag:stats |
| 0 token depuis plusieurs jours | workers arrĂȘtĂ©s silencieusement (crash non signalĂ©) | systemctl is-active telaria-messenger-async â si failed : journalctl -u telaria-messenger-async -n 30 |
| 503 sur tous les domaines aprÚs upgrade PHP | vhosts manuels ont le socket php8.X-fpm.sock hardcodé | sudo sed -i 's/php8.X-fpm/php8.Y-fpm/g' /etc/apache2/sites-enabled/*.conf && sudo a2disconf php8.X-fpm && sudo a2enconf php8.Y-fpm && sudo systemctl reload apache2 |
| Certificat expiré | renouvellement Certbot en échec | certbot renew --force-renewal puis recharger Apache |
Voir aussi
deployment.mdâ installation initiale.ssl-tls.md,hsts.md,security-headers.mdâ TLS et sĂ©curitĂ©.../specs/telaria-admin.mdâ pilotage de la consommation API.