Interruption complète du service DNS
Ce matin, à compter de 7h16, l'ensemble des services TeDomum étaient inaccessibles, cela pose plusieurs questions à résoudre, que je propose de suivre dans cette issue.
-
Pourquoi le service est-il tombé en premier lieu ? c'est la première fois qu'il tombe tout seul -
Pourquoi la résolution a-t-elle fait défaut alors que dns2 était opérationnel ? -
Comment accéder à aegir dans ce genre de cas (c'est une des premières fois qu'on n'a plus du tout de DNS, pas facile pour résoudre aegir.tech.tedomum.net, l'adresse dans mon known_hosts n'était pas la bonne) -
Comment continuer d'avoir des accès techniques dans ce genre de cas ? OVH et SYS ont installé un 2FA sur la base d'un mail, qui est... dépendant de nos DNS.
Ce qui s'est bien passé cela-dit :
- le monitoring a vu le souci très rapidement, et le souci DNS bien visible, même si pas de certitude que c'était la cause racine
- le monitoring a bien été reçu sur d'autres serveurs, donc j'ai bien pu tout recevoir sur matrix.org via un autre client
- Matrix a continué de tourner suffisamment longtemps aussi pour avoir le monitoring, ainsi que les premières com, grace à son cache DNS
- la communication via Matrix sur le salon technique, par d'autres comptes, fonctionne toujours sans souci