Crashloop des contrôleurs qui gèrent des leases
Les contrôleurs qui gèrent des leases ont régulièrement des timeouts avec l'apiserver, pour une raison inconnue à ce stade. Ils redémarrent sans difficulté et tout fonctionne bien quand même, mais c'est probablement symptômatique d'un souci plus profond.
Exemple de log :
{"level":"info","ts":"2020-11-15T12:33:31.012Z","logger":"controllers.Kustomization","msg":"Reconciliation finished in 11.098006996s, next run in 10m0s","controller":"kustomization","request":"flux-system/flux-system","revision":"master/2a4aeea4bdd420028c5c551f7eb5551e98d7f2f4"}
E1115 12:38:42.635357 7 leaderelection.go:357] Failed to update lock: Put "https://10.22.0.1:443/api/v1/namespaces/flux-system/configmaps/7593cc5d.fluxcd.io": context deadline exceeded
I1115 12:38:42.635585 7 leaderelection.go:278] failed to renew lease flux-system/7593cc5d.fluxcd.io: timed out waiting for the condition
{"level":"error","ts":"2020-11-15T12:38:42.635Z","logger":"setup","msg":"problem running manager","error":"leader election lost"}
Ce problème est actuellement rencontré par :
- flux (et ses contrôleurs)
- local-path-provisioner
- cert-manager
Edited by kaiyou