[FRsAG] Solutions VMs zero downtime / fault tolerent

Xavier Beaudouin kiwi at oav.net
Sam 27 Juil 13:33:42 CEST 2019


> Il n'y a pas que le HTTP dans la vie

+1
 
> Le cloud n'est rien de plus que des VM chez un fournisseur tiers, c'est
> la définition technique et la réalité

+1

>>> Comment gérez-vous une infra zero downtime / fault tolerent ?
>>> Pour situer le périmètre, je parle dans un contexte de virtualisation, du
>>> fait que l'ensemble de vos VMs continuent à fonctionner sans avoir subi de
>>> reboot suite à un crash de l'hyperviseur qui les héberge, donc dans un cas
>>> de disaster recovery uniquement. Autrement dit, un RTO RPO de 0 précisément.
>> [...]

Des fois des mise à jour nécessite des reboot et comme c'est l'été, c'est la fête
aux CVE : mysql et consors, kernels (linux, et autres), etc.... etc....

Donc il faut des fois rebooter la vm ne serait-ce que pour voir si elle résiste
au disaster recovery (ex: le putain de service qui ne démarre pas) :)

>> Désolé, je ne vais pas répondre à la question, mais juste dire que de nos
>> jours (Cloud...) la réponse n'es plus dans l'infrastructure mais dans les
>> applications.

+1000
 
>> Avec une application dont l'architecture logicielle est redondante, on peut
>> dire "Cloud Native", tu peut atteindre du TRO/RPO faible sur des machines
>> standard, quelconque sans garantie de SLA.

Considérer tout les vm / hardware peux cramer c'est prévoir une archi logicielle
redondante. Le pb c'est bcp de monde pensent que le cloud ça ne se viande jamais
et que ca marchera toujours... ce qui est un postulat faux de base. Les downtimes
dû à un hardware qui a fait plonk sont généralement plus bas, mais ils existent...

>> Et surtout au delà des pannes, on doit quand même redémarrer les applis et les
>> système pour les mises à jour, dans ce cas, pouvoir faire du rolling upgrade
>> sur plusieurs machines, l'une après l'autre sans interruption de service.

+1 :)

>> Bref, s'il n'y a plus beaucoup de solution de fault tolerance (VMware doit
>> toujours avoir ça), c'est peut-être que simplement ça n'a plus d'utilité sur
>> les nouveaux environnements applicatifs (Cloud native apps, Kubernetes...).

+1 aussi. Même le vmware ha est des fois pas sec. Conclusion, autant prévoir l'infra
redondante by the code que par l'hyperviseur :)

>> Je ne crois pas aux miracle, et RTO=RPO=0, dans un cadre de PRA, à moins
>> d'avoir aucune exigence de perf, je n'y crois pas (théorème CAP).

:)

/Xavier


Plus d'informations sur la liste de diffusion FRsAG