Een private cloud voor Refactory.it

Refactory is een webdevelopmentbedrijf dat het serieus aanpakt. Wél alles in eigen handen houden, maar weten waar je kracht ligt. Daarom heeft Tuxis de opdracht gekregen om een private cloud cluster voor ze te bouwen en te onderhouden. Na wat onprettige ervaringen bij de vorige leverancier (laten we zeggen dat de service net zoals de prijs is), waar nu het oude Proxmox-cluster nog draait zijn we gevraagd om een nieuw cluster op te zetten.

Daar zijn we mee aan de gang gegaan. De setup bestaat in beginsel uit twee fysieke machines waarop virtuele machines draaien. Ze halen hun storage van een derde fysieke machine met ZFS en iScsi, zodat de virtuele machines live gemigreerd kunnen worden. De live migratie (zie de video) gaat naadloos. Zelfs als je de console voor je hebt, merk je eigenlijk niets. De console moet even reloaden (de verbinding moet immers naar een andere fysieke machine), maar dat is ook alles.




High Availability
De routing/firewalling/filtering wordt afgehandeld door een Kerio Control VM. Omdat Kerio zelf (nog?) geen HA-oplossing ingebouwd heeft, moeten we daar zelf dus wat voor regelen. Gelukkig heeft Proxmox dat al prima voor elkaar.

De twee machines zitten met zijn tweeën in een cluster en gebruiken een shared iScsi-disk op de storagemachine als ‘derde node’ (in een cluster wil je om split-brain te voorkomen graag minimaal drie nodes hebben). Zodra een van de machines uitvalt, zal de overgebleven machine dat binnen enkele seconden in de gaten krijgen. Hij poogt vervolgens om via IPMI de andere node zeker uit te zetten, en start de HA-VM bij zichzelf.

Deze vorm van HA brengt wel even downtime met zich mee (een minuut of twee misschien, inclusief het booten), maar terwijl je aan de slag gaat met het herstellen van de defecte node, draaien alle echt belangrijke VM’s op de andere node verder.

Benieuwd wat we nog meer kunnen? Zie https://www.tuxis.nl/maatwerk/